FR3046321A1 - Procede de codage d'une image numerique, procede de decodage, dispositifs, terminal d'utilisateur et programmes d'ordinateurs associes - Google Patents

Procede de codage d'une image numerique, procede de decodage, dispositifs, terminal d'utilisateur et programmes d'ordinateurs associes Download PDF

Info

Publication number
FR3046321A1
FR3046321A1 FR1502721A FR1502721A FR3046321A1 FR 3046321 A1 FR3046321 A1 FR 3046321A1 FR 1502721 A FR1502721 A FR 1502721A FR 1502721 A FR1502721 A FR 1502721A FR 3046321 A1 FR3046321 A1 FR 3046321A1
Authority
FR
France
Prior art keywords
sequence
elements
current
values
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR1502721A
Other languages
English (en)
Other versions
FR3046321B1 (fr
Inventor
Felix Henry
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
B Com SAS
Original Assignee
Orange SA
B Com SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to FR1502721A priority Critical patent/FR3046321B1/fr
Application filed by Orange SA, B Com SAS filed Critical Orange SA
Priority to EP16829261.3A priority patent/EP3398330A1/fr
Priority to JP2018534103A priority patent/JP2019507521A/ja
Priority to PCT/FR2016/053540 priority patent/WO2017115028A1/fr
Priority to CN201680076689.3A priority patent/CN108781292B/zh
Priority to US16/066,966 priority patent/US10687082B2/en
Priority to KR1020187019193A priority patent/KR20180133378A/ko
Publication of FR3046321A1 publication Critical patent/FR3046321A1/fr
Application granted granted Critical
Publication of FR3046321B1 publication Critical patent/FR3046321B1/fr
Priority to JP2021183991A priority patent/JP2022043029A/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/39Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving multiple description coding [MDC], i.e. with separate layers being structured as independently decodable descriptions of input picture data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/619Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding the transform being operated outside the prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

L'invention concerne un procédé de codage d'une image numérique, ladite image (Im) étant divisée en une pluralité de blocs de pixels (C) traités dans un ordre défini, ledit procédé comprenant les étapes suivantes, mises en œuvre pour un bloc courant : Traitement (E1) du bloc courant destiné à fournir un ensemble d'éléments de description du bloc traité ; Sélection (E2) d'un sous-ensemble d'au moins deux éléments de description à prédire dans l'ensemble fourni; Ordonnancement (E4) des éléments de description du sous-ensemble en une séquence ordonnée; Codage des éléments de la séquence; Selon l'invention, l'étape de codage des éléments de la séquence comprend un parcours des éléments de la séquence et comprend, pour un élément courant, les sous-étapes suivantes: Sélection d'une combinaison de valeurs des éléments de description de la séquence parmi une pluralité de combinaisons en fonction d'un critère de coût prédéterminé et, à partir du deuxième élément, de valeurs d'éléments de description précédemment traités dans la séquence; Prédiction de l'élément courant de la séquence par sa valeur dans la combinaison sélectionnée ; et Codage d'un indicateur représentatif d'une différence entre la valeur réelle de l'élément courant et sa valeur prédite,

Description

Procédé de codage d'une image numérique, procédé de décodage, dispositifs, terminal d'utilisateur et programmes d'ordinateurs associés 1. Domaine de l'invention
Le domaine de l'invention est celui de la compression de signal, en particulier d'une image numérique ou d'une séquence d'images numériques, dans lequel une prédiction d'une portion du signal à coder est réalisée à partir d'une portion du signal déjà codée.
Le codage/décodage d'images numériques s'applique notamment à des images issues d'au moins une séquence vidéo comprenant : - des images issues d'une même caméra et se succédant temporellement (codage/décodage de type 2D), - des images issues de différentes caméras orientées selon des vues différentes (codage/décodage de type 3D), - des composantes de texture et de profondeur correspondantes (codage/décodage de type 3D), - etc.
La présente invention s'applique de manière similaire au codage/décodage d'images de type 2D ou 3D. L'invention peut notamment, mais non exclusivement, s'appliquer au codage vidéo mis en œuvre dans les codeurs vidéo actuels AVC et HEVC et leurs extensions (MVC, 3D-AVC, MV-HEVC, 3D-HEVC, etc), et au décodage correspondant. L'invention peut s'appliquer aussi au codage audio, par exemple mis en œuvre dans les codeurs audio actuels (EVS, OPUS, MPEG-H, etc) et leurs extensions et au décodage correspondant. 2. Présentation de l'art antérieur
On considère un schéma de compression classique d'une image numérique, selon lequel l'image est divisée en blocs de pixels. Un bloc courant à coder est prédit à partir d'un bloc précédemment codé décodé. Un bloc résidu est obtenu par soustraction des valeurs originales aux valeurs prédites. Il est ensuite transformé à l'aide d'une transformation de type DCT (pour « Discrète Cosinus Transform », en anglais) ou ondelettes. Les coefficients transformés sont quantifiés puis leurs amplitudes sont soumises à un codage entropique de type Huffmann ou arithmétique. Un tel codage obtient des performances efficaces, car, du fait de la transformation, les valeurs des amplitudes à coder sont en grande majorité nulles.
En revanche, il ne s'applique pas aux valeurs des signes des coefficients, dont les valeurs + et - sont généralement associées à des probabilités d'apparition équivalentes. Ainsi, les signes des coefficients sont codés par un bit 0 ou 1.
On connaît de l'article de Koyama, J. et al, intitulé « Coefficient sign bit compression in video coding », et publié dans les proceedings de la conférence «Picture Coding Symposium (PCS) », en mai 2012, une méthode de sélection de signes de coefficients d'un bloc résidu à prédire. La sélection proposée est basée sur un nombre de coefficients prédéterminé en fonction de leur amplitude et de la taille du bloc dont ils sont issus. Les signes sélectionnés sont prédits en testant toutes les combinatoires possibles des valeurs de ces signes pour le bloc et en choisissant celle qui maximise un critère de vraisemblance prédéterminé. Les prédictions obtenues sont comparées aux valeurs originales des signes pour déterminer la valeur d'un indicateur de prédiction, appelé aussi résidu d'un signe prédit. Cet indicateur peut prendre deux valeurs, qui sont une première valeur représentative d'une prédiction correcte et une deuxième valeur représentative d'une prédiction incorrecte. Le reste des signes est codé de façon explicite, sans prédiction.
Un avantage d'une telle sélection est de prédire la valeur d'un signe avec une probabilité de prédiction correcte supérieure à 50%, donc de permettre l'application d'un codage entropique aux valeurs des indicateurs de prédiction. Ce codage entropique code l’information de signe avec un débit moyen inférieur à un bit par signe, et permet ainsi d’augmenter le taux de compression. 3. Inconvénients de l'art antérieur
Un inconvénient de cette technique est qu'en prédisant globalement tous les signes sélectionnées, chaque signe subit l'influence de la valeur des autres, et la prédiction s'en trouve dégradée. 4. Objectifs de l'invention L'invention a notamment pour objectif de pallier ces inconvénients de l’art antérieur.
Plus précisément, un objectif de l'invention est de proposer une solution qui sélectionne plus efficacement les signes à prédire.
Un autre objectif de l'invention est de proposer une solution qui soit plus performante en compression.
Encore un autre objectif de l'invention est de proposer une solution qui s'applique à tout type d'élément de description d'un bloc de pixels mis en œuvre pour le codage d'une image numérique. 5. Exposé de l'invention
Ces objectifs, ainsi que d'autres qui apparaîtront par la suite, sont atteints à l’aide d’un procédé de codage d'une image numérique, ladite image étant divisée en une pluralité de blocs de pixels traités dans un ordre défini, ledit procédé comprenant les étapes suivantes, mises en œuvre pour un bloc courant
Traitement du bloc courant destiné à fournir un ensemble d'éléments de description du bloc traité ; Sélection d'un sous-ensemble d'au moins deux éléments de description à prédire dans l'ensemble fourni;
Ordonnancement des éléments de description du sous-ensemble en une séquence ordonnée;
Codage des éléments de la séquence;
Selon l'invention, l'étape de codage des éléments de la séquence comprend un parcours des éléments de la séquence et comprend, pour un élément courant, les sous-étapes suivantes: Sélection d'une combinaison de valeurs des éléments de description de la séquence parmi une pluralité de combinaisons en fonction d'un critère de coût prédéterminé et, à partir du deuxième élément, de valeurs d'éléments de description précédemment traités dans la séquence;
Prédiction de l'élément courant de la séquence par sa valeur dans la combinaison sélectionnée ; et
Codage d'un indicateur représentatif d'une différence entre la valeur réelle de l'élément courant et sa valeur prédite, L'invention repose sur une approche tout-à-fait nouvelle et inventive qui consiste ordonner les éléments de description à prédire en fonction d'un score associé et à prédire chaque élément de la séquence sur la base de la meilleure combinaison de prédictions des valeurs des éléments de la séquence ordonnée, selon un critère de coût prédéterminé. Ainsi, contrairement à l'art antérieur, l'élément courant profite d'un traitement individualisé qui exploite la connaissance des valeurs réelles des éléments déjà traités, ce qui permet d'améliorer la qualité de la prédiction des éléments au fur et à mesure du traitement de la séquence et donc d'augmenter l'efficacité de compression.
Selon un autre aspect de l'invention, l'étape d'ordonnancement produit une séquence initiale, l'étape de codage prend comme élément courant le premier élément d'une séquence courante initialisée à la séquence initiale et comprend, une fois le premier élément courant traité, une sous-étape de mise à jour de la séquence courante par suppression du premier élément.
Un avantage de cette implémentation est de libérer de la mémoire au fur et à mesure qu'on traite la séquence d'éléments de prédiction.
Selon un autre aspect de l'invention, le procédé comprend une étape préalable de calcul des coûts associés à la pluralité de combinaisons de valeurs de la séquence initiale, une étape de mémorisation de la pluralité de combinaisons et de leurs coûts associés et en l'étape de sélection sélectionne, pour l'élément courant, une combinaison de valeurs de la séquence initiale pour laquelle les éléments précédemment traités ont leurs valeurs réelles.
Un avantage de cette solution est d'être économe en ressources de calculs. Les combinaisons et leurs coûts associés sont calculés et mémorisés une fois pour toutes.
Selon un autre aspect de l'invention, l'étape de sélection comprend une sous-étape de calcul des coûts associés aux combinaisons de valeurs possibles de la séquence courante en fonction d'un critère de coût qui dépend des valeurs des éléments précédemment traités.
Un avantage de cette solution est d'être économe en ressources de mémoire, le calcul des combinaisons et de leurs coûts associés étant mis en oeuvre à la volée pour chaque séquence courante.
Selon un autre aspect de l'invention, l'étape de sélection sélectionne un sous-ensemble d'éléments de description à prédire en fonction de scores prédéterminés, un score prédéterminé étant représentatif d'un niveau de fiabilité de la prédiction de l'élément de prédiction auquel il est associé, et l'étape d'ordonnancement ordonne les éléments à prédire en fonction desdits scores.
Un avantage est que le score étant indicatif d'un niveau de fiabilité ou d'une faculté d'un élément à être bien prédit, le sous-ensemble ne comprend que les meilleurs candidats à la prédiction.
Selon encore un autre aspect de l'invention, le critère de coût prédéterminé appartient à un groupe comprenant au moins : un critère de minimisation d'une distorsion le long d'une frontière du bloc courant avec un bloc précédemment traité ; un critère de proximité avec une valeur prédéterminée ; un critère de minimisation d'une mesure d'énergie d'une différence entre le bloc courant une prédiction du bloc courant ;
Un avantage est que l'invention permet d'utiliser alternativement plusieurs critères de coût et éventuellement une combinaison de ces critères.
Le procédé qui vient d'être décrit dans ses différents modes de réalisation est avantageusement mis en œuvre par un dispositif de codage d'une image numérique, ladite image étant divisée en une pluralité de blocs de pixels traités dans un ordre défini, ledit dispositif comprenant une machine de calcul reprogrammable ou une machine de calcul dédiée, apte à et configurée pour :
Traiter un bloc courant et fournir un ensemble d'éléments de description du bloc traité ; Sélectionner un sous-ensemble d'au moins deux éléments de description à prédire dans l'ensemble fourni parmi un ensemble d'éléments de description du bloc courant;
Ordonner les éléments de description du sous-ensemble en une séquence ordonnée;
Coder les éléments de la séquence ordonnée.
Selon l'invention, le codage des éléments de la séquence comprend un parcours des éléments de la séquence et, pour un élément courant, est apte à et configuré pour : Sélectionner une combinaison de valeurs des éléments de description de la séquence parmi une pluralité de combinaisons en fonction d'un critère de coût prédéterminé et, à partir du deuxième élément, de valeurs d'éléments de description précédemment traités dans la séquence;
Prédire l'élément courant de la séquence par sa valeur dans la combinaison sélectionnée ; et
Coder un indicateur représentatif d'une différence entre la valeur réelle de l'élément courant et sa valeur prédite,
Corrélativement, l'invention concerne aussi un procédé de décodage d'une image numérique à partir d'un train binaire, ladite image étant divisée en une pluralité de blocs traités dans un ordre défini, le train binaire comprenant des données codées représentatives d'éléments de description des blocs de l'image, ledit procédé comprenant les étapes suivantes, mises en œuvre pour un bloc, dit bloc courant :
Identification d'un ensemble d'éléments de description du bloc courant à partir de données du train binaire ; Sélection d'un sous-ensemble d'au moins deux éléments de description à prédire dans l'ensemble identifié;
Ordonnancement des éléments de description du sous-ensemble en une séquence ordonnée; Décodage des éléments de la séquence ordonnée;
Selon l'invention, ledit procédé est particulier en ce que l'étape de décodage des éléments de la séquence comprend un parcours desdits éléments et comprend, pour un élément courant, les sous-étapes suivantes: Sélection d'une combinaison de valeurs des éléments de description de la séquence parmi une pluralité de combinaisons en fonction d'un critère de coût prédéterminé et, à partir du deuxième élément, à partir du deuxième élément, de valeurs d'éléments de description précédemment traités dans la séquence;
Prédiction du premier élément de la séquence par sa valeur dans la combinaison sélectionnée ; Décodage d'un indicateur représentatif d'une différence entre la valeur décodée de l'élément courant et la valeur prédite, à partir de données codées extraites du train binaire, et
Obtention de la valeur décodée de l'élément courant à partir de l'indicateur décodé et de la valeur prédite.
Un avantage de l'invention est qu'elle permet de garder une indépendance entre la lecture/analyse (pour « parsing », en anglais) des données codées contenues dans le train binaire et le traitement/exploitation de ces données pour décoder le bloc courant.
Selon un autre aspect de l'invention, l'étape d'ordonnancement produit une séquence initiale, l'étape de décodage prend comme élément courant le premier élément d'une séquence courante, initialisée à la séquence initiale et comprend, une fois le premier élément courant traité, une sous-étape de mise à jour de la séquence courante par suppression du premier élément.
Comme à l'encodage, ce mode de réalisation présente l'avantage de limiter le stockage de données calculées et de libérer la mémoire au fur et à mesure de l'avancement du traitement.
Selon encore un autre aspect de l'invention, le procédé de décodage comprend une étape préalable de calcul des coûts associés à la pluralité de combinaisons de valeurs de la séquence initiale, une étape d'enregistrement de la pluralité de combinaisons et de leurs coûts associés et l'étape de sélection sélectionne une combinaison parmi les combinaisons enregistrées qui commencent par les valeurs des éléments précédemment traités dans l'ordre de traitement.
Comme à l'encodage, ce mode de réalisation présente l'avantage d'être économe en ressources de calculs. Les combinaisons et leurs coûts associés sont calculés et mémorisés une fois pour toutes.
Selon encore un autre aspect de l'invention, l'étape de sélection comprend un calcul des coûts associés aux combinaisons de valeurs possibles de la séquence courante en fonction d'un critère de coût qui dépend des valeurs des éléments précédemment traités.
Comme à l'encodage, un avantage de cette solution est d'être économe en ressources de mémoire, le calcul des combinaisons et de leurs coûts associés étant mis en œuvre à la volée pour chaque séquence courante.
Le procédé qui vient d'être décrit dans ses différents modes de réalisation est avantageusement mis en œuvre par un dispositif de décodage d'une image numérique à partir d'un train binaire comprenant des données codées représentatives de ladite image, ladite image étant divisée en une pluralité de blocs traités dans un ordre défini, le train binaire comprenant des données codées représentatives d'éléments de description des blocs de l'image, ledit dispositif comprenant une machine de calcul reprogrammable ou une machine de calcul dédiée, configurée pour et apte à, pour un bloc, dit bloc courant :
Identifier un ensemble d'éléments de description du bloc courant à partir de données du train binaire ; Sélectionner un sous-ensemble d'au moins deux éléments de description à prédire dans l'ensemble identifié;
Ordonner les éléments de description du sous-ensemble en une séquence ordonnée; Décoder les éléments de la séquence ordonnée;
Selon l'invention, le décodage des éléments de la séquence initiale comprend au moins deux itérations des unités suivantes, configurées pour et aptes à être appliquées à une séquence dite courante, initialisée à la séquence initiale : Sélection (SEL Cbk) d'une combinaison de valeurs des éléments de description de la séquence courante parmi une pluralité de combinaisons possibles en fonction d'un critère de coût prédéterminé et à partir du deuxième élément, de valeurs d'éléments de description précédemment traités de la séquence initiale;
Prédiction (PRED) du premier élément de la séquence par sa valeur dans la combinaison sélectionnée ; Décodage (DEC IP) d'un indicateur représentatif d'une différence entre la valeur décodée de l'élément courant et la valeur prédite, à partir de données codées extraites du train binaire, et
Obtention (GET) de la valeur décodée de l'élément courant à partir de l'indicateur décodé et de la valeur prédite.
Corrélativement, l'invention concerne également un signal portant un train binaire comprenant des données codées représentatives d'éléments de description de blocs de pixels d'une image numérique, lesdits blocs de pixels étant traités dans un ordre défini.
Le signal selon l'invention est particulier caractérisé en ce que lesdites données codées dans le train binaire sont obtenues conformément au procédé de codage selon l'invention.
Corrélativement, l'invention concerne aussi un terminal d'utilisateur comprenant un dispositif de codage d'une image numérique et un dispositif de décodage d'une image numérique selon l'invention. L'invention concerne encore un programme d'ordinateur comportant des instructions pour la mise en œuvre des étapes d'un procédé de codage d'une image numérique tel que décrit précédemment, lorsque ce programme est exécuté par un processeur. L'invention concerne aussi un programme d'ordinateur comportant .des instructions pour la mise en œuvre des étapes d'un procédé de décodage d'une image numérique tel que décrit précédemment, lorsque ce programme est exécuté par un processeur.
Ces programmes peuvent utiliser n'importe quel langage de programmation. Ils peuvent être téléchargés depuis un réseau de communication et/ou enregistrés sur un support lisible par ordinateur. L'invention se rapporte enfin à des supports d'enregistrement, lisibles par un processeur, intégrés ou non au dispositif de codage d'une image numérique et au dispositif de décodage d'une image numérique selon l'invention, éventuellement amovibles, mémorisant respectivement un programme d'ordinateur mettant en œuvre un procédé de codage et un programme d'ordinateur mettant en œuvre un procédé de décodage, tels que décrits précédemment. 6. Liste des figures D'autres avantages et caractéristiques de l'invention apparaîtront plus clairement à la lecture de la description suivante d'un mode de réalisation particulier de l'invention, donné à titre de simple exemple illustratif et non limitatif, et des dessins annexés, parmi lesquels : la figure 1 illustre de façon schématique une séquence d'images numériques à coder et le découpage en blocs de ces images selon l'art antérieur ; la figure 2 présente de façon schématique les étapes d'un procédé de codage d'une image numérique selon l'invention ; la figure 3 détaille l'étape de traitement d'un bloc mise en œuvre dans le procédé de codage selon l'invention ; la figure 4 présente de façon schématique un bloc courant décodé d'une image numérique décodée; la figure 5 présente de façon schématique les étapes d'un procédé de décodage d'une image numérique selon un premier mode de réalisation de l'invention ; et la figure 6 présente un exemple de structure simplifiée d'un dispositif de codage d'une image numérique et d'un dispositif de décodage d'une image numérique selon un mode de réalisation de l'invention. 7. Description d'un mode de réalisation particulier de l'invention
Le principe général de l'invention repose sur un traitement individuel et successif d'éléments de description d'une séquence ordonnée d'éléments de description à prédire. Pour un élément de cette séquence, l'invention sélectionne la meilleure combinaison de valeurs de la séquence ordonnée selon un critère de coût prédéterminé et en fonction des valeurs réelles/décodées des éléments déjà traités et sur la prédiction de l'élément courant de cette séquence par sa valeur dans cette combinaison.
En relation avec la Figure 1, on considère une vidéo originale constituée d'une suite de M images II, 12, ...IM, avec M entier non nul. Les images sont encodées par un encodeur, les données codées sont insérées un train binaire TB transmis à un décodeur via un réseau de communication, ou un fichier compressé FC, destiné à être stocké sur un disque dur par exemple. Le décodeur extrait les données codées, puis reçues et décodées par un décodeur dans un ordre prédéfini connu de l'encodeur et du décodeur, par exemple dans l'ordre temporel II, puis 12, ..., puis IM, cet ordre pouvant différer suivant le mode de réalisation.
Lors de l'encodage d'une image Im, avec m entier compris entre 1 et M, celle-ci est subdivisée en blocs de taille maximale qui peuvent à leur tour être subdivisés en blocs plus petits. Chaque bloc C va subir une opération d'encodage ou de décodage consistant en une suite d'opérations, comprenant de manière non exhaustive une prédiction, un calcul de résidu du bloc courant, une transformation des pixels du bloc courant en coefficients, une quantification des coefficients et un codage entropique des coefficients quantifiés. Cette suite d'opérations sera détaillée par la suite.
Les étapes du procédé de codage d'une image Im selon l'invention vont maintenant être décrites en relation avec la Figure 2.
En EO, on commence par sélectionner comme bloc courant C le premier bloc à traiter. Par exemple, il s'agit du premier bloc (dans l'ordre lexicographique). Ce bloc comporte NxN pixels.
Au cours d'une étape Ei, on traite un bloc C courant en mettant en oeuvre un schéma de codage, par exemple tel que spécifié dans la norme HEVC, dans le document "ISO/IEC 23008-2:2013 - High efficiency coding and media delivery in heterogeneous environments — Part 2: High efficiency video coding », International Organization for Standardization, publié en novembre 2013.
Cette étape de traitement est destinée à fournir un ensemble d'éléments E de description des données à coder pour le bloc courant C. Ces éléments de description peuvent être de types variés. De façon non exhaustive, ils comprennent notamment : les informations relatives à des choix de codage du bloc courant C, par exemple un mode de codage du bloc courant, tel que le mode INTRA, INTER ou SKIP, un mode de prédiction du bloc courant, parmi les 35 modes de prédiction d'un bloc INTRA, un mode de prédiction d'un vecteur mouvement estimé pour le bloc courant, ou encore la signifiance d'une amplitude d'un coefficient, connus en soi dans HEVC; les valeurs de données à coder, telles que les composantes d'un vecteur mouvement, l'amplitude ou le signe d'un coefficient ; etc
On suppose qu'il existe L découpes en blocs possibles numérotées de 1 à L, et que la découpe utilisée sur le bloc C est la découpe numéro I. Par exemple, il peut y avoir 4 découpes possibles, en blocs de taille 4x4, 8x8, 16x16, et 32x32.
En relation avec la Figure 4, l'image courante décodée est désignée par ID. On notera que, dans un codeur vidéo, l'image ID est (re)construite dans le codeur de façon à pouvoir servir pour prédire les autres pixels de la séquence d'images.
En relation avec la Figure 3, on détaille un exemple de sous-étapes mises en œuvre par ce traitement Ei du bloc courant C sélectionné, conformément à la norme HEVC.
Au cours d'une étape Eli, on détermine une prédiction P du bloc original C. Il s'agit d'un bloc de prédiction construit par des moyens connus, typiquement par compensation de mouvement (bloc issu d'une image de référence précédemment décodée) dans le cas d'une prédiction dite INTER, ou par prédiction INTRA (bloc construit à partir des pixels décodés immédiatement adjacents au bloc courant dans l'image ID). Les informations de prédiction liées à P sont codées dans le train binaire TB ou fichier compressé FC. On suppose ici qu'il y a K modes de prédiction possibles Μι, Mk, avec K entier non nul, et que le mode de prédiction choisi pour le bloc C est le mode Mk.
Au cours d'une étape EI2, un résidu original R est formé, par soustraction R = C-P de la prédiction P du bloc courant C au bloc courant C.
Au cours d'une étape EI3, le résidu R est transformé en un bloc résidu transformé, appelé RT, par une transformée de type DCT ou transformée en ondelettes, toutes les deux connues de l'homme de métier et notamment mises en oeuvre dans les normes JPEG pour la DCT et JPEG2000 pour la transformée en ondelettes.
En EI4, le résidu transformé RT est quantifié par des moyens classiques de quantification, par exemple scalaire ou vectorielle, en un bloc résidu quantifié RQ. Ce bloc quantifié RQ contient NxN coefficients. De façon connue dans l'état de l'art, ces coefficients sont scannés dans un ordre prédéterminés de façon à constituer un vecteur monodimensionnel RQ[i], où l'indice i varie de 0 à N2-l. L'indice i est appelé fréquence du coefficient RQ[i]. Classiquement, on scanne ces coefficients par ordre croissant de fréquence, par exemple selon un parcours en zigzag, qui est connu de la norme de codage d'image fixes JPEG.
Lors d'une étape EI5, on vient coder les informations d'amplitude des coefficients du bloc résidu RQ par codage entropique, par exemple selon une technique de codage de Huffman ou de codage arithmétique. Par amplitude, on entend ici la valeur absolue du coefficient. Des moyens de codage des amplitudes sont par exemple décrits dans la norme HEVC et dans l'article de Sole et al, intitulé « Transform Coefficient Coding in HEVC », publié dans la revue IEEE Transactions on Circuits and Systems for Video Technology, Volume 22, Issue: 12, pp. 1765 - 1777, en décembre 2012. Classiquement, on peut coder pour chaque coefficient une information représentative du fait que le coefficient est non nul. Ensuite, pour chaque coefficient non nul, une ou plusieurs informations relatives à l'amplitude sont codées. On obtient les amplitudes codées CA. A l'issue de l'étape El, on dispose donc pour le bloc courant C d'un ensemble E d'éléments de description de données à coder, parmi lesquels on compte les coefficients résidus transformés quantifiés RQ[i] , les signes de ces coefficients, le mode de prédiction Mk etc
En relation avec la Figure 2, on sélectionne au cours d'une étape E2, un sous-ensemble SE de cet ensemble, comprenant les éléments de description à prédire EP pour le bloc C.
Par exemple, on sélectionne un nombre prédéterminé d'éléments à prédire en fonction de leur amplitude et de la taille du bloc courant.
Dans l'exemple de réalisation de l'invention qui va être maintenant détaillé, on considère des éléments de description d'un type particulier, par exemple des signes de coefficients transformés et quantifiés du bloc courant RQ. Bien sûr, l'invention n'est pas limitée à ce type d'éléments et s'applique à tout autre élément de description du bloc courant. D'autres exemples seront présentés ci-après.
Au cours d'une première sous-étape E2 on commence par définir un sous-ensemble initial SEI d'éléments de description à prédire. Par exemple il s'agit de tous les signes des coefficients résidus transformés quantifiés RQ[i] non nuis du bloc courant.
De façon avantageuse, on exploite la connaissance d'un contexte Cxj associé à chaque coefficient parmi une pluralité J de contextes prédéterminés, avec J entier non nul et j entier compris entre 1 et J. Un tel contexte est défini par au moins une caractéristique du coefficient ou du bloc dont il est issu.
De façon avantageuse, on considère les caractéristiques suivantes : la taille du bloc résidu quantifié RQ, l'amplitude du coefficient quantifié RQ[i], la fréquence du coefficient ou indice i dans le bloc RQ, le mode de prédiction du bloc courant Mi< parmi les K modes possibles.
En effet, la prédiction du signe est d'autant plus fiable que l'amplitude est élevée. De même, il a été constaté que lorsque le bloc est de taille plus grande, la fréquence du coefficient plus faible, la prédiction est plus fiable. Enfin, il a été constaté que la prédiction est plus fiable lorsque le bloc courant est associé à une prédiction intra d'un certain type.
De façon alternative, d'autres contextes sont envisageables. Ainsi, il est possible de tenir compte du type d’image dans lequel se trouve le bloc courant, par exemple du type Intra ou Inter, connu de la norme HEVC, en fonction de l'énergie du prédicteur P, ou encore en fonction du nombre total de coefficients non nuis dans le bloc courant.
Ensuite, on sélectionne les signes des coefficients du bloc RQ de l'ensemble initial, en fonction d'un score prédéterminé Sj, pour le contexte Cxj associé au coefficient RQ[i] considéré.
Un tel score Sj est représentatif d'un niveau de fiabilité de la prédiction du signe du coefficient RQ[i].
Par exemple, le score Sj prend des valeurs dans un ensemble prédéterminé, par exemple de 0 à 10.
Selon une variante, le score est une simple indication binaire, dont l'une des deux valeurs indique que le signe peut être prédit, et l'autre que le signe ne peut pas être prédit.
Selon une autre variante, les scores Sj correspondent à des probabilités connues a priori, dépendantes du contexte Cxj associé au coefficient RQ[i]. On dispose, dans l'encodeur, d'un ensemble de probabilités de détection correcte des signes des coefficients RQ. Par exemple cet ensemble de probabilités est stocké en mémoire.
Ces probabilités ont été construites avant l'encodage et le décodage, soit par accumulation statistique sur un ensemble de signaux représentatifs des signaux à coder, soit par calcul mathématique à partir d'hypothèses sur la distribution des signes des coefficients. Pour un coefficient RQ[i] associé au contexte Cxj, on peut donc obtenir le score Sj[i] en calculant la probabilité p[l][mk][i][|RQ[i]|] de prédiction correcte du signe du coefficient RQ[i].
Avantageusement, les signes à prédire sont sélectionnés par seuillage des scores auxquels ils sont associés. Ainsi, pour chaque coefficient RQ[i] qui a un signe (c'est-à-dire, qui n'est pas nul) et qui est associé à un contexte Cxj de score Sj, on prédit le signe si et seulement si Sj>Th, où Th est un seuil prédéterminé, par exemple égal à 0,7. Par exemple, le seuil Th est connu du codeur et du décodeur.
Selon une variante, le seuil Th peut être choisi en cours de codage et inscrit dans le fichier compressé ou dans le train binaire comprenant les données codées représentatives de l'image numérique Im. Par exemple, si l’unité qui effectue l’encodage ne dispose pas d’assez de ressources de calcul à un moment donné, il lui est possible d’augmenter ce seuil Th de façon à prédire moins de signes, et donc mettre en œuvre moins de calculs.
Il serait également possible de faire varier le seuil Th en fonction du contenu des images à coder : une image comportant beaucoup de contenu, tel que des variations de luminosité importantes ou des mouvements nombreux utiliserait un seuil élevé, et une image comportant peu de contenu tel que des variations de luminosité faibles ou mouvements peu nombreux, utiliserait un seuil Th plus bas, de façon à lisser la complexité ou la mémoire nécessaire au codage de chaque image. A l'issue de cette sélection, les signes des coefficients RQ[i] sélectionnés sont tous associés à un contexte Cxj et à un score Sj supérieur au seuil Th prédéterminé et forment un ensemble SE d'éléments EP de description à prédire.
Au cours d'une étape E3, on encode de façon classique les éléments de description ENP qui n'appartiennent pas au sous-ensemble SE sélectionné. Cette étape met en œuvre des techniques de codage connues de l’homme de métier. Pour les signes des coefficients RQ[i] par exemple, il est connu notamment de la norme HEVC, en particulier de l'article de Sole étal., déjà cité, le fait de transmettre chaque signe sous forme d'un élément binaire 0 ou 1, avec une convention associant l'un au signe plus et l'autre au signe moins.
En E4, on ordonne les éléments de description EP. Cet ordre peut être prédéfini, et par exemple correspondre à l'ordre de scan des signes tel que défini dans la norme HEVC. De façon préférentielle, on les ordonne en fonction de leur score associé. Par exemple si le score utilisé est représentatif d'une probabilité de prédiction correcte, on ordonne les éléments par score décroissant. On obtient une séquence Seqi dite initiale, d'éléments de description à prédire. Supposons que l'on dispose à ce stade de M signes ordonnés à prédire Seq, = { EPo=So, EPi=Si,...,EPm-i=Sm-i}-
En E5, on encode les éléments de description de la séquence ordonnée Seqi.
Selon un premier mode de réalisation de l'invention, cette étape E5 comprend les sous-étapes suivantes :
En E5i on considère une séquence courante Seqc que l'on initialise à la séquence initiale
Seqi.
Les étapes suivantes forment une boucle itérative qui sera répétée plusieurs fois, en fonction du nombre M d'éléments de description à prédire sélectionnés dans la séquence Seqc.
Un élément de description est susceptible de prendre au moins deux valeurs. Par exemple, un signe peut valoir + ou
Au cours de l'étape E5i, on évalue les différentes possibilités ou hypothèses de combinaisons de valeurs de la séquence Seqc d'éléments à prédire, à l'aide d'une fonction d'évaluation FE ou d'un critère de coût prédéterminé. On suppose qu'on a K hypothèses ou combinaisons possibles, avec K entier non nul. Dans le cas où les éléments de description à prédire sont les M signes d'une séquence, un signe pouvant prendre la valeur + ou la valeur -, le nombre de combinaisons possibles est K = 2M.
Par exemple, pour une hypothèse donnée cette fonction produit un coût, par exemple :
Ici, l'hypothèse est et le coût résultant est 4240. Bien sûr, la fonction d'évaluation doit faire en sorte de générer un coût minimal lorsque l'hypothèse de signes est la plus vraisemblable. Il existe plusieurs fonctions de coût connues de l'état de l'art et présentées dans l'article de Koyama et al, cité plus tôt.
De façon avantageuse, on utilise une fonction d'évaluation qui consiste à mesurer la distorsion le long de frontières gauche FG et supérieure FS du bloc courant avec des blocs précédemment traités. En relation avec la Figure 4, on a représenté une image décodée ID et un bloc décodé virtuel DVs de taille NxN pixels de cette image avec l'hypothèse de combinaison de signes dont on veut mesurer le coût, où DVs(lin,col) est la valeur du pixel du bloc DVs situé sur la ligne lin et la colonne col du bloc.
On considère un opérateur « Side Matching » SM(3,B)), avec 3 image courante et C bloc courant, défini comme suit :
avec C(i,j) la valeur des coefficients dans le bloc décodé virtuel DVs, avec i, j entiers compris entre 0 et N-l.
Sur la figure 4, on a représenté les pixels situés le long de la frontière gauche FG dont les valeurs sont de bas en haut yi à y4 et situés les pixels situés le long de la frontière supérieure FS du bloc décodé virtuel DVs dont les valeurs sont de gauche à droite y4 à y7, ainsi que les pixels Xi à x4 et x4 à x8 respectivement situés de l'autre côté des frontières FG et FS.
Appliquer cet opérateur revient à former la somme (xi-yi)2+ (x2-y2)2+ (X3~y3)2+ (x4-y4p+ (X5-y4)2+ (xe-ys)2+ (x7-ye)2+ (xs-y7)2.
On détermine le bloc décodé virtuel optimal DVopt qui minimise cette mesure :
où ID représente l'image reconstruite après décodage.
Alternativement, le critère de vraisemblance utilisé est la minimisation de l'erreur avec le prédicteur P. Cela consiste à sélectionner le bloc décodé virtuel qui minimise l'erreur avec le prédicteur P.
Le résidu virtuel associé au bloc décodé virtuel optimal est ainsi identifié.
Bien sûr, on pourrait recourir à d'autres critères de coût, tels que par exemple un critère de minimisation d'une mesure de distance/proximité à une valeur prédéterminée, par exemple moyenne ou la minimisation de l'énergie du bloc résidu.
Pour générer un bloc courant décodé correspondant à une hypothèse de signes Cbk, on procède de la façon suivante : on attribue à chaque coefficient du bloc résidu courant son signe réel (s'il s'agit d'un coefficient dont le signe n'est pas prédit), ou l'hypothèse de signe (s'il s'agit d'un coefficient dont le signe est à prédire). à l'aide des moyens classiques de déquantification et de transformée inverse, on obtient un bloc de résidu décodé, dont les échantillons {rl,r2,...,r7> voisins des bloc précédemment décodés sont ajoutés aux éléments prédits correspondants du bloc P pour former les éléments reconstruits yl = rl +pl,y2 = p2 + r2, y7=p7+r7 du bloc décodé virtuel DV, comme indiqué sur la figure 4.
Le bloc décodé virtuel obtenu DV est utilisé pour calculer le coût CTk associé à la combinaison CBi< évaluée.
Dans la suite, on considère que la séquence initiale Seqi={so,Si,s2} compte 3 signes à prédire. On suppose que les valeurs réelles de la séquence initiale sont So = -, Si = + et s2 =
On évalue donc les coûts CTk des 8 combinaisons suivantes : CT0=FE({+,+,+» CTl=FE({+,+,->) CT2=FE({+,-,+» CT3=FE({+,-,->) CT4=FE({-,+,+» CT5=FE({-,+,-}) CT6=FE({-,-,+}) CT7=FE({-,-,->)
On identifie la combinaison associée au coût minimal. Supposons qu'il s'agisse de CT2.
Au cours d'une étape E53, on prédit le premier élément de la séquence courante Seqc par la valeur qu'il prend dans la combinaison Ck2. Dans l'exemple considéré, cette valeur est +.
En E54, on calcule l'indicateur de prédiction IP correspondant. Pour ce faire, on compare la valeur prédite de sO à sa valeur réelle. L'indicateur IP indique si le signe prédit est égal à ou différent du signe réel. Par exemple, il vaut 0 si les signes prédit et réels sont égaux, 1 sinon. En l'espèce, la valeur prédite est un +, la valeur réelle un -, donc l'indicateur IP du premier signe EDO est fixé à 1.
En E5s, on code l'indicateur IP obtenu. On met par exemple en œuvre une technique de codage entropique connue, telle que par exemple un codage de Huffman, codage arithmétique ou encore codage CABAC utilisé dans la norme HEVC. On obtient une valeur codée de l'indicateur de prédiction.
Selon l'invention, du fait que seuls sont prédits les éléments de description qui sont associés à un score représentatif d'un niveau de fiabilité suffisant, l'indicateur de prédiction prend plus souvent la valeur 1 que la valeur 0. Ceci est mis à profit par le codage entropique pour réduire la taille du signal compressé.
Avantageusement, le codage entropique tient compte du score Sj associé au signe prédit pour coder l'indicateur IP. Par exemple, dans le mode de réalisation de l'invention selon lequel le score a une valeur comprise entre 0 (faible fiabilité de la prédiction) et 10 (haute fiabilité de la prédiction), le codage entropique des indicateurs est paramétré en tenant compte du score, de façon à exploiter la répartition plus ou moins uniforme des indicateurs. Par exemple, on utilise un codage entropique de type CABAC, connu de la norme HEVC, en initialisant les probabilités utilisées dans CABAC en fonction des scores prédéterminés.
En Ε5β, on teste si le premier signe EDo est le dernier de la séquence. Si c'est le cas, le traitement de l'étape E5 est fini, car la séquence ne comprenait qu'un seul élément. Sinon, on met à jour la séquence courante Seqc en E57, en supprimant le premier élément EDo qui vient d'être traité. Le deuxième élément EDi de la séquence initiale devient donc premier et on a terminé la première itération.
Au cours de la deuxième itération, on traite l'élément EDi, devenu premier de la séquence courante. Les étapes E52 à E5e sont répétées de la façon suivante : A ce stade deux modes de réalisation de l'étape E52 sont envisagés :
Selon une première option, on réutilise les combinaisons calculées pour la séquence initiale, déjà exploitées pour la première itération. On suppose donc qu'elles ont été enregistrées dans une mémoire. Parmi les K combinaisons de la première itération, on élimine celles pour lesquelles s0 n'a pas sa valeur réelle. On ne conserve donc que les 4 combinaisons CT4 à CT7 pour lesquelles so vaut -, et leurs coûts associés : CT4=FE({-,+,+» CT5=FE({-,+,->) CT6=FE({-,-,+» CT7=FE({-,-,->)
De nouveau on identifie celle qui obtient le coût minimal. Par exemple, on suppose qu'il s'agit de Cb6 avec le coût ΟΤβ.
Selon une deuxième option, on recalcule les coûts associés aux combinaisons de la nouvelle séquence courante. La séquence courante Seqc comprend M=2 éléments. Il y a K = 22 combinaisons possibles. On évalue donc les 4 combinaisons possibles à l'aide d'une fonction d'évaluation qui peut être différente de celle mise en œuvre à la première itération. Par exemple, on utilise une mesure de l'énergie des coefficients du bloc résidu virtuel décodé DVs et on choisit la combinaison qui minimise cette mesure. Cette fonction d'évaluation est plus précise, mais aussi plus complexe à calculer et donc mieux adaptée à des séquences plus courtes.
On comprend que les combinaisons et les coûts calculés pour une itération précédente ne sont pas conservés pour l'itération suivante.
En E53, on prédit le signe si à - ce qui correspond à sa valeur dans la combinaison sélectionnée.
En E54, on calcule l'indicateur de prédiction IP correspondant. La valeur réelle de si étant égale à +, l'indicateur IP vaut 1.
En Ε5δ, on code l'indicateur de prédiction IP obtenu pour Si ;
En E56, on teste si le signe Si est le dernier de la séquence courante.
Ce n'est pas le cas, on met donc à jour la séquence courante en supprimant Si. La nouvelle séquence courante ne comprend plus que le signe S2.
On réalise la troisième et dernière itération de façon similaire.
En E52, sachant que so vaut - et Si vaut +, les combinaisons de valeurs possibles restantes sont CT4 et CT5. On suppose que le coût minimal est CT5. On choisit donc la combinaison Cb4.
En E53, on prédit S3 à la valeur qu'il prend dans la combinaison Cb4, à savoir +.
En E54, on calcule l'indicateur de prédiction IP correspondant. La valeur réelle de S2 étant égale à +, l'indicateur IP indique une prédiction correcte et vaut 0.
En E5s, on code l'indicateur de prédiction calculé.
En Ε5β, on teste s'il reste des éléments de description à traiter dans la séquence. s2 étant le dernier, le traitement de l'étape de codage E5 est terminé.
Dans le mode de réalisation qui vient d'être présenté, les itérations de l'étape E5 s'appliquent au premier élément de la séquence, laquelle est mise à jour par suppression du premier élément une fois traité. Ce mode de réalisation présente l'avantage de réduire à chaque itération la longueur de la séquence courante à traiter. Néanmoins, l'invention ne se limite pas à ce choix d'implémentation. On peut alternativement conserver la séquence initiale et faire progresser l'indice de l'élément courant à chaque nouvelle itération de l'étape E5. Dans ce cas, l'option qui consiste à calculer préalablement les coûts associés à toutes les combinaisons de valeurs possibles de la séquence initiale et à les mémoriser, est la plus adaptée.
En E6, on construit le bloc décodé, en appliquant au résidu quantifié RQ les étapes de déquantification et de transformée inverse (connues en soi). On obtient un bloc résidu décodé RD. On ajoute à RD le bloc prédicteur P pour obtenir le bloc décodé BD. Au cours de cette étape on vient également ajouter le bloc décodé BD à l'image reconstruite ID. Ceci permet de disposer dans le codeur d'une version décodée de l'image courante. Cette version décodée est utilisée dans notamment au cours de l'étape de construction d'une prédiction des signes sélectionnés pour être prédits.
On passe à l'étape E7 d'insertion dans le train binaire TB ou dans un fichier compressé des données codées représentatives des indicateurs de prédiction IP et des éléments de description non prédits pour le bloc courant C.
En E8, on vient tester si le bloc courant est le dernier bloc à traiter par l'unité de codage, compte tenu de l'ordre de parcours défini précédemment. Si oui, l'unité de codage a terminé son traitement. Si non, l'étape suivante est l'étape EO de sélection du bloc suivant.
Dans un autre mode de réalisation, on sélectionne des éléments de description à prédire d'un autre type que les signes. On considère en particulier l'élément de description M indicatif du mode de prédiction INTRA/INTER (dans la norme HEVC, un tel élément de description porte le nom « pred_mode_flag »), l'élément de description A indicatif de l'amplitude du premier coefficient résidu quantifié pour le bloc courant (dans la norme HEVC, un tel élément de description porte le nom « coeff_abs_level_remaining ») et l'élément de description T indicateur de l'utilisation ou non d'une transformée inverse (dans la norme HEVC, un tel élément de description porte le nom « transform_skip_flag »).
Dans la norme HEVC par exemple, un élément M peut prendre une valeur comprise entre 0 et 34. Un élément A peut prendre des valeurs comprises entre 0 et 216-1.
Pour le bloc courant, l'ensemble de départ est constitué des éléments de description {M, A,T}. On considère dans cet exemple que, pour le bloc courant C, et en fonction des informations contextuelles, il est trouvé lors de l'étape E2 que le score de T est inférieur au seuil nécessaire Th, tandis que M et A ont un score supérieur. Le sous-ensemble SE est donc {M,A>.
Le train binaire TB est destiné à être présenté en entrée d'un décodeur, local ou distant. Par exemple, un signal portant le train binaire est transmis au décodeur par l'intermédiaire d'un réseau de communication.
En relation avec la Figure 5, on présente maintenant les étapes du procédé de décodage d'une image numérique codée selon un exemple de réalisation de l'invention. On suppose qu'un train binaire TB a été reçu par un dispositif de décodage mettant en oeuvre le procédé de décodage selon l'invention. En variante, le dispositif de décodage obtient un fichier compressé FC.
En DO, on commence par sélectionner comme bloc courant C' le premier bloc à traiter. Par exemple, il s'agit du premier bloc (dans l'ordre lexicographique). Ce bloc comporte NxN pixels.
En Dl, on traite le bloc C' courant en mettant en œuvre le schéma de décodage, correspondant au schéma de codage utilisé par l'encodeur, par exemple tel que spécifié dans la norme HEVC. En particulier, au cours de cette étape, on identifie un ensemble d'éléments ED de description des données à décoder pour le bloc courant C'.
On réalise en outre une prédiction P' du bloc à décoder C'. Les informations de prédiction liées à P' sont lues dans le train binaire ou fichier compressé et décodées. On décode donc l'information de mode de prédiction.
On décode aussi les informations d'amplitude du résidu à décoder RQ' sont lues dans le train binaire ou le fichier compressé et décodées. On connaît donc maintenant les amplitudes des RQ'fi], mais pas encore les signes.
En D2, le procédé de décodage selon l'invention met en œuvre l'étape de sélection des éléments de description à prédire parmi les éléments de description déterminés. Cette étape a déjà été décrite en détails pour le procédé de codage en relation avec les Figures 2 et 3. Les éléments de description à prédire sont avantageusement sélectionnés en fonction de scores prédéterminés. Un ensemble SE est obtenu. A l'issue de cette étape, on connaît les valeurs décodées des éléments de description du bloc qui n'ont pas été prédits parce qu'ils étaient associés à un score Sj inférieur à un seuil Th prédéterminé.
Au cours d'une étape D3, le procédé lit dans le train binaire TB les données codées relatives aux éléments de description du bloc courant non prédits et les décode.
En D4, il ordonne les éléments de l'ensemble SE obtenu en une séquence initiale Seq,, par scores décroissants, comme déjà décrit pour le procédé de codage selon l'invention. L'étape D5 de décodage des éléments de description à prédire va maintenant être détaillée dans un mode de réalisation particulier. On notera qu'elle est très similaire à l'étape E5 mise en œuvre par le procédé de codage selon l'invention qui vient d'être décrit.
En D5i on considère une séquence courante Seqc que l'on initialise à la séquence initiale
Seqi.
Les étapes suivantes (D52 à ϋ5β) forment une boucle itérative qui sera répétée plusieurs fois, en fonction du nombre M d'éléments de description à prédire sélectionnés dans la séquence Seqc.
En D52, on sélectionne la meilleure combinaison au sens d'une fonction d'évaluation FE, la même que celle utilisée par le procédé de codage qui a produit le train binaire à décoder, parmi les combinaisons de valeurs possibles de la séquence courante Seqc. Comme déjà évoqué pour le procédé de codage, il existe plusieurs fonctions d'évaluation possibles. Dans la suite, on considère une mesure de distorsion le long d'une frontière avec des blocs précédemment traités et on sélectionne la combinaison de valeurs qui minimise cette mesure.
Au cours d'une première itération, on décode le premier élément de description de la séquence Seqc. Dans la suite, on suppose que les éléments de description sont des signes. A l'aide de la fonction de coût, on génère les coûts correspondant à chaque hypothèse ou combinaison possible pour l'ensemble des signes à prédire. Ainsi, supposons que M=3, et Seqc={so,Si,S2>. On va générer les coûts suivants : CT0=FE({+,+,+» CTi=FE({+,+,->) CT2=FE({+,-,+» CT3=FE({+,-,->) CT4=FE({-,+,+» CT5=FE({-,+,->) CT6=FE({-,-,+» CT7=FE({-,-,->)
Ce sont les 8 coûts correspondant aux 8 hypothèses possibles sur les signes à prédire. On suppose que le coût minimal est CT2.
En D53, on prédit la valeur du premier signe sO par sa valeur dans la combinaison Cb2. Il s'agit d'un +.
En D54, on décode l'indicateur de prédiction IP correspondant à ce premier signe sO, à partir de données codées extraites du train binaire ou fichier compressé. Cet indicateur indique si le signe prédit a été correctement prédit ou non. Par exemple, on suppose que la valeur décodée est un 1 et qu'elle est associée à une prédiction incorrecte.
En D5s, on en déduit que la valeur décodée du signe sO est un -.
En D5e, on teste si l'élément EDo est le dernier de la séquence courante. Si c'est le cas, le traitement s'achève. Sinon, on met à jour la séquence courante en D57 en supprimant l'élément EDo = sO qui vient d'être décodé.
Au cours d'une deuxième itération, on traite le deuxième élément S2, devenu premier de la séquence courante.
En D52, on considère les combinaisons Cbk, pour lesquelles so a sa valeur décodée, les autres étant éliminées.
Dans l'exemple considéré, la valeur réelle de so est -, donc on compare les coûts suivants : CT4=FE({-,+,+}) ct5=fe({-,+,->) ct6=fe({-,-,+» ct7=fe({-,-,->)
Ces 4 coûts correspondent aux 4 hypothèses possibles sur les signes qui restent à prédire, connaissant la valeur décodée de celui qui a déjà été traité. CT6 est identifié comme le coût minimal
En D53, on prédit Si par sa valeur dans la combinaison 0)6, c'est-à-dire un -.
En D54, on décode l'indicateur IP correspondant à D2 à partir des données codées extraites du train binaire ou fichier compressé, un indicateur est décodé, qui indique si le signe prédit est égal ou différent du signe réel. Dans notre exemple, supposons que la valeur décodée de IP soit 0, ce qui signifie que la prédiction de ce signe est correcte.
En D5s, on en déduit que si vaut -.
En D56, on teste si si est le dernier élément. Comme ce n'est pas le cas, on met à jour la séquence courante en D57, en supprimant si. La nouvelle séquence Seqc est réduite à l'élément S2.
Au cours d'une troisième et dernière itération, on décode le dernier signe S2.
En D52, on considère les combinaisons de valeurs de la séquence initiale Seq, pour lesquelles les éléments de description déjà traités sO et si prennent leur valeur décodée.
On compare donc les coûts suivants : CT6=FE({-,-,+» CT7=FE({-,-,-})
On identifie CTe comme le coût minimal.
Alors, le dernier signe S2 dans l'ordre prédéfini est prédit, en D53, par sa valeur dans la combinaison Cb6 : il s'agit d'un +.
Ensuite, un indicateur IP associé au signe S2 est décodé en D54. Il indique si le signe S2 a été correctement prédit ou non. Dans notre exemple, supposons que la valeur décodée soit 0, ce qui correspond à une prédiction correcte.
On en déduit en D55 que la valeur décodée de S2 est le signe +.
En ϋ5β, on constate que S2 est le dernier élément à traiter.
Comme pour l'encodage, on notera que l'invention ne se limite pas au mode de réalisation qui vient d'être présenté. D'autres choix d'implémentation peuvent être faits, comme par exemple celui que conserver la séquence à sa longueur initiale, de mettre à jour l'indice de l'élément courant, initialisé au premier élément de description EDo et de mettre fin aux itérations une fois le dernier élément EDm-i traité.
On passe ensuite à l'étape D6 de reconstruction du bloc courant C' à partir des éléments de description décodés, EP prédits (D5) et ENP non prédits (Ü3),des informations d'amplitude des coefficients du bloc résidu RQ' et de la prédiction P' obtenus en Di.
Pour ce faire, on commence par déquantifier le bloc RQ' pour obtenir un bloc déquantifié. Ceci est réalisé par des moyens adaptés à la quantification utilisée lors du codage (déquantification scalaire, déquantification vectorielle...), connus de l'homme de métier.
On applique ensuite au résidu déquantifié une transformée inverse de celle utilisée au codage. On obtient alors le résidu décodé.
On reconstruit enfin le bloc décodé BD' en ajoutant le résidu décodé à la prédiction P'.
Ce bloc est intégré à l'image en cours de décodage.
Au cours d'une étape D7, on vient tester si le bloc courant est le dernier bloc à traiter, compte tenu de l'ordre de parcours des blocs, défini précédemment. Si oui, le décodage est terminé. Si non, l'étape suivante est l'étape D0 de sélection du bloc suivant et les étapes du procédé de décodage sont répétées.
Selon l'invention, du fait que tous les éléments de la séquence initiale sélectionnés en fonction des scores prédéterminés sont prédits, on sait donc dès l'issue de l'étape D2 combien d'indicateurs de prédiction IP sont à extraire du train binaire ou du fichier compressé. On comprend que cela permet d'implémenter une mise en œuvre de l'invention qui décorrèle les opérations de lecture et d'analyse des données codées contenues dans le train binaire ou fichier compressé (pour « parsing », en anglais) des opérations de traitement du bloc courant conformément au schéma de codage/décodage mis en œuvre. Par exemple, on pourrait organiser le décodage en utilisant un composant spécifique pour l'analyse/lecture des données codées dans le train binaire et un autre pour les opérations de reconstruction des blocs décodés. Un avantage de cette indépendance de parsing est de permettre une parallélisation des opérations de décodage.
On notera que l'invention qui vient d'être décrite, peut être mise en œuvre au moyen de composants logiciels et/ou matériels. Dans cette optique, les termes « module » et « unité », utilisés dans ce document, peuvent correspondre soit à un composant logiciel, soit à un composant matériel, soit encore à un ensemble de composants matériels et/ou logiciels, aptes à mettre en œuvre la ou les fonctions décrites pour le module ou l'unité concerné(e).
En relation avec la figure 6, on présente maintenant un exemple de structure simplifiée d'un dispositif 100 de codage d'une image numérique et d'un dispositif 200 de décodage d'un train binaire selon l'invention. Le dispositif 100 met en œuvre le procédé de codage selon l'invention qui vient d'être décrit en relation avec la Figure 2. Seuls les principaux éléments relatifs à la mise en œuvre de la technique selon l'invention sont illustrés.
Par exemple, le dispositif 100 comprend une unité de traitement 110, équipée d'un processeur μι, et pilotée par un programme d'ordinateur Pgi 120, stocké dans une mémoire 130 et mettant en œuvre le procédé de selon l'invention. A l'initialisation, les instructions de code du programme d'ordinateur Pgi 120 sont par exemple chargées dans une mémoire RAM avant d'être exécutées par le processeur de l'unité de traitement 110. Le processeur de l'unité de traitement 110 met en œuvre les étapes du procédé décrit précédemment, selon les instructions du programme d'ordinateur 120.
Dans cet exemple de réalisation de l'invention, le processeur 110 est apte à et configuré pour : traiter (PROC) un bloc courant et obtenir un ensemble d'éléments de description de ce bloc ; sélectionner (SEL) un sous-ensemble d'éléments de description à prédire parmi un ensemble d'éléments de description du bloc, en fonction de scores associés auxdits éléments; ordonner (ORDER) les éléments de description du sous-ensemble en une séquence, dit séquence initiale, en fonction desdits scores ;
Encoder (COD) les éléments de la séquence ordonnée.
Le dispositif 100 est en outre configuré pour encoder les éléments non prédits (ENC ENP) et pour reconstruire le bloc décodé BD et l'image décodée (RECONST).
Selon un mode de réalisation de l'invention, l'encodage des éléments de la séquence initiale comprend au moins deux itérations des unités suivantes, configurées pour et aptes à être appliquées à une séquence dite courante, initialisée à la séquence initiale : sélection (SEL Cbk) d'une combinaison de valeurs des éléments de description de la séquence courante parmi une pluralité de combinaisons possibles en fonction d'un critère de coût prédéterminé et, à partir du deuxième élément, de valeurs d'éléments de description précédemment traités de la séquence initiale; prédiction (PRED) du premier élément de la séquence par sa valeur dans la combinaison sélectionnée ; codage (COD IP) d'un indicateur représentatif d'une différence entre la valeur de l'élément courant et la valeur prédite, et
Mise à jour (UPD Seqc) de la séquence courante par suppression du premier élément.
Selon un mode de réalisation de l'invention, le dispositif 100 comprend en outre une unité Mi de stockage des contextes de codage des coefficients, des scores prédéterminés associés à chacun de ces contextes, des valeurs prédites pour les éléments de description sélectionnés et de la pluralité de combinaisons de valeurs de la séquence d'éléments de description à prédire sélectionnés.
Ces unités sont pilotées par le processeur μι de l'unité de traitement 110.
De façon avantageuse, un tel dispositif 100 peut être intégré à un équipement terminal d'utilisateur TU, tel qu'un encodeur, un ordinateur personnel, une tablette, une caméra numérique, un téléphone mobile intelligent (pour « smartphone », en anglais), etc. Le dispositif 100 est alors agencé pour coopérer au moins avec le module suivant du terminal TU : un module E/R d'émission/réception de données, par l'intermédiaire duquel le train binaire TB ou le fichier compressé FC est transmis dans un réseau de télécommunications, par exemple un réseau filaire, radio, ou hertzien.
Le dispositif de décodage 200 met en œuvre le procédé de décodage selon l'invention qui vient d'être décrit en relation avec la Figure 5.
Par exemple, le dispositif 200 comprend une unité de traitement 210, équipée d'un processeur μ2, et pilotée par un programme d'ordinateur Pg2 220, stocké dans une mémoire 230 et mettant en œuvre le procédé de selon l'invention. A l'initialisation, les instructions de code du programme d'ordinateur Pg2 220 sont par exemple chargées dans une mémoire RAM avant d'être exécutées par le processeur de l'unité de traitement 210. Le processeur de l'unité de traitement 210 met en œuvre les étapes du procédé décrit précédemment, selon les instructions du programme d'ordinateur 220. Dans cet exemple de réalisation de l'invention, le dispositif 200 est apte à et configuré pour :
Identifier (IDENT) un ensemble d'éléments de description du bloc courant à partir de données du train binaire ; Sélectionner (SEL) un sous-ensemble d'éléments de description à prédire dans l'ensemble identifié, en fonction de scores associés auxdits éléments;
Ordonner (ORDER) les éléments de description du sous-ensemble en une séquence, dit séquence initiale, en fonction desdits scores ; Décoder (DEC) les éléments de la séquence ordonnée;
Selon l'invention, le décodage des éléments de la séquence initiale comprend au moins deux itérations des unités suivantes, configurées pour et aptes à être appliquées à une séquence dite courante, initialisée à la séquence initiale : Sélection (SEL Cbk) d'une combinaison de valeurs des éléments de description de la séquence courante parmi une pluralité de combinaisons possibles en fonction d'un critère de coût prédéterminé et de valeurs d'éléments de description précédemment traités de la séquence initiale;
Prédiction (PRED) du premier élément de la séquence par sa valeur dans la combinaison sélectionnée ; Décodage (DEC IP) d'un indicateur représentatif d'une différence entre la valeur décodée de l'élément courant et la valeur prédite, à partir de données codées extraites du train binaire.
Obtention (GET DEDo) de la valeur décodée de l'élément courant à partir de l'indicateur décodé et de la valeur prédite ; et
Mise à jour (UPD Seqc) de la séquence courante par suppression du premier élément décodé.
Le dispositif 200 est en outre configuré pour décoder les éléments non prédits (DEC ENP) et pour reconstruire le bloc décodé BD et l'image décodée (RECONST).
Le dispositif 200 comprend en outre une unité M2 de stockage des contextes de codage des coefficients, des scores prédéterminés associés à chacun de ces contextes, des valeurs prédites pour les éléments de description sélectionnés pour un bloc C' et des combinaisons Cbk de valeurs des éléments de description de la séquence à prédire sélectionnés.
Ces unités sont pilotées par le processeur μ2 de l'unité de traitement 210.
De façon avantageuse, un tel dispositif 200 peut être intégré à un terminal d'utilisateur TU, par exemple un décodeur, un boîtier de connexion TV (pour « Set-Top-Box », en anglais), un téléviseur numérique, un ordinateur, une tablette, un téléphone mobile intelligent, etc. Le dispositif 200 est alors agencé pour coopérer au moins avec le module suivant du terminal TU : un module E/R d'émission/réception de données, par l'intermédiaire duquel le train binaire TB ou le fichier compressé FC est reçu du réseau de télécommunications. un module DISP d'affichage des images numériques décodées. L'invention qui vient d'être présentée peut trouver de nombreuses applications, en particulier dans le cadre d'une compression de signal vidéo, audio (paroles, son), d'images fixes, d'images acquises par un module d'imagerie médicale. Elle s'applique par exemple aussi bien aux contenus bidimensionnels (2D), tridimensionnels (3D) incluant une carte de profondeur, ou encore d'images multispectrales (dont les intensités de couleur sont différentes des trois bandes rouge vert bleu) ou enfin d'images intégrales.
Il va de soi que les modes de réalisation qui ont été décrits ci-dessus ont été donnés à titre purement indicatif et nullement limitatif, et que de nombreuses modifications peuvent être facilement apportées par l'homme de l'art sans pour autant sortir du cadre de l'invention.

Claims (16)

  1. REVENDICATIONS
    1. Procédé de codage d'une image numérique, ladite image (Im) étant divisée en une pluralité de blocs de pixels (C) traités dans un ordre défini, ledit procédé comprenant les étapes suivantes, mises en œuvre pour un bloc courant : Traitement (El) du bloc courant destiné à fournir un ensemble d'éléments de description du bloc traité ; Sélection (E2) d'un sous-ensemble d'au moins deux éléments de description à prédire dans l'ensemble fourni; Ordonnancement (E4) des éléments de description du sous-ensemble en une séquence ordonnée; Codage (E5) des éléments de la séquence; ledit procédé étant caractérisé en ce que l'étape de codage des éléments de la séquence comprend un parcours des éléments de la séquence et comprend, pour un élément courant, les sous-étapes suivantes: Sélection (E52) d'une combinaison de valeurs des éléments de description de la séquence parmi une pluralité de combinaisons en fonction d'un critère de coût prédéterminé et, à partir du deuxième élément, de valeurs d'éléments de description précédemment traités dans la séquence; Prédiction (E53) de l'élément courant de la séquence par sa valeur dans la combinaison sélectionnée ; et Codage (E5s) d'un indicateur représentatif d'une différence entre la valeur réelle de l'élément courant et sa valeur prédite,
  2. 2. Procédé de codage d'une image numérique selon la revendication 1, caractérisé en ce que l'étape (E4) d'ordonnancement produit une séquence initiale (Seq,), l'étape de codage (E5) prend comme élément courant le premier élément (EDo) d'une séquence courante initialisée à la séquence initiale et comprend, une fois le premier élément courant traité, une sous-étape (E5?) de mise à jour de la séquence courante par suppression du premier élément.
  3. 3. Procédé de codage d'une image numérique selon l'une des revendications précédentes, caractérisé en ce qu'il comprend une étape préalable de calcul des coûts associés à la pluralité de combinaisons de valeurs de la séquence ordonnée, une étape de mémorisation de la pluralité de combinaisons et de leurs coûts associés et en ce que l'étape de sélection (E52) sélectionne, pour l'élément courant, une combinaison de valeurs de la séquence ordonnée pour laquelle les éléments précédemment traités ont leurs valeurs réelles.
  4. 4. Procédé de codage d'une image numérique selon l'une des revendications 1 ou 2, caractérisé en ce que l'étape de sélection comprend, pour l'élément courant, une sous-étape de calcul des coûts associés aux combinaisons de valeurs possibles de la séquence courante en fonction d'un critère de coût qui dépend des valeurs des éléments précédemment traités.
  5. 5. Procédé de codage d'une image numérique selon l'une des revendications précédentes, caractérisé en ce que l'étape de sélection sélectionne un sous-ensemble d'éléments de description à prédire en fonction de scores prédéterminés, un score prédéterminé étant représentatif d'un niveau de fiabilité de la prédiction de l'élément de prédiction auquel il est associé et en ce que l'étape d'ordonnancement ordonne les éléments à prédire en fonction desdits scores.
  6. 6. Procédé de codage d'une image numérique selon l'une des revendications précédentes, caractérisé en ce que le critère de coût prédéterminé appartient à un groupe comprenant au moins : un critère de minimisation d'une distorsion le long d'une frontière du bloc courant avec un bloc précédemment traité ; un critère de proximité avec une valeur prédéterminée ; un critère de minimisation d'une mesure d'énergie d'une différence entre le bloc courant une prédiction du bloc courant ;
  7. 7. Dispositif (100) de codage d'une image numérique, ladite image (Im) étant divisée en une pluralité de blocs de pixels traités dans un ordre défini, ledit dispositif comprenant une machine de calcul reprogrammable ou une machine de calcul dédiée, apte à et configurée pour : - Traiter (PROC) un bloc courant et fournir un ensemble d'éléments de description du bloc traité ; - Sélectionner (SEL) un sous-ensemble d'au moins deux éléments de description à prédire dans l'ensemble fourni; - Ordonner (ORDER) les éléments de description du sous-ensemble en une séquence ordonnée; - Coder (COD) les éléments de la séquence ordonnée; ledit dispositif étant caractérisé en ce que le codage des éléments de la séquence comprend un parcours des éléments de la séquence et, pour un élément courant, est apte à et configuré pour : Sélectionner (SEL Cbk) une combinaison de valeurs des éléments de description de la séquence parmi une pluralité de combinaisons en fonction d'un critère de coût prédéterminé et, à partir du deuxième élément, de valeurs d'éléments de description précédemment traités dans la séquence; Prédire (PRED) l'élément courant de la séquence par sa valeur dans la combinaison sélectionnée ; et Coder (COD IP) un indicateur représentatif d'une différence entre la valeur réelle de l'élément courant et sa valeur prédite.
  8. 8. Procédé de décodage d'une image numérique (Im) à partir d'un train binaire (TB), ladite image étant divisée en une pluralité de blocs traités dans un ordre défini, le train binaire comprenant des données codées représentatives d'éléments de description des blocs de l'image, ledit procédé comprenant les étapes suivantes, mises en oeuvre pour un bloc (C'), dit bloc courant : Identification (Dl) d'un ensemble d'éléments de description du bloc courant à partir de données du train binaire ; Sélection (D2) d'un sous-ensemble d'au moins deux éléments de description à prédire dans l'ensemble identifié; Ordonnancement (D4) des éléments de description du sous-ensemble en une séquence ordonnée; Décodage (D5) des éléments de la séquence ordonnée; ledit procédé étant caractérisé en ce que l'étape (D5) de décodage des éléments de la séquence ordonnée comprend un parcours desdits éléments et comprend, pour un élément courant, les sous-étapes suivantes: Sélection (D52) d'une combinaison de valeurs des éléments de description de la séquence parmi une pluralité de combinaisons en fonction d'un critère de coût prédéterminé et, à partir du deuxième élément, de valeurs d'éléments de description précédemment traités dans la séquence; Prédiction (D53) du premier élément de la séquence par sa valeur dans la combinaison sélectionnée ; Décodage (D54) d'un indicateur représentatif d'une différence entre la valeur décodée de l'élément courant et la valeur prédite, à partir de données codées extraites du train binaire, et Obtention (D5s) de la valeur décodée de l'élément courant à partir de l'indicateur décodé et de la valeur prédite.
  9. 9. Procédé de décodage d'une image numérique selon la revendication 8, caractérisé en ce que l'étape d'ordonnancement (D52) produit une séquence initiale (Seq,), l'étape de décodage (D54) prend comme élément courant le premier élément (EDo) d'une séquence courante, initialisée à la séquence initiale et comprend, une fois le premier élément courant traité, une sous-étape (D5?) de mise à jour de la séquence courante par suppression du premier élément.
  10. 10. Procédé de décodage d'une image numérique selon la revendication 8, caractérisé en ce qu'il comprend une étape préalable de calcul des coûts associés à la pluralité de combinaisons de valeurs de la séquence initiale, une étape d'enregistrement de la pluralité de combinaisons et de leurs coûts associés et en ce que l'étape de sélection sélectionne une combinaison parmi les combinaisons enregistrées qui commencent par les valeurs des éléments précédemment traités dans l'ordre de traitement.
  11. 11. Procédé de décodage d'une image numérique selon l'une des revendication 8 ou 9, caractérisé en ce que l'étape de sélection comprend, pour l'élément courant, un calcul des coûts associés aux combinaisons de valeurs possibles de la séquence courante en fonction d'un critère de coût qui dépend des valeurs des éléments précédemment traités.
  12. 12. Dispositif (200) de décodage d'une image numérique (ID) à partir d'un train binaire (TB), ladite image étant divisée en une pluralité de blocs traités dans un ordre défini, le train binaire comprenant des données codées représentatives d'éléments de description des blocs de l'image, ledit dispositif comprenant une machine de calcul reprogrammable ou une machine de calcul dédiée, configurée pour et apte à, pour un bloc (C'), dit bloc courant : Identifier (IDENT) un ensemble d'éléments de description du bloc courant à partir de données du train binaire ; Sélectionner (SEL) un sous-ensemble d'au moins deux éléments de description à prédire dans l'ensemble identifié; Ordonner (ORDER) les éléments de description du sous-ensemble en une séquence ordonnée; Décoder (DEC) les éléments de la séquence ordonnée; ledit dispositif étant caractérisé en ce que le décodage des éléments de la séquence initiale comprend au moins deux itérations des unités suivantes, configurées pour et aptes à être appliquées à une séquence dite courante, initialisée à la séquence initiale : Sélection (SEL Cbk) d'une combinaison de valeurs des éléments de description de la séquence courante parmi une pluralité de combinaisons possibles en fonction d'un critère de coût prédéterminé et à partir du deuxième élément, de valeurs d'éléments de description précédemment traités de la séquence initiale; Prédiction (PRED) du premier élément de la séquence par sa valeur dans la combinaison sélectionnée ; Décodage (DEC IP) d'un indicateur représentatif d'une différence entre la valeur décodée de l'élément courant et la valeur prédite, à partir de données codées extraites du train binaire, et Obtention (GET) de la valeur décodée de l'élément courant à partir de l'indicateur décodé et de la valeur prédite.
  13. 13. Signal portant un train binaire (TB) comprenant des données codées représentatives d'éléments de description de blocs de pixels d'une image numérique, lesdits blocs de pixels étant traités dans un ordre défini, caractérisé en ce que lesdites données codées sont obtenues conformément au procédé de codage selon l'une des revendications 1 à 6.
  14. 14. Terminal d'utilisateur (TU) caractérisé en ce qu'il comprend un dispositif de codage d'une image numérique selon la revendication 7 et un dispositif de décodage d'une image numérique selon la revendication 12.
  15. 15. Programme d'ordinateur (Pgi) comprenant des instructions pour la mise en oeuvre du procédé de codage d'une image numérique selon l'une des revendications 1 à 6, lorsqu'il est exécuté par un processeur.
  16. 16. Programme d'ordinateur (Pg2) comprenant des instructions pour la mise en œuvre du procédé de décodage d'une image numérique selon l'une des revendications 8 à 11, lorsqu'il est exécuté par un processeur.
FR1502721A 2015-12-29 2015-12-29 Procede de codage d'une image numerique, procede de decodage, dispositifs, terminal d'utilisateur et programmes d'ordinateurs associes Expired - Fee Related FR3046321B1 (fr)

Priority Applications (8)

Application Number Priority Date Filing Date Title
FR1502721A FR3046321B1 (fr) 2015-12-29 2015-12-29 Procede de codage d'une image numerique, procede de decodage, dispositifs, terminal d'utilisateur et programmes d'ordinateurs associes
JP2018534103A JP2019507521A (ja) 2015-12-29 2016-12-16 デジタル画像のコーディング方法、デコーディング方法、付随するデバイス、ユーザ端末およびコンピュータプログラム
PCT/FR2016/053540 WO2017115028A1 (fr) 2015-12-29 2016-12-16 Procédé de codage d'une image numérique, procédé de décodage, dispositifs, terminal d'utilisateur et programmes d'ordinateurs associés
CN201680076689.3A CN108781292B (zh) 2015-12-29 2016-12-16 用于对数字图像进行编码的方法以及相关联的解码方法、设备、用户终端和计算机程序
EP16829261.3A EP3398330A1 (fr) 2015-12-29 2016-12-16 Procédé de codage d'une image numérique, procédé de décodage, dispositifs, terminal d'utilisateur et programmes d'ordinateurs associés
US16/066,966 US10687082B2 (en) 2015-12-29 2016-12-16 Method for encoding a digital image, decoding method, devices, user terminal and associated computer programs
KR1020187019193A KR20180133378A (ko) 2015-12-29 2016-12-16 디지털 이미지를 인코딩하기 위한 방법, 디코딩 방법, 디바이스들, 사용자 단말 및 연관된 컴퓨터 프로그램들
JP2021183991A JP2022043029A (ja) 2015-12-29 2021-11-11 デジタル画像のコーディング方法、デコーディング方法、付随するデバイス、ユーザ端末およびコンピュータプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1502721A FR3046321B1 (fr) 2015-12-29 2015-12-29 Procede de codage d'une image numerique, procede de decodage, dispositifs, terminal d'utilisateur et programmes d'ordinateurs associes
FR1502721 2015-12-29

Publications (2)

Publication Number Publication Date
FR3046321A1 true FR3046321A1 (fr) 2017-06-30
FR3046321B1 FR3046321B1 (fr) 2018-01-26

Family

ID=55411444

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1502721A Expired - Fee Related FR3046321B1 (fr) 2015-12-29 2015-12-29 Procede de codage d'une image numerique, procede de decodage, dispositifs, terminal d'utilisateur et programmes d'ordinateurs associes

Country Status (7)

Country Link
US (1) US10687082B2 (fr)
EP (1) EP3398330A1 (fr)
JP (2) JP2019507521A (fr)
KR (1) KR20180133378A (fr)
CN (1) CN108781292B (fr)
FR (1) FR3046321B1 (fr)
WO (1) WO2017115028A1 (fr)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10848763B2 (en) 2018-11-14 2020-11-24 Tencent America LLC Method and apparatus for improved context design for prediction mode and coded block flag (CBF)
FR3092719A1 (fr) * 2019-02-07 2020-08-14 Orange Procédés et dispositifs de codage et de décodage d'un flux de données représentatif d'au moins une image.
FR3098073B1 (fr) * 2019-06-25 2021-09-24 Fond B Com Procédé de codage et de décodage d’une image d’une séquence vidéo et dispositif associé
US11978912B2 (en) * 2020-11-19 2024-05-07 The Research Foundation For The State University Of New York Atomically dispersed platinum-group metal-free catalysts and method for synthesis of the same

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130044808A1 (en) * 2010-02-12 2013-02-21 Fujitsu Limited Image encoding device and image decoding device

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101553850B1 (ko) * 2008-10-21 2015-09-17 에스케이 텔레콤주식회사 동영상 부호화/복호화 장치 및 그를 위한 적응적 가중치를 사용하는 적응 중첩 블록 움직임 보상 방법 및 장치
EP2348732A4 (fr) * 2008-11-10 2012-05-09 Lg Electronics Inc Procede et dispositif de traitement de signal video par prediction inter-vues
WO2012042646A1 (fr) * 2010-09-30 2012-04-05 富士通株式会社 Appareil de codage de vidéo de mouvement, procédé de codage de vidéo de mouvement, programme informatique de codage de vidéo de mouvement, appareil de décodage de vidéo de mouvement, procédé de décodage de vidéo de mouvement, programme informatique de décodage de vidéo de mouvement
FR2977111A1 (fr) * 2011-06-24 2012-12-28 France Telecom Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
JP2014528190A (ja) * 2011-08-12 2014-10-23 テレフオンアクチーボラゲット エル エム エリクソン(パブル) カメラおよび/または深度パラメータのシグナリング
GB2496197A (en) * 2011-11-07 2013-05-08 Sony Corp Frequency Domain Video Data Reordering for Encoding
EP4020989A1 (fr) * 2011-11-08 2022-06-29 Nokia Technologies Oy Manipulation d'images de référence
KR101830885B1 (ko) * 2012-04-16 2018-02-21 삼성전자주식회사 영상의 레퍼런스 픽쳐 세트를 결정하기 위한 방법 및 장치
WO2014115283A1 (fr) * 2013-01-24 2014-07-31 シャープ株式会社 Dispositif de décodage d'image et dispositif de codage d'image
JP6505026B2 (ja) * 2013-07-10 2019-04-24 シャープ株式会社 符号化方法
FR3012714A1 (fr) * 2013-10-25 2015-05-01 Orange Procede de codage et de decodage d'images, dispositif de codage et de decodage d'images et programmes d'ordinateur correspondants
JP6268989B2 (ja) * 2013-11-29 2018-01-31 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
US10560710B2 (en) * 2014-01-03 2020-02-11 Qualcomm Incorporated Method for coding recovery point supplemental enhancement information (SEI) messages and region refresh information SEI messages in multi-layer coding
US20170006289A1 (en) * 2014-03-14 2017-01-05 Samsung Electronics Co., Ltd. Image encoding method for sample value compensation and apparatus therefor, and image decoding method for sample value compensation and apparatus therefor
JP6417815B2 (ja) * 2014-09-19 2018-11-07 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
WO2016056550A1 (fr) * 2014-10-08 2016-04-14 シャープ株式会社 Dispositif de décodage d'image
US10142626B2 (en) * 2014-10-31 2018-11-27 Ecole De Technologie Superieure Method and system for fast mode decision for high efficiency video coding
US11223852B2 (en) * 2016-03-21 2022-01-11 Qualcomm Incorporated Coding video data using a two-level multi-type-tree framework

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130044808A1 (en) * 2010-02-12 2013-02-21 Fujitsu Limited Image encoding device and image decoding device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KOYAMA J ET AL: "Coefficient sign bit compression in video coding", 2012 PICTURE CODING SYMPOSIUM (PCS 2012) : KRAKOW, POLAND, 7 - 9 MAY 2012 ; [PROCEEDINGS], IEEE, PISCATAWAY, NJ, 7 May 2012 (2012-05-07), pages 385 - 388, XP032449909, ISBN: 978-1-4577-2047-5, DOI: 10.1109/PCS.2012.6213370 *

Also Published As

Publication number Publication date
CN108781292B (zh) 2022-07-12
FR3046321B1 (fr) 2018-01-26
JP2022043029A (ja) 2022-03-15
EP3398330A1 (fr) 2018-11-07
US10687082B2 (en) 2020-06-16
WO2017115028A1 (fr) 2017-07-06
KR20180133378A (ko) 2018-12-14
JP2019507521A (ja) 2019-03-14
US20190007706A1 (en) 2019-01-03
CN108781292A (zh) 2018-11-09

Similar Documents

Publication Publication Date Title
WO2015197945A1 (fr) Procédé de codage d&#39;une image numérique, procédé de décodage, dispositifs, et programmes d&#39;ordinateurs associés
EP2985998B1 (fr) Support d&#39;enregistrement mémorisant un flux de données d&#39;images codées
EP3061246B1 (fr) Procédé de codage et de décodage d&#39;images, dispositif de codage et de décodage d&#39;images et programmes d&#39;ordinateur correspondants
EP3490258A1 (fr) Procédé et support d&#39;enregistrement mémorisant un flux de données d&#39;images codées
EP3398330A1 (fr) Procédé de codage d&#39;une image numérique, procédé de décodage, dispositifs, terminal d&#39;utilisateur et programmes d&#39;ordinateurs associés
FR3038196A1 (fr) Procede de codage d&#39;une image numerique, procede de decodage, dispositifs et programmes d&#39;ordinateurs associes
EP3058737A1 (fr) Procédé de codage et de décodage d&#39;images, dispositif de codage et de décodage d&#39;images et programmes d&#39;ordinateur correspondants
EP3075155B1 (fr) Procédé de codage et de décodage d&#39;images, dispositif de codage et de décodage d&#39;images et programmes d&#39;ordinateur correspondants
EP3646597B1 (fr) Procédé de décodage d&#39;une image, procédé de codage, dispositifs, équipement terminal et programmes d&#39;ordinateurs associés
EP3238449A1 (fr) Procede de codage d&#39;une image numerique, procede de decodage, dispositifs et programmes d&#39;ordinateurs associes
FR3057130B1 (fr) Procede de codage d&#39;une image, procede de decodage, dispositifs, equipement terminal et programmes d&#39;ordinateurs associes
EP3158749B1 (fr) Procédé de codage et de décodage d&#39;images, dispositif de codage et de décodage d&#39;images et programmes d&#39;ordinateur correspondants
FR3047379A1 (fr) Procede de codage et decodage de donnees, dispositif de codage et decodage de donnees et programmes d&#39;ordinateur correspondants
WO2016097556A1 (fr) Procédé de codage d&#39;une image numérique, procédé de décodage, dispositifs, terminal d&#39;utilisateur et programmes d&#39;ordinateurs associes
FR3057429A1 (fr) Procede de codage d&#39;une image numerique, procede de decodage, dispositifs et programmes d&#39;ordinateurs associes
FR3064145A1 (fr) Procede de codage et decodage d&#39;images, dispositif de codage et decodage et programmes d&#39;ordinateur correspondants
FR3057131A1 (fr) Procede de codage d&#39;une image numerique, procede de decodage, dispositifs, terminal et programmes d&#39;ordinateurs associes

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 2

PLSC Publication of the preliminary search report

Effective date: 20170630

PLFP Fee payment

Year of fee payment: 3

ST Notification of lapse

Effective date: 20190906