FR2951346A1 - Procede de codage multivues et procede de decodage correspondant - Google Patents

Procede de codage multivues et procede de decodage correspondant Download PDF

Info

Publication number
FR2951346A1
FR2951346A1 FR0957023A FR0957023A FR2951346A1 FR 2951346 A1 FR2951346 A1 FR 2951346A1 FR 0957023 A FR0957023 A FR 0957023A FR 0957023 A FR0957023 A FR 0957023A FR 2951346 A1 FR2951346 A1 FR 2951346A1
Authority
FR
France
Prior art keywords
view
block
coding
image
current block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
FR0957023A
Other languages
English (en)
Inventor
Vincent Bottreau
Paul Kerbiriou
Guillaume Boisson
Patrick Lopez
David Touze
Yannick Olivier
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Priority to FR0957023A priority Critical patent/FR2951346A1/fr
Priority to PCT/EP2010/064837 priority patent/WO2011042440A1/fr
Publication of FR2951346A1 publication Critical patent/FR2951346A1/fr
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction

Abstract

L'invention concerne un procédé de codage multivues d'une séquence d'images se présentant sous la forme d'une première vue et d'au moins une vue additionnelle. Le procédé comprend les étapes suivantes : - coder (10) les images de la première vue en un flux de données codées ; et - coder (12, 14, 16), dans le flux de données codées, les images de la vue additionnelle à partir de données de prédiction. Le codage (12, 14, 16) d'un bloc courant d'une image de la vue additionnelle, dite image courante, comprend les étapes suivantes : - déterminer (12), selon un mode de prédiction scalable SVC, des données de prédiction pour le bloc courant à partir de données correspondantes associées à au moins un bloc de référence d'une image de la première vue, dite image de référence, non colocalisé ; - coder (14) le bloc courant à partir des données de prédiction ; - coder (16) pour le bloc courant des données indiquant la position du bloc référence par rapport au bloc de l'image de référence colocalisé au bloc courant.

Description

PROCEDE DE CODAGE MULTIVUES ET PROCEDE DE DECODAGE CORRESPONDANT
1. Domaine de l'invention L'invention se rapporte au domaine général du codage d'image. L'invention concerne un procédé de codage multivues d'une séquence d'images et un procédé de décodage correspondant.
2. Etat de l'art Le codage multivues comprend le codage de séquences d'images représentant une même scène capturée avec différents angles de vue. Plus généralement, le codage multivues comprend le codage de séquences d'images représentant une même scène capturée dans différentes conditions, p.ex. angle de prise de vue, exposition, etc. Chaque séquence d'images représente donc une vue particulière de la scène. Il est connu pour coder de telles vues d'utiliser l'information redondante qui existe entre elles. A cet effet, une des vues est généralement codée indépendamment des autres vues selon un procédé de codage monovue connu. Un procédé de codage conforme à la norme de codage H.264/AVC est un exemple d'un tel procédé de codage monovue. Sur la figure 1, les images de la vue j sont donc codées indépendamment des images de la vue i, p.ex. conformément à la norme H.264/AVC ou encore la norme MPEG-2 Video. Les images de la vue i sont ensuite codées notamment à partir des images de la vue j. Plus précisément, un bloc X de la vue i est codé soit classiquement selon un procédé de codage monovue (p.ex. conforme à H.264/AVC ou MPEG-2 Video) à partir de blocs de la même vue i préalablement codés et reconstruits (flèches en trait plein sur la figure 1), soit selon un procédé de codage inter-vues (p.ex. conforme à l'Annexe H û l'extension multivue dite MVC û de la norme ITU-T Rec. H.264 / ISO/IEC 14496-10) à partir d'un bloc Z non nécessairement colocalisé de l'image de la vue j qui coïncide temporellement avec l'image T de la vue i à laquelle appartient le bloc X (flèche en traits pointillés sur la figure 1). Selon une variante connue illustrée par la figure 2, le bloc X de la vue i est codé selon un procédé de codage inter-couche également connu sous le nom de codage scalable à partir du bloc X colocalisé et des éventuellement de blocs voisins (e.g. A, B, C, etc) de l'image T de la vue j qui coïncide temporellement avec l'image T de la vue i à laquelle appartient le bloc X (flèche en pointillés sur la figure 2). Un procédé de codage conforme à la norme de codage SVC (acronyme anglais de « Scalable Video Coding ») est un exemple d'un tel procédé de codage inter-couche. Un tel procédé de codage, de type SVC, comprend la prédiction du bloc X de la vue i selon l'un des modes de prédiction définis dans l'Annexe G de la norme ITU-T Rec. H.264 / ISO/IEC 14496-10. La prédiction du bloc X comprend la prédiction de données associées au bloc X à partir de données correspondantes associées au bloc X de la vue j. Ces données sont par exemple des données de texture, des données de mouvement (p.ex. vecteurs de mouvement, indices d'image de référence, partitionnement en sous-blocs) ou encore des données résiduelles. Les procédés de codage SVC et MVC décrits restent limités en termes d'efficacité de codage et ne peuvent pas être utilisés conjointement.
3. Résumé de l'invention L'invention a pour but de pallier au moins un des inconvénients de l'art antérieur.
L'invention concerne un procédé de codage multivues d'une séquence d'images se présentant sous la forme d'une première vue et d'au moins une vue additionnelle, chacune des vues comprenant des images de la séquence divisées en blocs. Le procédé de codage comprend les étapes suivantes : - coder les images de la première vue en un flux de données codées ; et - coder, dans le flux de données codées, les images de la vue additionnelle à partir de données de prédiction. Le codage d'au moins un bloc courant d'une image de la vue additionnelle, dite image courante, comprend les étapes suivantes : - déterminer, selon un mode de prédiction scalable SVC, des données de prédiction pour le au moins un bloc courant à partir de données correspondantes associées à au moins un bloc de référence d'une image de la première vue, dite image de référence, non colocalisé ; - coder le au moins un bloc courant à partir des données de prédiction ; - coder pour le bloc courant des données indiquant la position du au moins un bloc référence par rapport au bloc de la image de référence colocalisé au bloc courant. Le procédé de codage selon l'invention permet avantageusement d'augmenter l'efficacité de codage de plusieurs vues d'une même scène. Selon un aspect particulier de l'invention, la image courante et la image de référence ne coïncident pas temporellement et, pour le au moins un bloc courant, une donnée d'identification de la image de référence est codée dans le flux de données codées.
Selon une caractéristique particulière, les données de prédiction pour le au moins un bloc courant sont des données de mouvement et/ou des données de texture et/ou des données résiduelles. Selon un autre aspect particulier de l'invention, la vue additionnelle comprend les mêmes images que les images de la première vue avec une exposition différente et, pour le au moins un bloc courant, au moins une donnée représentative d'une variation d'exposition entre le bloc courant et le bloc de référence est codé dans le flux de données codées.
L'invention concerne également un procédé de décodage d'un flux de données codées représentatif d'une séquence d'images se présentant sous la forme d'une première vue et d'au moins une vue additionnelle, chacune des vues comprenant des images de la séquence divisées en blocs, le procédé de décodage comprenant les étapes suivantes : - reconstruire les images de la première vue à partir du décodage d'au moins 25 une première partie du flux de données codées; et - reconstruire les images de la vue additionnelle à partir du décodage d'au moins une deuxième partie du flux de données codées et de données de prédiction. La reconstruction d'au moins un bloc courant d'une image de la vue 30 additionnelle, dite image courante, comprend les étapes suivantes : - décoder pour le bloc courant des données indiquant la position d'au moins un bloc référence d'une image de la première vue, dite image de référence, par rapport au bloc de la image de référence, colocalisé au bloc courant. - déterminer, selon un mode de prédiction scalable SVC, des données de prédiction pour le au moins un bloc courant à partir de données correspondantes associées au moins un bloc de référence; et - reconstruire le au moins un bloc courant à partir des données de prédiction.
4. Listes des figures L'invention sera mieux comprise et illustrée au moyen d'exemples de modes de réalisation et de mise en oeuvre avantageux, nullement limitatifs, en référence aux figures annexées sur lesquelles : les figures 1 et 2 illustrent deux vues d'une même scène et les modes de codage selon l'état de l'art; la figure 3 illustre le procédé de codage selon l'invention ; les figures 4 et 5 illustrent deux vues d'une même scène et les modes de codage selon l'invention ; et la figure 6 illustre le procédé de codage selon l'invention.
5. Description détaillée de l'invention L'invention concerne un procédé de codage multivues, p.ex. conforme à MVC, illustré sur les figures 3 et 4. A l'étape 10, les images d'une première vue (vue j) sont codés classiquement selon un procédé de codage monovue. A titre d'exemple, un bloc X de la première vue est codé par prédiction temporelle (mode INTER) ou par prédiction spatiale (mode INTRA) à partir de blocs de la même vue préalablement codés et reconstruits. Les données résiduelles obtenues en extrayant, généralement en soustrayant, du bloc X des données de prédiction sont transformées, p.ex. avec une DCT (acronyme anglais de « Discrete Cosine Transform »), quantifiées et codées par codage entropique de type VLC (acronyme anglais de « Variable Length Coding ») en un flux de données codées. A l'étape 12, des données de prédiction sont déterminées, selon un mode de prédiction scalable de type SVC, pour le bloc X de l'image T de la vue i, appelée vue additionnelle, à partir de données correspondantes associées à au moins un bloc K non colocalisé d'une image T de la première vue j. Le bloc X est appelé bloc courant et le bloc K bloc de référence. Comme décrit en référence à la figure 2, les données de prédiction sont par exemple des données de texture, des données de mouvement ou encore des données résiduelles. A l'étape 14, le bloc X de l'image T de la vue i est codé à partir des données prédites à l'étape 12. A l'étape 16, des données additionnelles (dx, dy) indiquant la position du bloc de référence K de la première vue par rapport au bloc colocalisé au bloc X courant sont également codées. Le bloc de la première vue (vue j) colocalisé au bloc au bloc X de la vue additionnelle (vue i) est également noté X sur la figure 4.
Selon une variante représentée sur la figure 5, le bloc K appartient à une image préalablement codée et reconstruite (e.g. image T-1 ou image T+1) qui ne coïncide pas temporellement avec l'image à laquelle appartient le bloc X de la vue i. Dans ce cas, le procédé de codage selon l'invention comprend le codage pour le bloc X de la vue i d'une donnée d'identification de l'image à laquelle appartient le bloc K.
Selon une caractéristique particulière de l'invention, les images de la vue additionnelle sont les mêmes images que les images de la première vue avec une exposition différente, i.e. plus forte ou plus faible. Dans ce cas, le procédé de codage selon l'invention comprend le codage, pour le bloc X de la vue i, d'au moins une donnée représentative de la variation d'exposition entre le bloc X de la vue i et le bloc K. A titre d'exemple, deux données représentatives de la différence d'exposition sont codées : une valeur de poids a et une valeur de seuil 3. A titre d'exemple, la texture intra T(X, i) ou respectivement le résidu R(X, i) du bloc X de la vue i peuvent être prédits à partir de la texture intra T(K, j) ou respectivement du résidu R(K, j) du bloc K de la vue j selon la formule T(K, j) = a * T(X, i) + 3, respectivement R(K, j) = a *R(X,i)+(3.. Selon une autre caractéristique particulière, deux vues additionnelles sont codées, l'une des deux vues additionnelles comprenant les mêmes images que les images de la première vue avec une exposition plus faible et l'autre vue additionnelle comprenant les mêmes images que les images de la première vue avec une exposition plus forte.
L'invention concerne également un procédé de décodage illustré sur la figure 6. A l'étape 20, les images d'une première vue (vue j) sont reconstruites classiquement selon un procédé de décodage monovue. A titre d'exemple, un bloc X de la première vue est reconstruit par prédiction temporelle (mode INTER) ou par prédiction spatiale (mode INTRA) à partir de blocs de la même vue préalablement reconstruits. Cette étape met en oeuvre les étapes inverses de celles décrites pour l'étape 10 notamment décodage entropique, quantification inverse, transformation inverse. A l'étape 22, des données (dx, dy) indiquant la position d'un bloc de référence K de la première vue par rapport au bloc colocalisé au bloc X courant sont décodées. Le bloc de la première vue (vue j) colocalisé au bloc au bloc X de la vue additionnelle (vue i) est également noté X sur la figure 4. A l'étape 24, des données de prédiction sont déterminées, selon un mode de prédiction scalable de type SVC, pour le bloc X de l'image T de la vue i à partir de données correspondantes associées à au moins un bloc K non colocalisé de l'image T de la première vue j. Comme décrit en référence à la figure 2, les données de prédiction sont par exemple des données de texture, des données de mouvement ou encore des données résiduelles. A l'étape 26, le bloc X de l'image T de la vue i est reconstruit à partir des données prédites à l'étape 12.30

Claims (5)

  1. Revendications1. Procédé de codage multivues d'une séquence d'images se présentant sous la forme d'une première vue et d'au moins une vue additionnelle, chacune desdites vues comprenant des images de ladite séquence divisées en blocs, ledit procédé de codage comprenant les étapes suivantes : - coder (10) les images de la première vue en un flux de données codées ; - coder (12, 14, 16), dans ledit flux de données codées, les images de la vue additionnelle à partir de données de prédiction; caractérisé en ce que le codage (12, 14, 16) d'au moins un bloc courant d'une image de la vue additionnelle, dite image courante, comprend les étapes suivantes : - déterminer (12), selon un mode de prédiction scalable SVC, des données de prédiction pour ledit au moins un bloc courant à partir de données correspondantes associées à au moins un bloc de référence d'une image de ladite première vue, dite image de référence, non colocalisé ; - coder (14) ledit au moins un bloc courant à partir desdites données de prédiction ; - coder (16) pour ledit bloc courant des données indiquant la position dudit au moins un bloc référence par rapport au bloc de ladite image de référence colocalisé audit bloc courant.
  2. 2. Procédé de codage selon la revendication 1, dans lequel ladite image courante et ladite image de référence ne coïncident pas temporellement et dans lequel, pour ledit au moins un bloc courant, une donnée d'identification de ladite image de référence est codée dans ledit flux de données codées.
  3. 3. Procédé de codage selon la revendication 1 ou 2, dans lequel lesdites données de prédiction pour ledit au moins un bloc courant sont des données de mouvement et/ou des données de texture et/ou des données résiduelles.
  4. 4. Procédé de codage selon la revendication 1 à 3, dans lequel ladite vue additionnelle comprend les mêmes images que les images de ladite première vue avec une exposition différente et dans lequel, pour ledit au moins un bloc courant, au moins une donnée représentative d'une variation d'exposition entre ledit bloc courant et ledit bloc de référence est codé dans ledit flux de données codées.
  5. 5. Procédé de décodage d'un flux de données codées représentatif d'une séquence d'images se présentant sous la forme d'une première vue et d'au moins une vue additionnelle, chacune desdites vues comprenant des images de ladite séquence divisées en blocs, ledit procédé de décodage comprenant les étapes suivantes : - reconstruire (20) les images de la première vue à partir du décodage d'au moins une première partie dudit flux de données codées; - reconstruire (22, 24, 26) les images de la vue additionnelle à partir du décodage d'au moins une deuxième partie dudit flux de données codées et de données de prédiction; caractérisé en ce que la reconstruction (22, 24, 26) d'au moins un bloc courant d'une image de la vue additionnelle, dite image courante, comprend les étapes suivantes : - décoder (22) pour ledit bloc courant des données indiquant la position d'au moins un bloc référence d'une image de ladite première vue, dite image de référence, par rapport au bloc de ladite image de référence, colocalisé audit bloc courant. - déterminer (24), selon un mode de prédiction scalable SVC, des données de prédiction pour ledit au moins un bloc courant à partir de données correspondantes associées audit moins un bloc de référence; et - reconstruire (26) ledit au moins un bloc courant à partir desdites données de prédiction.30
FR0957023A 2009-10-08 2009-10-08 Procede de codage multivues et procede de decodage correspondant Pending FR2951346A1 (fr)

Priority Applications (2)

Application Number Priority Date Filing Date Title
FR0957023A FR2951346A1 (fr) 2009-10-08 2009-10-08 Procede de codage multivues et procede de decodage correspondant
PCT/EP2010/064837 WO2011042440A1 (fr) 2009-10-08 2010-10-05 Procédé de codage multivue et procédé de décodage correspondant

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0957023A FR2951346A1 (fr) 2009-10-08 2009-10-08 Procede de codage multivues et procede de decodage correspondant

Publications (1)

Publication Number Publication Date
FR2951346A1 true FR2951346A1 (fr) 2011-04-15

Family

ID=42224532

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0957023A Pending FR2951346A1 (fr) 2009-10-08 2009-10-08 Procede de codage multivues et procede de decodage correspondant

Country Status (2)

Country Link
FR (1) FR2951346A1 (fr)
WO (1) WO2011042440A1 (fr)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2859724B1 (fr) * 2012-06-22 2019-09-04 MediaTek Inc. Procédé et appareil d'intra-prédiction adaptative pour le codage inter-couche

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008051041A1 (fr) * 2006-10-25 2008-05-02 Electronics And Telecommunications Research Institute Codage et décodage échelonnables de vidéo multivue
WO2008136607A1 (fr) * 2007-05-02 2008-11-13 Samsung Electronics Co., Ltd. Procédé et appareil de codage et de décodage de données vidéo multifenêtres

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008051041A1 (fr) * 2006-10-25 2008-05-02 Electronics And Telecommunications Research Institute Codage et décodage échelonnables de vidéo multivue
WO2008136607A1 (fr) * 2007-05-02 2008-11-13 Samsung Electronics Co., Ltd. Procédé et appareil de codage et de décodage de données vidéo multifenêtres

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LIQUAN SHEN, GUORUI FENG, ZHI LIU, ZHAOYANG ZHANG, AND PING AN: "Macroblock-level adaptive search range algorithm for motion estimation in multiview video coding", JOURNAL OF ELECTRONIC IMAGING SPIE, vol. 18, no. 3, 033003, 6 July 2009 (2009-07-06), pages 1 - 8, XP002586165, Retrieved from the Internet <URL:http://spiedl.aip.org/getpdf/servlet/GetPDFServlet?filetype=pdf&id=JEIME5000018000003033003000001&idtype=cvips&prog=normal> [retrieved on 20100608], DOI: 10.1117/1.3167850 *
MERKLE P ET AL: "Efficient Prediction Structures for Multiview Video Coding", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, IEEE SERVICE CENTER, PISCATAWAY, NJ, US LNKD- DOI:10.1109/TCSVT.2007.903665, vol. 17, no. 11, 1 November 2007 (2007-11-01), pages 1461 - 1473, XP011195138, ISSN: 1051-8215 *

Also Published As

Publication number Publication date
WO2011042440A1 (fr) 2011-04-14

Similar Documents

Publication Publication Date Title
KR101365575B1 (ko) 인터 예측 부호화, 복호화 방법 및 장치
KR101590511B1 (ko) 움직임 벡터 부호화/복호화 장치 및 방법과 그를 이용한 영상 부호화/복호화 장치 및 방법
EP3777189A1 (fr) Codage vidéo basé sur une super-résolution niveau bloc
EP1601208A2 (fr) Méthode, appareil et support lisible par ordinateur pour le codage/decodage prédictif
US20100309975A1 (en) Image acquisition and transcoding system
US20060165302A1 (en) Method of multi-layer based scalable video encoding and decoding and apparatus for the same
US20190014333A1 (en) Inter-layer prediction for scalable video coding
KR101098739B1 (ko) 비디오 신호의 부호화/복호화 장치 및 방법
US20150312575A1 (en) Advanced video coding method, system, apparatus, and storage medium
US20080107181A1 (en) Method of and apparatus for video encoding and decoding based on motion estimation
KR100694137B1 (ko) 동영상 부호화 장치, 동영상 복호화 장치, 및 그 방법과,이를 구현하기 위한 프로그램이 기록된 기록 매체
JP2014524707A (ja) 非対称な空間解像度を持つ3次元ビデオ
FR2948845A1 (fr) Procede de decodage d&#39;un flux representatif d&#39;une sequence d&#39;images et procede de codage d&#39;une sequence d&#39;images
KR101924088B1 (ko) 적응적 예측 블록 필터링을 이용한 영상 부호화/복호화 장치 및 방법
KR101375667B1 (ko) 영상의 부호화, 복호화 방법 및 장치
FR3008840A1 (fr) Procede et dispositif de decodage d&#39;un train scalable representatif d&#39;une sequence d&#39;images et procede et dispositif de codage correspondants
WO2007060071A1 (fr) Procede et dispositif de codage d&#39;une image video
Xu et al. The impact of bitrate and GOP pattern on the video quality of H. 265/HEVC compression standard
KR20180042899A (ko) 적응적 보간 필터를 사용하는 비디오 코딩 방법 및 장치
WO2013114028A1 (fr) Codage et decodage par heritage progressif
EP3972246A1 (fr) Procédé de codage et de décodage d&#39;images, dispositif de codage et de décodage d&#39;images et programmes d&#39;ordinateur correspondants
FR2951346A1 (fr) Procede de codage multivues et procede de decodage correspondant
FR2933837A1 (fr) Procede de codage, procede et dispositif de transcodage et flux de donnees image codees.
Mir et al. Rate distortion analysis of high dynamic range video coding techniques
KR101582495B1 (ko) 움직임 벡터 부호화/복호화 장치 및 방법과 그를 이용한 영상 부호화/복호화 장치 및 방법