ES2752001T3 - Predicción de imágenes por determinación previa de una familia de píxeles de referencia, codificación y decodificación que usan dicha predicción - Google Patents
Predicción de imágenes por determinación previa de una familia de píxeles de referencia, codificación y decodificación que usan dicha predicción Download PDFInfo
- Publication number
- ES2752001T3 ES2752001T3 ES09742264T ES09742264T ES2752001T3 ES 2752001 T3 ES2752001 T3 ES 2752001T3 ES 09742264 T ES09742264 T ES 09742264T ES 09742264 T ES09742264 T ES 09742264T ES 2752001 T3 ES2752001 T3 ES 2752001T3
- Authority
- ES
- Spain
- Prior art keywords
- prediction
- pixel
- pixels
- partition
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/649—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding the transform being applied to non rectangular image segments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/19—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/57—Motion estimation characterised by a search window with variable size or shape
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Procedimiento de predicción de particiones de al menos un grupo de píxeles en una imagen (IE) para codificación, con respecto a un grupo de píxeles de referencia, estando el grupo de píxeles descompuesto previamente en una pluralidad de particiones que no se superponen, de manera que una partición actual para predicción se predice en referencia a al menos una partición que la precede inmediatamente y que ha sido codificada y después decodificada, con el procedimiento caracterizado porque el grupo de píxeles de referencia se obtiene mediante el cálculo de una función parametrizada según un modo de predicción predeterminado, perteneciendo los píxeles de referencia de dicho grupo obtenido a al menos una partición diferente de la partición actual y siendo susceptibles de variar de una partición a otra, y porque para cada píxel de una partición actual para predicción, dicha función determina, a partir de un conjunto de píxeles de referencia que pueden ser seleccionados para predecir el píxel considerado según el modo de predicción predeterminado, al menos dos píxeles de referencia de tal manera que la distancia que separa cada uno de ellos del píxel considerado es la menor en comparación con las distancias que se han estimado para los otros píxeles de referencia del conjunto.
Description
DESCRIPCIÓN
Predicción de imágenes por determinación previa de una familia de píxeles de referencia, codificación y decodificación que usan dicha predicción
Antecedentes de la invención
La presente invención se refiere de manera general al dominio del tratamiento de imágenes, y más exactamente a la codificación y a la decodificación de imágenes digitales y de secuencias de imágenes digitales.
Se sabe que las imágenes y secuencias de imágenes digitales ocupan mucho espacio en memoria, lo que obliga, cuando se transmiten estas imágenes, a comprimirlas para evitar los problemas de congestión en la red de comunicación usada para esta transmisión, siendo la velocidad que puede usarse en la misma generalmente limitada.
La norma H.264/MPEG-4 AVC (del inglés Advanced Video Coding), tal como se presenta en el documento ISO/IEC 14496-10, describe en particular una técnica según la cual unos grupos de píxeles, denominados bloques o macrobloques, de una imagen actual son objeto de predicción espacialmente con respecto a otros bloques o macrobloques que pertenecen a la misma imagen. Es lo que se denomina codificación intratrama (Intra-frame-coding). Después de esta codificación predictiva, los bloques de píxeles son transformados, y posteriormente cuantificados. Los coeficientes de los bloques de píxeles cuantificados son recorridos a continuación en un orden de lectura que permite aprovechar el importante número de coeficientes nulos en las altas frecuencias, que después son codificados por una codificación entrópica.
Más exactamente, durante la codificación predictiva de un macrobloque según la norma citada anteriormente, con la excepción de un macrobloque de tipo 16 x 16, el macrobloque se descompone generalmente según una pluralidad de particiones que tienen generalmente la forma de bloques de menor tamaño y cuyo contorno es rectangular o cuadrado. La predicción espacial de dicho macrobloque en una imagen consiste en predecir cada bloque de menor tamaño que forma este macrobloque con respecto a uno o varios bloques de otro macrobloque de esta misma imagen, denominado macrobloque de referencia. Esta predicción solo es posible si el macrobloque de referencia está cerca del macrobloque para predicción y se encuentra en ciertas direcciones predeterminadas con respecto a este, es decir, generalmente encima y a la izquierda, en una proximidad denominada «causal».
Así, por ejemplo, en el caso de un macrobloque de tipo 16 x 16, la predicción de píxeles que están situados debajo y a la derecha de este macrobloque se efectúa necesariamente con respecto a píxeles de referencia que están situados encima y a la izquierda del macrobloque. Dichos píxeles de referencia están muy alejados espacialmente de los píxeles para predicción.
Por tanto, la precisión de dicho tipo de predicción no está optimizada, sobre todo en el caso de macrobloques que tienen una actividad espacial elevada, es decir, en el caso en que la imagen para codificación presenta numerosos detalles.
Por otra parte, dicho tipo de predicción carece de flexibilidad ya que para predecir los píxeles de una misma partición, obliga a elegir:
- píxeles de referencia agrupados siempre en forma de un bloque o macrobloque y que tienen a menudo el mismo número, de manera que estos píxeles de referencia no están adaptados necesariamente para predecir particiones que tienen una forma diferente a la de un rectángulo o un cuadrado,
- siempre el o los mismos píxeles de referencia con independencia de cuál sea la partición actual para predicción, para un modo de predicción predeterminado,
- siempre la o las mismas particiones de referencia, de manera que el alejamiento espacial elevado con respecto a algunos de los píxeles de la partición sujeta a predicción puede suponer un perjuicio para la exactitud de la predicción,
- siempre la o las mismas direcciones de predicción, sin tener en cuenta la posición concreta de cada píxel de la partición sujeta a predicción.
El documento de Wiegand T. y col.: "Overview of the H.264/AVC Video Coding Standard", IEEE Transactions of Circuits and Systems for Video Technology, IEEE Service Center, Piscataway, NJ, EE. UU., vol. 13, n.° 7, julio de 2003 (2003-07), páginas 560-576, ISSN: 1051-8215 describe la codificación de vídeo según la norma H.264/AVC.
La presente invención pretende resolver los inconvenientes de la técnica anterior suministrando un procedimiento y un dispositivo de predicción que permite, para cada píxel para predicción, una personalización de su predicción, con el fin de optimizar la exactitud de la predicción de cada píxel.
Objetivo y resumen de la invención
Para este fin, la invención propone un procedimiento de predicción de particiones de al menos un grupo de píxeles en
una imagen para codificación, con respecto a un grupo de píxeles de referencia, de manera que el grupo de píxeles se obtiene mediante el cálculo de una función característica de un modo de predicción predeterminado, pudiendo los píxeles de referencia del grupo obtenido variar de una partición a otra. La invención se define mediante las reivindicaciones adjuntas; los ejemplos denominados «características ventajosas» son ejemplos ilustrativos.
Dicha predicción de particiones de píxeles se basa así ventajosamente en una regla que determina exactamente una familia o grupo de píxeles de referencia que se usarán, y el número de píxeles de esta familia que se usarán para la predicción de cada píxel. En consecuencia, la predicción de cada píxel de una partición actual para predicción es variable, en el sentido de que los píxeles de referencia usados para predecir un píxel actual pueden ser diferentes de los que han servido para predecir el píxel precedente, si no sucediera que los píxeles de referencia citados anteriormente responden todos a un mismo modo de predicción. Como consecuencia dicha predicción se efectúa con independencia del número de píxeles de un grupo de píxeles de referencia y de la forma según la cual se agrupan los píxeles de referencia, lo que permite obtener una predicción mucho más exacta que las predicciones intratrama clásicas.
Según una característica ventajosa, cuando una partición sujeta a predicción contiene un contorno que prolonga un contorno de referencia, un modo de predicción se define mediante la elección, para al menos un píxel para predicción situado en una posición determinada con respecto al contorno de la partición sujeta a predicción, de al menos un píxel de referencia situado en la misma posición que dicho píxel para predicción, con respecto al contorno de referencia.
Dicha predicción se basa en píxeles de referencia obtenidos mediante una función que tiene en cuenta los contornos contenidos en bloques o macrobloques de referencia. Dicho de otro modo, la función citada anteriormente determina los píxeles más cercanos en una proximidad «semánticamente» idéntica, lo que permite obtener una predicción especialmente eficaz.
Según otra característica ventajosa, el modo de predicción se define mediante la elección, para al menos un píxel de una partición sujeta a predicción, de al menos un píxel de referencia que está separado del píxel para predicción una distancia predeterminada.
Dicho modo de predicción permite así determinar de forma sencilla y sin ningún otro criterio adicional, un número adecuado de píxeles de referencia situados por ejemplo lo más cerca posible del píxel para predicción, de forma que se prediga este píxel con la mayor exactitud posible.
Según otra característica ventajosa más, se define un modo de predicción mediante la elección, para al menos un píxel de una partición sujeta a predicción, de al menos un píxel de referencia situado en una dirección predeterminada, con respecto al píxel para predicción.
Según otra característica ventajosa más, la partición de píxeles para predicción tiene un tamaño y una forma cualesquiera, lo que hace que el procedimiento según la invención pueda adaptarse especialmente a cualquier tipo de partición de macrobloques para predicción.
La invención se refiere también a un procedimiento de codificación de una imagen o de una secuencia de imágenes, un procedimiento de decodificación de un flujo de datos representativo de una imagen o de una secuencia de imágenes, una señal portadora de un flujo de datos representativo de una imagen o de una secuencia de imágenes, un dispositivo de predicción de particiones de al menos un grupo de píxeles en una imagen para codificación, un dispositivo de codificación de una imagen o de una secuencia de imágenes, un dispositivo de decodificación de un flujo de datos representativo de una imagen o de una secuencia de imágenes y un programa informático según las reivindicaciones adjuntas.
Breve descripción de los dibujos
Otras características y ventajas se desprenderán de la lectura de realizaciones preferidas descritas con referencia a las figuras en las que:
- la figura 1 representa etapas del procedimiento de codificación según la invención,
- la figura 2 representa una realización de un dispositivo de codificación según la invención,
- la figura 3 representa diferentes formas de particiones que pueden ser seleccionadas en el dispositivo de codificación según la invención,
- la figura 4 representa macrobloques particionados después de la selección de las diferentes particiones iniciales representadas en la figura 3,
- la figura 5 representa dos modos de predicción que pueden caracterizar la función de predicción según la invención,
- la figura 6 representa el macrobloque particionado de la figura 4B, que se ha predicho según un modo de predicción representado en la figura 5,
- la figura 7 representa el macrobloque particionado de la figura 4C, que se ha predicho según un modo de predicción representado en la figura 5,
- la figura 8 representa una primera variante de la predicción de la figura 7,
- la figura 9 representa una segunda variante de la predicción de la figura 7,
- la figura 10 representa un modo de predicción suplementario que puede caracterizar la función de predicción según la invención,
- la figura 11 representa la estructura de un macrobloque codificado por el dispositivo de codificación según la invención,
- la figura 12 representa un dispositivo de decodificación según la invención,
- la figura 13 representa las etapas del procedimiento de decodificación según la invención.
Descripción detallada de una realización
A continuación se describirá una realización de la invención, en la que el procedimiento de codificación según la invención se usa para codificar una secuencia de imágenes según un flujo binario cercano al que se obtiene mediante una codificación según la norma H.264/MPEG-4 AVC. En esta realización, el procedimiento de codificación según la invención se implementa por ejemplo mediante software o hardware con modificaciones de un codificador inicialmente según la norma H.264/MPEG-4 AVC. El procedimiento de codificación según la invención se representa en la forma de un algoritmo que incluye las etapas C1 a C6, representadas en la figura 1.
Debe observarse que el procedimiento de decodificación según la invención se implementa simétricamente mediante software o hardware con modificaciones de un decodificador inicialmente según la norma H.264/MPEG-4 AVC. Según la realización de la invención, el procedimiento de codificación según la invención se implementa en un dispositivo de codificación CO representado en la figura 2. La codificación efectuada por el codificador CO es de tipo intratrama.
La primera etapa C1, representada en la figura 1, es la selección, para un macrobloque que pertenece a una imagen IE de la secuencia de imágenes para codificación, de una partición de píxeles particular más pequeña elegida en un conjunto predeterminado de particiones de forma predeterminada. Para ello, se aplica un macrobloque MB que pertenece a la imagen IE, por ejemplo de tamaño 8 x 8, en la entrada de un módulo SP de selección de particiones, representado en la figura 2.
Este módulo SP de selección de particiones usa por ejemplo un procedimiento de elección por competencia exhaustiva o incluso un procedimiento de elección con la ayuda de un algoritmo con a priori. Dichos procedimientos son muy conocidos para el experto en la materia (véase: G.J. Sullivan and T.Wiegand, "Rate-distortion optimization for video compression", IEEE Signal Proc. Mag., pág. 74-90, 1998). Por tanto no se describirán en lo sucesivo.
Dichas particiones se agrupan en una base de datos BD del codificador CO. Dichas particiones pueden ser de forma rectangular o cuadrada o bien tener otras formas, tales como por ejemplo formas sustancialmente lineales.
Diferentes particiones de un macrobloque, por ejemplo de tamaño 8 x 8, que pueden ser seleccionadas por el módulo de selección SP, son representadas a modo de ejemplos no limitativos en la figura 3.
La figura 3A representa una partición inicial P1 que tiene la forma de un cuadrado.
La figura 3B representa una partición inicial P1 que tiene la forma de una línea.
La figura 3C representa una partición inicial P1 que tiene la forma de una «L».
La figura 3D representa una partición inicial P1 que tiene la forma de una cruz.
La figura 3E representa una partición inicial P1 que tiene la forma de una línea quebrada que contiene segmentos verticales, horizontales y diagonales.
La figura 3F representa una partición inicial P1 que tiene la forma de una línea quebrada cuyos dos extremos se unen de manera que forman un punto. Dicha línea quebrada está determinada por ejemplo por el gradiente de un macrobloque situado en la misma posición en una imagen precedente (colocalizada).
La etapa siguiente C2 representada en la figura 1 es la descomposición del macrobloque MB según una partición inicial P1 elegida, tal como una de las representadas en la figura 3, en n particiones P1, P2,..., Pn. Dicha descomposición es efectuada por un módulo PMB de partición de macrobloques representado en la figura 2 que usa un algoritmo de partición.
La figura 4 representa los macrobloques MBpart que se han obtenido después de la descomposición según las particiones iniciales P1 representadas en la figura 3.
Como puede constatarse, el algoritmo de partición citado anteriormente se diseña de manera que las particiones P1,....,
Pn así obtenidas:
- no se superpongan en el macrobloque MBpart,
- y no tengan necesariamente el mismo número de píxeles y la misma forma que la partición P1 inicial.
La figura 4A representa un macrobloque particionado MBpart que comprende dieciséis particiones P1,..., P16, todas las cuales tienen la forma de un cuadrado y el mismo número de píxeles.
La figura 4B representa un macrobloque particionado MBpart que comprende ocho particiones P1...P8, todas las cuales tienen la forma de una línea y el mismo número de píxeles.
La figura 4C representa un macrobloque particionado MBpart que comprende ocho particiones P1...P8, todas las cuales tienen la forma de un «L», salvo la última partición P8, aunque cada una con un número diferente de píxeles. La figura 4D representa un macrobloque particionado MBpart que comprende cuatro particiones P1...P4, que tienen casi todas la forma de una cruz aunque con un número diferente de píxeles.
La figura 4E representa un macrobloque particionado MBpart que comprende cuatro particiones P1...P4 que tienen casi todas la forma de una línea quebrada que contiene segmentos verticales, horizontales y diagonales, aunque cada una con un número diferente de píxeles.
La figura 4F representa un macrobloque particionado MBpart que comprende cuatro particiones P1...P4 todas las cuales tienen la forma de una línea quebrada con los dos extremos unidos, aunque cada una con un número diferente de píxeles.
A continuación de la etapa de partición C2, durante una etapa C3 representada en la figura 1, el módulo de partición PMB transmite el macrobloque MBpart que acaba de ser particionado a un módulo de cálculo de predicción PRED representado en la figura 2.
Durante una etapa C4 representada en la figura 1, el módulo de cálculo de predicción PRED calcula diferentes predicciones posibles del macrobloque particionado MBpart recibido. Teniendo en cuenta que el codificador CO es de tipo intratrama, el módulo de cálculo de predicción PRED calcula las predicciones espaciales posibles de cada partición P1,..., Pn del macrobloque MBpart, con respecto a al menos la última partición anteriormente codificada y después decodificada.
De forma especialmente ventajosa, el módulo de cálculo de predicción PRED predice las particiones del macrobloque MBpart una tras otra, de manera que una partición actual para predicción se predice con referencia a al menos una partición que la precede inmediatamente y que ha sido codificada y después decodificada, de forma que en lo sucesivo sirva de partición de referencia.
Así, la distancia de predicción se minimiza, dado que la predicción de una partición se hace con respecto a píxeles de referencia situados cerca de los píxeles de dicha partición sujeta a predicción.
Con referencia a la figura 2 , dicha partición de referencia se codifica según la norma H.264/MPEG-4AVC, es decir, que experimenta de forma conocida de por sí:
- una codificación mediante transformada de coseno discreta y cuantificación que es efectuada por un módulo MTQ de transformada y de cuantificación,
- a continuación una decodificación mediante transformada de coseno discreta inversa y cuantificación inversa, que es efectuada por el módulo MTQI de transformada y de cuantificación inversa.
En la realización descrita se contemplan diferentes tipos de predicciones espaciales que corresponden respectivamente a órdenes de recorridos diferentes de las particiones, en los que el módulo de cálculo de predicción PRED tiene la posibilidad de predecir las particiones P1,..., Pn de un macrobloque particionado MBpart. En otros términos, el módulo de cálculo de predicción PRED tiene la posibilidad de predecir las particiones P1...Pn una tras otra, en el orden en que estas últimas se han propagado o en órdenes diferentes. Para este fin, con referencia a la figura 2, el módulo de cálculo de predicción PRED comprende un módulo de selección de orden de recorrido SOP de las particiones para predicción.
Después de la selección citada anteriormente, y siempre durante la etapa de predicción C4, un módulo de software MA calcula, para cada píxel de una partición actual Pj para predicción (1<j<n), una función que determina un número de píxeles de referencia útiles con respecto al cual cada píxel considerado está destinado a su predicción. Dichos píxeles de referencia útiles son píxeles conformes con uno o varios modos de predicción fijados previamente.
En los ejemplos de predicción que se describirán a continuación con referencia a las figuras 6 a 9 , los píxeles de referencia útiles son los situados a una distancia predeterminada del píxel actual para predicción, en particular lo más
cerca posible de este último. La elección de dicho modo de predicción permite así reducir al máximo la distancia de predicción entre un píxel actual pc para predicción y el o los píxeles de referencia, con el fin de afinar aún más la exactitud de la predicción y, por tanto, de la codificación.
De forma especialmente ventajosa, el modo de predicción citado anteriormente constituye una característica de una función matemática apta para determinar un número predeterminado de píxeles de referencia considerados como situados lo más cerca posible del píxel actual para predicción. Esta función es la calculada por el módulo de software MA.
La figura 5 ilustra dos representaciones matemáticas posibles del modo de predicción citado anteriormente que definen, para cada píxel para predicción, la posición y el número de los píxeles de referencia que se considerarán situados lo más cerca posible del píxel para predicción.
En el ejemplo representado en la figura 5A, la función matemática se define previamente para determinar sistemáticamente, para cada píxel actual pc para predicción, un número de píxeles de referencia útiles, por ejemplo los cuatro píxeles descompuestos enumerados a continuación:
- el píxel de referencia pr1 situado lo más cerca posible justo encima del píxel actual pc;
- el píxel de referencia pr2 situado lo más cerca posible justo debajo del píxel actual pc;
- el píxel de referencia pr3 situado lo más cerca posible a la izquierda del píxel actual pc, según una dirección horizontal;
- el píxel de referencia pr4 situado lo más cerca posible a la derecha del píxel actual pc, según una dirección horizontal.
Según otra alternativa representada en la figura 5B, la función matemática se define previamente para determinar, para cada píxel actual pc para predicción, cuatro píxeles de referencia suplementarios enumerados a continuación: - el píxel de referencia pr5 situado lo más cerca posible del píxel actual pc, en la dirección diagonal superior izquierda; - el píxel de referencia pr6 situado lo más cerca posible del píxel actual pc, en la dirección diagonal superior derecha; - el píxel de referencia pr7 situado lo más cerca posible del píxel actual pc, en la dirección diagonal inferior izquierda; - el píxel de referencia pr8 situado lo más cerca posible del píxel actual pc, en la dirección diagonal inferior izquierda. A continuación se describirá, con referencia a la figura 6 , un ejemplo de predicción, que se basa en el criterio de proximidad más cercano que acaba de mencionarse.
En este ejemplo se supone que:
- cada macrobloque particionado MBpart para predicción es el de la figura 4B, es decir, descompuesto en ocho particiones P1,..., P8 que tienen la forma de líneas,
- el módulo de selección de orden de recorrido SOP de particiones ha seleccionado un orden de recorrido que difiere del orden en el que se han propagado las particiones P1 a P8,
- la función matemática, que está destinada a ser calculada por el módulo de software MA, se define como en la figura 5B, con un número de píxeles de referencia fijado sistemáticamente en dos, para cada píxel actual pc para predicción.
Más exactamente, el módulo de cálculo de predicción PRED de la figura 2 recorre de izquierda a derecha una primera línea del macrobloque MBpart representado en la figura 4B que está destinada a verse afectada en la predicción de la partición inicial P1. La primera línea elegida corresponde a la última línea del macrobloque MBpart. El módulo de software MA calcula entonces, para cada píxel de dicha partición P1 para predicción, una función que determina los dos píxeles de referencia que están situados lo más cerca posible del píxel actual para predicción.
En concreto, para cada píxel de la partición P1 para predicción, la función matemática determina a partir de los ocho píxeles de referencia modelizados como en la figura 5B y que pueden ser seleccionados, los dos píxeles de referencia para los que la distancia que separa cada uno de estos últimos del píxel actual para predicción se ha estimado como la menor en comparación con las distancias que se han estimado para los otros seis píxeles de referencia.
La figura 6A representa los dos píxeles de referencia determinados por la función matemática citada anteriormente, en el caso únicamente de la predicción de los píxeles primero, quinto y octavo de la partición P1, con fines de claridad del dibujo.
Se constata así que:
- el primer píxel pc1 de la partición P1 se predice con respecto a dos píxeles de referencia que pertenecen a la partición de referencia vertical PRV de un macrobloque adyacente (no representado), que ha sido codificada, y después decodificada, como se explica anteriormente: estos dos píxeles de referencia se han determinado respectivamente como el píxel de referencia situado lo más cerca posible del píxel actual pc1, en la dirección
diagonal superior izquierda y el píxel de referencia situado lo más cerca posible a la izquierda del píxel actual pci, según una dirección horizontal;
- el quinto píxel pc5 de la partición P1 se predice con respecto a dos píxeles de referencia que pertenecen igualmente a la partición de referencia vertical PRV citada anteriormente: estos dos píxeles de referencia se han determinado respectivamente como el píxel de referencia situado lo más cerca posible del píxel actual pc1, en la dirección diagonal superior izquierda, y el píxel de referencia situado lo más cerca posible a la izquierda del píxel actual pc1, según una dirección horizontal;
- el octavo píxel pc8 de la partición P1 se predice con respecto a dos píxeles de referencia de los que uno pertenece a la partición de referencia vertical PRV citada anteriormente y el otro pertenece a la partición de referencia horizontal PRH de un macrobloque adyacente (no representado), que ha sido codificada, y después decodificada, como se explica anteriormente: estos dos píxeles de referencia se han determinado respectivamente como el píxel de referencia situado lo más cerca posible a la izquierda del píxel actual pc8, según una dirección horizontal, y el píxel de referencia situado lo más cerca posible justo encima del píxel actual pc8.
Una vez que todos los píxeles de la partición P1 han sido objeto de predicción tal como se ha descrito anteriormente, el módulo de cálculo de predicción PRED suministra una primera partición predicha que, en el caso en que sea interpretada por el codificador CO como del tipo de partición óptima, es codificada inmediatamente por el módulo de transformada y de cuantificación MTQ, y después decodificada por el módulo MTQI de transformada y de cuantificación inversa. Como resultado de estas operaciones, se obtiene una partición de referencia PR1, como se representa en la figura 6B.
El módulo de cálculo de predicción PRED recorre a continuación de izquierda a derecha una segunda línea del macrobloque MBpart que está destinada a verse afectada en la predicción de la segunda partición P2. La segunda línea elegida es la cuarta línea del macrobloque MBpart. El módulo de software MA calcula entonces, para cada píxel de dicha partición P2 para predicción, la función citada anteriormente que determina los dos píxeles de referencia situados lo más cerca posible del píxel actual para predicción.
La figura 6B representa los dos píxeles de referencia elegidos en el caso únicamente de la predicción de los píxeles primero, cuarto y séptimo de la partición P2, con fines de claridad del dibujo.
Se constata así que:
- el primer píxel pc1 de la partición P2 se predice con respecto a dos píxeles de referencia que pertenecen a la partición de referencia vertical PRV citada anteriormente: estos dos píxeles de referencia se han determinado respectivamente como el píxel de referencia situado lo más cerca posible del píxel actual pc1, en la dirección diagonal superior izquierda, y el píxel de referencia situado lo más cerca posible a la izquierda del píxel actual pc1, según una dirección horizontal;
- el cuarto píxel pc4 de la partición P2 se predice con respecto a dos píxeles de referencia que pertenecen respectivamente a la partición de referencia vertical PRV y a la partición de referencia horizontal PRH citadas anteriormente: estos dos píxeles de referencia se han determinado respectivamente como el píxel de referencia situado lo más cerca posible a la izquierda del píxel actual pc4, según una dirección horizontal, y el píxel de referencia situado lo más cerca posible justo encima del píxel actual pc4;
- el séptimo píxel pc7 de la partición P2 se predice con respecto a dos píxeles de referencia de los que uno pertenece a la partición de referencia vertical PRH citada anteriormente y el otro pertenece a la partición de referencia PR1 citada anteriormente: estos dos píxeles de referencia se han determinado respectivamente como el píxel de referencia situado lo más cerca posible justo encima del píxel actual pc7 y el píxel de referencia situado lo más cerca posible justo debajo del píxel actual pc7.
Una vez que todos los píxeles de la partición P2 han sido objeto de predicción tal como se describe anteriormente, el módulo de cálculo de predicción PRED suministra una segunda partición predicha que es codificada inmediatamente por el módulo de transformada y de cuantificación MTQ, y después decodificada por el módulo MTQI de transformada y de cuantificación inversa. Como resultado de estas operaciones, se obtiene una partición de referencia PR2, como se representa en la figura 6C.
El módulo de cálculo de predicción PRED recorre a continuación de izquierda a derecha una tercera línea del macrobloque MBpart que está destinada a verse afectada en la predicción de la tercera partición P3. La tercera línea elegida es la segunda línea del macrobloque MBpart. El módulo de software MA calcula entonces, para cada píxel de dicha partición P3 para predicción, la función citada anteriormente que determina los dos píxeles de referencia situados lo más cerca posible del píxel actual para predicción.
La figura 6C representa los dos píxeles de referencia elegidos en el caso únicamente de la predicción de los píxeles primero, segundo y cuarto de la partición P3, con fines de claridad del dibujo.
Se constata así que:
- el primer píxel peí de la partición P3 se predice con respecto a dos píxeles de referencia que pertenecen a la partición de referencia vertical PRV citada anteriormente: estos dos píxeles de referencia se han determinado respectivamente como el píxel de referencia situado lo más cerca posible del píxel actual pc1, en la dirección diagonal superior izquierda, y el píxel de referencia situado lo más cerca posible a la izquierda del píxel actual pc1, según una dirección horizontal;
- el segundo píxel pc2 de la partición P3 se predice con respecto a dos píxeles de referencia que pertenecen respectivamente a la partición de referencia vertical PRV y a la partición de referencia horizontal PRH citadas anteriormente: estos dos píxeles de referencia se han determinado respectivamente como el píxel de referencia situado lo más cerca posible a la izquierda del píxel actual pc2 , según una dirección horizontal, y el píxel de referencia situado lo más cerca posible justo encima del píxel actual pc2;
- el cuarto píxel pc4 de la partición P3 se predice con respecto a dos píxeles de referencia de los que uno pertenece a la partición de referencia vertical PRH citada anteriormente y el otro pertenece a la partición de referencia PR2 citada anteriormente: estos dos píxeles de referencia se han determinado respectivamente como el píxel de referencia situado lo más cerca posible justo encima del píxel actual pc4 y el píxel de referencia situado lo más cerca posible justo debajo del píxel actual pc4.
El módulo de cálculo de predicción PRED suministra una tercera partición predicha que es codificada inmediatamente por el módulo de transformada y de cuantificación MTQ, y después decodificada por el módulo MTQI de transformada y de cuantificación inversa. Como resultado de estas operaciones, se obtiene una partición de referencia PR3 (no representada).
Las otras particiones P4 a P8 se predicen de la misma forma que se describe anteriormente de manera que se obtiene un macrobloque predicho MBpred cuyas particiones predichas PR5, PR3,..., PR2,..., PR8, PR1 se suceden según un orden dicotómico que es diferente del orden de propagación de las particiones P1 a P8. Dicho macrobloque predicho se representa en la figura 6D.
A continuación se describirá, con referencia a la figura 7 , un ejemplo de predicción, que se basa en el criterio de proximidad más cercano que acaba de definirse, al cual se le añade un criterio direccional de proximidad.
En este ejemplo se supone que:
- cada macrobloque particionado MBpart para predicción es el de la figura 4C, es decir, descompuesto en ocho particiones P1,..., P8 que tienen forma de «L»,
- el módulo de selección de orden de recorrido SOP de particiones ha seleccionado un orden de recorrido que corresponde al orden en el que se han propagado las particiones P1 a P8,
- la función matemática, que está destinada a ser calculada por el módulo de software MA, se define como en la figura 5A, con, para cada píxel para predicción:
• un número de píxeles de referencia fijado esta vez sistemáticamente en uno,
• el píxel de referencia que debe situarse primero encima del píxel actual para predicción, en la dirección vertical. Más exactamente, el módulo de cálculo de predicción PRED de la figura 2 recorre la primera partición P1 del macrobloque MBpart representado en la figura 4C que está destinada a su predicción. El módulo de software MA calcula entonces, para cada píxel de dicha partición P1 para predicción, una función que determina el píxel de referencia que está situado el primero encima del píxel para predicción, en la dirección vertical.
Dicha función se calcula de la forma siguiente.
Sea p(x,y) el píxel para predicción, p(x,y) que pertenece a la partición pj actual, y |x| el valor de medida de la distancia x que separa el píxel para predicción de un píxel de referencia. El píxel de referencia que se usará es igual a p(x, y'), con y' = argmin |y' - y| con p(x,y') perteneciente a pi, i<j.
La figura 7A representa el píxel de referencia determinado por la función matemática citada anteriormente, en el caso únicamente de la predicción de los ocho primeros píxeles pc1 a pc8 de la partición P1, con fines de claridad del dibujo. Se constata así que los píxeles pc1 a pc8 son objeto de predicción respectivamente con respecto a ocho píxeles de referencia de la partición horizontal PRH que son inmediatamente superiores a ellos, en la dirección vertical.
Una vez que todos los píxeles de la partición P1 han sido objeto de predicción tal como se describe anteriormente, el
módulo de cálculo de predicción PRED suministra una primera partición predicha que es codificada inmediatamente por el módulo de transformada y de cuantificación MTQ, y después decodificada por el módulo MTQI de transformada y de cuantificación inversa. Como resultado de estas operaciones, se obtiene una partición de referencia PR1, como se representa en la figura 7B.
El módulo de cálculo de predicción PRED recorre a continuación la segunda partición del macrobloque MBpart destinada a su predicción. El módulo de software MA calcula entonces, para cada píxel de dicha partición P2 para predicción, una función que determina el píxel de referencia que está situado el primero encima del píxel para predicción, en la dirección vertical.
La figura 7B representa el píxel de referencia determinado por la función matemática citada anteriormente, en el caso únicamente de la predicción de los siete primeros píxeles pc1 a pc7 y del decimotercer píxel pc13 de la partición P2, con fines de claridad del dibujo.
Se constata así que los píxeles pc1 a pc7 y pc13 son objeto de predicción respectivamente con respecto a ocho píxeles de referencia de la partición de referencia PR1 que son inmediatamente superiores a ellos en la dirección vertical. En particular, los píxeles pc1 y pc13 son objeto de predicción usando el mismo píxel de referencia.
El módulo de cálculo de predicción PRED suministra una segunda partición predicha que es codificada inmediatamente por el módulo de transformada y de cuantificación MTQ, y después decodificada por el módulo MTQI de transformada y de cuantificación inversa. Como resultado de estas operaciones, se obtiene una partición de referencia PR2 (no representada).
Las otras particiones P3 a P8 son objeto de predicción de la misma forma que se describe anteriormente de manera que se obtiene un macrobloque predicho MBpred cuyas particiones predichas PR1 a PR8 se suceden en el orden en el que se han propagado las particiones P1 a P8. Dicho macrobloque predicho se representa en la figura 7C.
En una variante del modo de predicción de la figura 7 , la función matemática citada anteriormente es parametrizada para determinar, para cada píxel para predicción, dos píxeles de referencia que están situados con respecto al píxel actual para predicción, respectivamente según dos direcciones predeterminadas, en lugar de una sola.
Los dos píxeles de referencia que se considerarán son por ejemplo:
- el que está situado el primero, a la izquierda del píxel actual para predicción, en la dirección horizontal, - y el que está situado el primero encima del píxel actual para predicción, en la dirección vertical.
Dicha variante se representa en la figura 8 , para la que solo se representa la predicción de la primera partición P1. La figura 8 representa los píxeles de referencia determinados por la función matemática citada anteriormente, en el caso únicamente de la predicción de los píxeles primero, quinto y decimoprimero pci, pc5 y pc11 de la partición P1, con fines de claridad del dibujo.
En otra variante del modo de predicción de la figura 7 , la función matemática citada anteriormente es parametrizada para determinar, para cada píxel para predicción, dos píxeles de referencia que están situados con respecto al píxel actual para predicción, según una misma dirección predeterminada.
Los dos píxeles de referencia que se considerarán son por ejemplo:
- el que está situado el primero encima del píxel actual para predicción, en la dirección vertical,
- y el que está situado el segundo encima del píxel actual para predicción, en la dirección vertical.
Dicha variante se representa en la figura 9, para la que solo se representa la predicción de la segunda partición P2. La figura 9 representa los píxeles de referencia determinados por la función matemática citada anteriormente, en el caso únicamente de la predicción del tercer píxel pc3 de la partición P2, con fines de claridad del dibujo.
A continuación se describirá, con referencia a la figura 10, un modo de predicción adaptado al caso en que las particiones para predicción contienen un contorno CR que prolonga un contorno de referencia CRR. Con referencia a la figura 10, el contorno CRR y su prolongación CR se extienden por ejemplo según una dirección diagonal Dg. Dicho contorno es detectado de forma conocida de por sí por un algoritmo de detección de contorno.
En este ejemplo se supone que:
- cada macrobloque particionado MBpart para predicción es el de la figura 4C, es decir, descompuesto en ocho particiones P1,..., P8 que tienen la forma de «L»,
- el módulo de selección de orden de recorrido SOP de particiones ha seleccionado un orden de recorrido que corresponde al orden en el que se han propagado las particiones P1 a P8,
- la función matemática, que está destinada a ser calculada por el módulo de software MA, es parametrizada de manera que determine, para cada píxel para predicción:
• un número de píxeles de referencia fijado por ejemplo en dos,
• los píxeles de referencia deben situarse, con respecto al contorno de referencia CRR, en la misma posición que la del píxel para predicción con respecto al contorno CR de la partición sujeta a predicción.
La figura 10 representa los píxeles de referencia determinados por la función matemática citada anteriormente, en el caso únicamente de la predicción, tratándose de la partición P2:
- del tercer píxel pc3 que está situado a la izquierda del contorno CR,
- del cuarto píxel pc4 que está situado en el contorno CR,
- y del séptimo píxel pc7 que está situado a la derecha del contorno CR, siempre con fines de claridad del dibujo.
En referencia a esta figura, los dos píxeles de referencia que se usarán para predecir el píxel pc3 son dos píxeles dispuestos igualmente a la izquierda del contorno de referencia CRR. Según una variante, estos dos píxeles pueden ser:
- el que está situado el primero encima del píxel actual para predicción, en la dirección vertical (cuarto píxel horizontal de PR1),
- y el que está situado el segundo encima del píxel actual para predicción, en la dirección vertical (cuarto píxel horizontal de PRH).
Siempre con referencia a la figura 10, los dos píxeles de referencia que se usarán para predecir el píxel pc4 son dos píxeles dispuestos igualmente en el contorno de referencia CRR. Según una variante, estos dos píxeles pueden ser:
- el que está situado el primero encima del píxel actual para predicción, en la dirección diagonal Dg (sexto píxel horizontal de PR1),
- y el que está situado el segundo encima del píxel actual para predicción, en la dirección diagonal Dg (séptimo píxel horizontal de PRH).
Siempre con referencia a la figura 10, los dos píxeles de referencia que se usarán para predecir el píxel pc7 son dos píxeles dispuestos igualmente a la derecha del contorno de referencia CRR. Según una variante, estos dos píxeles pueden ser:
- el que está situado el primero encima del píxel actual para predicción, en la dirección vertical (séptimo píxel horizontal de PR1),
- y el que está situado el segundo encima del píxel actual para predicción, en la dirección vertical (séptimo píxel horizontal de PRH).
Así, según los ejemplos de modos de predicción que acaban de describirse en referencia las figuras 6 a 10, se comprende que la función que es calculada por el módulo de software MA constituye en otros términos una regla que permite determinar, para un tipo de partición dado de un macrobloque para predicción (bloque cuadrado, líneas, «L», etc...), una familia particular de píxeles de referencia.
De forma especialmente ventajosa, dicha regla puede ajustarse según el tipo de partición seleccionado, según el grado de exactitud de la predicción que se desea o incluso según el número de píxeles de referencia disponibles, según la presencia de contornos, etc..., gracias sobre todo a las múltiples características que la definen (disposición del o de los píxeles de referencia con respecto al píxel para predicción, disposición del o de los píxeles de referencia a una dirección dada, disposición del o de los píxeles de referencia con respecto a un contorno que se prolonga en la partición sujeta a predicción, etc.,...).
Una vez que se han calculado diferentes predicciones posibles mediante el módulo de cálculo de predicción PRED, durante una etapa C5 representada en la figura 1, un módulo de decisión DCN, representado en la figura 2, recorre los macrobloques particionados de la imagen IE y elige, en esta etapa C5, el modo de predicción usado para codificar cada uno de estos macrobloques. Entre las predicciones posibles para un macrobloque, el módulo de decisión DCN elige la predicción óptima según un criterio de velocidad y distorsión bien conocido por el experto en la materia.
Para un macrobloque MB actual para codificación, el módulo de decisión DCN pone en competencia por ejemplo los modos de predicción representados en las figuras 7 y 8.
Cada macrobloque predicho MBpred es codificado, durante una etapa C6, como en la norma H.264/MPEG-4 AVC. Más exactamente con referencia a la figura 11, en la que se representa un intervalo T de macrobloque codificado de la imagen IE, cada macrobloque codificado incluye un campo c H1 que precisa el tipo de codificación del macrobloque
MB considerado, intratrama en el caso de la realización representada, un campo CH2 que indica la forma de la partición seleccionada (cuadrada, línea, columna, cruz, «L», etc...), un campo CH3 que indica la función de predicción usada y un campo CH4 que codifica los valores de los residuos del macrobloque predicho MBpred.
Una vez efectuada esta codificación estructural por el módulo de decisión DCN, los coeficientes de residuos, si existen, correspondientes a los bloques de la imagen IE, son enviados al módulo MTQ de transformada y de cuantificación, para someterse a transformadas en coseno discretas y después a una cuantificación. Los intervalos de macrobloques con estos coeficientes cuantificados son transmitidos a continuación al módulo CE de codificación entrópica, para producir, con las otras imágenes de la secuencia de vídeo ya codificadas de la misma forma que la imagen IE, un flujo de vídeo F, binario, codificado según la invención.
El flujo binario F así codificado es transmitido por una red de comunicación, a un terminal distante. Este incluye un decodificador DEC según la invención, representado en la figura 12.
El flujo binario F es enviado en primer lugar a un módulo DE de decodificación entrópica, con la decodificación inversa del mismo efectuada por el módulo de codificación entrópica CE representado en la figura 2. Posteriormente, para cada macrobloque de imagen que se va a reconstruir, los coeficientes decodificados por el módulo DE son enviados a un módulo QTI de cuantificación inversa y de transformada inversa.
Un módulo RI de reconstrucción de imagen recibe a continuación datos decodificados correspondientes a los datos producidos por el módulo DCN (figura 2) en la etapa C5 de codificación según la invención, con los errores de transmisión próximos. El módulo RI implementa las etapas D1 a D4 del procedimiento de decodificación según la invención, tal como se representan en la figura 13.
La primera etapa D1 es la decodificación de estructuras de datos codificadas en un intervalo T de un macrobloque actual de la imagen IE para decodificar. De forma conocida de por sí, el módulo de reconstrucción RI determina en el campo CH1 (figura 11) que los datos del intervalo T se han sometido a una codificación de tipo intratrama.
Durante esta misma etapa, el módulo de reconstrucción RI determina, según el procedimiento de decodificación según la invención:
- la forma de la partición inicial P1 que se va a reconstruir, gracias al campo CH2 (figura 7),
- la función de predicción seleccionada por el módulo de decisión DCN (figura 2), gracias al campo CH3.
Si por ejemplo, la partición inicial P1 tiene una forma de «L» como se representa en la figura 4C y la función de predicción óptima es la que permite efectuar la predicción representada en la figura 7 , el módulo de reconstrucción RI deduce de ello el orden en el que se decodificarán las diferentes particiones P1 a P8 del macrobloque actual y la función de predicción asociada a cada partición. Dicha deducción es realizada por ejemplo por medio de una tabla de correspondencia (no representada) que es memorizada en el decodificador DEC.
La etapa siguiente D2 representada en la figura 13 es la descomposición del macrobloque actual para decodificar, a partir de la partición inicial P1 determinada a la etapa D1, en una pluralidad de n particiones P1, P2,..., Pn. Esta partición es realizada por un módulo PMB de partición de macrobloques que se asemeja en todos los puntos al representado en la figura 2.
A continuación de la etapa de partición D2, durante una etapa D3 representada en la figura 13, el módulo de partición PMB transmite el macrobloque actual para decodificar y que acaba de ser particionado en n particiones, a un módulo de decodificación de particiones DECP representado en la figura 12.
Durante una etapa D4 representada en la figura 13, el módulo DECP realiza entonces una decodificación de las n particiones según el orden de decodificación y la función de predicción que se han determinado en la etapa D1.
Para este fin, para cada partición que se va a decodificar de un macrobloque actual para decodificar, el módulo de decodificación DECP usa valores de predicción de la o las particiones inmediatamente precedentes que son suministradas por el módulo PRED de cálculo de predicción, representado en la figura 13.
El módulo PRED de cálculo de predicción recibe en efecto los valores de las particiones decodificadas anteriormente por el módulo de reconstrucción RI, valores que conserva en memoria.
Las n particiones de un macrobloque de la imagen IE son decodificadas usando la predicción espacial intratrama indicada en el campo CH1 representado en la figura 11.
Una vez decodificados todos los macrobloques de la imagen IE, el módulo RI de reconstrucción de imagen suministra en salida del decodificador DEC una imagen ID correspondiente a la decodificación de la imagen IE.
Claims (12)
1. Procedimiento de predicción de particiones de al menos un grupo de píxeles en una imagen (IE) para codificación, con respecto a un grupo de píxeles de referencia, estando el grupo de píxeles descompuesto previamente en una pluralidad de particiones que no se superponen, de manera que una partición actual para predicción se predice en referencia a al menos una partición que la precede inmediatamente y que ha sido codificada y después decodificada, con el procedimiento caracterizado porque el grupo de píxeles de referencia se obtiene mediante el cálculo de una función parametrizada según un modo de predicción predeterminado, perteneciendo los píxeles de referencia de dicho grupo obtenido a al menos una partición diferente de la partición actual y siendo susceptibles de variar de una partición a otra, y porque para cada píxel de una partición actual para predicción, dicha función determina, a partir de un conjunto de píxeles de referencia que pueden ser seleccionados para predecir el píxel considerado según el modo de predicción predeterminado, al menos dos píxeles de referencia de tal manera que la distancia que separa cada uno de ellos del píxel considerado es la menor en comparación con las distancias que se han estimado para los otros píxeles de referencia del conjunto.
2. Procedimiento de predicción según la reivindicación 1, en el que cuando una partición sujeta a predicción contiene un contorno que prolonga un contorno de referencia contenido en un grupo de píxeles de referencia, se define un modo de predicción mediante la elección, para al menos un píxel para predicción situado en una posición determinada con respecto al contorno de dicha partición sujeta a predicción, de al menos un píxel de referencia situado en la misma posición que dicho píxel para predicción, con respecto al contorno de referencia.
3. Procedimiento de predicción según la reivindicación 1 o 2, en el que un modo de predicción se define mediante la elección, para al menos un píxel de una partición sujeta a predicción, de al menos un píxel de referencia que separa el píxel para predicción en una distancia predeterminada.
4. Procedimiento de predicción según la reivindicación 3, en el que la distancia predeterminada se minimiza de manera que los píxeles de referencia de dicho grupo estén situados lo más cerca posible de dicho píxel para predicción.
5. Procedimiento de predicción según una cualquiera de las reivindicaciones 1 a 4, en el que un modo de predicción se define mediante la elección, para al menos un píxel de una partición sujeta a predicción, de al menos un píxel de referencia situado en una dirección predeterminada, con respecto al píxel para predicción.
6. Procedimiento de codificación de una imagen o de una secuencia de imágenes que genera un flujo (F) de datos que incluye datos representativos de al menos un grupo de píxeles en una de dichas imágenes (IE), comprendiendo dicho procedimiento las etapas de:
- descomposición de dicho grupo de píxeles en una pluralidad de particiones,
- predicción de dichas particiones,
estando dicho procedimiento caracterizado porque dicha etapa de predicción se efectúa según el procedimiento según una cualquiera de las reivindicaciones 1 a 5.
7. Procedimiento de decodificación de un flujo (F) de datos representativo de una imagen o de una secuencia de imágenes, incluyendo dicho flujo (F) datos representativos de al menos un grupo de píxeles en una de dichas imágenes (IE), comprendiendo dicho procedimiento las etapas de:
- descomposición de dicho grupo de píxeles en una pluralidad de particiones,
- predicción de dichas particiones,
estando dicho procedimiento caracterizado porque dicha etapa de predicción se efectúa según el procedimiento según una cualquiera de las reivindicaciones 1 a 5.
8. Señal portadora de un flujo (F) de datos representativo de una imagen o de una secuencia de imágenes, incluyendo dicho flujo (F) datos representativos de al menos un grupo de píxeles en una de dichas imágenes (IE), siendo algunos de dichos datos de predicción de particiones de dicho grupo de píxeles con respecto a un grupo de píxeles de referencia, estando el grupo de píxeles descompuesto previamente en una pluralidad de particiones que no se superponen, prediciéndose una partición actual para predicción en referencia a al menos una partición que la precede inmediatamente y que ha sido codificada y después decodificada, de manera que dicha señal está caracterizada porque dichos datos de predicción se refieren a una función parametrizada según un modo de predicción predeterminado que permite obtener dicho grupo de píxeles de referencia, perteneciendo dichos píxeles de referencia de dicho grupo a al menos una partición diferente de la partición actual y siendo susceptibles de variar de una partición a otra, y porque para cada píxel de una partición actual para predicción, dicha función determina, a partir de un conjunto de píxeles de referencia que pueden ser seleccionados para predecir el píxel considerado según el modo de predicción predeterminado, al menos dos píxeles de referencia de tal manera que la distancia que separa cada uno de ellos del píxel considerado es la menor en comparación con las distancias que se han estimado para los otros píxeles de referencia del conjunto,
9. Dispositivo de predicción de particiones de al menos un grupo de píxeles en una imagen (IE) para codificación, con respecto a un grupo de píxeles de referencia, estando el grupo de píxeles descompuesto previamente en una pluralidad de particiones que no se superponen, prediciéndose una partición actual para predicción en referencia a al menos una partición que la precede inmediatamente y que ha sido codificada y después decodificada, caracterizado porque el dispositivo comprende medios de cálculo de una función parametrizada según un modo de predicción predeterminado para obtener dicho grupo de píxeles de referencia, perteneciendo dichos píxeles de referencia de dicho grupo a al menos una partición diferente de la partición actual y siendo susceptibles de variar de una partición a otra, y porque para cada píxel de una partición actual para predicción, dicha función determina, a partir de un conjunto de píxeles de referencia que pueden ser seleccionados para predecir el píxel considerado según el modo de predicción predeterminado, al menos dos píxeles de referencia de tal manera que la distancia que separa cada uno de ellos del píxel considerado es la menor en comparación con las distancias que se han estimado para los otros píxeles de referencia del conjunto.
10. Dispositivo de codificación (CO) de una imagen o de una secuencia de imágenes que genera un flujo (F) de datos que incluye datos representativos de al menos un grupo de píxeles en una de dichas imágenes (IE), comprendiendo dicho dispositivo:
- medios de descomposición de dicho grupo de píxeles en una pluralidad de particiones,
- medios de predicción de dichas particiones,
estando dicho dispositivo caracterizado porque los medios de predicción están contenidos en un dispositivo de predicción según el dispositivo según la reivindicación 9.
11. Dispositivo (DEC) de decodificación de un flujo (F) de datos representativo de una imagen o de una secuencia de imágenes, incluyendo dicho flujo (F) datos representativos de al menos un grupo de píxeles en una de dichas imágenes (IE), comprendiendo dicho dispositivo:
- medios de descomposición de dicho grupo de píxeles en una pluralidad de particiones,
- medios de predicción de dichas particiones,
estando dicho dispositivo caracterizado porque los medios de predicción están contenidos en un dispositivo de predicción según el dispositivo según la reivindicación 9.
12. Programa informático que incluye instrucciones para implementar uno de los procedimientos según una cualquiera de las reivindicaciones 1 a 7, cuando se ejecuta en un ordenador.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0852531 | 2008-04-15 | ||
PCT/FR2009/050601 WO2009136066A1 (fr) | 2008-04-15 | 2009-04-07 | Prediction d'images par determination prealable d'une famille de pixels de reference, codage et decodage utilisant une telle prediction |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2752001T3 true ES2752001T3 (es) | 2020-04-02 |
Family
ID=40092073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES09742264T Active ES2752001T3 (es) | 2008-04-15 | 2009-04-07 | Predicción de imágenes por determinación previa de una familia de píxeles de referencia, codificación y decodificación que usan dicha predicción |
Country Status (5)
Country | Link |
---|---|
US (1) | US8787693B2 (es) |
EP (1) | EP2279620B1 (es) |
CN (1) | CN102067602B (es) |
ES (1) | ES2752001T3 (es) |
WO (1) | WO2009136066A1 (es) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3499883A3 (en) * | 2010-05-14 | 2019-08-14 | Interdigital VC Holdings, Inc | Methods and apparatus for intra coding a block having pixels assigned to groups |
GB2486726B (en) | 2010-12-23 | 2017-11-29 | British Broadcasting Corp | Compression of pictures |
EP3301931A1 (en) | 2016-09-30 | 2018-04-04 | Thomson Licensing | Method and apparatus for omnidirectional video coding with adaptive intra prediction |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100459715C (zh) * | 1997-07-31 | 2009-02-04 | 日本胜利株式会社 | 数字视频信号块间预测编码/解码装置及编码/解码方法 |
US6711211B1 (en) * | 2000-05-08 | 2004-03-23 | Nokia Mobile Phones Ltd. | Method for encoding and decoding video information, a motion compensated video encoder and a corresponding decoder |
KR100642043B1 (ko) * | 2001-09-14 | 2006-11-03 | 가부시키가이샤 엔티티 도코모 | 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 화상 처리 시스템, 및 저장 매체 |
US7289672B2 (en) * | 2002-05-28 | 2007-10-30 | Sharp Laboratories Of America, Inc. | Methods and systems for image intra-prediction mode estimation |
US7010044B2 (en) * | 2003-07-18 | 2006-03-07 | Lsi Logic Corporation | Intra 4×4 modes 3, 7 and 8 availability determination intra estimation and compensation |
KR20050112445A (ko) * | 2004-05-25 | 2005-11-30 | 경희대학교 산학협력단 | 예측 부호화/복호화 장치, 예측 부호화/복호화 방법 및 그방법을 수행하는 프로그램이 기록된 컴퓨터 판독가능한기록매체 |
KR20050114751A (ko) * | 2004-06-01 | 2005-12-06 | 경희대학교 산학협력단 | 예측 부호화/복호화 장치 및 예측 부호화/복호화 방법 |
JP4763422B2 (ja) * | 2004-12-03 | 2011-08-31 | パナソニック株式会社 | イントラ予測装置 |
KR100727972B1 (ko) * | 2005-09-06 | 2007-06-14 | 삼성전자주식회사 | 영상의 인트라 예측 부호화, 복호화 방법 및 장치 |
KR100750128B1 (ko) | 2005-09-06 | 2007-08-21 | 삼성전자주식회사 | 영상의 인트라 예측 부호화, 복호화 방법 및 장치 |
CA2631336A1 (en) * | 2005-11-30 | 2007-06-07 | Kabushiki Kaisha Toshiba | Image encoding/image decoding method, image encoding/image decoding apparatus |
KR101246294B1 (ko) * | 2006-03-03 | 2013-03-21 | 삼성전자주식회사 | 영상의 인트라 예측 부호화, 복호화 방법 및 장치 |
US7672377B2 (en) * | 2006-04-21 | 2010-03-02 | Dilithium Holdings, Inc. | Method and system for video encoding and transcoding |
JP4182442B2 (ja) * | 2006-04-27 | 2008-11-19 | ソニー株式会社 | 画像データの処理装置、画像データの処理方法、画像データの処理方法のプログラム及び画像データの処理方法のプログラムを記録した記録媒体 |
US8126046B2 (en) * | 2006-06-30 | 2012-02-28 | Intel Corporation | Flexible macroblock ordering and arbitrary slice ordering apparatus, system, and method |
BRPI0621935A2 (pt) * | 2006-07-28 | 2016-09-13 | Toshiba Kk Toshiba Corp | método e aparelho para codificar e decodificar imagem |
KR101380580B1 (ko) | 2006-08-02 | 2014-04-02 | 톰슨 라이센싱 | 비디오 인코딩을 위한 적응형 기하학적 파티셔닝 방법 및 장치 |
KR101266168B1 (ko) * | 2006-08-16 | 2013-05-21 | 삼성전자주식회사 | 영상의 부호화, 복호화 방법 및 장치 |
CN101523917A (zh) * | 2006-09-29 | 2009-09-02 | 汤姆逊许可证公司 | 几何帧内预测 |
US8428125B2 (en) * | 2006-12-22 | 2013-04-23 | Qualcomm Incorporated | Techniques for content adaptive video frame slicing and non-uniform access unit coding |
KR101403338B1 (ko) * | 2007-03-23 | 2014-06-09 | 삼성전자주식회사 | 영상의 부호화, 복호화 방법 및 장치 |
KR101366093B1 (ko) * | 2007-03-28 | 2014-02-21 | 삼성전자주식회사 | 영상의 부호화, 복호화 방법 및 장치 |
JP4707118B2 (ja) * | 2007-03-28 | 2011-06-22 | 株式会社Kddi研究所 | 動画像符号化装置および動画像復号装置のイントラ予測方式 |
KR101375664B1 (ko) * | 2007-10-29 | 2014-03-20 | 삼성전자주식회사 | 영상의 디퓨전 특성을 이용한 영상 부호화/복호화 방법 및장치 |
-
2009
- 2009-04-07 CN CN200980122620.XA patent/CN102067602B/zh active Active
- 2009-04-07 EP EP09742264.6A patent/EP2279620B1/fr active Active
- 2009-04-07 WO PCT/FR2009/050601 patent/WO2009136066A1/fr active Application Filing
- 2009-04-07 US US12/937,293 patent/US8787693B2/en active Active
- 2009-04-07 ES ES09742264T patent/ES2752001T3/es active Active
Also Published As
Publication number | Publication date |
---|---|
US20110026845A1 (en) | 2011-02-03 |
WO2009136066A1 (fr) | 2009-11-12 |
CN102067602A (zh) | 2011-05-18 |
EP2279620A1 (fr) | 2011-02-02 |
EP2279620B1 (fr) | 2019-08-07 |
US8787693B2 (en) | 2014-07-22 |
CN102067602B (zh) | 2014-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230179791A1 (en) | Method and apparatus for encoding motion information and method and apparatus for decoding same | |
TWI759389B (zh) | 用於視訊寫碼之低複雜度符號預測 | |
CN108293113B (zh) | 图像编码系统中的基于建模的图像解码方法和设备 | |
ES2715107T3 (es) | Codificación de imagen con bajo retardo | |
KR101705940B1 (ko) | 이미지들을 코딩 및 디코딩하는 방법, 코딩 및 디코딩 디바이스 및 그에 대응하는 컴퓨터 프로그램들 | |
KR101292093B1 (ko) | 화면내 예측 부호화를 위한 영상 부호화/복호화 장치 및 방법 | |
TW202107894A (zh) | 以歷史為基礎之運動向量預測之簡化 | |
CN107257476B (zh) | 视频解码方法、视频编码方法以及计算机可读存储介质 | |
KR101375666B1 (ko) | 전역 차이 벡터를 이용한 다시점 영상의 부호화, 복호화방법 및 장치 | |
US20130016789A1 (en) | Context modeling techniques for transform coefficient level coding | |
US20150023426A1 (en) | Method and encoding/decoding of video using common merging candidate set of asymmetric partitions | |
EP3932068A1 (en) | Constraints on decoder-side motion vector refinement | |
US20180167610A1 (en) | Method and apparatus for inter prediction on basis of virtual reference picture in video coding system | |
TW202021354A (zh) | 運動向量預測器清單產生 | |
US9247252B2 (en) | Image decoding device | |
JP2010502102A (ja) | 低減された解像度の分割の方法及び装置 | |
CN110832869B (zh) | 用于视频编码或解码的运动信息获取方法与装置 | |
US11245897B2 (en) | Methods and apparatuses for signaling partioning information for picture encoding and decoding | |
US9813735B2 (en) | Method for encoding a current block of a first image component relative to a reference block of at least one second image component, encoding device and corresponding computer program | |
EP3522531A1 (en) | Method for processing picture based on intra-prediction mode and apparatus for same | |
KR20110135471A (ko) | 블록 병합을 이용한 영상 부호화/복호화 장치 및 방법 | |
ES2752001T3 (es) | Predicción de imágenes por determinación previa de una familia de píxeles de referencia, codificación y decodificación que usan dicha predicción | |
KR102210230B1 (ko) | 스캔 순서 선택을 위한 방법 및 장치 | |
US20160050426A1 (en) | Lossless-coding-mode video encoding method and device, and decoding method and device | |
US20180249176A1 (en) | Method and apparatus for encoding and decoding video signal |