ES2347912T3 - Codificación adaptativa de un error de predicción en la codificación de video híbrida. - Google Patents
Codificación adaptativa de un error de predicción en la codificación de video híbrida. Download PDFInfo
- Publication number
- ES2347912T3 ES2347912T3 ES06841140T ES06841140T ES2347912T3 ES 2347912 T3 ES2347912 T3 ES 2347912T3 ES 06841140 T ES06841140 T ES 06841140T ES 06841140 T ES06841140 T ES 06841140T ES 2347912 T3 ES2347912 T3 ES 2347912T3
- Authority
- ES
- Spain
- Prior art keywords
- prediction
- signal
- domain
- prediction error
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/65—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/129—Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/19—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/43—Hardware specially adapted for motion estimation or compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Error Detection And Correction (AREA)
Abstract
Procedimiento para codificar una señal de vídeo usando una codificación híbrida, que comprende: reducción de la redundancia temporal mediante una predicción con compensación de movimiento basada en bloques, para establecer una señal de error de predicción, decisión entre transformar la señal de error de predicción en el dominio de frecuencias o mantener la señal de error de predicción en el dominio espacial para la codificación proporcionando las muestras de la señal de error de predicción en un bloque de error de predicción en el dominio espacial, y proporcionando las muestras exploradas para la posterior codificación.
Description
Codificación adaptativa de un error de
predicción en la codificación de vídeo híbrida.
La invención se refiere a un procedimiento de
codificación y descodificación, un codificador y un descodificador,
y señales de datos que usan la codificación adaptativa del error de
predicción.
Los actuales procedimientos de codificación de
vídeo se basan en una codificación híbrida. La codificación híbrida
proporciona una etapa de codificación en el dominio temporal y una
etapa de codificación en el dominio espacial. En primer lugar, la
redundancia temporal de las señales de vídeo se reduce mediante el
uso de una predicción con compensación de movimiento basada en
bloques entre el bloque de imágenes que se va a codificar y un
bloque de referencia de una imagen que ya ha sido transmitida
determinada por un vector de movimiento. Las muestras de error de
predicción restantes se disponen en bloques y se transforman en el
dominio de frecuencias, dando lugar a un bloque de coeficientes.
Estos coeficientes se cuantifican y exploran de acuerdo con un
patrón de exploración en zigzag bastante conocido, que comienza con
el coeficiente que representa el valor de la CC. De acuerdo con una
representación típica, este coeficiente se encuentra entre los
coeficientes de baja frecuencia en la esquina superior izquierda de
un bloque. La exploración en zigzag produce un conjunto
unidimensional de coeficientes, que se someten a una codificación
de entropía posteriormente por un codificador. El codificador está
optimizado para un conjunto de coeficientes con una energía
decreciente. Debido a que el orden de los coeficientes dentro de un
bloque está predeterminado y fijado, la exploración en zigzag
produce un conjunto de coeficientes de energía decreciente, si las
muestras de predicción de error están correlacionadas. La siguiente
etapa de codificación se puede optimizar entonces para dicha
situación. Con este fin, el estándar más reciente H.264/AVC propone
una codificación aritmética binaria adaptativa basada en el contexto
(CABAC) o una codificación de longitud variable adaptable al
contexto (CAVLC). Sin embargo, la eficiencia de la transformación
solo es alta si las muestras de error de predicción están
correlacionadas. Para las muestras que estén correlacionadas solo
ligeramente en el dominio espacial, la transformación resulta menos
eficiente.
La memoria de la conferencia de NARROSCHKE:
"Extending the prediction error coder of H.246/AVC by a vector
quantizer" PROCEEDINGS OF SPIE VISUAL COMMUNICATIONS AND IMAGE
PROCESSING, [Online] vol. 5969, 12 de julio de 2005
(12-07-2005), páginas M1 a M12,
XP002431468 tiene por objeto un codificador de predicción de error
de H.24 6/AVC mediante un cuantificador vectorial.
A partir de "Adaptive coding of the prediction
error for H. 24 6/AVC", presentado el 2 de diciembre de 2005 y
publicado en Internet en la siguiente dirección
URL:http//itg32.hhi.de/docs/ITG312 UH 05 2 151.pdf, se conoce
un codificador híbrido que comprende unos medios para decidir si se
transforma una señal de error de predicción en el dominio de
frecuencias o se mantiene la señal de error de predicción en el
dominio espacial.
La presente invención tiene por objeto
proporcionar un procedimiento de codificación y descodificación, los
respectivos codificadores y descodificadores, señales de datos así
como los correspondientes sistemas y semántica para codificar y
descodificar señales de vídeo que sean más eficientes que en la
técnica anterior. La invención se expresa en las reivindicaciones
adjuntas.
De acuerdo con un aspecto de la presente
invención, se proporciona un procedimiento para codificar una señal
de vídeo basado en una codificación híbrida El procedimiento
comprende las etapas de reducción de la redundancia temporal
mediante la predicción con compensación de movimiento basada en
bloques, para establecer una señal de error de predicción, y la
etapa de decisión entre transformar la señal de error de predicción
en el dominio de frecuencias o mantener la señal de error de
predicción en el dominio espacial.
De acuerdo con un aspecto correspondiente de la
presente invención, se proporciona un codificador que está adaptado
para aplicar la codificación híbrida de una señal de vídeo. El
codificador incluye unos medios para reducir la redundancia
temporal mediante una predicción con compensación de movimiento
basada en bloques, para establecer una señal de error de
predicción, y unos medios para decidir entre transformar la señal de
error de predicción en el dominio de frecuencia o mantener la señal
de error de predicción en el dominio espacial. De acuerdo con este
aspecto de la invención, se proporciona un concepto y los
correspondientes aparatos, señales y semántica para decidir de
forma adaptativa entre procesar la señal de error de predicción en
el dominio de frecuencias o en el espacial. Si las muestras de
error de predicción solo tienen una pequeña correlación, las
siguientes etapas de codificación de las muestras pueden ser más
eficientes y provocarían una reducción en la tasa de datos,
comparada con la codificación de los coeficientes en el dominio de
frecuencia. De este modo, por la presente invención se aplica una
etapa de decisión adaptativa y unos medios de control adaptativos
para tomar la decisión. Por consiguiente, en función de la señal de
error de predicción, se decide si se usa una transformación en el
dominio de frecuencias o se mantiene la señal de error de predicción
en el dominio espacial. Los siguientes mecanismos de codificación
pueden ser los mismos que para el dominio de frecuencias, o se
pueden adaptar especialmente a las necesidades de las muestras en el
dominio espacial.
De acuerdo con otro aspecto de la invención, el
procedimiento para codificar una señal de vídeo, y en particular la
etapa de decisión, está basado en una función de costes.
Generalmente, la decisión de usar los coeficientes en el dominio de
frecuencias o las muestras en el dominio espacial puede basarse en
diversos tipos de mecanismos de decisión. La decisión se puede
tomar para todas las muestras contenidas en una parte especifica de
una señal de vídeo de una sola vez o, por ejemplo, incluso para un
número específico de bloques, macrobloques, o rebanadas
(slices). La decisión puede basarse en una función de costes,
como por ejemplo una función de Lagrange. Los costes se calculan
para ambas codificaciones: en el dominio de frecuencias y en el
dominio espacial. En la decisión, se opta por la codificación con
los costes más bajos.
De acuerdo con otro aspecto de la presente
invención, la función de costes incluye los costes de
tasa-distorsión para la codificación en el dominio
espacial y en el de frecuencias. De acuerdo con otro aspecto más de
la invención, los costes de tasa-distorsión se
pueden calcular mediante la tasa requerida y la distorsión
resultante ponderada por un parámetro de Lagrange. Además, la
medida de la distorsión puede ser el error cuadrático medio de la
cuantificación o el error absoluto medio de la cuantificación.
De acuerdo con un aspecto de la presente
invención, las muestras en el dominio espacial se pueden codificar
básicamente por los mismos procedimientos que se usan para los
coeficientes en el dominio de frecuencias. Estos procedimientos
pueden incluir los procedimientos de codificación CABAC o CAVLC. Por
lo tanto, solo sería necesaria, si acaso, una pequeña adaptación de
los mecanismos de codificación si los medios de control adaptivos
decidieran cambiar entre el dominio de frecuencias y el espacial. No
obstante, también se podría proporcionar para usar diferentes
sistemas de codificación para los coeficientes en los dos
dominios.
De acuerdo con otro aspecto de la invención, se
proporciona un procedimiento para codificar una señal de vídeo,
basado en la codificación híbrida De acuerdo con este aspecto de la
invención, la redundancia temporal se reduce mediante una
predicción con compensación de movimiento basada en bloques, y las
muestras de la señal del error de predicción se proporcionan en el
bloque del error de predicción en el dominio espacial. Las muestras
se exploran a partir del bloque de error de predicción para
proporcionar un conjunto de muestras en un orden especifico. De
acuerdo con este aspecto de la invención, se proporciona un sistema
de exploración obtenido a partir de una imagen de error de
predicción o una imagen de predicción. El sistema de exploración de
acuerdo con este aspecto de la invención tiene en cuenta el hecho
de que la exploración en zigzag de acuerdo con la técnica anterior
para el dominio de frecuencias puede no ser el orden de exploración
más eficiente para el dominio espacial. Por lo tanto, se
proporciona un sistema de exploración adaptativa, que tiene en
cuenta la distribución de las muestras y la magnitud de las
muestras en el dominio espacial. El sistema de exploración puede
estar basado preferentemente en una imagen de error de predicción o
una imagen de predicción. Este aspecto de la invención tiene en
cuenta las posiciones más probables de las muestras con la magnitud
más alta y las muestras con mayor probabilidad de ser cero. Debido
a que la ganancia de codificación para el dominio de frecuencias
está basada principalmente en el fenómeno consistente en que los
componentes de baja frecuencia poseen magnitudes más grandes, y la
mayor parte de los coeficientes de alta frecuencia son cero, se
puede aplicar un sistema de codificación de longitud de código
variable muy eficaz como CABAC o CAVLC. Sin embargo, en el dominio
espacial, las muestras que poseen las magnitudes más altas pueden
estar situadas en cualquier posición dentro de un bloque. Sin
embargo, como el error de predicción alcanza normalmente sus valores
máximos en los bordes de un objeto en movimiento, se puede usar la
imagen de predicción o la imagen de error de predicción para
establecer el orden de exploración más eficiente.
De acuerdo con un aspecto de la presente
invención, se pueden usar los gradientes de la imagen de predicción
para identificar las muestras con magnitudes grandes. El orden de
exploración sigue los gradientes contenidos en la imagen de
predicción en su orden de magnitud. Después se aplica el mismo orden
de exploración a la imagen de error de predicción, es decir, las
muestras en la imagen de error de predicción en el dominio
espacial.
Además, de acuerdo con otro aspecto más de la
presente invención, el sistema de exploración puede estar basado en
un vector de movimiento combinado con la imagen de error de
predicción del bloque de referencia. La exploración sigue las
magnitudes del error de predicción en orden decreciente.
De acuerdo con un aspecto de la invención, el
sistema de exploración se obtiene a partir de una combinación
lineal del gradiente de la imagen de predicción y la imagen de error
de predicción del bloque de referencia junto con un vector de
movimiento.
De acuerdo con otro aspecto de la invención, se
usa un código específico para los mecanismos de codificación, como
por ejemplo CABAC o similares, basado en probabilidades determinadas
por separado para los coeficientes en el dominio de frecuencias o
las muestras en el dominio espacial. Por lo tanto, los mecanismos de
codificación de la técnica anterior ya conocidos se pueden adaptar
al menos ligeramente para proporcionar el mecanismo de codificación
más eficiente para el dominio espacial. Por lo tanto, el mecanismo
de conmutación que está controlado de forma adaptativa para
codificar en el dominio espacial o en el de frecuencias se puede
adaptar aún más para cambiar las siguientes etapas de la
codificación para las muestras o coeficientes en los dominios
respectivos.
De acuerdo con un aspecto de la presente
invención, se proporciona un procedimiento para codificar una señal
de vídeo que incluye una etapa de cuantificación de las muestras de
error de predicción en el dominio espacial mediante un
cuantificador, que incluye una optimización del error de
cuantificación ponderado subjetivamente o bien una optimización del
error cuadrático medio de cuantificación. De acuerdo con este
aspecto de la invención, el cuantificador usado para cuantificar
las muestras en el dominio espacial se puede adaptar para que tenga
en cuenta la impresión visual subjetivamente óptima de una imagen.
Los niveles y umbrales de decisión representativos de un
cuantificador se pueden adaptar entonces basándose en las
propiedades subjetivas o estadísticas correspondientes de la señal
de error de predicción.
\newpage
Además, la presente invención también se refiere
a un procedimiento de descodificación y un aparato descodificador
de acuerdo con los aspectos expuestos anteriormente. De acuerdo con
un aspecto de la presente invención, se proporciona un
descodificador que incluye unos medios de control adaptativos para
decidir de forma adaptativa si un flujo de entrada de una señal de
vídeo codificada representa la señal de error de predicción de la
señal de vídeo codificada en el dominio espacial o en el dominio de
frecuencias. Por consiguiente, el descodificador de acuerdo con
este aspecto de la presente invención está adaptado para tomar una
decisión para un flujo de datos entrante, es decir, si la señal de
error de predicción está codificada en el dominio de frecuencias o
en el espacial. Además, el descodificador proporciona unos medios de
descodificación respectivos para cada uno de los dos dominios, el
dominio espacial o el de frecuencias.
Además, de acuerdo con otro aspecto más de la
presente invención, el descodificador comprende una unidad de
control de exploración para proporcionar un orden de exploración
basado en una señal de predicción o una señal de error de
predicción. La unidad de control de exploración de acuerdo con este
aspecto de la invención está adaptada para recuperar la información
necesaria acerca del orden de exploración, en el que se han
explorado las muestras de un bloque durante la codificación de las
señales de vídeo Además, el descodificador puede comprender todos
los medios con el fin de aplicar una cuantificación inversa y una
transformación inversa en los coeficientes en el dominio de
frecuencias o una cuantificación inversa en las muestras en el
dominio espacial. El descodificador también puede incluir un
mecanismo para proporcionar la compensación de movimiento y la
descodificación. El descodificador puede estar configurado,
fundamentalmente, para proporcionar todos los medios para aplicar
las etapas del procedimiento correspondientes a las etapas de
codificación explicadas anteriormente.
De acuerdo con otro aspecto más de la presente
invención, se proporciona una señal de datos que representa una
señal de vídeo codificada, en la que la información codificada de la
señal de error de predicción en la señal de datos está codificada,
en parte, en el dominio espacial y, en parte,, en el dominio de
frecuencias. Este aspecto de la invención se refiere a la señal de
vídeo codificada, que se obtiene mediante los mecanismos de
codificación expuestos anteriormente.
Además, de acuerdo con otro aspecto más de la
invención, la señal de datos puede incluir información adicional
que indique el dominio en el que una rebanada, macrobloque o bloque
está codificado; en particular, información acerca de si una
rebanada, macrobloque o bloque está codificado en el dominio
espacial o en el de frecuencias. Debido a que el control adaptativo
de acuerdo con la presente invención supone que la señal de error de
predicción esté codificada en el dominio espacial o bien en el
dominio de frecuencias, es necesario incluir la información
correspondiente en la señal de vídeo codificada. Por lo tanto, la
presente invención también proporciona una información especifica,
que indica el dominio en el que se ha codificado la parte
especifica, por ejemplo una rebanada, macrobloque o bloque.
Además, este aspecto de la invención también
tiene en cuenta la posibilidad de que un macrobloque completo o
rebanada completa pueda estar codificado solo en uno de los dos
dominios. De forma que, por ejemplo, si un macrobloque completo
está codificado en el dominio espacial, esto se pueda indicar
mediante un único indicador o similar. Además, incluso una rebanada
completa puede estar codificada solo en el dominio de frecuencias o
en el espacial, y en el flujo de datos se podría incluir un
indicador correspondiente para la rebanada completa. Esto da lugar
a una reducción en la tasa de datos y un mecanismo de codificación
más eficiente para la información adicional.
Los aspectos de la presente invención se
explican con respecto a las formas de realización preferidas que se
aclaran haciendo referencia a los dibujos adjuntos.
La fig. 1 muestra un diagrama de bloques
simplificado de un codificador que incorpora aspectos de la
presente invención;
la fig. 2 muestra un diagrama de bloques
simplificado de un descodificador que incorpora aspectos de la
presente invención;
la fig. 3 muestra un sistema de exploración de
acuerdo con la técnica anterior;
la fig. 4 muestra sistemas de exploración de
acuerdo con la presente invención; y
la fig. 5 ilustra los parámetros usados para un
cuantificador optimizado de acuerdo con la presente invención.
La fig. 1 muestra un diagrama de bloques
simplificado de un codificador de acuerdo con la presente invención.
Según esto, la señal de entrada 101 se somete a una estimación del
movimiento, en la que se basa una predicción con compensación de
movimiento que se lleva a cabo para proporcionar una señal de
predicción 104, que se resta de la señal de entrada 101. La señal
de error de predicción 105 resultante se transforma en el dominio de
frecuencias 106 y se cuantifica mediante un cuantificador
optimizado 107 para los coeficientes relativos a la frecuencia. La
señal de salida 120 del cuantificador 107 se lleva a un codificador
de entropía 113 que proporciona la señal de salida 116 que se va a
transmitir, almacenar, etc. Por medio de un bloque de cuantificación
inversa 110 y un bloque de transformación inversa 111, la señal de
error de predicción 105 cuantificada 120 se usa también para la
siguiente etapa de predicción en el bloque de predicción con
compensación de movimiento 103. La señal de error de predicción a
la que se le ha aplicado la cuantificación inversa y la
transformación DCT inversa se añade a la señal de predicción y se
lleva a la memoria de tramas 122, en la que se almacenan las
imágenes precedentes para el bloque de predicción con compensación
de movimiento 103 y el bloque de estimación de movimiento 102. Por
lo general, la presente invención sugiere usar, además de la técnica
anterior, un mecanismo con control adaptativo 115 para cambiar
entre el dominio de frecuencias y el dominio espacial para
transformar la señal de error de predicción 105. Los medios de
control adaptativos 115 producen señales y parámetros para
controlar el cambio adaptativo entre el dominio de frecuencias y el
espacial. Por consiguiente, se proporciona una señal de información
con control adaptativo 121 a los dos conmutadores que cambian entre
las posiciones A y B. Si la transformación se lleva a cabo en el
dominio de frecuencias, los dos conmutadores se encuentran en la
posición A. Si se usa el dominio espacial, los conmutadores se
cambian a la posición B. Además, la señal de información adicional
121, es decir, cuál de los dos dominios se ha usado para el
procedimiento de codificación de una imagen también se lleva al
codificador de entropía 113. Por consiguiente, en el flujo de datos
se incluye una información apropiada para el dispositivo. En
paralelo a la transformación de frecuencias, a través de una ruta
alternativa, la señal de error de predicción 105 se lleva al
cuantificador 109. Este bloque de cuantificación 109 proporciona
una cuantificación optimizada para la señal de error de predicción
105 en el dominio espacial. La señal de error de predicción
cuantificada 124 en el dominio espacial se puede hacer pasar por un
segundo bloque de cuantificación inversa 112 y, después, a la
conexión posterior hacia el bloque de predicción con compensación
de movimiento 103. Además, existe un bloque de control de la
exploración 114 que recibe el vector de movimiento 123 y la señal
de error de predicción sometida a la cuantificación inversa 118, o
bien la señal de predicción 104 a través de la conexión 119. El
bloque 117 sirve para codificar la información de movimiento.
El bloque de control de adaptación 115 decide si
un bloque se debe codificar en el dominio de frecuencias o en el
espacial, y genera una información adicional correspondiente para
indicar el dominio. La decisión tomada por los medios de control de
adaptación se basa en los costes de tasa-distorsión
para la codificación en el dominio espacial y de frecuencias. Para
la codificación, se selecciona el dominio que tenga los costes de
tasa-distorsión más bajos. Por ejemplo, los costes
de tasa- distorsión C se calculan mediante la tasa requerida R y la
distorsión resultante D ponderadas por un parámetro de Lagrange L:
C=L*R+D. Como medida de la distorsión, se puede usar el error
cuadrático medio de cuantificación, pero también se pueden aplicar
otras medidas como, por ejemplo, el error absoluto medio de
cuantificación. Como parámetro de Lagrange L, se puede usar el
parámetro de Lagrange usado normalmente para el control del
codificador de H.246/AVC, L =
0,85*2^{((QO-12>/3)}. También hay otros
posibles procedimientos para determinar los costes de
tasa-distorsión.
Como otra posibilidad, el control de adaptación
115 puede controlar el procedimiento de codificación. Esto se puede
realizar, por ejemplo, basándose en la señal de predicción o
basándose en la correlación en el error de predicción, o basándose
en el dominio, el error de predicción se codifica en una posición
con compensación de movimiento de tramas ya transmitidas.
La fig. 2 muestra un diagrama de bloques
simplificado de una arquitectura de un descodificador de acuerdo
con unos aspectos de la presente invención. Según esto, los datos de
vídeo codificados se llevan a dos bloques de descodificación de
entropía 201 y 202, El bloque de descodificación de entropía 202
descodifica información de compensación de movimiento como, por
ejemplo, vectores de movimiento, etc. El bloque de descodificación
de entropía 201 aplica el mecanismo de codificación inversa usado en
el codificador, como, por ejemplo, una descodificación según CABAC
o CAVLC. Si el descodificador usa un mecanismo de codificación
diferente para los coeficientes o las muestras en el dominio
espacial, se debe usar el correspondiente mecanismo de
descodificación en los bloques de descodificación de entropía
correspondientes. Por consiguiente, el bloque de descodificación de
entropía 201 produce las señales apropiadas para cambiar entre las
posiciones A y B con el fin de usar la ruta de cuantificación
inversa apropiada para el dominio espacial, es decir, el bloque
operativo de cuantificación inversa 206, o los bloques apropiados
según la posición A de cambio, es decir el bloque de cuantificación
inversa 203 y el bloque de transformación inversa 204. Si el error
de predicción se representa en el dominio de frecuencias, el bloque
de cuantificación inversa 203 y el bloque de transformación inversa
204 aplican las correspondientes operaciones inversas. Debido a que
las muestras en el dominio espacial se han dispuesto en un orden
especifico de acuerdo con un mecanismo de exploración según unos
aspectos de la presente invención, una unidad de control de
exploración 205 proporciona el orden correcto de las muestras para
el bloque de descodificación de entropía 201. Si la codificación se
ha llevado a cabo en el dominio espacial, el bloque de
transformación inversa 204 y el bloque de cuantificación inversa
203 se evitan a favor de una operación de cuantificación inversa en
el bloque 206. El mecanismo de conmutación, para cambiar entre el
dominio de frecuencias y el espacial (es decir, la posición A y B
de los conmutadores) , se controla mediante la información adicional
enviada en el flujo de bits y descodificada por el bloque de
descodificación de entropía 201. Además, la señal sometida a la
cuantificación inversa en el dominio espacial, o la señal sometida a
cuantificación inversa y transformación inversa en el dominio de
frecuencias se suman a la imagen de predicción con compensación de
movimiento con el fin de proporcionar las señales de vídeo
descodificadas 210. La compensación de movimiento se lleva cabo en
el bloque 209, basándose en datos de señal de vídeo descodificada
previamente (imágenes previas) y vectores de movimiento. La unidad
de control de exploración 205 usa la imagen de predicción 208, o
bien la señal de error de predicción 207 combinada con el vector de
movimiento 212 para determinar la secuencia de exploración correcta
de los coeficientes. El mecanismo de exploración también puede estar
basado en ambas imágenes, es decir, la imagen de error de
predicción y la imagen de predicción. Tal como se explicó para el
mecanismo de codificación con respecto a la fig. 1, la secuencia de
exploración durante la codificación puede basarse en una
combinación de la información del error de predicción 207 y los
vectores de compensación de movimiento. Por consiguiente, los
vectores de compensación de movimiento se pueden llevar a través de
una ruta 212 hacia la unidad de control de exploración 205. Además,
en correspondencia con la fig. 1, existe una memoria de tramas 211,
en la que se almacenan las imágenes necesarias y descodificadas
previamente.
La fig. 3 muestra un diagrama simplificado para
ilustrar el orden de exploración en zigzag de acuerdo con la
técnica anterior. Según esto, los coeficientes, que se obtienen a
partir de la transformación en el dominio de frecuencias (por
ejemplo, DCT) se disponen en un orden predeterminado, tal como se
muestra en la fig. 3 para un bloque de cuatro por cuatro. Estos
coeficientes se leen en un orden específico, de manera que los
coeficientes que representan las partes de baja frecuencia se sitúan
en las primeras posiciones de la izquierda de un conjunto
unidimensional. Cuantos más hacia la parte inferior derecha del
conjunto, mayores serán las frecuencias correspondientes de los
coeficientes. Debido a que los bloques que se codifican contienen a
menudo una cantidad sustancial de coeficientes de baja frecuencia,
los coeficientes de alta frecuencia, o al menos una mayoría de los
coeficientes de alta frecuencia, son cero. Esta situación se puede
usar eficazmente para reducir los datos para su transmisión, por
ejemplo, sustituyendo una secuencia larga de ceros por una
información única acerca del número de ceros.
La fig. 4 muestra un ejemplo ilustrativo
simplificado de un mecanismo de exploración de acuerdo con un
aspecto de la presente invención. La fig. 4(a) muestra la
magnitud de los gradientes en la imagen de predicción para un
bloque. Los valores en cada posición del bloque representan el
gradiente de la imagen de predicción del bloque actual. El propio
gradiente es un vector formado por dos componentes que representan
el gradiente en dirección horizontal y vertical. Cada componente se
puede determinar mediante la diferencia entre las dos muestras
adyacentes o se puede determinar mediante el conocido operador de
Sobel, teniendo en cuenta seis muestras adyacentes. La magnitud del
gradiente es la magnitud del vector. Si dos valores tienen la misma
magnitud, se puede aplicar un orden de exploración fijo o
predeterminado. El orden de exploración sigue la magnitud de los
valores de gradiente en el bloque que se indican mediante la línea
de puntos. Una vez que se establece el orden de exploración dentro
de la imagen de predicción del gradiente, se aplica el mismo orden
de exploración a las muestras de error de predicción cuantificadas,
que se ilustran en la fig. 4 (b). Si las muestras cuantificadas en
el dominio espacial del bloque que se ilustran en la fig.
4(b) están dispuestas en un conjunto unidimensional, tal
como se indica en el lado izquierdo de la fig. 4 (b) de acuerdo con
el orden de exploración establecido basado en la magnitud de los
gradientes en la imagen de predicción, las muestras que poseen un
valor alto se disponen típicamente en primer lugar en el conjunto,
es decir, en las posiciones de la izquierda. Las posiciones de la
derecha se llenan con ceros, tal como se indica en la fig.
4(b).
En lugar de una exploración controlada por el
gradiente, también se pueden aplicar otras exploraciones como, por
ejemplo, una exploración predefinida o una exploración controlada
por el error de predicción cuantificado de las tramas ya
transmitidas en combinación con un vector de movimiento, o
combinaciones de los mismos (el control de exploración se refiere a
los bloques 114 ó 205, como se explicó con respecto a la fig. 1 y la
fig. 2). En el caso de una exploración controlada por la señal de
error de predicción en combinación con un vector de movimiento, la
exploración sigue las magnitudes de las muestras de error de
predicción cuantificadas del bloque, a las que se refiere el vector
de movimiento del bloque actual, en orden decreciente.
Si el vector de movimiento apunta a posiciones
de muestras fraccionales, las muestras de error de predicción
cuantificadas requeridas se pueden determinar usando una técnica de
interpolación. Esta puede ser la misma técnica de interpolación que
la usada para la interpolación de la imagen de referencia con el fin
de generar las muestras de predicción.
En el caso de que la exploración esté controlada
por la combinación de la imagen de predicción y la imagen de error
de predicción junto con un vector de movimiento, se calculan
combinaciones lineales de las magnitudes de los gradientes y de las
muestras de error de predicción cuantificadas del bloque, a las que
se refiere el vector de movimiento del bloque actual. La
exploración sigue los valores de estas combinaciones lineales.
Además, el procedimiento para la determinación de la exploración se
puede señalar para segmentos de la secuencia, por ejemplo, para
cada trama o para cada rebanada o para un grupo de bloques. De
acuerdo con el procesamiento estándar típico, los vectores de
compensación de movimiento ya se tienen en consideración, mientras
que la imagen de predicción se determina.
De acuerdo con otro aspecto de la presente
invención, el orden de exploración también puede basarse en la
imagen de error de predicción en combinación con un vector de
movimiento. Además, se pueden concebir combinaciones del principio
del gradiente como las explicadas anteriormente y la imagen de error
de predicción.
La fig. 5 muestra una ilustración simplificada
que resulta útil para ilustrar la definición de un cuantificador
optimizado de acuerdo con unos aspectos de la presente invención.
Según esto, los tres parámetros a, b y c son los parámetros usados
para adaptar el cuantificador. De acuerdo con el estándar H.246/AVC,
se aplican cuantificadores optimizados de
tasa-distorsión para los coeficientes con dos
medidas de distorsión diferentes. La primera medida es el error
cuadrático medio de cuantificación; la segunda es el error de
cuantificación ponderado subjetivamente. De acuerdo con el estándar
H.246/AVC, se desarrollan dos cuantificadores para las muestras de
error de predicción. Debido a que la distribución del error de
predicción se aproxima a una distribución laplaciana, se usa un
cuantificador de escalar con zona muerta más umbral uniforme en el
caso de una optimización de error cuadrático medio de
cuantificación. La fig. 5 ilustra los parámetros a, b y c de la
cuantificación y la cuantificación inversa.
En la tabla 1, se muestran los parámetros a, b y
c, que se pueden usar ventajosamente para los QP (parámetros de
cuantificación) usados normalmente en el sistema de codificación
H.246/AVC. Los parámetros a, b y c son los respectivos parámetros
optimizados para la optimización del error cuadrático medio de
cuantificación. No obstante, esto es solo un ejemplo, y puede haber
parámetros diferentes o adicionales que resulten útiles para
diferentes aplicaciones.
\vskip1.000000\baselineskip
Para la optimización del error de cuantificación
ponderado subjetivamente, se propone un cuantificador no uniforme
con unos niveles representativos r_{i}, -r_{i} y unos umbrales
de decisión en el centro del r_{i} adyacente que también se
muestran en la tabla 1. Si se producen grandes errores de predicción
en los bordes, se debe sacar provecho del enmascaramiento visual.
Por consiguiente, se pueden permitir grandes errores de
cuantificación en los bordes y pequeños si la señal de imagen es
plana. H. 24 6/AVC puede usar más de 4 QP, tal como se muestra en
la tabla 1. En este caso, la tabla 1 se debe ampliar. H.246/AVC
puede usar 52 QP diferentes. La idea básica para determinar los
valores representativos apropiados r_{i}, -r_{i} se explica a
continuación con respecto a la fig. 6.
La fig. 6 muestra una representación
simplificada del error de reconstrucción absoluto medio medido de un
elemento de una imagen en el caso de la cuantificación ponderada
subjetivamente en el dominio de frecuencias en la fig. 6(a)
y en el dominio espacial en la fig. 6(b). El error de
reconstrucción absoluto medio medido de la cuantificación ponderada
subjetivamente en el dominio de frecuencias se muestra como una
función del valor absoluto del error de predicción. Para el error
de reconstrucción absoluto de la cuantificación ponderada
subjetivamente en el dominio espacial, los niveles de representación
n se ajustan de manera que el error de reconstrucción absoluto
medio sea igual para la cuantificación en el dominio de frecuencias
y el espacial con respecto a los intervalos de cuantificación en el
dominio espacial. Únicamente a modo de ejemplo, los valores
r_{1}, r_{2}, r_{3} y r_{4} para QP = 26 que se indican en
la tabla 1 también están presentes en la fig. 6(b). Como
regla, un nivel representativo r_{i} se dobla aproximadamente si
el valor de QP aumenta en 6. El diseño del cuantificador también
puede sacar provecho de otras características del sistema visual.
Además, se pueden usar cuantificadores para crear un error de
cuantificación con propiedades diferentes a las de los
cuantificadores H.246/AVC.
\vskip1.000000\baselineskip
De acuerdo con un aspecto de la presente
invención, la codificación de entropía en el dominio espacial puede
basarse en algunos procedimientos en lo que respecta a los
coeficientes cuantificados en el dominio de frecuencias. Para el
estándar H.246/AVC, dos de los procedimientos de codificación de
entropía preferidos son CABAC y CAVLC. No obstante, de acuerdo con
este aspecto de la presente invención, en lugar de codificar los
coeficientes cuantificados en el dominio de frecuencias, se
codifican las muestras cuantificadas en el dominio espacial
mediante los procedimientos mencionados anteriormente. Como se
explicó antes, el orden de exploración se puede cambiar para
proporcionar la misma reducción en los datos que para el dominio de
frecuencias. Según se expone anteriormente, la exploración en el
dominio espacial se puede controlar por la magnitud del gradiente de
la señal de imagen de predicción en la misma posición espacial. De
acuerdo con este principio, las muestras que se van a codificar se
disponen en un orden decreciente de gradientes, como ya se explicó
con respecto a la fig. 4 (a) y (b). También se pueden aplicar otros
mecanismos de exploración, tal como se explica anteriormente.
Además, se pueden usar códigos separados, lo que supone modelos de
probabilidad separados en el caso de CABAC, para el dominio
espacial, de acuerdo con unos aspectos de la presente invención. El
código, y en el caso de CABAC la inicialización de los modelos de
probabilidad, se pueden obtener a partir de las estadísticas de las
muestras cuantificadas. La modelización contextual en el dominio
espacial se puede realizar del mismo modo que en el dominio de
frecuencias.
\vskip1.000000\baselineskip
Los medios de control adaptativos explicados con
respecto a la fig. 1 generan la información relativa al dominio en
el que se va a codificar un bloque. El tamaño del bloque puede ser
de cuatro por cuatro u ocho por ocho elementos de imagen, según el
tamaño de la transformación. No obstante, de acuerdo con diferentes
aspectos de la presente invención, se pueden aplicar otros tamaños
de bloque independientes del tamaño de la transformación. De
acuerdo con un aspecto de la presente invención, la información
adicional incluye unos indicadores específicos, que indican si el
mecanismo de codificación se ha cambiado de forma adaptativa durante
la codificación. Si, por ejemplo, se codifican todos los bloques de
una rebanada en el dominio de frecuencias, esto se puede indicar
mediante un bit específico en la señal de datos de vídeo
codificadas. Este aspecto de la invención también se puede
relacionar con los bloques de un macrobloque, que se pueden
codificar todos ellos en cada uno de los dos dominios, o sólo en un
dominio. Además, el concepto de acuerdo con el presente aspecto de
la invención se puede aplicar a macrobloques y se puede incluir
información en el flujo de datos que indique si al menos un bloque
o un macrobloque está codificado en el dominio espacial. Por
consiguiente, se puede usar el indicador:
Indicador_codificación_DF_DE_rebanada para indicar si todos los
bloques de la rebanada actual están codificados en el dominio de
frecuencias, o si al menos hay un bloque codificado en el dominio de
frecuencias. Este indicador puede estar codificado por un único
bit. Si hay al menos un bloque de la rebanada que esté codificado en
el dominio espacial, esto se puede indicar mediante el indicador:
Indicador_codificación_DF_DE_MB para cada macrobloque de la
rebanada actual, si todos los bloques del macrobloque actual se
codifican en el dominio de frecuencias, o si al menos hay un bloque
codificado en el dominio espacial. Este indicador puede codificarse
condicionado por los indicadores de los bloques adyacentes ya
codificados situados hacia arriba y hacia la izquierda. Si el
último de un macrobloque está codificado en el dominio espacial,
esto se puede indicar mediante el indicador Indicador_DF_o_DE para
cada bloque del macrobloque que se va a codificar, si el bloque
actual está codificado en el dominio de frecuencias o en el
espacial. Este indicador puede codificarse condicionado por los
indicadores de los bloques adyacentes ya codificados situados hacia
arriba y hacia la izquierda. Otra posibilidad consiste en que la
información adicional se codifique también condicionada por la señal
de predicción o la señal de error de predicción, junto con un
vector de movimiento.
\vskip1.000000\baselineskip
De acuerdo con este aspecto de la presente
invención, se presenta una sintaxis y una semántica ejemplares que
permiten incorporar aspectos de la presente invención en el sistema
de codificación H.246/AVC. Según esto, se puede introducir el
indicador Indicador_codificación_DF_DE_rebanada en la cabecera_
rebanada, tal como se muestra en la tabla 2. El indicador Indicador
codificación_DF_DE_MB se puede enviar en cada capa_macrobloque, tal
como se muestra en la tabla 3. En cabac_bloque_residual, se puede
señalar mediante el indicador Indicador_DF_o_DE si se suministra la
codificación en el dominio de frecuencias o la codificación en el
dominio espacial para el bloque actual; esto se muestra en la tabla
4 que se presenta a continuación. Se puede aplicar un sistema
similar en otros algoritmos de codificación de vídeo para la
codificación del error de predicción.
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
Claims (18)
-
\global\parskip0.950000\baselineskip
1. Procedimiento para codificar una señal de vídeo usando una codificación híbrida, que comprende:reducción de la redundancia temporal mediante una predicción con compensación de movimiento basada en bloques, para establecer una señal de error de predicción,decisión entre transformar la señal de error de predicción en el dominio de frecuencias o mantener la señal de error de predicción en el dominio espacial para la codificación proporcionando las muestras de la señal de error de predicción en un bloque de error de predicción en el dominio espacial, y proporcionando las muestras exploradas para la posterior codificación.\vskip1.000000\baselineskip
- 2. El procedimiento según la reivindicación 1, en el que la etapa de decisión está basada en una función de costes.
- 3. El procedimiento según la reivindicación 1 ó 2, en el que la función de costes incluye los costes de tasa-distorsión para la codificación en el dominio espacial y la codificación en el dominio de frecuencias.
- 4. El procedimiento según la reivindicación 3, en el que los costes de tasa-distorsión se calculan mediante la tasa requerida (R) y la distorsión resultante (D) ponderadas por un parámetro de Lagrange.
- 5. El procedimiento según la reivindicación 4, en el que la medida de la distorsión es el error cuadrático medio de cuantificación o el error absoluto medio de la cuantificación.
- 6. El procedimiento según una de las reivindicaciones anteriores, en el que las muestras en el dominio espacial se codifican mediante el mismo procedimiento que los coeficientes en el dominio de frecuencias.
- 7. El procedimiento según la reivindicación 6, en el que la codificación de los coeficientes se lleva a cabo según CABAC o CAVLC.
- 8. El procedimiento según la reivindicación 7, en el que el sistema de exploración se obtiene a partir del gradiente de la imagen de predicción.
- 9. El procedimiento según la reivindicación 7, en el que el sistema de exploración está basado en un vector de movimiento junto con la imagen del error de predicción del bloque de referencia.
- 10. El procedimiento según la reivindicación 7, en el que el sistema de exploración se obtiene a partir de una combinación lineal del gradiente de la imagen de predicción y la imagen del error de predicción del bloque de referencia en combinación con un vector de movimiento.
- 11. El procedimiento según una de las reivindicaciones anteriores, en el que se usa un código específico para CABAC que posee probabilidades separadas para el dominio espacial.
- 12. El procedimiento según una de las reivindicaciones anteriores, en el que se usa un código específico para CAVLC para el dominio espacial.
- 13. El procedimiento según una de las reivindicaciones anteriores, que comprende otra cuantificación de las muestras de error de predicción mediante un cuantificador que posee una optimización del error de cuantificación ponderado subjetivamente u optimización del error cuadrático medio de cuantificación en el dominio espacial.
- 14. Procedimiento para descodificar una señal de vídeo usando una codificación híbrida, que comprende:descodificación eficaz de datos de vídeo codificados en el dominio de frecuencias o el espacial, de acuerdo con el mecanismo de codificación usado para codificar los datos de la señal de vídeo, según las reivindicaciones 1 a 13.
\vskip1.000000\baselineskip
- 15. El procedimiento de descodificación según la reivindicación 14, en el que las posiciones de las muestras de la señal de error de predicción recibidas en un conjunto unidimensional se asignan a ubicaciones en una disposición bidimensional y se determinan basándose en una señal de error de predicción o imagen de predicción recibida.
- 16. Codificador para codificar una señal de vídeo usando una codificación híbrida según cualquiera de las reivindicaciones 1 a 13, que comprende:unos medios para reducir la redundancia temporal mediante una predicción con compensación de movimiento basada en bloques, para establecer una señal de error de predicción, yunos medios de control adaptativos para decidir entre transformar la señal de error de predicción en el dominio de frecuencias o mantener la señal de error de predicción en el dominio espacial.
\global\parskip1.000000\baselineskip
- 17. Descodificador para descodificar una señal de vídeo que se ha codifica usando una codificación híbrida según cualquiera de las reivindicaciones 1 a 13, que comprende unos medios de control adaptativo (201) para decidir de forma adaptativa si un flujo de entrada de una señal de vídeo codificada representa la señal de error de predicción de la señal de vídeo codificada en el dominio espacial o en el dominio de frecuencias.
- 18. El descodificador según la reivindicación 17, que comprende además unos medios de control de exploración para proporcionar un orden de exploración basado en una señal de predicción o una señal de error de predicción o una combinación lineal de ambos.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US76630006P | 2006-01-09 | 2006-01-09 | |
US766300P | 2006-01-09 | ||
PCT/EP2006/012492 WO2007079964A1 (en) | 2006-01-09 | 2006-12-22 | Adaptive coding of a prediction error in hybrid video coding |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2347912T3 true ES2347912T3 (es) | 2010-11-25 |
Family
ID=37963091
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES15172281T Active ES2729678T3 (es) | 2006-01-09 | 2006-12-22 | Codificación adaptativa de un error de predicción en la codificación de vídeo híbrida |
ES10153812.2T Active ES2544978T3 (es) | 2006-01-09 | 2006-12-22 | Codificación adaptativa de un error de predicción en la codificación de vídeo híbrida |
ES06841140T Active ES2347912T3 (es) | 2006-01-09 | 2006-12-22 | Codificación adaptativa de un error de predicción en la codificación de video híbrida. |
ES15172279.0T Active ES2648093T3 (es) | 2006-01-09 | 2006-12-22 | Codificación adaptativa de un error de predicción en la codificación de vídeo híbrida |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES15172281T Active ES2729678T3 (es) | 2006-01-09 | 2006-12-22 | Codificación adaptativa de un error de predicción en la codificación de vídeo híbrida |
ES10153812.2T Active ES2544978T3 (es) | 2006-01-09 | 2006-12-22 | Codificación adaptativa de un error de predicción en la codificación de vídeo híbrida |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES15172279.0T Active ES2648093T3 (es) | 2006-01-09 | 2006-12-22 | Codificación adaptativa de un error de predicción en la codificación de vídeo híbrida |
Country Status (16)
Country | Link |
---|---|
US (5) | US9749660B2 (es) |
EP (6) | EP2950544B1 (es) |
JP (9) | JP5061122B2 (es) |
KR (1) | KR100964641B1 (es) |
CN (4) | CN101356823A (es) |
AT (1) | ATE480104T1 (es) |
DE (1) | DE602006016650D1 (es) |
DK (3) | DK2950544T3 (es) |
ES (4) | ES2729678T3 (es) |
HK (4) | HK1143480A1 (es) |
HU (3) | HUE025501T2 (es) |
PL (4) | PL2192783T3 (es) |
PT (2) | PT2950543T (es) |
SI (1) | SI2192783T1 (es) |
TR (1) | TR201904706T4 (es) |
WO (1) | WO2007079964A1 (es) |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2950544B1 (en) * | 2006-01-09 | 2019-03-27 | Matthias Narroschke | Adaptive coding of the prediction error in hybrid video coding |
US8711925B2 (en) * | 2006-05-05 | 2014-04-29 | Microsoft Corporation | Flexible quantization |
US8634462B2 (en) | 2007-03-13 | 2014-01-21 | Matthias Narroschke | Quantization for hybrid video coding |
US20080225947A1 (en) * | 2007-03-13 | 2008-09-18 | Matthias Narroschke | Quantization for hybrid video coding |
US8891615B2 (en) * | 2008-01-08 | 2014-11-18 | Qualcomm Incorporated | Quantization based on rate-distortion modeling for CABAC coders |
US9008171B2 (en) | 2008-01-08 | 2015-04-14 | Qualcomm Incorporated | Two pass quantization for CABAC coders |
US8902972B2 (en) | 2008-04-11 | 2014-12-02 | Qualcomm Incorporated | Rate-distortion quantization for context-adaptive variable length coding (CAVLC) |
US8897359B2 (en) | 2008-06-03 | 2014-11-25 | Microsoft Corporation | Adaptive quantization for enhancement layer video coding |
KR20110015356A (ko) | 2009-08-07 | 2011-02-15 | 한국전자통신연구원 | 차분 신호의 특성에 기반한 적응적인 변환 부호화/양자화 영역을 이용한 동영상 부호화/복호화 장치 및 그 방법 |
KR101694399B1 (ko) * | 2009-10-07 | 2017-01-09 | 에스케이 텔레콤주식회사 | 적응적 부호화 패턴 정보를 생성/이용하는 동영상 부호화/복호화 방법, 장치 및 기록 매체 |
KR20110071231A (ko) * | 2009-12-21 | 2011-06-29 | 엠텍비젼 주식회사 | 부호화 방법, 복호화 방법 및 장치 |
RS56512B1 (sr) | 2010-04-13 | 2018-02-28 | Ge Video Compression Llc | Kodiranje mapa značaja i blokova koeficijenata transformacije |
KR20120016980A (ko) | 2010-08-17 | 2012-02-27 | 한국전자통신연구원 | 영상 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
CN102595113B (zh) * | 2011-01-13 | 2014-06-04 | 华为技术有限公司 | 一种变换系数块的扫描方法、装置和系统 |
WO2012118358A2 (ko) * | 2011-03-03 | 2012-09-07 | 한국전자통신연구원 | 변환 계수 스캔 방법 및 그 장치 |
US11102494B2 (en) | 2011-03-03 | 2021-08-24 | Electronics And Telecommunication Research Institute | Method for scanning transform coefficient and device therefor |
UA109312C2 (uk) * | 2011-03-04 | 2015-08-10 | Імпульсно-кодова модуляція з квантуванням при кодуванні відеоінформації | |
KR101880325B1 (ko) * | 2011-03-09 | 2018-07-19 | 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 | 동화상 부호화 장치 |
WO2012120909A1 (ja) * | 2011-03-09 | 2012-09-13 | パナソニック株式会社 | 動画像復号化装置および動画像復号化方法 |
WO2012121575A2 (ko) * | 2011-03-10 | 2012-09-13 | 한국전자통신연구원 | 인트라 예측 방법 및 그 장치 |
US8762797B2 (en) | 2011-04-29 | 2014-06-24 | Google Inc. | Method and apparatus for detecting memory access faults |
DE102011100498A1 (de) | 2011-05-04 | 2012-11-08 | Gottfried Wilhelm Leibniz Universität Hannover | Prädiktion von Transformationskoeffizienten |
GB2492333B (en) * | 2011-06-27 | 2018-12-12 | British Broadcasting Corp | Video encoding and decoding using transforms |
EP2705667B1 (en) * | 2011-06-30 | 2016-09-21 | Huawei Technologies Co., Ltd. | Lossless coding and associated signaling methods for compound video |
JP6080375B2 (ja) | 2011-11-07 | 2017-02-15 | キヤノン株式会社 | 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム |
US9113164B1 (en) | 2012-05-15 | 2015-08-18 | Google Inc. | Constant bit rate control using implicit quantization values |
US9510019B2 (en) | 2012-08-09 | 2016-11-29 | Google Inc. | Two-step quantization and coding method and apparatus |
US9386306B2 (en) | 2012-08-15 | 2016-07-05 | Qualcomm Incorporated | Enhancement layer scan order derivation for scalable video coding |
US9253483B2 (en) | 2012-09-25 | 2016-02-02 | Google Technology Holdings LLC | Signaling of scaling list |
US9407915B2 (en) | 2012-10-08 | 2016-08-02 | Google Inc. | Lossless video coding with sub-frame level optimal quantization values |
CN103051895B (zh) * | 2012-12-07 | 2016-04-13 | 浙江大学 | 一种上下文模型选择的方法和装置 |
JP2016105528A (ja) * | 2013-03-22 | 2016-06-09 | パナソニック株式会社 | 画像符号化装置および画像符号化方法 |
US20180213222A1 (en) * | 2015-05-27 | 2018-07-26 | Kt Corporation | Method and device for processing video signal |
EP3350539A4 (en) * | 2015-09-16 | 2019-05-01 | Orica International Pte Ltd | WIRELESS PRIMING DEVICE |
WO2017127115A1 (en) * | 2016-01-22 | 2017-07-27 | Hewlett-Packard Development Company, L.P. | Drift correction |
US10142652B2 (en) | 2016-05-05 | 2018-11-27 | Google Llc | Entropy coding motion vector residuals obtained using reference motion vectors |
CN108429911B (zh) * | 2017-02-15 | 2020-10-27 | 上海富瀚微电子股份有限公司 | 一种高效视频编码率失真优化量化方法 |
CN107257461B (zh) * | 2017-04-21 | 2019-08-20 | 中国计量大学 | 基于上下文自适应偏移模型的视音频编码硬判决量化方法 |
CN116437104A (zh) | 2017-05-19 | 2023-07-14 | 松下电器(美国)知识产权公司 | 解码方法和编码方法 |
CN107547898B (zh) * | 2017-09-05 | 2020-04-14 | 东华大学 | 一种能耗-精度可控的传感器双参数分配系统 |
FR3081656A1 (fr) * | 2018-06-27 | 2019-11-29 | Orange | Procedes et dispositifs de codage et de decodage d'un flux de donnees representatif d'au moins une image. |
US10878597B2 (en) * | 2018-09-14 | 2020-12-29 | Sony Corporation | Rate distortion optimization for adaptive subband coding of regional adaptive HAAR transform (RAHT) |
FR3086486A1 (fr) * | 2018-09-21 | 2020-03-27 | Orange | Procedes et dispositifs de codage et de decodage d'un flux de donnees representatif d'au moins une image. |
US10848763B2 (en) * | 2018-11-14 | 2020-11-24 | Tencent America LLC | Method and apparatus for improved context design for prediction mode and coded block flag (CBF) |
CN111918068B (zh) * | 2020-08-05 | 2022-03-08 | 电子科技大学 | 基于视频序列特征和QP-λ修正的时域率失真优化方法 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0771292B2 (ja) | 1987-07-30 | 1995-07-31 | 富士通株式会社 | 画像の適応量子化符号化方式 |
US5253056A (en) * | 1992-07-02 | 1993-10-12 | At&T Bell Laboratories | Spatial/frequency hybrid video coding facilitating the derivatives of variable-resolution images |
US20020015513A1 (en) * | 1998-07-15 | 2002-02-07 | Sony Corporation | Motion vector detecting method, record medium on which motion vector calculating program has been recorded, motion detecting apparatus, motion detecting method, picture encoding apparatus, picture encoding method, motion vector calculating method, record medium on which motion vector calculating program has been recorded |
CN1205818C (zh) * | 2000-04-11 | 2005-06-08 | 皇家菲利浦电子有限公司 | 视频编码和解码方法 |
KR100468844B1 (ko) | 2002-01-07 | 2005-01-29 | 삼성전자주식회사 | 정지영상 및 동영상을 부호화/복호화하기 위한변환계수들의 최적주사방법 |
CN100380980C (zh) * | 2002-04-23 | 2008-04-09 | 诺基亚有限公司 | 用于在视频编码系统中指示量化器参数的方法与设备 |
JP4230188B2 (ja) * | 2002-06-06 | 2009-02-25 | パナソニック株式会社 | 可変長符号化方法および可変長復号化方法 |
KR20040007818A (ko) * | 2002-07-11 | 2004-01-28 | 삼성전자주식회사 | 동영상 부호화를 위한 dct연산량 조절 방법 및 그 장치 |
CN100411442C (zh) * | 2003-03-24 | 2008-08-13 | 华为技术有限公司 | 一种视频图象编码方法 |
CN1194544C (zh) * | 2003-04-25 | 2005-03-23 | 北京工业大学 | 基于时空域相关性运动矢量预测的视频编码方法 |
US8427494B2 (en) * | 2004-01-30 | 2013-04-23 | Nvidia Corporation | Variable-length coding data transfer interface |
EP1571850A3 (en) * | 2004-03-05 | 2006-12-13 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding image containing grayscale alpha channel image |
US20050276493A1 (en) * | 2004-06-01 | 2005-12-15 | Jun Xin | Selecting macroblock coding modes for video encoding |
KR100621581B1 (ko) * | 2004-07-15 | 2006-09-13 | 삼성전자주식회사 | 기초 계층을 포함하는 비트스트림을 프리디코딩,디코딩하는 방법, 및 장치 |
KR100664932B1 (ko) * | 2004-10-21 | 2007-01-04 | 삼성전자주식회사 | 비디오 코딩 방법 및 장치 |
EP2950544B1 (en) * | 2006-01-09 | 2019-03-27 | Matthias Narroschke | Adaptive coding of the prediction error in hybrid video coding |
-
2006
- 2006-12-22 EP EP15172281.6A patent/EP2950544B1/en active Active
- 2006-12-22 ES ES15172281T patent/ES2729678T3/es active Active
- 2006-12-22 AT AT06841140T patent/ATE480104T1/de not_active IP Right Cessation
- 2006-12-22 PL PL10153812T patent/PL2192783T3/pl unknown
- 2006-12-22 EP EP06841140A patent/EP1982524B1/en active Active
- 2006-12-22 SI SI200631951T patent/SI2192783T1/sl unknown
- 2006-12-22 PL PL15172279T patent/PL2950543T3/pl unknown
- 2006-12-22 PT PT151722790T patent/PT2950543T/pt unknown
- 2006-12-22 EP EP15172279.0A patent/EP2950543B1/en active Active
- 2006-12-22 JP JP2008549789A patent/JP5061122B2/ja active Active
- 2006-12-22 PL PL15172281T patent/PL2950544T3/pl unknown
- 2006-12-22 ES ES10153812.2T patent/ES2544978T3/es active Active
- 2006-12-22 EP EP10153812.2A patent/EP2192783B1/en active Active
- 2006-12-22 DK DK15172281.6T patent/DK2950544T3/da active
- 2006-12-22 US US12/160,418 patent/US9749660B2/en active Active
- 2006-12-22 PT PT15172281T patent/PT2950544T/pt unknown
- 2006-12-22 CN CNA2006800507912A patent/CN101356823A/zh active Pending
- 2006-12-22 HU HUE10153812A patent/HUE025501T2/en unknown
- 2006-12-22 ES ES06841140T patent/ES2347912T3/es active Active
- 2006-12-22 DK DK15172279.0T patent/DK2950543T3/da active
- 2006-12-22 DK DK10153812.2T patent/DK2192783T3/en active
- 2006-12-22 EP EP19166295.6A patent/EP3537719A1/en active Pending
- 2006-12-22 DE DE602006016650T patent/DE602006016650D1/de active Active
- 2006-12-22 CN CN201410168323.1A patent/CN103974065B/zh active Active
- 2006-12-22 ES ES15172279.0T patent/ES2648093T3/es active Active
- 2006-12-22 CN CN201410168301.5A patent/CN103974064B/zh active Active
- 2006-12-22 HU HUE15172279A patent/HUE037348T2/hu unknown
- 2006-12-22 KR KR1020087018756A patent/KR100964641B1/ko active IP Right Grant
- 2006-12-22 HU HUE15172281A patent/HUE044060T2/hu unknown
- 2006-12-22 EP EP15172280.8A patent/EP2983370A1/en not_active Withdrawn
- 2006-12-22 PL PL06841140T patent/PL1982524T3/pl unknown
- 2006-12-22 WO PCT/EP2006/012492 patent/WO2007079964A1/en active Application Filing
- 2006-12-22 TR TR2019/04706T patent/TR201904706T4/tr unknown
- 2006-12-22 CN CN201410168728.5A patent/CN103957409B/zh active Active
-
2010
- 2010-11-01 HK HK10110215.6A patent/HK1143480A1/xx unknown
-
2012
- 2012-03-22 JP JP2012065961A patent/JP2012124965A/ja active Pending
-
2013
- 2013-08-22 JP JP2013172356A patent/JP5715665B2/ja active Active
- 2013-08-22 JP JP2013172363A patent/JP5586756B2/ja active Active
-
2014
- 2014-03-27 US US14/227,927 patent/US10027983B2/en active Active
- 2014-03-27 US US14/227,922 patent/US10021424B2/en active Active
- 2014-03-27 US US14/227,932 patent/US10021425B2/en active Active
- 2014-07-03 JP JP2014138035A patent/JP2014195333A/ja active Pending
-
2015
- 2015-01-08 HK HK15100178.7A patent/HK1199785A1/xx unknown
- 2015-01-14 HK HK15100417.8A patent/HK1200046A1/xx unknown
- 2015-01-14 HK HK15100416.9A patent/HK1200045A1/xx unknown
-
2016
- 2016-01-15 US US14/997,399 patent/US10070150B2/en active Active
- 2016-09-20 JP JP2016183300A patent/JP2016213905A/ja active Pending
- 2016-09-20 JP JP2016183298A patent/JP6263590B2/ja active Active
- 2016-09-20 JP JP2016183299A patent/JP6199462B2/ja active Active
-
2018
- 2018-04-23 JP JP2018082568A patent/JP6526869B2/ja active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2347912T3 (es) | Codificación adaptativa de un error de predicción en la codificación de video híbrida. | |
USRE46777E1 (en) | Quantization for hybrid video coding | |
US8634462B2 (en) | Quantization for hybrid video coding | |
ES2693643T3 (es) | Exploración dependiente de modo de coeficientes de un bloque de datos de vídeo | |
BR112021003210A2 (pt) | métodos e dispositivos para codificar e decodificar uma sequência de dados representando pelo menos uma imagem |