ES2598106T3 - Procedimiento y aparato para codificar vídeo mediante predicción de movimiento usando partición arbitraria, y procedimiento y aparato para decodificar vídeo mediante predicción de movimiento usando partición arbitraria - Google Patents

Procedimiento y aparato para codificar vídeo mediante predicción de movimiento usando partición arbitraria, y procedimiento y aparato para decodificar vídeo mediante predicción de movimiento usando partición arbitraria Download PDF

Info

Publication number
ES2598106T3
ES2598106T3 ES13167741.1T ES13167741T ES2598106T3 ES 2598106 T3 ES2598106 T3 ES 2598106T3 ES 13167741 T ES13167741 T ES 13167741T ES 2598106 T3 ES2598106 T3 ES 2598106T3
Authority
ES
Spain
Prior art keywords
coding
unit
coding unit
depth
partitions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES13167741.1T
Other languages
English (en)
Inventor
Sun-Il Lee
Min-Su Cheon
Woo-Jin Han
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Application granted granted Critical
Publication of ES2598106T3 publication Critical patent/ES2598106T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/533Motion estimation using multistep search, e.g. 2D-log search or one-at-a-time search [OTS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • H04N19/543Motion estimation other than block-based using regions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un procedimiento de decodificación de un vídeo, comprendiendo el procedimiento: recibir y analizar un flujo de bits de una imagen codificada; analizar, a partir del flujo de bits, información de división que indica si una unidad de codificación se divide en unidades de codificación más pequeñas e información que indica si se usan particiones asimétricas para inter predicción; determinar una o más unidades de codificación incluidas en una unidad de codificación máxima usando la información de división; determinar particiones para realizar inter predicción en una unidad de codificación entre la una o más unidades de codificación usando la información que indica si se usan particiones asimétricas de una unidad de codificación para inter predicción; y realizar compensación de movimiento usando las particiones para la unidad de codificación, en el que: la determinación de la una o más unidades de codificación incluidas en una unidad de codificación máxima comprende: analizar, a partir del flujo de bits, información para determinar un tamaño máximo de una unidad de codificación y la información de división que indica si una unidad de codificación se divide en unidades de codificación más pequeñas; dividir la imagen en una pluralidad de unidades de codificación máxima de acuerdo con la información para determinar un tamaño máximo de una unidad de codificación; y dividir jerárquicamente la unidad de codificación máxima entre la pluralidad de codificación máxima en la una o más unidades de codificación de profundidades de acuerdo con la información de división, en el que dividir jerárquicamente la unidad de codificación máxima en una o más unidades de codificación de profundidades comprende: cuando la información de división indica una división de una unidad de codificación de una profundidad actual entre la una o más unidades de codificación de profundidades, dividir la unidad de codificación de la profundidad actual en unidades de codificación cuadradas de una profundidad inferior, y cuando la información de división indica una no división de la unidad de codificación de la profundidad actual, dividir la unidad de codificación de la profundidad actual en las particiones de la unidad de codificación de la profundidad actual, en el que determinar las particiones comprende: cuando la información indica que las particiones asimétricas no se usan para inter predicción, determinar particiones simétricas que indican una de una partición obtenida no dividiendo la unidad de codificación de la profundidad actual y particiones obtenidas dividiendo al menos una de una altura y una anchura de la unidad de codificación de la profundidad actual de acuerdo con una proporción simétrica de 1:1, y cuando la información indica que las particiones asimétricas se usan para inter predicción, determinar las particiones asimétricas obtenidas dividiendo una de una altura y una anchura de la unidad de codificación de la profundidad actual de acuerdo con una proporción asimétrica de 1:3 o 3:1 o particiones simétricas que indican una de una partición obtenida no dividiendo la unidad de codificación de la profundidad actual en una o más unidades de codificación y particiones obtenidas dividiendo al menos una de una altura y una anchura de la unidad de codificación de la profundidad actual de acuerdo con una proporción simétrica de 1:1.

Description

imagen1
imagen2
imagen3
imagen4
imagen5
10
15
20
25
30
35
40
45
50
55
realizar la codificación de predicción en los datos de imagen en la unidad de codificación.
Para realizar codificación de predicción en la unidad de codificación máxima, la codificación de predicción puede realizarse basándose en una unidad de codificación que corresponde a una profundidad codificada, es decir, basándose en una unidad de codificación que ya no se divide en unidades de codificación que corresponden a una profundidad inferior. En lo sucesivo, la unidad de codificación que ya no se divide se hace una unidad base para codificación de predicción que se denominará ahora como una ‘unidad de predicción’. Una partición obtenida dividiendo la unidad de predicción puede incluir una unidad de predicción o una unidad de datos obtenida dividiendo al menos una de una altura y una anchura de la unidad de predicción.
Por ejemplo, cuando una unidad de codificación de 2Nx2N (donde N es un entero positivo) ya no se divide y se hace una unidad de predicción de 2Nx2N, y un tamaño de una partición puede ser 2Nx2N, 2NxN, Nx2N, o NxN. Ejemplos de un tipo de partición incluyen particiones simétricas que se obtienen dividiendo simétricamente una altura o anchura de la unidad de predicción, las particiones obtenidas dividiendo asimétricamente la altura o anchura de la unidad de predicción, tales como 1:n o n:-1, particiones que se obtienen dividiendo geométricamente la unidad de predicción, y particiones que tienen formas arbitrarias.
Un modo de predicción de la unidad de predicción puede ser al menos uno de un modo intra, un modo inter, y un modo de salto. Por ejemplo, el modo intra o el modo inter pueden realizarse en la partición de 2Nx2N, 2NxN, Nx2N,
o NxN. También, el modo de salto puede realizarse únicamente en la partición de 2Nx2N. La codificación se realiza independientemente en una unidad de predicción en una unidad de codificación, seleccionando de esta manera un modo de predicción que tiene un menor error de codificación.
El aparato 100 de codificación de vídeo puede realizar también la transformación en los datos de imagen en una unidad de codificación basándose no únicamente en la unidad de codificación para codificar los datos de imagen, sino también basándose en una unidad de datos que es diferente de la unidad de codificación.
Para realizar la transformación en la unidad de codificación, la transformación puede realizarse basándose en una unidad de datos que tiene un tamaño menor que o igual a la unidad de codificación. Por ejemplo, la unidad de datos para la transformación puede incluir una unidad de datos para un modo intra y una unidad de datos para un modo inter.
Una unidad de datos usada como una base de la transformación se denominará ahora como una ‘unidad de transformación’. Puede establecerse también una profundidad de transformación que indica el número de veces de división para alcanzar la unidad de transformación dividiendo la altura y anchura de la unidad de codificación en la unidad de transformación. Por ejemplo, en una unidad de codificación actual de 2Nx2N, una profundidad de transformación puede ser 0 cuando el tamaño de una unidad de transformación es también 2Nx2N, puede ser 1 cuando cada una de la altura y anchura de la unidad de codificación actual se divide en dos partes iguales, dividida totalmente en 4^1 unidades de transformación, y el tamaño de la unidad de transformación es por lo tanto NxN, y puede ser 2 cuando cada una de la altura y anchura de la unidad de codificación actual se divide en cuatro partes iguales, dividida totalmente en 4^2 unidades de transformación y el tamaño de la unidad de transformación es por lo tanto N/2xN/2. Por ejemplo, la unidad de transformación puede establecerse de acuerdo con una estructura de árbol jerárquico, en la que una unidad de transformación de una profundidad de transformación superior se divide en cuatro unidades de transformación de una profundidad de transformación inferior de acuerdo con las características jerárquicas de una profundidad de transformación.
De manera similar a la unidad de codificación, la unidad de transformación en la unidad de codificación puede dividirse recursivamente en regiones con tamaño más pequeño, de modo que la unidad de transformación puede determinarse independientemente en unidades de regiones. Por lo tanto, los datos residuales en la unidad de codificación pueden dividirse de acuerdo con la transformación que tiene la estructura de árbol de acuerdo con las profundidades de transformación.
La información de codificación de acuerdo con las unidades de codificación que corresponden a una profundidad codificada requiere no únicamente información acerca de la profundidad codificada, sino también acerca de información relacionada con codificación de predicción y transformación. Por consiguiente, el determinador 120 de unidad de codificación no determina únicamente una profundidad codificada que tiene un menor error de codificación, sino determina también un tipo de partición en una unidad de predicción, un modo de predicción de acuerdo con unidades de predicción, y un tamaño de una unidad de transformación para transformación.
Las unidades de codificación de acuerdo con una estructura de árbol en una unidad de codificación máxima y un procedimiento de determinación de una partición de acuerdo con realizaciones ejemplares, se describirán en detalle más adelante con referencia a las Figuras 3 a 12.
El determinador 120 de unidad de codificación puede medir un error de codificación de unidades de codificación más profundas de acuerdo con las profundidades usando optimización de tasa-distorsión basándose en multiplicadores de Lagrange.
5
10
15
20
25
30
35
40
45
50
55
La unidad 130 de salida emite los datos de imagen de la unidad de codificación máxima, que se codifica basándose en la al menos una profundidad codificada determinada mediante el determinador 120 de unidad de codificación, y la información acerca del modo de codificación de acuerdo con la profundidad codificada, en flujos de bits.
Los datos de imagen codificados pueden obtenerse codificando datos residuales de una imagen.
La información acerca del modo de codificación de acuerdo con la profundidad codificada puede incluir información acerca de la profundidad codificada, acerca del tipo de partición en la unidad de predicción, el modo de predicción, y el tamaño de la unidad de transformación.
La información acerca de la profundidad codificada puede definirse usando información de división de acuerdo con las profundidades, que indica si se realiza codificación en unidades de codificación de una profundidad inferior en lugar de en una profundidad actual. Si la profundidad actual de la unidad de codificación actual es la profundidad codificada, los datos de imagen en la unidad de codificación actual se codifican y emiten, y por lo tanto la información de división puede definirse para no dividir la unidad de codificación actual a una profundidad inferior. Como alternativa, si la profundidad actual de la unidad de codificación actual no es la profundidad codificada, la codificación se realiza en la unidad de codificación de la profundidad inferior, y por lo tanto la información de división puede definirse para dividir la unidad de codificación actual para obtener las unidades de codificación de la profundidad inferior.
Si la profundidad actual no es la profundidad codificada, se realiza la codificación en la unidad de codificación que se divide en al menos una unidad de codificación de la profundidad inferior. Puesto que al menos existe una unidad de codificación de la profundidad inferior en una unidad de codificación de la profundidad actual, la codificación se realiza repetitivamente en cada unidad de codificación de la profundidad inferior, y por lo tanto la codificación puede realizarse recursivamente para las unidades de codificación que tienen la misma profundidad.
Puesto que las unidades de codificación que tienen una estructura de árbol se determinan para una unidad de codificación máxima, y la información acerca de al menos un modo de codificación se determina para una unidad de codificación de una profundidad codificada, la información acerca de al menos un modo de codificación puede determinarse para una unidad de codificación máxima. También, una profundidad codificada de los datos de imagen de la unidad de codificación máxima puede ser diferente de acuerdo con las localizaciones puesto que los datos de imagen se dividen jerárquicamente de acuerdo con las profundidades, y por lo tanto la información acerca de la profundidad codificada y el modo de codificación pueden establecerse para los datos de imagen.
Por consiguiente, la unidad 130 de salida puede asignar información de codificación acerca de una profundidad codificada correspondiente y un modo de codificación a al menos una de la unidad de codificación, la unidad de predicción, y una unidad mínima incluida en la unidad de codificación máxima.
La unidad mínima de acuerdo con una realización ejemplar, es una unidad de datos rectangular obtenida dividiendo la unidad de codificación mínima que constituye la profundidad más baja por 4. Como alternativa, la unidad mínima puede ser una unidad de datos rectangular máxima que puede incluirse en todas las unidades de codificación, unidades de predicción, unidades de partición, y unidades de transformación incluidas en la unidad de codificación máxima.
Por ejemplo, la información de codificación emitida a través de la unidad 130 de salida puede clasificarse en información de codificación de acuerdo con unidades de codificación, e información de codificación de acuerdo con unidades de predicción. La información de codificación de acuerdo con las unidades de codificación puede incluir la información acerca del modo de predicción y acerca del tamaño de las particiones. La información de codificación de acuerdo con las unidades de predicción puede incluir información acerca de una dirección estimada de un modo inter, acerca de un índice de imagen de referencia del modo inter, acerca de un vector de movimiento, acerca de un componente de crominancia de un modo intra, y acerca de un procedimiento de interpolación del modo intra. También, puede insertarse información acerca de un tamaño máximo de la unidad de codificación definido de acuerdo con las instantáneas, cortes, o GOP, e información acerca de una profundidad máxima en SPS (Conjunto de Parámetros de Secuencia) o un encabezamiento de un flujo de bits.
En el aparato 100 de codificación de vídeo, la unidad de codificación más profunda puede ser una unidad de codificación obtenida dividiendo por dos una altura o anchura de una unidad de codificación de una profundidad superior, que está una capa por encima. En otras palabras, cuando el tamaño de la unidad de codificación de la profundidad actual es 2Nx2N, el tamaño de la unidad de codificación de la profundidad inferior es NxN. También, la unidad de codificación de la profundidad actual que tiene el tamaño de 2Nx2N puede incluir un máximo de 4 unidades de codificación de la profundidad inferior.
Por consiguiente, el aparato 100 de codificación de vídeo puede formar las unidades de codificación que tienen la estructura de árbol determinando unidades de codificación que tienen una forma óptima y un tamaño óptimo para cada unidad de codificación máxima, basándose en el tamaño de la unidad de codificación máxima y la profundidad máxima determinada mientras se consideran las características de la instantánea actual. También, puesto que la codificación puede realizarse en cada unidad de codificación máxima usando uno cualquiera de diversos modos de predicción y transformaciones, puede determinarse un modo de codificación óptimo mientras se consideran las
imagen6
imagen7
10
15
20
25
30
35
40
45
50
55
profundidad máxima de los datos 330 de vídeo es 1, las unidades 335 de codificación de los datos 330 de vídeo pueden incluir una unidad de codificación máxima que tiene un tamaño de eje de longitud de 16, y unidades de codificación que tienen un tamaño de eje de longitud de 8 puesto que las profundidades profundizan en una capa dividiendo la unidad de codificación máxima una vez.
Puesto que la profundidad máxima de los datos 320 de vídeo es 3, las unidades 325 de codificación de los datos 320 de vídeo pueden incluir una unidad de codificación máxima que tiene un tamaño de eje de longitud de 64, y unidades de codificación que tienen tamaños de ejes de longitud de 32, 16, y 8 puesto que las profundidades profundizan a 3 capas dividiendo la unidad de codificación máxima tres veces. A medida que una profundidad se hace profunda, puede expresarse con precisión la información detallada.
La Figura 4 es un diagrama de bloques de un codificador 400 de imagen basándose en unidades de codificación de acuerdo con una realización ejemplar.
El codificador 400 de imagen realiza operaciones del determinador 120 de unidad de codificación del aparato 100 de codificación de vídeo para codificar datos de imagen. En otras palabras, un predictor 410 intra realiza intra predicción en unidades de codificación en un modo intra, de entre un fotograma 405 actual, y un estimador 420 de movimiento y un compensador 425 de movimiento realiza inter estimación y compensación de movimiento en unidades de codificación en un modo inter de entre el fotograma 405 actual usando el fotograma 405 actual, y un fotograma 495 de referencia.
Los datos emitidos desde el predictor 410 intra, el estimador 420 de movimiento, y el compensador 425 de movimiento se emiten como un coeficiente de transformación cuantificado a través de un transformador 430 y un cuantificador 440. El coeficiente de transformación cuantificado se restaura como datos en un dominio espacial a través de un cuantificador 460 inverso y un transformador 470 inverso, y los datos restaurados en el dominio espacial se emiten como el fotograma 495 de referencia después de que se post-procesan a través de una unidad 480 de desbloqueo y una unidad 490 de filtrado en bucle. El coeficiente de transformación cuantificado puede emitirse como un flujo de bits 455 a través de un codificador 450 por entropía.
Para que se aplique el codificador 400 de imagen en el aparato 100 de codificación de vídeo, todos los elementos del codificador 400 de imagen, es decir, el predictor 410 intra, el estimador 420 de movimiento, el compensador 425 de movimiento, el transformador 430, el cuantificador 440, el codificador 450 por entropía, el cuantificador 460 inverso, el transformador 470 inverso, la unidad 480 de desbloqueo, y la unidad 490 de filtrado en bucle realizan operaciones basándose en cada unidad de codificación de entre las unidades de codificación que tienen una estructura de árbol mientras consideran la profundidad máxima de cada unidad de codificación máxima.
Específicamente, el predictor 410 intra, el estimador 420 de movimiento, y el compensador 425 de movimiento determinan particiones y un modo de predicción de cada unidad de codificación de entre las unidades de codificación que tienen una estructura de árbol mientras consideran el tamaño máximo y la profundidad máxima de una unidad de codificación máxima actual, y el transformador 430 determina el tamaño de la unidad de transformación en cada unidad de codificación de entre las unidades de codificación que tienen una estructura de árbol.
La Figura 5 es un diagrama de bloques de un decodificador 500 de imagen basándose en unidades de codificación, de acuerdo con una realización ejemplar.
Un analizador 510 analiza datos de imagen codificados a decodificar e información acerca de la codificación requerida para decodificar desde un flujo de bits 505. Los datos de imagen codificados se emiten como datos cuantificados inversos a través de un decodificador 520 por entropía y un cuantificador 530 inverso, y los datos cuantificados inversos se restauran a datos de imagen en un dominio espacial a través de un transformador 540 inverso.
Un predictor 550 intra realiza intra predicción en unidades de codificación en un modo intra con respecto a los datos de imagen en el dominio espacial, y un compensador 560 de movimiento realiza compensación de movimiento en unidades de codificación en un modo inter usando un fotograma 585 de referencia.
Los datos de imagen en el dominio espacial, que se pasan a través del predictor 550 intra y del compensador 560 de movimiento, pueden emitirse como un fotograma 595 restaurado después de post-procesarse a través de una unidad 570 de desbloqueo y una unidad 580 de filtrado en bucle. También, los datos de imagen que se postprocesan a través de la unidad 570 de desbloqueo y la unidad 580 de filtrado en bucle pueden emitirse como el fotograma 585 de referencia.
Para decodificar los datos de imagen en el decodificador 230 de datos de imagen del aparato 200 de decodificación de vídeo, el decodificador 500 de imagen puede realizar operaciones que se realizan después del analizador 510.
Para que el decodificador 500 de imagen se aplique en el aparato 200 de decodificación de vídeo, todos los elementos del decodificador 500 de imagen, es decir, el analizador 510, el decodificador 520 por entropía, el cuantificador 530 inverso, el transformador 540 inverso, el predictor 550 intra, el compensador 560 de movimiento, la
10
15
20
25
30
35
40
45
50
55
unidad 570 de desbloqueo, y la unidad 580 de filtrado en bucle realizan operaciones basándose en unidades de codificación que tienen una estructura de árbol para cada unidad de codificación máxima.
Específicamente, el predictor 550 intra y el compensador 560 de movimiento realizan operaciones basándose en particiones y un modo de predicción para cada una de las unidades de codificación que tienen una estructura de árbol, y el transformador 540 inverso realiza operaciones basándose en un tamaño de una unidad de transformación para cada unidad de codificación.
La Figura 6 es un diagrama que ilustra unidades de codificación más profundas de acuerdo con las profundidades y particiones, de acuerdo con una realización ejemplar.
El aparato 100 de codificación de vídeo y el aparato 200 de decodificación de vídeo usan unidades de codificación jerárquicas para considerar las características de una imagen. Una altura máxima, una anchura máxima y una profundidad máxima de unidades de codificación pueden determinarse de manera adaptativa de acuerdo con las características de la imagen, o pueden establecerse de manera diferente por un usuario. Los tamaños de las unidades de codificación más profundas de acuerdo con las profundidades pueden determinarse de acuerdo con el tamaño máximo predeterminado de la unidad de codificación.
En una estructura 600 jerárquica de unidades de codificación, de acuerdo con una realización ejemplar, la altura máxima y la anchura máxima de las unidades de codificación son cada una 64, y la profundidad máxima es 4. Puesto que una profundidad se hace profunda a lo largo de un eje vertical de la estructura 600 jerárquica, una altura y una anchura de la unidad de codificación más profunda se dividen ambas. También, una unidad de predicción y las particiones, que son las bases para la codificación de predicción de cada unidad de codificación más profunda, se muestran a lo largo de un eje horizontal de la estructura 600 jerárquica.
En otras palabras, una unidad 610 de codificación es una unidad de codificación máxima en la estructura 600 jerárquica, en la que la una profundidad es 0 y un tamaño, es decir, una altura por anchura, es 64x64. La profundidad se hace profunda a lo largo del eje vertical, y existe una unidad 620 de codificación que tiene un tamaño de 32x32 y una profundidad de 1, una unidad 630 de codificación que tiene un tamaño de 16x16 y una profundidad de 2, una unidad 640 de codificación que tiene un tamaño de 8x8 y una profundidad de 3, y una unidad 650 de codificación que tiene un tamaño de 4x4 y una profundidad de 4. La unidad 650 de codificación que tiene el tamaño de 4x4 y la profundidad de 4 es una unidad de codificación mínima.
La unidad de predicción y las particiones de una unidad de codificación están dispuestas a lo largo del eje horizontal de acuerdo con cada profundidad. En otras palabras, si la unidad 610 de codificación que tiene el tamaño de 64x64 y la profundidad de 0 es una unidad de predicción, la unidad de predicción puede dividirse en particiones incluidas en la unidad 610 de codificación, es decir una partición 610 que tiene un tamaño de 64x64, particiones 612 que tienen el tamaño de 64x32, particiones 614 que tienen el tamaño de 32x64, o particiones 616 que tienen el tamaño de 32x32.
De manera similar, una unidad de predicción de la unidad 620 de codificación que tiene el tamaño de 32x32 y la profundidad de 1 puede dividirse en particiones incluidas en la unidad 620 de codificación, es decir una partición 620 que tiene un tamaño de 32x32, particiones 622 que tienen un tamaño de 32x16, particiones 624 que tienen un tamaño de 16x32, y particiones 626 que tienen un tamaño de 16x16.
De manera similar, una unidad de predicción de la unidad 630 de codificación que tiene el tamaño de 16x16 y la profundidad de 2 puede dividirse en particiones incluidas en la unidad 630 de codificación, es decir, una partición que tiene un tamaño de 16x16 incluida en la unidad 630 de codificación, particiones 632 que tienen un tamaño de 16x8, particiones 634 que tienen un tamaño de 8x16, y particiones 636 que tienen un tamaño de 8x8.
De manera similar, una unidad de predicción de la unidad 640 de codificación que tiene el tamaño de 8x8 y la profundidad de 3 puede dividirse en particiones incluidas en la unidad 640 de codificación, es decir una partición que tiene un tamaño de 8x8 incluida en la unidad 640 de codificación, particiones 642 que tienen un tamaño de 8x4, particiones 644 que tienen un tamaño de 4x8, y particiones 646 que tienen un tamaño de 4x4.
La unidad 650 de codificación que tiene el tamaño de 4x4 y la profundidad de 4 es la unidad de codificación mínima y una unidad de codificación de la profundidad más baja. Una unidad de predicción de la unidad 650 de codificación se asigna únicamente a una partición que tiene un tamaño de 4x4.
Para determinar la al menos una profundidad codificada de las unidades de codificación que constituyen la unidad 610 de codificación máxima, el determinador 120 de unidad de codificación del aparato 100 de codificación de vídeo realiza codificación para unidades de codificación que corresponden a cada profundidad incluida en la unidad 610 de codificación máxima.
Un número de unidades de codificación más profundas de acuerdo con las profundidades que incluyen datos en el mismo intervalo y el mismo tamaño aumenta a medida que la profundidad se hace profunda. Por ejemplo, se requieren cuatro unidades de codificación que corresponden a una profundidad de 2 para cubrir datos que están incluidos en una unidad de codificación que corresponde a una profundidad de 1. Por consiguiente, para comparar
imagen8
10
15
20
25
30
35
40
45
50
55
Una unidad 910 para codificar por predicción una unidad 900 de codificación que tiene una profundidad de 0 y un tamaño de 2N_0x2N_0 puede incluir particiones de un tipo 912 de partición que tiene un tamaño de 2N_0x2N_0, un tipo 914 de partición que tiene un tamaño de 2N_0xN_0, un tipo 916 de partición que tiene un tamaño de N_0x2N_0, y un tipo 918 de partición que tiene un tamaño de N_0xN_0. La Figura 9 ilustra únicamente los tipos 912 a 918 de particiones que se obtienen dividiendo simétricamente la unidad 910 de predicción, pero un tipo de partición no está limitado a las mismas, y las particiones de la unidad 910 de predicción puede incluir particiones asimétricas, particiones que tienen una forma determinada y particiones que tienen una forma geométrica.
La codificación de predicción se realiza repetitivamente en una partición que tiene un tamaño de 2N_0x2N_0, dos particiones que tienen un tamaño de 2N_0xN_0, dos particiones que tienen un tamaño de N_0x2N_0, y cuatro particiones que tienen un tamaño de N_0xN_0, de acuerdo con cada tipo de partición. La codificación de predicción en un modo intra y en un modo inter puede realizarse en las particiones que tienen los tamaños de 2N_0x2N_0, N_0x2N_0, 2N_0xN_0, y N_0xN_0. La codificación de predicción en un modo de salto se realiza únicamente en la partición que tiene el tamaño de 2N_0x2N_0.
Se comparan los errores de codificación que incluyen la codificación de predicción en los tipos 912 a 918 de particiones, y se determina el menor error de codificación entre los tipos de partición. Si un error de codificación es el más pequeño en uno de los tipos de particiones 912 a 916, la unidad 910 de predicción puede no dividirse en una profundidad inferior.
Si el error de codificación es el más pequeño en el tipo 918 de partición, se cambia una profundidad desde 0 a 1 para dividir el tipo 918 de partición en la operación 920, y la codificación se realiza repetitivamente en las unidades 930 de codificación que tienen una profundidad de 2 y un tamaño de N_0xN_0 para buscar un error de codificación mínimo.
Una unidad 940 de predicción para codificar por predicción la unidad 930 de codificación que tiene una profundidad de 1 y un tamaño de 2N_1x2N_1 (=N_0xN_0) puede incluir particiones de un tipo 942 de partición que tiene un tamaño de 2N_1x2N_1, un tipo 944 de partición que tiene un tamaño de 2N_1xN_1, un tipo 946 de partición que tiene un tamaño de N_1x2N_1, y un tipo 948 de partición que tiene un tamaño de N_1xN_1.
Si un error de codificación es el más pequeño en el tipo 948 de partición, se cambia una profundidad desde 1 a 2 para dividir el tipo 948 de partición en la operación 950, y se realiza la codificación repetitivamente en unidades 960 de codificación, que tienen una profundidad de 2 y un tamaño de N_2xN_2 para buscar un error de codificación mínimo.
Cuando una profundidad máxima es d, la operación de división de acuerdo con cada profundidad puede realizarse hasta cuando una profundidad se hace d-1, y la información de división puede codificarse como hasta cuando una profundidad es una de 0 a d-2. En otras palabras, cuando se realiza codificación hasta cuando la profundidad es d-1 después de que se divide una unidad de codificación que corresponde a una profundidad de d-2 en la operación 970, una unidad 990 de predicción para codificar por predicción una unidad 980 de codificación que tiene una profundidad de d-1 y un tamaño de 2N_(d-1)x2N_(d-1) puede incluir particiones de un tipo 992 de partición que tiene un tamaño de 2N_(d-1)x2N_(d-1), un tipo 994 de partición que tiene un tamaño de 2N_(d-1)xN_(d-1), un tipo 996 de partición que tiene un tamaño de N_(d-1)x2N_(d-1), y un tipo 998 de partición que tiene un tamaño de N_(d-1)xN_(d1).
La codificación de predicción puede realizarse repetitivamente en una partición que tiene un tamaño de 2N_(d1)x2N_(d-1), dos particiones que tienen un tamaño de 2N_(d-1)xN_(d-1), dos particiones que tienen un tamaño de N_(d-1)x2N_(d-1), cuatro particiones que tienen un tamaño de N_(d-1)xN_(d-1) de entre los tipos 992 a 998 de particiones para buscar un tipo de partición que tiene un error de codificación mínimo.
Incluso cuando el tipo 998 de partición tiene el error de codificación mínimo, puesto que una profundidad máxima es d, una unidad de codificación CU_(d-1) que tiene una profundidad de d-1 ya no se divide a una profundidad inferior, y una profundidad codificada para las unidades de codificación que constituyen una unidad 900 de codificación máxima actual se determina que es d-1 y un tipo de partición de la unidad 900 de codificación máxima actual puede determinarse que es N_(d-1)xN_(d-1). También, puesto que la profundidad máxima es d y una unidad 980 de codificación mínima que tiene una profundidad más baja de d-1 ya no se divide a una profundidad inferior, no se establece la información de división para la unidad 980 de codificación mínima.
Una unidad 999 de datos puede ser una ‘unidad mínima’ para la unidad de codificación máxima actual. Una unidad mínima, de acuerdo con una realización ejemplar, puede ser una unidad de datos rectangular obtenida dividiendo una unidad 980 de codificación mínima por 4. Realizando la codificación repetitivamente, el aparato 100 de codificación de vídeo puede seleccionar una profundidad que tiene el menor error de codificación comparando errores de codificación de acuerdo con las profundidades de la unidad 900 de codificación para determinar una profundidad codificada, y establecer un tipo de partición correspondiente y un modo de predicción como un modo de codificación de la profundidad codificada.
Como tal, los errores de codificación mínimos de acuerdo con las profundidades se comparan en todas las profundidades de 1 a d, y puede determinarse una profundidad que tiene el menor error de codificación como una
10
15
20
25
30
35
40
profundidad codificada. La profundidad codificada, el tipo de partición de la unidad de predicción, y el modo de predicción pueden codificarse y transmitirse como información acerca de un modo de codificación. También, puesto que una unidad de codificación se divide desde una profundidad de 0 a una profundidad codificada, únicamente la información de división de la profundidad codificada se establece a 0, y la información de división de las profundidades excluyendo la profundidad codificada se establece a 1.
Los datos de imagen y el extractor 220 de información de codificación del aparato 200 de decodificación de vídeo pueden extraer y usar la información acerca de la profundidad codificada y la unidad de predicción de la unidad 900 de codificación para decodificar la partición 912. El aparato 200 de decodificación de vídeo puede determinar una profundidad, en el que la información de división es 0, como una profundidad codificada usando información de división de acuerdo con las profundidades, y usar la información acerca de un modo de codificación de la correspondiente profundidad para decodificar.
Las Figuras 10 a 12 son diagramas para describir una relación entre unidades 1010 de codificación, unidades 1060 de predicción, y unidades 1070 de transformación, de acuerdo con una realización ejemplar.
Las unidades 1010 de codificación son unidades de codificación que tienen una estructura de árbol, que corresponde a profundidades codificadas determinadas por el aparato 100 de codificación de vídeo, en una unidad de codificación máxima. Las unidades 1060 de predicción son particiones de unidades de predicción de cada una de las unidades 1010 de codificación, y las unidades 1070 de transformación son unidades de transformación de cada una de las unidades 1010 de codificación.
Cuando una profundidad de una unidad de codificación máxima es 0 en las unidades 1010 de codificación, las profundidades de las unidades 1012 y 1054 de codificación son 1, las profundidades de las unidades 1014, 1016, 1018, 1028, 1050, y 1052 de codificación son 2, las profundidades de las unidades 1020, 1022, 1024, 1026, 1030, 1032, y 1048 de codificación son 3, y las profundidades de las unidades 1040, 1042, 1044, y 1046 de codificación son 4.
En las unidades 1060 de predicción, se obtienen algunas unidades 1014, 1016, 1022, 1032, 1048, 1050, 1052, y 1054 de codificación dividiendo las unidades de codificación en las unidades 1010 de codificación. En otras palabras, los tipos de partición en las unidades 1014, 1022, 1050, y 1054 de codificación tienen un tamaño de 2NxN, los tipos de partición en las unidades 1016, 1048, y 1052 de codificación tienen un tamaño de Nx2N, y un tipo de partición de la unidad 1032 de codificación tiene un tamaño de NxN. Las unidades de predicción y las particiones de las unidades 1010 de codificación son menores que o iguales a cada unidad de codificación.
Se realiza transformación o transformación inversa en los datos de imagen de la unidad 1052 de codificación en las unidades 1070 de transformación en una unidad de datos que es menor que la unidad 1052 de codificación. También, las unidades 1014, 1016, 1022, 1032, 1048, 1050, y 1052 de codificación en las unidades 1070 de transformación son diferentes de aquellas en las unidades 1060 de predicción en términos de tamaños y formas. En otras palabras, los aparatos 100 y 200 de codificación y decodificación de vídeo pueden realizar intra predicción, estimación de movimiento, compensación de movimiento, transformación y transformación inversa individualmente en una unidad de datos en la misma unidad de codificación.
Por consiguiente, se realiza codificación recursivamente en cada una de las unidades de codificación que tienen una estructura jerárquica en cada región de una unidad de codificación máxima para determinar una unidad de codificación óptima, y por lo tanto pueden obtenerse las unidades de codificación que tienen una estructura de árbol recursiva. La información de codificación puede incluir información de división acerca de una unidad de codificación, información acerca de un tipo de partición, información acerca de un modo de predicción, e información acerca de un tamaño de una unidad de transformación. La Tabla 1 muestra la información de codificación que puede establecerse por los aparatos 100 y 200 de codificación y decodificación de vídeo.
5
10
15
20
25
30
35
[Tabla 1]
Información de división 0 (codificación en unidad de codificación que tiene tamaño de 2Nx2N y profundidad actual de d)
Información de división 1
Modo de predicción
Tipo de partición Tamaño de unidad de transformación Codificar repetitivamente unidades de codificación que
Intra lnter
Tipo de partición simétrica Tipo de partición asimétrica Información de división 0 de unidad de transformación Información de división 1 de unidad de transformación
NxN
2Nx2N
2NxnU (tipo simétrico) tienen profundidad
Salto
2NxN 2NxnD 2Nx2N inferior de d+1
(únicamente
Nx2N nLx2N
2Nx2N)
NxN nRx2N N/2xN/2 (tipo asimétrico)
La unidad 130 de salida del aparato 100 de codificación de vídeo puede emitir la información de codificación acerca de las unidades de codificación que tienen una estructura de árbol, y los datos de imagen y el extractor 220 de información de codificación del aparato 200 de decodificación de vídeo pueden extraer la información de codificación acerca de las unidades de codificación que tienen una estructura de árbol desde un flujo de bits recibido.
La información de división indica si una unidad de codificación actual se divide en unidades de codificación de una profundidad inferior. Si la información de división de una profundidad actual d es 0, una profundidad, en la que una unidad de codificación actual ya no se divide en una profundidad inferior, es una profundidad codificada, y por lo tanto puede definirse la información acerca de un tipo de partición, modo de predicción, y un tamaño de una unidad de transformación para la profundidad codificada. Si la unidad de codificación actual se divide adicionalmente de acuerdo con la información de división, la codificación se realiza independientemente en cuatro unidades de codificación de división de una profundidad inferior.
Un modo de predicción puede ser uno de un modo intra, un modo inter, y un modo de salto. El modo intra y el modo inter pueden definirse en todos los tipos de partición, y el modo de salto se define únicamente en un tipo de partición que tiene un tamaño de 2Nx2N.
La información acerca del tipo de partición puede indicar tipos de partición simétrica que tienen tamaños de 2Nx2N, 2NxN, Nx2N, y NxN, que se obtienen dividiendo simétricamente una altura o una anchura de una unidad de predicción, y tipos de partición asimétrica que tienen tamaños de 2NxnU, 2NxnD, nLx2N, y nRx2N, que se obtienen dividiendo asimétricamente la altura o anchura de la unidad de predicción. Los tipos de partición asimétrica que tienen los tamaños de 2NxnU y 2NxnD pueden obtenerse respectivamente dividiendo la altura de la unidad de predicción en 1:3 y 3:1, y los tipos de partición asimétrica que tienen los tamaños de nLx2N y nRx2N pueden obtenerse respectivamente dividendo la anchura de la unidad de predicción en 1:3 y 3:1
El tamaño de la unidad de transformación puede establecerse para que sea dos tipos en el modo intra y dos tipos en el modo inter. En otras palabras, si la información de división de la unidad de transformación es 0, el tamaño de la unidad de transformación puede ser 2Nx2N, que es el tamaño de la unidad de codificación actual. Si la información de división de la unidad de transformación es 1, las unidades de transformación pueden obtenerse dividiendo la unidad de codificación actual. También, si un tipo de partición de la unidad de codificación actual que tiene el tamaño de 2Nx2N es un tipo de partición simétrica, un tamaño de una unidad de transformación puede ser NxN, y si el tipo de partición de la unidad de codificación actual es un tipo de partición asimétrica, el tamaño de la unidad de transformación puede ser N/2xN/2.
La información de codificación acerca de las unidades de codificación que tienen una estructura de árbol puede incluir al menos uno de una unidad de codificación que corresponde a una profundidad codificada, una unidad de predicción, y una unidad mínima. La unidad de codificación que corresponde a la profundidad codificada puede incluir al menos una de una unidad de predicción y una unidad mínima que contiene la misma información de codificación.
imagen9
10
15
20
25
30
35
40
45
50
Por lo tanto, si se define que la bandera de tamaño TU máximo es ‘MaxTransformSizelndex’, un tamaño de unidad de transformación mínimo es ‘MinTransformSize’, y un tamaño de unidad de transformación es ‘RootTuSize’ cuando la bandera de tamaño TU es 0, entonces un tamaño de unidad de transformación mínimo actual ‘CurrMinTuSize’ que puede determinarse en una unidad de codificación actual, puede definirse mediante la Ecuación (1):
CurrMinTuSize = max(MinTransformSize, RootTuSize/(2^MaxTransformSizelndex))……(1)
En comparación con el tamaño de unidad de transformación mínimo actual ‘CurrMinTuSize’ que puede determinarse en la unidad de codificación actual, un tamaño de unidad de transformación ‘RootTuSize’ cuando la bandera de tamaño TU es 0 puede indicar un tamaño de unidad de transformación máximo que puede seleccionarse en el sistema. En la Ecuación (1), ‘RootTuSize/(2^MaxTransformSizelndex)’ indica un tamaño de unidad de transformación cuando el tamaño de la unidad de transformación ‘RootTuSize’, cuando la bandera de tamaño TU es 0, se divide un número de veces que corresponde a la bandera de tamaño TU máximo, y ‘MinTransformSize’ indica un tamaño de transformación mínimo. Por lo tanto, un valor más pequeño de entre ‘RootTuSize/(2^MaxTransformSizelndex)’ y ‘MinTransformSize’ puede ser el tamaño de unidad de transformación mínimo actual ‘CurrMinTuSize’ que puede determinarse en la unidad de codificación actual.
De acuerdo con una realización ejemplar, el tamaño de unidad de transformación máximo RootTuSize puede variar de acuerdo con el tipo de un modo de predicción.
Por ejemplo, si un modo de predicción actual es un modo inter, entonces ‘RootTuSize’ puede determinarse usando la Ecuación (2) a continuación. En la Ecuación (2), ‘MaxTransformSize’ indica un tamaño de unidad de transformación máximo, y ‘PUSize’ indica un tamaño de unidad de predicción actual.
RootTuSize = min(MaxTransformSize, PUSize) …… (2)
Es decir, si el modo de predicción actual es el modo inter, el tamaño de la unidad de transformación ‘RootTuSize’ cuando la bandera de tamaño TU es 0, puede ser un valor menor de entre el tamaño de unidad de transformación máximo y el tamaño de unidad de predicción actual.
Si un modo de predicción de una unidad de partición actual es un modo intra, ‘RootTuSize’ puede determinarse usando la Ecuación (3) a continuación. En la Ecuación (3), ‘Partitionsize’ indica el tamaño de la unidad de partición actual.
RootTuSize = min(MaxTransformSize, Partitionsize) …… (3)
Es decir, si el modo de predicción actual es el modo intra, el tamaño de la unidad de transformación ‘RootTuSize’ cuando la bandera de tamaño TU es 0 puede ser un valor menor de entre el tamaño de unidad de transformación máximo y el tamaño de la unidad de partición actual.
Sin embargo, el tamaño de unidad de transformación máximo actual ‘RootTuSize’ que varía de acuerdo con el tipo de un modo de predicción en una unidad de partición es solo un ejemplo y no está limitado al mismo.
La Figura 14 es un diagrama de flujo que ilustra un procedimiento de codificación de un vídeo, de acuerdo con una realización ejemplar.
En la operación 1210, una instantánea actual se divide en al menos una unidad de codificación máxima. Puede predeterminarse una profundidad máxima que indica el número total de posibles veces de división.
En la operación 1220, se determina una profundidad codificada para emitir un resultado de codificación final de acuerdo con al menos una región de división, que se obtiene dividiendo una región de cada unidad de codificación máxima de acuerdo con las profundidades, codificando la al menos una región de división, y se determina una unidad de codificación de acuerdo con una estructura de árbol.
La unidad de codificación máxima se divide espacialmente cada vez que la profundidad se hace profunda, y por lo tanto se divide en unidades de codificación de una profundidad inferior. Cada unidad de codificación puede dividirse en unidades de codificación de otra profundidad inferior dividiéndose espacialmente de manera independiente desde unidades de codificación adyacentes. La codificación se realiza repetitivamente en cada unidad de codificación de acuerdo con las profundidades.
También, se determina una unidad de transformación de acuerdo con los tipos de partición que tiene el menor error de codificación para cada unidad de codificación más profunda. Para determinar una profundidad codificada que tiene un error de codificación mínimo en cada unidad de codificación máxima, pueden medirse errores de codificación y compararse en todas las unidades de codificación más profundas de acuerdo con las profundidades.
En la operación 1230, los datos de imagen codificados que constituyen el resultado de codificación final de acuerdo con la profundidad codificada se emiten para cada unidad de codificación máxima, con información de codificación acerca de la profundidad codificada y un modo de codificación. La información acerca del modo de codificación puede incluir información acerca de una profundidad codificada o la información de división, información acerca de
10
15
20
25
30
35
40
45
50
un tipo de partición de una unidad de predicción, un modo de predicción, y un tamaño de una unidad de transformación. La información codificada acerca del modo de codificación puede transmitirse a un decodificador con los datos de imagen codificados.
La Figura 15 es un diagrama de flujo que ilustra un procedimiento de decodificación de un vídeo, de acuerdo con una realización ejemplar.
En la operación 1310, se recibe y analiza un flujo de bits de un vídeo codificado.
En la operación 1320, los datos de imagen codificados de una instantánea actual asignados a una unidad de codificación máxima, y la información acerca de una profundidad codificada y un modo de codificación de acuerdo con unidades de codificación máxima se extraen desde del flujo de bits analizado. La profundidad codificada de cada unidad de codificación máxima es una profundidad que tiene el menor error de codificación en cada unidad de codificación máxima. Al codificar cada unidad de codificación máxima, los datos de imagen se codifican basándose en al menos una unidad de datos obtenida dividiendo jerárquicamente cada unidad de codificación máxima de acuerdo con las profundidades.
De acuerdo con la información acerca de la profundidad codificada y el modo de codificación, la unidad de codificación máxima puede dividirse en unidades de codificación que tienen una estructura de árbol. Cada una de las unidades de codificación que tienen la estructura de árbol se determina como una unidad de codificación que corresponde a una profundidad codificada, y se codifica de manera óptima para emitir el menor error de codificación. Por consiguiente, la eficacia de codificación y decodificación de una imagen puede mejorarse decodificando cada pieza de los datos de imagen codificados en las unidades de codificación después de determinar al menos una profundidad codificada de acuerdo con las unidades de codificación.
En la operación 1330, los datos de imagen de cada unidad de codificación máxima se decodifican basándose en la información acerca de la profundidad codificada y el modo de codificación de acuerdo con las unidades de codificación máxima. Los datos de imagen decodificada pueden reproducirse mediante un aparato de reproducción, almacenarse en un medio de almacenamiento, o transmitirse a través de una red.
La Figura 16 es un diagrama de bloques de un aparato 1400 de codificación de vídeo con respecto a inter predicción usando particiones divididas de acuerdo con proporciones arbitrarias, de acuerdo con otra realización ejemplar.
El aparato 1400 de codificación de vídeo incluye un divisor 1410 de unidad de codificación máxima, un codificador 1420, y una unidad 1430 de salida.
El divisor 1410 de unidad de codificación máxima puede dividir datos de vídeo en una unidad de codificación máxima. Los datos de vídeo máximos divididos en la unidad de codificación máxima se emiten a la unidad 1430 de salida. La unidad de codificación máxima puede establecerse previamente en unidades de datos, tal como una secuencia de fotogramas, un fotograma, un corte, una unidad de codificación, etc.
Los datos de vídeo máximos pueden establecerse de manera selectiva como al menos uno de bloques que tienen tamaños respectivos de 16x16, 32x32, 64x64, 128x128 y 256x256.
El codificador 1420 codifica los datos de vídeo de la unidad de codificación máxima divididos por el divisor 1410 de unidad de codificación máxima. El codificador 1420 codifica los datos de vídeo para al menos una región de división de la unidad de codificación máxima basándose en unidades de codificación más profundas de estructuras jerárquicas. Durante una operación de codificación de las unidades de codificación más profundas, se realiza inter predicción para buscar una región similar usando particiones incluidas en las unidades de codificación más profundas y para estimar información de movimiento de las particiones.
La inter predicción puede usar particiones obtenidas dividiendo una unidad de codificación de acuerdo con proporciones arbitrarias. Ejemplos de la unidad de predicción y particiones mostradas en las Figuras 3 a 13 incluyen particiones que tienen tamaños de 2Nx2N, 2NxN, Nx2N y NxN divididos desde una unidad de codificación que tiene un tamaño de 2Nx2N. El codificador 1420 puede realizar la inter predicción de acuerdo con tipos de partición que incluyen particiones divididas de acuerdo con proporciones arbitrarias o de acuerdo con proporciones asimétricas así como particiones obtenidas dividiendo la anchura o la altura de la unidad de codificación a una proporción de 1:1.
Por ejemplo, las particiones obtenidas dividiendo la unidad de codificación de acuerdo con proporciones arbitrarias pueden obtenerse dividiendo la anchura o la altura de la unidad de codificación a una proporción de 1:3 o 3:1. Las particiones pueden dividirse a diversas proporciones arbitrarias tales como 1:2, 2:1, 1:3, 3:1, 2:3, 3:2, 1:4, 4:1, etc.
Los tipos de partición pueden incluir particiones obtenidas dividiendo asimétricamente la unidad de codificación así como particiones obtenidas dividiendo las unidades de codificación de acuerdo con proporciones arbitrarias. Los tipos de partición para la inter predicción de la unidad de codificación pueden no estar limitados a incluir particiones divididas en una dirección definida de acuerdo con proporciones arbitrarias y pueden incluir particiones que tienen formas arbitrarias.
imagen10
10
15
20
25
30
35
40
45
50
55
El extractor 1520 puede extraer adicionalmente información con respecto a si un tipo de partición para inter predicción incluye particiones obtenidas dividiendo una unidad de codificación de acuerdo con proporciones arbitrarias a partir del flujo de bits. La información con respecto a si el tipo de partición es para inter predicción incluye particiones obtenidas dividiendo la unidad de codificación de acuerdo con proporciones arbitrarias puede extraerse a partir de un conjunto de parámetros de secuencia del flujo de bits, un encabezamiento de corte, información de codificación para unidades de codificación, etc.
El decodificador 1530 recibe los datos de vídeo y la información de codificación extraídos desde el extractor 1520 y decodifica datos de vídeo basándose en la información de codificación. Más específicamente, el decodificador 1530 decodifica los datos de vídeo para una unidad de codificación de al menos una profundidad de codificación de acuerdo con las unidades de codificación máxima basándose en la información con respecto a las profundidades de codificación y modos de codificación de acuerdo con las unidades de codificación máxima.
En particular, el decodificador 1530 puede realizar de manera selectiva compensación de movimiento usando las particiones obtenidas dividiendo la unidad de codificación de acuerdo con proporciones arbitrarias de acuerdo con la información con respecto a si el tipo de partición para inter predicción incluye porciones obtenidas dividiendo la unidad de codificación de acuerdo con proporciones arbitrarias extraídas por el extractor 1520.
Es decir, el decodificador 1530 puede realizar compensación de movimiento usando un vector de movimiento previsto de acuerdo con un tipo de partición que incluye particiones obtenidas dividiendo asimétricamente la unidad de codificación de acuerdo con proporciones arbitrarias tal como 1:2, 2:1, 1:3, 3:1, 2:3, 3:2, 1:4, 4:1, etc. y las particiones obtenidas dividiendo la unidad de codificación en la proporción arbitraria de 1:1 también. Adicionalmente, el decodificador 1530 puede realizar compensación de movimiento usando particiones que tienen formas arbitrarias así como particiones obtenidas dividiendo la unidad de codificación en una dirección.
El decodificador 1530 puede realizar de manera selectiva compensación de movimiento de acuerdo con particiones que tienen alturas y anchuras en proporciones arbitrarias determinando si la inter predicción se codifica usando las particiones obtenidas dividiendo la unidad de codificación de acuerdo con proporciones arbitrarias, restaurando de esta manera con precisión la unidad de codificación distinguida con respecto a regiones que tienen diversas características de una imagen.
El aparato 1500 de decodificación de vídeo puede restaurar y reproducir los datos de vídeo decodificados de acuerdo con las unidades de codificación máxima.
Por lo tanto, si la codificación/decodificación de predicción que usa las particiones divididas de acuerdo con proporciones arbitrarias se realiza como el aparato 1400 de codificación de vídeo y el aparato 1500 de decodificación de vídeo, la inter predicción se realiza usando las particiones que se dividen en un lado a una profundidad actual sin tener que dividir adicionalmente una unidad de codificación más profunda actual en profundidades inferiores. Por lo tanto, las particiones divididas de acuerdo con proporciones arbitrarias pueden usarse para realizar más eficazmente y con precisión codificación o decodificación de predicción en una unidad de codificación con tamaño grande.
La Figura 18 es un diagrama de particiones ejemplares obtenidas dividiendo una unidad de codificación de acuerdo con proporciones arbitrarias, de acuerdo con una realización ejemplar.
Haciendo referencia a la Figura 18, un tipo de partición para codificación de predicción de la unidad de codificación puede incluir particiones obtenidas dividiendo la altura y anchura de la unidad de codificación de acuerdo con proporciones arbitrarias. Por ejemplo, un tipo de partición de una unidad 1600 de codificación que tiene un tamaño de 64x64 puede incluir particiones obtenidas dividiendo la unidad 1600 de codificación de acuerdo con una proporción de 1:3 o 3:1 y particiones que tienen tamaños de 64x32, 32x64 y 32x32 obtenidas dividiendo la altura o la anchura de la unidad 1600 de codificación de acuerdo con una proporción de 1:1 también.
Más específicamente, un tipo de partición de la unidad 1600 de codificación que tiene el tamaño de 64x64 puede incluir las particiones 1610 y 1620 que tienen tamaños de 64x16 y 64x48, respectivamente, obtenidas dividiendo la altura de la unidad 1600 de codificación de acuerdo con la proporción de 1:3 o 3:1. Adicionalmente, el tipo de partición de la unidad 1600 de codificación que tiene el tamaño de 64x64 puede incluir las particiones 1630 y 1640 que tienen tamaños de 64x16 y 64x48 obtenidas dividiendo la anchura de la unidad 1600 de codificación de acuerdo con la proporción de 1:3 o 3:1.
La Figura 19 ilustra una sintaxis de un conjunto 1700 de parámetros de secuencia que incluye información con respecto a si un tipo de partición para inter predicción incluye particiones obtenidas dividiendo una unidad de codificación de acuerdo con proporciones arbitrarias, de acuerdo con una realización ejemplar.
Haciendo referencia a la Figura 19, sequence_parameter_set es la sintaxis del conjunto 1700 de parámetros de secuencia para un corte de imagen actual. La información con respecto a si el tipo de partición para inter predicción incluye particiones obtenidas dividiendo la unidad de codificación de acuerdo con proporciones arbitrarias se inserta en la sintaxis del conjunto 1700 de parámetros de secuencia para el corte de imagen actual.
imagen11
imagen12
imagen13

Claims (1)

  1. imagen1
ES13167741.1T 2009-12-08 2010-12-08 Procedimiento y aparato para codificar vídeo mediante predicción de movimiento usando partición arbitraria, y procedimiento y aparato para decodificar vídeo mediante predicción de movimiento usando partición arbitraria Active ES2598106T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20090121400A KR101484280B1 (ko) 2009-12-08 2009-12-08 임의적인 파티션을 이용한 움직임 예측에 따른 비디오 부호화 방법 및 장치, 임의적인 파티션을 이용한 움직임 보상에 따른 비디오 복호화 방법 및 장치
KR20090121400 2009-12-08

Publications (1)

Publication Number Publication Date
ES2598106T3 true ES2598106T3 (es) 2017-01-25

Family

ID=44081984

Family Applications (5)

Application Number Title Priority Date Filing Date
ES10836203.9T Active ES2610410T3 (es) 2009-12-08 2010-12-08 Método de descodificación vídeo por partición arbitraria utilizando predicción de movimiento
ES15159952.9T Active ES2625313T3 (es) 2009-12-08 2010-12-08 Procedimiento y aparato de decodificación de vídeo mediante predicción de movimiento usando partición arbitraria
ES13167741.1T Active ES2598106T3 (es) 2009-12-08 2010-12-08 Procedimiento y aparato para codificar vídeo mediante predicción de movimiento usando partición arbitraria, y procedimiento y aparato para decodificar vídeo mediante predicción de movimiento usando partición arbitraria
ES15159951.1T Active ES2683595T3 (es) 2009-12-08 2010-12-08 Procedimiento y aparato de decodificación de vídeo mediante predicción de movimiento usando partición arbitraria
ES13167742.9T Active ES2533304T3 (es) 2009-12-08 2010-12-08 Método y aparato para codificar vídeo por predicción de movimiento usando una partición arbitraria, y método y aparato para decodificar vídeo por predicción de movimiento usando una partición arbitraria

Family Applications Before (2)

Application Number Title Priority Date Filing Date
ES10836203.9T Active ES2610410T3 (es) 2009-12-08 2010-12-08 Método de descodificación vídeo por partición arbitraria utilizando predicción de movimiento
ES15159952.9T Active ES2625313T3 (es) 2009-12-08 2010-12-08 Procedimiento y aparato de decodificación de vídeo mediante predicción de movimiento usando partición arbitraria

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES15159951.1T Active ES2683595T3 (es) 2009-12-08 2010-12-08 Procedimiento y aparato de decodificación de vídeo mediante predicción de movimiento usando partición arbitraria
ES13167742.9T Active ES2533304T3 (es) 2009-12-08 2010-12-08 Método y aparato para codificar vídeo por predicción de movimiento usando una partición arbitraria, y método y aparato para decodificar vídeo por predicción de movimiento usando una partición arbitraria

Country Status (24)

Country Link
US (10) US8938006B2 (es)
EP (6) EP2510698B1 (es)
JP (6) JP5813000B2 (es)
KR (1) KR101484280B1 (es)
CN (7) CN104837018B (es)
AU (1) AU2010328813B2 (es)
BR (5) BR122020024421B1 (es)
CA (5) CA2783786C (es)
CY (5) CY1116338T1 (es)
DK (5) DK2510698T3 (es)
ES (5) ES2610410T3 (es)
HR (5) HRP20150304T1 (es)
HU (3) HUE030162T2 (es)
LT (4) LT2899978T (es)
MX (1) MX2012006633A (es)
MY (5) MY155120A (es)
PL (5) PL2629528T3 (es)
PT (5) PT2629527T (es)
RS (5) RS53897B1 (es)
RU (5) RU2569807C2 (es)
SI (5) SI2629528T1 (es)
SM (1) SMT201500074B (es)
WO (1) WO2011071308A2 (es)
ZA (4) ZA201204888B (es)

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101484280B1 (ko) 2009-12-08 2015-01-20 삼성전자주식회사 임의적인 파티션을 이용한 움직임 예측에 따른 비디오 부호화 방법 및 장치, 임의적인 파티션을 이용한 움직임 보상에 따른 비디오 복호화 방법 및 장치
KR101487687B1 (ko) 2010-01-14 2015-01-29 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
KR101675118B1 (ko) * 2010-01-14 2016-11-10 삼성전자 주식회사 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
WO2011129619A2 (ko) 2010-04-13 2011-10-20 삼성전자 주식회사 트리 구조 부호화 단위에 기반한 디블록킹 필터링을 수행하는 비디오 부호화 방법과 그 장치 및 복호화 방법과 그 장치
PL2953356T3 (pl) 2010-08-17 2019-02-28 Samsung Electronics Co., Ltd. Sposób dekodowania wideo wykorzystujący jednostkę przekształcenia o zmiennej strukturze drzewiastej
KR101829515B1 (ko) * 2011-01-13 2018-02-14 닛본 덴끼 가부시끼가이샤 영상 복호 장치, 영상 복호 방법 및 기록 매체
KR20120090740A (ko) * 2011-02-07 2012-08-17 (주)휴맥스 정밀한 단위의 필터 선택을 적용한 영상 부호화/복호화 장치 및 방법
WO2012117744A1 (en) 2011-03-03 2012-09-07 Panasonic Corporation Method of encoding an image into a coded image, method of decoding a coded image, and apparatuses thereof
EP2533537A1 (en) * 2011-06-10 2012-12-12 Panasonic Corporation Transmission of picture size for image or video coding
US11245912B2 (en) 2011-07-12 2022-02-08 Texas Instruments Incorporated Fast motion estimation for hierarchical coding structures
CN102970526B (zh) * 2011-08-31 2016-12-14 华为技术有限公司 一种获得变换块尺寸的方法和模块
EP3754982B1 (en) 2011-09-29 2024-05-01 SHARP Kabushiki Kaisha Image decoding device, image decoding method, image encoding method and image encoding device for performing bi-prediction to uni-prediction conversion
WO2013047805A1 (ja) * 2011-09-29 2013-04-04 シャープ株式会社 画像復号装置、画像復号方法および画像符号化装置
WO2013065402A1 (ja) * 2011-10-31 2013-05-10 三菱電機株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
US20130163664A1 (en) * 2011-12-22 2013-06-27 Qualcomm Incorporated Unified partition mode table for intra-mode coding
WO2013155664A1 (en) * 2012-04-16 2013-10-24 Mediatek Singapore Pte. Ltd. Methods and apparatuses of coding structure for scalable extension of high efficiency video coding (hevc)
WO2013155665A1 (en) * 2012-04-16 2013-10-24 Mediatek Singapore Pte. Ltd. Improvement of implicit tu split mode in hevc
CN102761742B (zh) * 2012-07-03 2017-06-06 华为技术有限公司 变换块划分方法,变换块划分参数的编码方法及解码方法
US9053366B2 (en) 2013-02-20 2015-06-09 Honeywell International Inc. System and method for detecting motion in compressed video
CN110087089B (zh) 2013-11-27 2023-03-10 寰发股份有限公司 用于颜色视频数据的视频编解码方法
TWI536811B (zh) 2013-12-27 2016-06-01 財團法人工業技術研究院 影像處理方法與系統、解碼方法、編碼器與解碼器
CN104768012B (zh) * 2014-01-03 2018-04-20 华为技术有限公司 非对称运动分割方式编码的方法和编码设备
KR102457810B1 (ko) * 2014-03-19 2022-10-21 삼성전자주식회사 3d 영상에 관련된 블록의 파티션 경계에서 필터링 수행 방법
US10003807B2 (en) 2015-06-22 2018-06-19 Cisco Technology, Inc. Block-based video coding using a mixture of square and rectangular blocks
US10009620B2 (en) 2015-06-22 2018-06-26 Cisco Technology, Inc. Combined coding of split information and other block-level parameters for video coding/decoding
WO2017008263A1 (en) 2015-07-15 2017-01-19 Mediatek Singapore Pte. Ltd. Conditional binary tree block partitioning structure
CN108293122A (zh) * 2015-11-24 2018-07-17 三星电子株式会社 对图像进行编码/解码的方法及其设备
US10306258B2 (en) 2016-01-29 2019-05-28 Google Llc Last frame motion vector partitioning
US10469841B2 (en) * 2016-01-29 2019-11-05 Google Llc Motion vector prediction using prior frame residual
CA3014259A1 (en) * 2016-02-12 2017-08-17 Thomson Licensing A method and device for intra-predictive encoding/decoding a coding unit comprising picture data, said intra-predictive encoding depending on a prediction tree and a transform tree
US11146821B2 (en) * 2016-05-25 2021-10-12 Arris Enterprises Llc JVET coding block structure with asymmetrical partitioning
WO2017205700A1 (en) * 2016-05-25 2017-11-30 Arris Enterprises Llc Binary, ternary and quad tree partitioning for jvet coding of video data
US10284845B2 (en) 2016-05-25 2019-05-07 Arris Enterprises Llc JVET quadtree plus binary tree (QTBT) structure with multiple asymmetrical partitioning
PL3446483T3 (pl) * 2016-05-25 2021-10-25 Arris Enterprises Llc Partycjonowanie typu drzewo binarne, potrójne i poczwórne dla kodowania danych wideo przez jvet
WO2017205704A1 (en) * 2016-05-25 2017-11-30 Arris Enterprises Llc General block partitioning method
CN116962679A (zh) 2016-08-31 2023-10-27 株式会社Kt 用于处理视频信号的方法和设备
EP3975573A1 (en) 2016-09-20 2022-03-30 KT Corporation Method for decoding and method for encoding a video signal
KR20230070062A (ko) * 2016-10-04 2023-05-19 주식회사 비원영상기술연구소 영상 데이터 부호화/복호화 방법 및 장치
CN115022625A (zh) 2016-10-04 2022-09-06 有限公司B1影像技术研究所 图像数据编码/解码方法和计算机可读记录介质
CN117354516A (zh) 2016-10-04 2024-01-05 有限公司B1影像技术研究所 图像编码/解码方法、记录介质和传输比特流的方法
EP3306927A1 (en) * 2016-10-05 2018-04-11 Thomson Licensing Encoding and decoding methods and corresponding devices
US10779004B2 (en) 2016-10-12 2020-09-15 Mediatek Inc. Methods and apparatuses of constrained multi-type-tree block partition for video coding
KR20180045530A (ko) 2016-10-26 2018-05-04 디지털인사이트 주식회사 임의의 블록 분할을 사용하는 비디오 코딩 방법 및 장치
CN116614647A (zh) * 2016-11-08 2023-08-18 株式会社Kt 对视频进行解码和编码的方法、发送压缩数据的方法
KR102230877B1 (ko) 2017-02-06 2021-03-22 후아웨이 테크놀러지 컴퍼니 리미티드 인코딩 방법 및 장치와, 디코딩 방법 및 장치
CN107197251B (zh) * 2017-06-27 2019-08-13 中南大学 一种新视频编码标准的基于分层b帧的帧间模式快速选择方法及装置
AU2017204643B2 (en) 2017-07-07 2020-05-14 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding video data
KR20210156351A (ko) 2017-07-07 2021-12-24 삼성전자주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
SG11202013232QA (en) 2017-07-17 2021-01-28 Univ Hanyang Ind Univ Coop Found Method and apparatus for encoding/decoding image
EP3662664A4 (en) * 2017-08-03 2020-11-25 Sharp Kabushiki Kaisha SYSTEMS AND METHODS FOR DIVIDING VIDEO BLOCKS INTO AN INTERPREDICTION SLICE OF VIDEO DATA
EP3701719B1 (en) 2017-10-27 2024-02-21 Huawei Technologies Co., Ltd. Methods and apparatuses for signaling partioning information for picture encoding and decoding
EP3777157A4 (en) * 2018-04-20 2021-05-19 Huawei Technologies Co., Ltd. LINE BUFFER FOR PREDICTOR CANDIDATE FOR SPATIAL MOTION VECTORS
CN110198443B (zh) * 2018-05-10 2022-09-13 腾讯科技(深圳)有限公司 视频帧的编码单元划分方法、装置、存储介质及电子装置
WO2019245841A1 (en) * 2018-06-18 2019-12-26 Interdigital Vc Holdings, Inc. Method and apparatus for video encoding and decoding based on asymmetric binary partitioning of image blocks
CN108769674B (zh) * 2018-06-27 2019-11-12 北京大学深圳研究生院 一种基于自适应层次化运动建模的视频预测方法
EP3891994A1 (en) * 2018-12-07 2021-10-13 InterDigital VC Holdings, Inc. Managing coding tools combinations and restrictions
US11496774B2 (en) 2019-08-27 2022-11-08 Tencent America LLC Header syntax for QT/BT/TT size
CN113281716B (zh) * 2021-03-16 2023-08-08 中国人民解放军战略支援部队信息工程大学 一种光子计数激光雷达数据去噪方法
CN113747160B (zh) * 2021-09-07 2023-06-16 腾讯科技(深圳)有限公司 视频编码配置方法、装置、设备及计算机可读存储介质
CN114584771B (zh) * 2022-05-06 2022-09-06 宁波康达凯能医疗科技有限公司 一种基于内容自适应的帧内图像编码单元划分方法与系统

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2090011C1 (ru) * 1995-06-28 1997-09-10 Закрытое акционерное общество "Техно-ТМ" Устройство кодирования-декодирования видеосигнала изображений
KR19990036188A (ko) 1996-06-05 1999-05-25 엠. 제이. 엠. 반캄 부호화된 디지탈 비디오 신호의 복호화 방법 및 장치
JP3263807B2 (ja) 1996-09-09 2002-03-11 ソニー株式会社 画像符号化装置および画像符号化方法
JPH10178639A (ja) 1996-12-19 1998-06-30 Matsushita Electric Ind Co Ltd 画像コーデック部および画像データ符号化方法
US6633611B2 (en) 1997-04-24 2003-10-14 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for region-based moving image encoding and decoding
JPH1146367A (ja) 1997-07-25 1999-02-16 Matsushita Electric Ind Co Ltd 自動色温度補正装置
JP4416846B2 (ja) * 1997-08-22 2010-02-17 ソニー株式会社 メニュー制御用データを記録したコンピュータ読み取り可能な記録媒体ならびにメニュー制御方法および装置
JPH1164305A (ja) 1997-08-27 1999-03-05 Taisei Corp コンクリート壁背面状況検査のための起振・受振装置
JPH11146367A (ja) 1997-11-06 1999-05-28 Matsushita Electric Ind Co Ltd モバイルビデオフォン
JP3740813B2 (ja) * 1997-12-12 2006-02-01 ソニー株式会社 画像符号化方法および画像符号化装置
US6985589B2 (en) * 1999-12-02 2006-01-10 Qualcomm Incorporated Apparatus and method for encoding and storage of digital image and audio signals
CN1284373C (zh) * 2001-07-06 2006-11-08 皇家菲利浦电子有限公司 用于运动或深度估计的方法和装置和配备这种运动估计装置的图像处理设备
CN1513268B (zh) 2001-09-14 2010-12-22 株式会社Ntt都科摩 编码方法、译码方法、编码装置、译码装置和图象处理系统
AU2002347635B2 (en) * 2001-11-29 2008-04-24 Godo Kaisha Ip Bridge 1 Coding distortion removal method and video encoding end decoding methods
CN100525850C (zh) 2001-12-26 2009-08-12 耶鲁大学 血管进入装置
US7006699B2 (en) * 2002-03-27 2006-02-28 Microsoft Corporation System and method for progressively transforming and coding digital data
US7302006B2 (en) * 2002-04-30 2007-11-27 Hewlett-Packard Development Company, L.P. Compression of images and image sequences through adaptive partitioning
JP2004140667A (ja) 2002-10-18 2004-05-13 Canon Inc 情報処理方法
US20040081238A1 (en) * 2002-10-25 2004-04-29 Manindra Parhy Asymmetric block shape modes for motion estimation
HUP0301368A3 (en) 2003-05-20 2005-09-28 Amt Advanced Multimedia Techno Method and equipment for compressing motion picture data
JP4142563B2 (ja) 2003-12-12 2008-09-03 株式会社エヌ・ティ・ティ・ドコモ 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム
KR100813958B1 (ko) * 2004-06-07 2008-03-14 세종대학교산학협력단 동영상의 무손실 인코딩 및 디코딩 방법, 그 장치
KR100679022B1 (ko) 2004-10-18 2007-02-05 삼성전자주식회사 계층간 필터링을 이용한 비디오 코딩 및 디코딩방법과,비디오 인코더 및 디코더
KR100716999B1 (ko) 2005-06-03 2007-05-10 삼성전자주식회사 영상의 대칭성을 이용한 인트라 예측 방법, 이를 이용한영상의 복호화, 부호화 방법 및 장치
EP3229472B1 (en) 2005-09-26 2020-07-01 Mitsubishi Electric Corporation Moving image coding apparatus
US7602984B2 (en) * 2005-09-28 2009-10-13 Novell, Inc. Adaptive method and system for encoding digital images for the internet
KR100727989B1 (ko) 2005-10-01 2007-06-14 삼성전자주식회사 동영상 부호화시의 인터 모드 결정 방법 및 장치
AU2006320064B2 (en) 2005-11-30 2010-09-09 Kabushiki Kaisha Toshiba Image encoding/image decoding method and image encoding/image decoding apparatus
JP4666255B2 (ja) * 2005-12-27 2011-04-06 日本電気株式会社 符号化データ選定、符号化データ設定、再符号化データ生成及び再符号化の方法及び装置
BRPI0714859A2 (pt) * 2006-08-02 2013-05-21 Thomson Licensing mÉtodo e aparelho para particionamento geomÉtrico adaptativo para codificaÇço de vÍdeo e estrutura de sinal de vÍdeo para codificaÇço de vÍdeo
JP5474546B2 (ja) 2006-08-25 2014-04-16 トムソン ライセンシング 低減された解像度の分割の方法及び装置
US7756348B2 (en) 2006-10-30 2010-07-13 Hewlett-Packard Development Company, L.P. Method for decomposing a video sequence frame
JP2008131569A (ja) * 2006-11-24 2008-06-05 Sony Corp 画像情報伝送システム、画像情報送信装置、画像情報受信装置、画像情報伝送方法、画像情報送信方法、画像情報受信方法
KR101307050B1 (ko) 2006-12-14 2013-09-11 톰슨 라이센싱 비트 심도 스케일러빌리티를 위하여 인핸스먼트 계층 레시듀얼 예측을 이용하여 비디오 데이터를 인코딩 및/또는 디코딩하기 위한 방법 및 장치
KR101366093B1 (ko) * 2007-03-28 2014-02-21 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
US7936146B2 (en) 2007-04-13 2011-05-03 Sanyo Electric Co., Ltd. Motor control device
KR101566564B1 (ko) * 2007-10-16 2015-11-05 톰슨 라이센싱 기하학적으로 분할된 수퍼 블록들의 비디오 인코딩 및 디코딩 방법 및 장치
JP5400062B2 (ja) 2008-01-07 2014-01-29 トムソン ライセンシング パラメトリックフィルタリングを使用したビデオ符号化及び復号化方法及び装置
KR20090099720A (ko) 2008-03-18 2009-09-23 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
JP4990927B2 (ja) * 2008-03-28 2012-08-01 三星電子株式会社 動きベクトル情報の符号化/復号化方法及び装置
US8855199B2 (en) 2008-04-21 2014-10-07 Nokia Corporation Method and device for video coding and decoding
KR101517768B1 (ko) * 2008-07-02 2015-05-06 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
US8503527B2 (en) * 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
WO2011001078A1 (fr) * 2009-07-03 2011-01-06 France Telecom Prédiction d'un vecteur mouvement d'une partition d'image courante de forme géometrique ou de taille différente de celle d'au moins une partition d'image de référence voisine, codage et décodage utilisant une telle prédiction
KR20110017719A (ko) 2009-08-14 2011-02-22 삼성전자주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR101457418B1 (ko) 2009-10-23 2014-11-04 삼성전자주식회사 계층적 부호화 단위의 크기에 따른 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
KR101484280B1 (ko) 2009-12-08 2015-01-20 삼성전자주식회사 임의적인 파티션을 이용한 움직임 예측에 따른 비디오 부호화 방법 및 장치, 임의적인 파티션을 이용한 움직임 보상에 따른 비디오 복호화 방법 및 장치
WO2011129619A2 (ko) * 2010-04-13 2011-10-20 삼성전자 주식회사 트리 구조 부호화 단위에 기반한 디블록킹 필터링을 수행하는 비디오 부호화 방법과 그 장치 및 복호화 방법과 그 장치
US8885704B2 (en) * 2010-10-01 2014-11-11 Qualcomm Incorporated Coding prediction modes in video coding
KR101484282B1 (ko) 2013-04-02 2015-01-22 삼성전자주식회사 임의적인 파티션을 이용한 움직임 예측에 따른 비디오 부호화 방법 및 장치, 임의적인 파티션을 이용한 움직임 보상에 따른 비디오 복호화 방법 및 장치

Also Published As

Publication number Publication date
CN104539960B (zh) 2016-08-17
US8885723B2 (en) 2014-11-11
RU2014104111A (ru) 2015-08-10
CN102771124B (zh) 2015-05-06
CA2816755A1 (en) 2011-06-16
CN104581165B (zh) 2016-12-21
RU2517404C2 (ru) 2014-05-27
WO2011071308A2 (en) 2011-06-16
HRP20150304T1 (hr) 2015-04-24
RS53897B1 (en) 2015-08-31
EP2510698B1 (en) 2016-11-09
CN102771124A (zh) 2012-11-07
EP2908525A1 (en) 2015-08-19
PL2629527T3 (pl) 2017-04-28
CA2783786A1 (en) 2011-06-16
US20140192874A1 (en) 2014-07-10
EP2899978B1 (en) 2018-08-08
US20140192875A1 (en) 2014-07-10
LT2510698T (lt) 2016-11-25
KR20110064694A (ko) 2011-06-15
US20120236944A1 (en) 2012-09-20
US8885724B2 (en) 2014-11-11
MX2012006633A (es) 2012-07-10
DK2899978T3 (en) 2018-08-20
PT2899978T (pt) 2018-10-04
JP2016171592A (ja) 2016-09-23
EP2629527A3 (en) 2013-10-30
JP5632515B2 (ja) 2014-11-26
MY168315A (en) 2018-10-30
EP2510698A2 (en) 2012-10-17
JP6149140B2 (ja) 2017-06-14
JP2015136171A (ja) 2015-07-27
JP5945025B2 (ja) 2016-07-05
JP2013513330A (ja) 2013-04-18
CN103220519B (zh) 2016-08-03
US10448042B2 (en) 2019-10-15
CA2816467A1 (en) 2011-06-16
EP3402189B1 (en) 2021-05-05
CA2816755C (en) 2016-05-17
BR112012013871B1 (pt) 2022-02-01
US20130251035A1 (en) 2013-09-26
BR112012013871A2 (pt) 2020-08-25
AU2010328813A1 (en) 2012-07-05
US8223843B2 (en) 2012-07-17
BR122013019952A2 (pt) 2020-09-15
ZA201505590B (en) 2016-05-25
JP5813000B2 (ja) 2015-11-17
RS55893B1 (sr) 2017-08-31
CA2816467C (en) 2016-09-06
US20120114043A1 (en) 2012-05-10
CN104539960A (zh) 2015-04-22
RU2012128519A (ru) 2014-02-20
EP2899978A1 (en) 2015-07-29
DK2629528T3 (da) 2015-03-30
CN104581165A (zh) 2015-04-29
EP2629528A3 (en) 2013-10-30
CA2876814A1 (en) 2011-06-16
US8885725B2 (en) 2014-11-11
HUE030154T2 (en) 2017-04-28
CY1119160T1 (el) 2018-02-14
ZA201505589B (en) 2016-11-30
ES2625313T3 (es) 2017-07-19
DK2629527T3 (da) 2016-11-14
SI2908525T1 (sl) 2017-06-30
LT2629527T (lt) 2016-11-10
CA2876814C (en) 2015-09-15
US9025667B2 (en) 2015-05-05
AU2010328813B2 (en) 2014-06-12
LT2899978T (lt) 2018-08-27
EP2510698A4 (en) 2013-10-30
EP2629528B1 (en) 2015-03-18
PT2629528E (pt) 2015-04-01
US8446959B2 (en) 2013-05-21
US8780993B2 (en) 2014-07-15
CN104837018A (zh) 2015-08-12
CN104602012B (zh) 2017-02-15
US20110134998A1 (en) 2011-06-09
US8938006B2 (en) 2015-01-20
US20160156924A1 (en) 2016-06-02
PT2908525T (pt) 2017-05-24
SI2899978T1 (sl) 2018-10-30
ES2610410T3 (es) 2017-04-27
RU2580472C2 (ru) 2016-04-10
JP5632516B2 (ja) 2014-11-26
KR101484280B1 (ko) 2015-01-20
PL2899978T3 (pl) 2018-10-31
CA2783786C (en) 2016-11-01
MY155120A (en) 2015-09-15
PL2629528T3 (pl) 2015-06-30
JP2013255275A (ja) 2013-12-19
US20150215636A1 (en) 2015-07-30
SI2510698T1 (sl) 2017-01-31
US20140286426A1 (en) 2014-09-25
BR122020024414B1 (pt) 2022-01-18
CY1121084T1 (el) 2019-12-11
CN104602012A (zh) 2015-05-06
RS57529B1 (sr) 2018-10-31
HUE042036T2 (hu) 2019-06-28
HRP20181297T1 (hr) 2018-10-05
PL2510698T3 (pl) 2017-06-30
RU2517253C1 (ru) 2014-05-27
WO2011071308A3 (en) 2011-10-27
BR122013019953A2 (pt) 2020-09-15
SMT201500074B (it) 2015-05-05
PT2629527T (pt) 2016-10-24
HRP20170701T1 (hr) 2017-07-14
MY168314A (en) 2018-10-30
ZA201304980B (en) 2013-09-25
EP2908525B1 (en) 2017-05-10
CY1118261T1 (el) 2017-06-28
ES2533304T3 (es) 2015-04-09
BR122013019952B1 (pt) 2022-01-18
EP2629527A2 (en) 2013-08-21
CN103220523B (zh) 2016-09-28
RU2014104110A (ru) 2015-08-10
CA2876818A1 (en) 2011-06-16
CN103220523A (zh) 2013-07-24
JP2013255274A (ja) 2013-12-19
SI2629527T1 (sl) 2016-11-30
BR122013019953B1 (pt) 2022-01-18
ES2683595T3 (es) 2018-09-27
EP3402189A1 (en) 2018-11-14
PT2510698T (pt) 2016-11-18
BR122020024421B1 (pt) 2022-01-18
RS55323B1 (sr) 2017-03-31
HUE030162T2 (en) 2017-04-28
MY164871A (en) 2018-01-30
CY1118094T1 (el) 2017-06-28
RU2515226C1 (ru) 2014-05-10
HRP20161335T1 (hr) 2016-12-02
SI2629528T1 (sl) 2015-05-29
US20140192890A1 (en) 2014-07-10
MY165981A (en) 2018-05-21
EP2629528A2 (en) 2013-08-21
RS55235B1 (sr) 2017-02-28
US9294780B2 (en) 2016-03-22
ZA201204888B (en) 2016-02-24
JP5945026B2 (ja) 2016-07-05
RU2569807C2 (ru) 2015-11-27
JP2015136170A (ja) 2015-07-27
PL2908525T3 (pl) 2017-08-31
CY1116338T1 (el) 2017-02-08
EP2629527B1 (en) 2016-10-12
CN104837018B (zh) 2018-11-16
CA2876818C (en) 2016-05-03
LT2908525T (lt) 2017-06-12
DK2510698T3 (da) 2016-12-12
DK2908525T3 (da) 2017-05-22
CN103220519A (zh) 2013-07-24
HRP20161480T1 (hr) 2016-12-30

Similar Documents

Publication Publication Date Title
ES2598106T3 (es) Procedimiento y aparato para codificar vídeo mediante predicción de movimiento usando partición arbitraria, y procedimiento y aparato para decodificar vídeo mediante predicción de movimiento usando partición arbitraria
ES2577116T3 (es) Procedimiento y aparato de codificación de vídeo, y procedimiento y aparato de decodificación de vídeo
ES2936026T3 (es) Procedimiento para decodificar vídeo en consideración del orden de salto y división
ES2733936T3 (es) Procedimiento de decodificación de vídeo en base a información de patrón de bloque codificado jerárquico
ES2612715T3 (es) Procedimiento y aparato de codificación de vídeo y procedimiento y aparato de decodificación de vídeo, basándose en estructura jerárquica de unidad de codificación
ES2706511T3 (es) Procedimiento de decodificación de vídeo teniendo en cuenta el orden de exploración de unidades de codificación que tienen estructura jerárquica
ES2673893T3 (es) Procedimiento para decodificación por entropía de un vídeo
ES2699098T3 (es) Aparato de decodificación de vídeo usando unidad de transformación de estructura de árbol variable
ES2691984T3 (es) Procedimiento de decodificación de imágenes