ES2943647T3 - Imágenes de acceso de capa temporal gradual en compresión de vídeo - Google Patents

Imágenes de acceso de capa temporal gradual en compresión de vídeo Download PDF

Info

Publication number
ES2943647T3
ES2943647T3 ES18184360T ES18184360T ES2943647T3 ES 2943647 T3 ES2943647 T3 ES 2943647T3 ES 18184360 T ES18184360 T ES 18184360T ES 18184360 T ES18184360 T ES 18184360T ES 2943647 T3 ES2943647 T3 ES 2943647T3
Authority
ES
Spain
Prior art keywords
image
gtla
identifier
temporal
electronic device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18184360T
Other languages
English (en)
Inventor
Sachin G Deshpande
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Application granted granted Critical
Publication of ES2943647T3 publication Critical patent/ES2943647T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

La divulgación se refiere a imágenes de acceso de capa temporal gradual (GTLA) en compresión de video. La imagen GTLA puede incluir un identificador temporal. Una imagen posterior que se codifica después de la imagen GTLA, que tiene un identificador temporal igual al identificador temporal de la imagen GTLA no puede usar una imagen anterior para la predicción interna que tiene un identificador temporal MAYOR o IGUAL al identificador temporal de la imagen GTLA y que precede a la imagen GTLA en orden de decodificación. Una imagen posterior en orden de decodificación que se codifica después de la imagen GTLA, que tiene un identificador temporal igual al identificador temporal de la imagen GTLA puede usar una imagen anterior para la predicción interna que tiene un identificador temporal MENOR que el identificador temporal de la imagen GTLA y que precede a la imagen GTLA en orden de decodificación. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Imágenes de acceso de capa temporal gradual en compresión de vídeo
Campo técnico
La presente divulgación se refiere en general a dispositivos electrónicos. Más específicamente, la presente divulgación se refiere a métodos, dispositivos y estructuras de flujos de bits para señalizar una imagen de acceso de capa temporal gradual.
Antecedentes de la técnica
Los dispositivos electrónicos se han vuelto más pequeños y más potentes para satisfacer las necesidades de los consumidores y mejorar la portabilidad y la comodidad. Los consumidores se han vuelto dependientes de los dispositivos electrónicos y esperan una mayor funcionalidad. Algunos ejemplos de dispositivos electrónicos incluyen computadoras de escritorio, computadoras portátiles, teléfonos móviles, teléfonos inteligentes, reproductores de medios, circuitos integrados, etc.
Algunos dispositivos electrónicos se utilizan para procesar y visualizar medios digitales. Por ejemplo, los dispositivos electrónicos portátiles ahora permiten que los medios digitales se consuman en casi cualquier lugar donde pueda estar un consumidor. Además, algunos dispositivos electrónicos pueden proporcionar descarga o transmisión de contenido de medios digitales para el uso y disfrute de un consumidor.
La creciente popularidad de los medios digitales ha presentado varios problemas. Por ejemplo, la representación eficiente de medios digitales de alta calidad para almacenamiento, transmisión y reproducción presenta varios desafíos. Como se puede observar en esta discusión, los sistemas y métodos que representan los medios digitales de manera más eficiente pueden ser beneficiosos.
SAMUELSSON JET AL: “AHG15: Temporal layer access pictures” (propuesta de estandarización con número de documento JCTVC-H0566, publicado el 21/01/2012 en relación con la 8a reunión de JCT-VC en San José, EEUU) presenta una propuesta para unificar la señalización de imágenes de Acceso Aleatorio Limpio (CRA) y puntos de conmutación de capa temporal en lo que se denomina imágenes de Acceso de Capa Temporal (TLA). Se propone reemplazar el tipo de unidad de Capa de Abstracción de Red (NAL) de CRA por un tipo de unidad de NAL de TLA.
Resumen de la invención
Problema técnico
Se desea proporcionar técnicas más eficientes para representar medios digitales.
Solución al problema
La invención se define en las reivindicaciones independientes. Las características adicionales de la invención se proporcionan en las reivindicaciones dependientes. A continuación, las partes de la descripción y los dibujos que se refieren a realizaciones que no están cubiertas por las reivindicaciones no se presentan como realizaciones de la invención, sino como ejemplos útiles para comprender la invención.
Un aspecto de la invención proporciona un dispositivo electrónico para decodificar una imagen de acuerdo con la reivindicación 1.
Otro aspecto de la invención proporciona un dispositivo electrónico para codificar una imagen de acuerdo con la reivindicación 9.
Otro aspecto de la invención proporciona un método para decodificar una imagen de acuerdo con la reivindicación 16.
Otro aspecto de la invención proporciona un método para codificar una imagen de acuerdo con la reivindicación 17 y otro aspecto más de la invención proporciona un flujo de bits de video de acuerdo con la reivindicación 18.
Efectos ventajosos de la invención
Los anteriores y otros objetivos, características y ventajas de la invención se entenderán más fácilmente después de considerar la siguiente descripción detallada de la invención, tomada en conjunto con los dibujos adjuntos.
Breve descripción de los dibujos
[Fig. 1] la Figura 1 es un diagrama de bloques que ilustra un ejemplo de uno o más dispositivos electrónicos en los que se pueden implementar sistemas y métodos para señalizar una imagen de acceso de capa temporal gradual (GTLA);
[Fig.2] la Figura 2 es un diagrama de bloques que ilustra dos ejemplos de una estructura de codificación;
[Fig.3] la Figura 3 es un diagrama de bloques que ilustra dos ejemplos más de una estructura de codificación;
[Fig.4] la Figura 4 es un diagrama de bloques que ilustra una configuración de un codificador en un dispositivo electrónico;
[Fig.5] la Figura 5 es un diagrama de flujo que ilustra una configuración de un método para señalizar una imagen de acceso de capa temporal gradual (GTLA);
[Fig. 6] la Figura 6 es un diagrama de flujo que ilustra una configuración más específica de un método para señalizar una imagen de acceso de capa temporal gradual (GTLA);
[Fig.7] la Figura 7 es un diagrama de bloques que ilustra una configuración de un decodificador en un dispositivo electrónico;
[Fig.8] la Figura 8 es un diagrama de flujo que ilustra una configuración de un método para recibir una imagen de acceso de capa temporal gradual (GTLA);
[Fig.9] la Figura 9 es un diagrama de flujo que ilustra una configuración más específica de un método para recibir una imagen de acceso de capa temporal gradual (GTLA);
[Fig.10] la Figura 10 es un diagrama de bloques que ilustra una configuración de un dispositivo electrónico en el que se pueden implementar sistemas y métodos para señalizar una imagen de acceso de capa temporal gradual (GTLA);
[Fig.11] la Figura 11 es un diagrama de bloques que ilustra una configuración de un dispositivo electrónico en el que se pueden implementar sistemas y métodos para recibir una imagen de acceso de capa temporal gradual (GTLA);
[Fig.12] la Figura 12 es un diagrama de bloques que ilustra diversos componentes que pueden utilizarse en un dispositivo electrónico de transmisión;
[Fig.13] la Figura 13 es un diagrama de bloques que ilustra varios componentes que pueden utilizarse en un dispositivo electrónico de recepción.
Descripción de las realizaciones
Se describe un dispositivo electrónico para codificar una imagen. El dispositivo electrónico incluye un procesador e instrucciones almacenadas en memoria que están en comunicación electrónica con el procesador. Las instrucciones son ejecutables para codificar una imagen de acceso de capa temporal gradual (GTLA). Las instrucciones son además ejecutables para enviar la imagen de GTLA.
El dispositivo electrónico también puede incluir instrucciones ejecutables para generar un indicador de imagen de GTLA y enviar el indicador de imagen de GTLA. El indicador de imagen de GTLA puede señalizarse como un Conjunto de Parámetros de Secuencia (SPS), un Conjunto de Parámetros de Imagen (PPS), un Conjunto de Parámetros de Adaptación (APS), un Conjunto de Parámetros de Video (VPS) y/o un encabezado de segmento.
El indicador de imagen de GTLA puede ser un tipo de unidad de Capa de Abstracción a la Red (NAL). El tipo de unidad de NAL puede incluir un tipo de unidad de NAL asociado con la imagen de GTLA. El tipo de unidad de NAL asociado con la imagen de GTLA puede ser igual a nueve.
La imagen de GTLA puede incluir un identificador temporal. Una imagen posterior que se codifica después de la imagen de GTLA, que tiene un identificador temporal igual que el identificador temporal de la imagen de GTLA, puede no utilizar una imagen anterior para predicción inter que tiene un identificador temporal mayor o igual que el identificador temporal de la imagen de GTLA y que precede a la imagen de GTLA en orden de decodificación.
Una imagen posterior en orden de decodificación que se codifica después de la imagen de GTLA, que tiene un identificador temporal igual que el identificador temporal de la imagen de GTLA, puede utilizar una imagen anterior para la predicción inter que tiene un identificador temporal menor que el identificador temporal de la imagen de GTLA y que precede a la imagen de GTLA en orden de decodificación.
Una imagen de referencia con un identificador temporal mayor o igual que el identificador temporal de la imagen de GTLA puede no incluirse en una lista anterior actual a corto plazo del conjunto de imágenes de referencia (RPS), una lista posterior actual a corto plazo de RPS y/o una lista actual a largo plazo de RPS para una imagen actual. Para una imagen posterior a la imagen de GTLA con identificador temporal igual que el identificador temporal de la imagen de GTLA, puede no incluirse una imagen de referencia con un identificador temporal mayor o igual que el identificador temporal de la imagen de GTLA en una lista anterior actual a corto plazo de RPS, una lista posterior actual a corto plazo de RPS y/o una lista actual a largo plazo de RPS para una imagen actual.
La imagen de GTLA puede proporcionar la funcionalidad de conmutación de capa temporal. La imagen de GTLA puede ser una imagen de acceso de capa temporal (TLA) y la imagen de GTLA puede estar marcada como una imagen de GTLA. La imagen de GTLA puede ser una imagen de TLA y la imagen de GTLA puede marcarse como imagen de TLA. La imagen de GTLA puede no ser una imagen etiquetada para descarte (TFD).
También se describe un dispositivo electrónico para decodificar una imagen. El dispositivo electrónico incluye un procesador e instrucciones almacenadas en la memoria que están en comunicación electrónica con el procesador. Las instrucciones son ejecutables para obtener una imagen de GTLA. Las instrucciones también son ejecutables para decodificar la imagen de GTLA. Las instrucciones son ejecutables para decodificar una imagen actual en base a la imagen de GTLA.
Las instrucciones pueden ser ejecutables, además, para obtener un indicador de imagen de GTLA. El indicador de imagen de GTLA se puede recibir en un SPS, un PPS, APS, VPS y/o un encabezado de segmento.
La imagen de GTLA puede incluir un identificador temporal. Una imagen posterior que se decodifica después de la imagen de GTLA, que tiene un identificador temporal igual que el identificador temporal de la imagen de GTLA, no podrá utilizar una imagen anterior para predicción inter que tiene un identificador temporal mayor o igual que el identificador temporal de la imagen de GTLA y que precede a la imagen de GTLA en orden de decodificación.
Una imagen posterior que se puede decodificar después de la imagen de GTLA, que tiene un identificador temporal igual que el identificador temporal de la imagen de GTLA, utiliza una imagen anterior para predicción inter que tiene un identificador temporal menor que el identificador temporal de la imagen de GTLA y que precede a la imagen de GTLA en orden de decodificación.
También se describe un método para codificar una imagen mediante un dispositivo electrónico. Se codifica una imagen de GTLA. Se envía la imagen de GTLA.
También se describe un método para decodificar una imagen mediante un dispositivo eléctrico. Se recibe un flujo de bits. Se obtiene una imagen de GTLA. Se decodifica la imagen de GTLA. Se decodifica una imagen actual en base a la imagen de GTLA.
Los sistemas y métodos dados a conocer en el presente documento, describen enfoques que señalizan una imagen de acceso de capa temporal gradual (GTLA). Por ejemplo, algunas configuraciones descritas en el presente documento incluyen dispositivos y métodos para señalizar imágenes de GTLA utilizando una correspondiente unidad de Capa de Acceso a la Red (NAL).
En los sistemas conocidos, las imágenes de acceso de capa temporal (TLA) pueden señalizarse actualmente en un flujo de bits. Las imágenes de TLA unifican la señalización de las imágenes de Acceso Aleatorio Limpio (CRA) y los puntos de conmutación de capa temporal. Una imagen de CRA puede indicar un punto de acceso aleatorio (RAP), o un punto a partir del cual un decodificador puede comenzar a decodificar sin tener acceso a imágenes que preceden a la imagen de CRA en orden de decodificación. En algunos casos, una imagen de CRA puede incluir segmentos de predicción intra (segmentos-I) que se decodifican utilizando predicciones intra.
Como se utiliza en el presente documento, el término “capa temporal” se refiere a todas las imágenes con el mismo identificador temporal (temporal_id) o a todas las imágenes en el mismo nivel temporal. Los detalles adicionales con respecto a las capas temporales se describirán a continuación con mayor detalle en relación con las Figuras 2 y 3.
Un punto de conmutación de capa temporal es una imagen que representa un punto en el flujo de bits donde es posible comenzar a decodificar un número mayor de capas temporales que el que se decodificó antes del punto de conmutación. Como tal, no hay imagen después del punto de conmutación tanto en orden de decodificación como en orden de visualización que utilice cualquier imagen que precedió al punto de conmutación en orden de decodificación o en orden de visualización. El punto de conmutación de capa temporal puede señalizarse en un conjunto de parámetros de imagen (PPS) o en otro conjunto de parámetros.
En algunas configuraciones, un tipo de unidad de NAL puede especificar el tipo de estructura de datos de carga útil de secuencia de bytes en bruto (RBSP) incluida en una unidad de NAL. En un ejemplo, una unidad de NAL que utiliza un tipo de unidad de NAL igual a 0 o en el rango de 24-63, puede no afectar el proceso de decodificación especificado en diversas configuraciones. Cabe señalar que en algunas configuraciones, los tipos 0 y 24-63 de unidades de NAL pueden utilizarse según lo determinado por varias aplicaciones. Los tipos 0 y 24-63 de unidades de NAL pueden reservarse para uso futuro. En algunas configuraciones descritas en el presente documento, un decodificador puede ignorar el contenido de las unidades de NAL que utilizan valores reservados o no especificados de los tipos de unidad de NAL.
En la Tabla 1 y la Tabla 2 de abajo, se incluyen ejemplos de códigos de tipo de unidad de NAL y clases de tipo de unidad de NAL que pueden implementarse de acuerdo con los sistemas y métodos dados a conocer en el presente documento. Cabe señalar que, algunas configuraciones pueden incluir campos similares y diferentes a los descritos abajo.
En algunas configuraciones, algunos o todos los campos de NAL en la Tabla 1 pueden ser ejemplos de diferentes tipos de unidad de NAL. En algunas configuraciones, ciertos tipos de unidad de NAL pueden estar asociados con diferentes campos y estructuras de sintaxis asociadas con una o más imágenes. Abajo se incluyen explicaciones adicionales de uno o más campos. Cabe señalar que, la Tabla 1 de abajo incluye las abreviaturas para clases de tipo de NAL de la Capa de Codificación de Video (VCL), Punto de Acceso Aleatorio (RAP), imágenes Etiquetadas Para Descartar (TFD), Actualización Instantánea de Decodificación (IDR) y Acceso a Capa Temporal (TLA). Los ejemplos incluidos en relación con la Tabla 1, también pueden ser aplicables a la Tabla 2 y otras configuraciones que descritas abajo.
[Tabla 1]
Figure imgf000005_0001
Figure imgf000006_0001
La Tabla 1 está organizada en columnas tipo de unidad de NAL (nal_unit_type), contenido de unidad de NAL y estructura de sintaxis de RBSP y clase de tipo de unidad de NAL. En la Tabla 1, la sintaxis puede incluir la sintaxis de RBSP de información de mejora complementaria (SEI). Una SEI de RBSP puede incluir uno o más mensajes de SEI. Cada uno de los mensajes de SEI puede incluir variables que especifican el tipo (p. ej., payloadType) y el tamaño (p. ej., payloadSize) de la carga útil de SEI. El tamaño de carga útil de SEI derivado puede especificarse en bytes y puede ser igual al número de bytes de RBSP en la carga útil de SEI.
La Tabla 1 incluye los tipos de unidad de NAL. El tipo de unidad de NAL especifica el tipo de estructura de datos de RBSP incluida en la unidad de NAL. Si el tipo de unidad de NAL indica una imagen con un valor de tipo de unidad de NAL reservado, tal como un tipo de unidad de aNAL de 32-47, un decodificador debe ignorar y descartar el contenido de la imagen. Este requisito permite agregar y estandarizar futuras definiciones de extensiones compatibles.
En la Tabla 1, cuando el valor del tipo de unidad de NAL es igual a 3 para todas las unidades de NAL de VCL de una imagen en particular, esa imagen en particular se conoce como una imagen de TLA. Una imagen de TLA y todas las imágenes codificadas con un identificador temporal (temporal_id) mayor o igual que el identificador temporal de la imagen de TLA que siguen a la imagen de TLA en orden de decodificación, pueden no utilizar la predicción inter de cualquier imagen con temporal_id mayor o igual que el identificador temporal de la imagen de TLA que precede a la imagen de TLA en orden de decodificación. Además, una imagen de TLA puede no ser una imagen de TFD; por lo tanto, las imágenes de TLA también se conocen como imágenes de TLA no TFD.
En algunas configuraciones, un tipo de unidad de NAL igual a 3 representa cuando una bandera de anidamiento de indicador temporal es igual a 1 y un identificador temporal es mayor que 0. Cuando el tipo de unidad de NAL es igual a 3, el identificador temporal puede no ser igual a 0.
Cuando el valor del tipo de unidad de NAL es igual a 4 o 5 para todas las unidades de NAL de VCL de una imagen particular, la imagen particular se conoce como una imagen de CRA. Una imagen de CRA que tiene un tipo de unidad de NAL igual a 4 puede tener imágenes de TFD asociadas presentes en el flujo de bits. Una imagen de CRA que tiene un tipo de unidad de NAL igual a 5 puede no tener imágenes de TFD asociadas presentes en el flujo de bits.
Cuando el valor del tipo de unidad de NAL es igual a 6 o 7 para todas las unidades de NAL de VCL de una imagen particular, la imagen particular se conoce como una imagen de acceso de enlace roto (BLA). Una imagen de BLA que tiene un tipo de unidad de NAL igual a 6 puede tener imágenes de TFD asociadas presentes en el flujo de bits. Una imagen de BLA que tiene un tipo de unidad de NAL igual a 7 puede no tener imágenes de TFD asociadas presentes en el flujo de bits.
En algunas configuraciones conocidas, tal como en Benjamin Bros et al., “High efficiency video coding (HEVC) text specification draft 7”, JCTVC-11003, Ginebra, mayo de 2012, las imágenes codificadas que siguen una imagen de CRA o de BLA en orden de decodificación y en orden de salida, no utilizan la predicción inter de cualquier imagen que precede a la imagen de CRA o de BLA, ya sea en orden de decodificación o en orden de salida. Además, cualquier imagen que precede a la imagen de CRA o de BLA en orden de decodificación, también precede a la imagen de CRA o de BLA en orden de salida. En la configuración conocida anterior, es un requisito de la conformidad del flujo de bits que no haya imágenes de TFD presentes en el flujo de bits que estén asociadas con una imagen de CRA que tenga un tipo de unidad de NAL igual a 5 o una imagen de BLA que tenga un tipo de unidad de NAL igual a 7.
En la Tabla 1, cuando el valor del tipo de unidad de NAL es igual a 8 para todas las unidades de NAL de VCL de una imagen particular, esa imagen particular se conoce como una imagen de IDR. Las imágenes codificadas que siguen a una imagen de IDR en orden de decodificación no utilizan la predicción inter de cualquier imagen que precede a la imagen de IDR en orden de decodificación. Cualquier imagen que precede a la imagen de IDR en orden de decodificación, también precede a la imagen de IDR en orden de salida.
Los tipos de unidad de NAL en el rango de 1 a 8, inclusive, se refieren a una unidad de NAL de VCL. En otras palabras, cuando el valor de un tipo de unidad de NAL es igual a cualquier valor en el rango de 1 a 8, inclusive, para una unidad de NAL de una imagen particular, todas las unidades de NAL de VCL de esa imagen particular pueden tener nal_unit_type igual a ese valor particular.
Los tipos de unidad de NAL en el rango de 4 a 8, inclusive, pueden indicar una imagen de punto de acceso aleatorio (RAP). Una imagen de RAP se refiere a una imagen codificada que es una imagen de CRA, una imagen de BLA o una imagen de IDR. Una unidad de acceso de RAP, se refiere a una unidad de acceso que es una unidad de acceso de CRA, una unidad de acceso de BLA o una unidad de acceso de IDR. Una imagen de RAP puede descartar todas las unidades de acceso antes que una unidad de acceso de RAP particular. Cuando una unidad de acceso es una unidad de acceso de RAP, el identificador temporal para todas las unidades de NAL de VCL de la unidad de acceso puede ser igual a 0.
En la Tabla 1, cualquier conjunto de parámetros (conjunto de parámetros de video (VPS), conjunto de parámetros de secuencia (SPS), conjunto de parámetros de imagen (PPS) o conjunto de parámetros de adaptación (APS)) debe estar disponible antes de la activación del conjunto de parámetros. Además, para poder realizar un acceso aleatorio desde una unidad de RAP particular, cada uno de los conjuntos de parámetros activado durante la decodificación de la unidad de acceso de RAP particular o durante la decodificación de cualquier unidad de acceso posterior en orden de decodificación, debe estar presente o provista a través de medios externos en o posterior a esa unidad de acceso de RAP particular y antes de que cualquier unidad de NAL active ese conjunto de parámetros. Esta condición permite decodificar correctamente la unidad de acceso de RAP particular y todas las unidades de acceso posteriores tanto en orden de decodificación como de salida.
En algunas configuraciones, los sistemas y métodos dados a conocer en el presente documento describen una imagen de GTLA. Una imagen de GTLA puede ser una imagen codificada para la cual cada uno de los segmentos tiene un tipo de unidad de NAL igual a 9.
Una imagen de GTLA y todas las imágenes codificadas con un identificador temporal (temporal_id) igual que el identificador temporal de la imagen de GTLA que sigue a la imagen de GTLA en orden de decodificación, pueden no utilizar la predicción inter de cualquier imagen con un identificador temporal mayor o igual que el identificador temporal de la imagen de GTLA que precede a la imagen de GTLA en orden de decodificación. Además, una imagen de GTLA puede no ser una imagen de TFD; por lo tanto, las imágenes de GTLA también se conocen como imágenes de GTLA no TFD.
Una imagen de GTLA puede proporcionar ventajas con respecto a una imagen de TLA. Por ejemplo, una imagen de GTLA puede proporcionar una flexibilidad adicional en la selección de imágenes de referencia al tiempo que proporciona la funcionalidad de conmutación de capa temporal. Además, una imagen de GTLA puede permitir la selección de la tasa de tramas deseada en una manera de paso por paso. Los beneficios y ventajas adicionales se describirán a continuación.
En algunos sistemas y métodos para señalizar una imagen de GTLA descritos en el presente documento, se pueden implementar uno o más indicadores para indicar una imagen de GTLA en un flujo de bits. Por ejemplo, en una configuración, se puede introducir una nueva unidad de NAL para indicar una imagen de GTLA en el flujo de bits.
Ahora se describen diversas configuraciones con referencia a las figuras, donde números de referencia similares pueden indicar elementos funcionalmente similares. Los sistemas y métodos descritos e ilustrados como en general en las figuras del presente documento, podrían organizarse y diseñarse en una amplia variedad de configuraciones diferentes. Por lo tanto, la siguiente descripción más detallada de varias configuraciones, como se representan en las figuras, no pretende limitar el alcance, como se reivindica, sino que es meramente representativa de los sistemas y métodos.
La Figura 1 es un diagrama de bloques que ilustra un ejemplo de uno o más dispositivos 102a-b electrónicos en los que se pueden implementar sistemas y métodos para señalizar una imagen de acceso de capa temporal gradual (GTLA). En este ejemplo, se ilustran el dispositivo A 102a electrónico y el dispositivo B 102b electrónico. Sin embargo, cabe señalarse que una o más de las características y funcionalidades descritas en relación con el dispositivo A 102a electrónico y el dispositivo B 102b electrónico se pueden combinar en un solo dispositivo electrónico en algunas configuraciones.
El dispositivo A 102a electrónico incluye un codificador 104 y un módulo 108 de imagen de GTLA. Cada uno de los elementos incluidos dentro del dispositivo A 102a electrónico (p. ej., el codificador 104 y el módulo 108 de imagen de GTLA) puede implementarse en hardware, software o una combinación de ambos.
El dispositivo A 102a electrónico puede obtener una imagen 106 de entrada. En algunas configuraciones, la imagen 106 de entrada puede capturarse en el dispositivo A 102a electrónico utilizando un sensor de imagen, recuperado de memoria y/o recibido desde otro dispositivo electrónico.
El codificador 104 puede codificar la imagen 106 de entrada para producir datos codificados. Por ejemplo, el codificador 104 puede codificar una serie de imágenes 106 de entrada (p. ej., video). En una configuración, el codificador 104 puede ser un codificador de codificación de video de alta eficiencia (HEVC). Los datos codificados pueden incluirse en un flujo 110 de bits. El codificador 104 puede generar una señalización de sobrecarga en base a la imagen 106 de entrada.
En algunas configuraciones, el módulo 108 de imagen de GTLA puede incluir una imagen de GTLA así como un correspondiente indicador de imagen de GTLA. La imagen de GTLA y el correspondiente indicador de imagen de GTLA pueden generarse por el módulo 108 de imagen de GTLA.
En algunas configuraciones, el módulo 108 de imagen de GTLA puede enviar o compartir de otro modo la imagen de GTLA y/o un correspondiente indicador de imagen de GTLA con uno o más dispositivos 102 electrónicos. En un ejemplo, el dispositivo A 102a electrónico puede enviar una o más imágenes de GTLA y/o correspondientes indicadores de imagen de GTLA al dispositivo B 102b electrónico. Un beneficio de generar una imagen de GTLA y/o un correspondiente indicador de imagen de GTLA, puede incluir proporcionar una mayor flexibilidad en la selección de imágenes de referencia al tiempo que proporciona la funcionalidad de conmutación de capa temporal.
Se pueden describir uno o más tipos de indicadores de acuerdo con los sistemas y métodos dados a conocer en el presente documento. Por ejemplo, el codificador 104 puede identificar una imagen de GTLA con uno o más indicadores. A continuación, se dan más detalles. Cabe señalar que el módulo 108 de imagen de GTLA puede estar incluido dentro del codificador 104 en algunas configuraciones.
El codificador 104 (y el módulo 108 de imagen de GTLA, por ejemplo) puede producir un flujo 110 de bits. El flujo 110 de bits puede incluir datos codificados en base a la imagen 106 de entrada. En un ejemplo, el flujo 110 de bits puede incluir datos de imagen codificados. En algunas configuraciones, el flujo 110 de bits también puede incluir datos de sobrecarga, tal como información de encabezado de segmento, información de PPS, información de SPS, información de APS, información de VPS, etc. En algunos casos, un encabezado de segmento, información de PPS, información de SPS, información de APS o información de VPS, puede denominarse sintaxis de alto nivel. El flujo 110 de bits también puede incluir otros datos, algunos ejemplos de los cuales se describen en el presente documento. A medida que se codifican imágenes 106 de entrada adicionales, el flujo 110 de bits puede incluir una o más imágenes de GTLA. Adicional o alternativamente, el flujo 110 de bits puede incluir uno o más indicadores de imagen de GTLA y otros datos codificados.
El flujo 110 de bits puede proporcionarse a un decodificador 112. En un ejemplo, el flujo 110 de bits puede transmitirse al dispositivo B 102b electrónico utilizando un enlace cableado o inalámbrico. En algunos casos, esto puede hacerse a través de una red, tal como la Internet, Red de Área Local (LAN) u otro tipo de red para comunicarse entre dispositivos. Como se ilustra en la Figura 1, el decodificador 112 puede implementarse en el dispositivo B 102b electrónico por separado del codificador 104 en el dispositivo A 102a electrónico. Cabe señalar que en algunas configuraciones, el codificador 104 y el decodificador 112 pueden implementarse en el mismo dispositivo electrónico. En una implementación, en la que el codificador 104 y el decodificador 112 se implementan en el mismo dispositivo electrónico, por ejemplo, el flujo 110 de bits puede hacerse disponible para el decodificador en una variedad de formas. Por ejemplo, el flujo 110 de bits puede proporcionarse a través de un bus al decodificador 112 o almacenarse en memoria para la recuperación por el decodificador 112.
El decodificador 112 puede implementarse en hardware, software o una combinación de ambos. En una configuración, el decodificador 112 puede ser un decodificador de HEVC. El decodificador 112 puede obtener (p. ej., recibir) el flujo 110 de bits. El decodificador 112 puede generar una o más imágenes 114 decodificadas en base al flujo 110 de bits. Una imagen 114 decodificada puede visualizarse, reproducirse, almacenarse en memoria y/o transmitirse a otro dispositivo, etc.
El decodificador 112 puede incluir un módulo 120 receptor de imagen de GTLA. El módulo 120 receptor de imagen de GTLA, puede permitir que el dispositivo B 102b electrónico obtenga una imagen de GTLA y/o un indicador de imagen de GTLA a partir del flujo 110 de bits. En algunas configuraciones, el módulo 120 receptor de imagen de GTLA puede obtener una imagen de GTLA en base a si el flujo 110 de bits incluye un indicador de imagen de GTLA.
El dispositivo B 102b electrónico, también puede realizar una o más operaciones sobre el flujo 110 de bits. En un ejemplo, una operación o proceso realizado sobre el flujo 110 de bits puede ser en base si está presente una imagen de GTLA o un indicador de imagen de GTLA. En algunas configuraciones, el decodificador 112 u otro elemento en el dispositivo B 102b electrónico puede realizar la operación sobre el flujo 110 de bits. Además, también pueden realizarse otras operaciones sobre el flujo 110 de bits.
En algunas configuraciones, el dispositivo B 102b electrónico puede emitir una imagen 114 decodificada. En un ejemplo, la imagen 114 decodificada puede transmitirse a otro dispositivo o de vuelta al dispositivo A 102a electrónico. En una configuración, la imagen 114 decodificada puede almacenarse o mantenerse de otro modo en el dispositivo B 102b electrónico. En otra configuración, el dispositivo B 102b electrónico puede visualizar la imagen 114 decodificada. En aún otra configuración, la imagen 114 decodificada puede incluir elementos de la imagen 106 de entrada con diferentes propiedades en base a la codificación y a otras operaciones realizadas sobre el flujo 110 de bits. En algunas configuraciones, la imagen 114 decodificada puede incluirse en un flujo de imágenes con una resolución, formato, especificaciones u otro atributo diferentes de la imagen 106 de entrada.
Cabe señalar que uno o más de los elementos o partes de los mismos incluidos en el(los) dispositivo(s) 102 electrónico(s) pueden implementarse en hardware. Por ejemplo, uno o más de estos elementos o partes de los mismos, pueden implementarse como un chip, circuitería o componentes de hardware, etc. También cabe señalarse que una o más de las funciones o métodos descritos en el presente documento pueden implementarse y/o ejecutarse utilizando hardware. Por ejemplo, uno o más de los métodos descritos en el presente documento pueden implementarse en y/o realizarse utilizando un conjunto de chips, un circuito integrado de aplicación específica (ASIC), un circuito integrado a gran escala (LSI) o circuito integrado, etc.
La Figura 2 es un diagrama de bloques que ilustra dos ejemplos de una estructura de codificación. El Ejemplo A 230 ilustra una estructura de codificación cuando se utiliza una imagen 228 de acceso de capa temporal (TLA). El Ejemplo B 231 ilustra una estructura de codificación cuando se utiliza una imagen 229 de acceso de capa temporal gradual (GTLA).
El acceso horizontal en el ejemplo A 230 representa el orden 222 de salida de las imágenes en una estructura de codificación. El orden de salida puede comenzar en cero y contar hacia arriba (p. ej., de izquierda a derecha) y se puede utilizar para identificar las correspondientes imágenes en la estructura de código. A modo de ejemplo, el ejemplo A 230 tiene un orden 222 de salida de 0-16 que corresponde a las imágenes 0-16, respectivamente.
En el ejemplo A 230, el acceso vertical representa las capas 218 temporales. Cada una de las capas 218a-n temporales puede incluir una o más imágenes. Cada una de las imágenes en la misma capa 218 temporal puede tener el mismo identificador temporal. Por ejemplo, todas las imágenes en la capa A 218a temporal pueden tener temporal_id igual a cero, todas las imágenes en la capa B 218b temporal pueden tener temporal_id igual a uno, todas las imágenes en la capa C 218c temporal pueden tener temporal_id igual a dos, todas las imágenes en la capa N 218n temporal puede tener temporal_id igual a N - 1, etc.
Como se muestra en el ejemplo A 230, puede haber varias capas 218a-n temporales. Por ejemplo, puede haber dos, tres, cuatro, ocho, dieciséis, etc. capas 218 temporales. Cada una de las capas 218 temporales puede incluir un número diferente de imágenes. En algunas configuraciones, las capas 218 temporales están organizadas en forma jerárquica. Cada una de las capas 218 temporales superiores, por encima de la capa base (p. ej., la capa A 218a temporal), puede incluir más imágenes que las capas 218 temporales inferiores precedentes. Por ejemplo, la capa N 218n temporal puede incluir el doble de imágenes que la capa C 218c temporal y, la capa C 218c temporal, puede incluir el doble de imágenes que la capa B 218b temporal. Las capas 218 temporales superiores con mayor número de imágenes pueden proporcionar tasas de tramas más altas para imágenes decodificadas.
Cada una de las capas 218 temporales puede tener una variedad de tipos de imagen y de segmento. Por ejemplo, la capa A 218a temporal puede tener una imagen con un segmento de predicción intra (segmento-I) y una imagen con un segmento predictivo (segmento-P). La capa C 218a temporal puede tener imágenes con segmentos bi-predictivos (segmentos-B). La capa B 218b temporal puede tener imágenes con segmentos-P e imágenes con segmentos-B.
En el ejemplo A 230, se muestra una imagen 228 de TLA. Por ejemplo, la imagen 228 de TLA puede ser la 12a imagen en el orden 222 de codificación. Una imagen de TLA puede ser una imagen de Acceso Aleatorio Limpio (CRA) y/o un punto de conmutación de capa temporal.
El dispositivo 102 electrónico puede utilizar una funcionalidad de conmutación de capa temporal indicada por una imagen 228 de TLA para conmutar entre capas 218 temporales. Por ejemplo, el dispositivo 102 electrónico puede utilizar un punto de conmutación de capa temporal para indicar una conmutación entre la capa A 218a temporal y capa B 218b temporal.
El ejemplo B 231 ilustra una estructura de codificación cuando se utiliza una imagen 229 de acceso de capa temporal gradual (GTLA). El ejemplo B 231 incluye las capas 219a-n temporales y un orden 223 de salida similares a las correspondientes capas 218a-n temporales y al orden 222 de salida descritos en relación con el ejemplo A 230 de la Figura 2. Por ejemplo, el ejemplo B 231 puede tener imágenes emitidas en un orden 223 de salida de 0-16.
Cada una de las capas 219a-n temporales puede incluir una o más imágenes. Cada una de las imágenes en la misma capa 219 temporal puede tener el mismo identificador temporal. Por ejemplo, todas las imágenes en la capa B 219b temporal pueden tener el mismo temporal_id. Las capas 219a-n temporales pueden estar organizadas de manera jerárquica con cada una de las capas 219 temporales superiores, por encima de la capa base (p. ej., la capa A 219a temporal), que tiene más imágenes que las capas 219 temporales inferiores. Por ejemplo, la capa N 219n temporal puede tener ocho imágenes, mientras que la capa B 218b temporal puede tener dos imágenes. Las capas 219 temporales superiores con mayor número de imágenes pueden proporcionar tasas de tramas más altas para imágenes decodificadas.
En el ejemplo B 231, se muestra una imagen 229 de GTLA. Por ejemplo, la imagen 229 de GTLA puede ser la 12a imagen en el orden 223 de salida.
Una estructura codificada de imagen de GTLA puede proporcionar una mayor flexibilidad en la selección de imágenes de referencia que una estructura codificada de imagen de TLA, mientras que todavía proporciona la funcionalidad de conmutación de capa temporal. Por ejemplo, la imagen 9, como se muestra en el orden 223 de salida, puede ser capaz de utilizar las imágenes 7, 8 y 10 como imágenes de referencia bajo una estructura de codificación con una imagen 229 de GTLA. En contraste, bajo una estructura de codificación con una imagen 228 de TLA, tal como se muestra en el ejemplo A 230, la imagen 7 no está disponible como una imagen de referencia para la imagen 9. Del mismo modo, la imagen 10, como se muestra en el orden 223 de salida, puede ser capaz de utilizar las imágenes 6, 8 y 12 como imágenes de referencia. Esto permite que el dispositivo 102 electrónico tenga una mayor flexibilidad en la selección de imágenes de referencia al permitir el uso de referencias adicionales.
Además, debido a que se pueden utilizar imágenes adicionales como imágenes de referencia, se puede conseguir una mejor eficiencia de compresión en comparación con tasas de compresión de imágenes 228 de TLA. Por ejemplo, debido a que la imagen 9 puede utilizar la imagen 7 como imagen de referencia además de las imágenes 8 y 10, la imagen 9 se puede comprimir aún más. En otras palabras, la compresión adicional es el resultado de tener una mayor selección de imágenes de referencia para elegir. Esto contrasta con una estructura de codificación con imágenes 228 de TLA, que no emplean imágenes adicionales para utilizar como imágenes de referencia.
La Figura 3 es un diagrama de bloques que ilustra dos ejemplos más de una estructura de codificación. El Ejemplo A 330 ilustra una estructura de codificación de un conjunto más grande de imágenes cuando se utilizan imágenes 328 de TLA para la conmutación de capa temporal. El ejemplo B 331 ilustra una estructura de codificación de un conjunto más grande de imágenes con imágenes 329 de GTLA escalonadas utilizadas para la conmutación de capa temporal.
El ejemplo A 330 incluye las capas 318a-n temporales y un orden 322 de salida similares a las correspondientes capas 218a-n temporales y al orden 222 de salida descrito en relación con el ejemplo A 230 de la Figura 2. Por ejemplo, en la Figura 3, ejemplo A 330 puede tener imágenes 0-32 emitidas en el orden 322 de salida.
Como se muestra en el ejemplo A 330, puede haber un número de capas 318a-n temporales. Cada una de las capas 318 temporales puede incluir un número diferente de imágenes. En algunas configuraciones, las capas 318 temporales pueden organizarse en forma jerárquica. Cada una de las imágenes en la misma capa 318 temporal puede compartir el mismo identificador temporal. Por ejemplo, todas las imágenes en la capa A 318a temporal pueden tener temporal_id igual a cero y todas las imágenes en la capa N 318n temporal pueden tener temporal_id igual a N - 1. Las capas 318 temporales superiores con mayor número de imágenes, pueden proporcionar tasas de tramas más altas y mayor resolución para imágenes decodificadas.
El dispositivo 102 electrónico puede utilizar una funcionalidad de conmutación de capa temporal para conmutar entre capas 318 temporales. Por ejemplo, el dispositivo 102 electrónico puede utilizar un punto de conmutación de capa temporal para indicar una conmutación entre la capa A 318a temporal y la capa B 318b temporal. La funcionalidad de conmutación de capa temporal se puede indicar mediante la imagen 328a de TLA y la imagen 328b de TLA, mostradas en el orden 322 de salida como imágenes 12 y 28, respectivamente.
El ejemplo B 331 ilustra una estructura de codificación con imágenes 329 de GTLA escalonadas utilizadas para la conmutación de capa temporal. El ejemplo B 331 incluye las capas 319a-n temporales y un orden 323 de salida similares a los correspondientes elementos 318a-n y 322 descritos en el ejemplo A 330 de la Figura 3 y los correspondientes elementos 218a-n y 222 descritos en relación con el ejemplo A 230 de la Figura 2.
Como se muestra en el ejemplo B 331, puede haber un número de capas 319a-n temporales. En algunas configuraciones, las capas 319 temporales pueden organizarse en forma jerárquica. Las capas 319 temporales superiores con mayor número de imágenes pueden proporcionar tasas de tramas más altas y mayor resolución para imágenes decodificadas.
El dispositivo 102 electrónico puede utilizar una funcionalidad de conmutación de capa temporal para conmutar entre capas 319 temporales. Por ejemplo, el dispositivo 102 electrónico puede utilizar un punto de conmutación de capa temporal para indicar una conmutación entre la capa C 319c temporal y la capa N 318n temporal.
Las imágenes 329a-d de GTLA en el ejemplo B 331 pueden indicar a un dispositivo 102 electrónico que conmute entre capas 319 temporales. Las imágenes 329a-d de GTLA pueden estar escalonadas entre las capas 319 temporales. En otras palabras, las imágenes 329a-d de GTLA pueden ubicarse en diferentes capas temporales. Por ejemplo, la imagen 329a de GTLA y la imagen 329d de GTLA pueden estar en la capa B 319b temporal, una imagen 329b de GTLA puede estar en la capa C 319c temporal y una imagen 329c de GTLA puede estar en la capa N 319n temporal. En el ejemplo B 331 de la Figura 3, GTLA 329a, GTLA 329b, GTLA 329c y Gt LA 329d se muestran en el orden 323 de salida como imágenes 12, 18, 23 y 28, respectivamente.
Como se ha descrito anteriormente, Las imágenes 329 de GTLA pueden proporcionar mayor flexibilidad en la selección de imágenes de referencia que las imágenes 328 de TLA, mientras que todavía proporcionan la funcionalidad de conmutación de capa temporal. Esto se puede lograr porque las imágenes 329 de GTLA permiten que se utilicen más imágenes como imágenes de referencia en una estructura de codificación en comparación con las estructuras de codificación con imágenes 328 de TLA. Además, debido a que pueden utilizarse imágenes adicionales como imágenes de referencia, se puede lograr una mejor eficiencia de compresión en comparación con tasas de compresión de imágenes 328 de TLA.
En algunas configuraciones, utilizar imágenes 329 de GTLA entre múltiples capas 319 temporales permite la selección de las tramas deseadas en una manera de paso por paso. Por ejemplo, una tasa de tramas completa puede representarse por “F” hercios (Hz). En este ejemplo, se utilizan todas las capas 319a-n temporales y cada una de las capas 319a-n temporales puede representar una tasa de tramas diferente. La capa A 319a temporal, la capa B 319b temporal, la capa C 319c temporal y la capa N 319n temporal, pueden tener identificadores temporales de 0, 1, 2 y 3 respectivamente. Una tasa de tramas completa utiliza todas las capas 319 temporales. En otras palabras, la tasa, F Hz, de tramas completa emplea todas las imágenes que tienen temporal_id igual a 0, 1, 2 o 3. A modo de ejemplo, esto puede incluir las 32 imágenes mostradas en el ejemplo B 331.
Sin embargo, en algunos casos, se puede utilizar un subflujo, o menos que la tasa de tramas completa. Por ejemplo, un subflujo que utiliza solo temporal_ids 0, 1 y 2 puede utilizar la mitad de la tasa de tramas completa, representada por F/2 Hz. Por ejemplo, esto puede incluir todas las imágenes en la capa A 319a temporal a la capa C 319c temporal mostradas en el ejemplo B 331, o 16 imágenes.
Un subflujo que utiliza solo temporal_ids 0 y 1, puede utilizar una cuarta parte de la tasa de tramas completa, representada por F/4 Hz. Por ejemplo, esto puede incluir todas las imágenes en la capa A 319a temporal a la capa B 319b temporal mostradas en el ejemplo B 331, u 8 imágenes.
Un subflujo que utiliza sólo temporal_id 0 puede utilizar un octavo de la tasa de tramas completa, representada por F/8 Hz. Por ejemplo, esto puede incluir solo imágenes en la capa A 319a temporal mostrada en el ejemplo B 331, o 4 imágenes.
En algunas configuraciones, el ancho de banda disponible puede determinar si la tasa de tramas completa (p. ej., F Hz) o una tasa de tramas parcial, (p. ej., F/2 Hz, F/4 Hz, F/8 Hz) puede transmitirse por un dispositivo 102 electrónico. Como tal, cada una de las capas 319a-n temporales y el correspondiente identificador temporal pueden transmitirse por separado como su propio grupo de multidifusión.
En algunas configuraciones, la tasa de tramas más baja (p. ej., F/8 Hz) se transmite primero como un grupo de multidifusión. Adicionalmente, se pueden transmitir tasas de tramas más altas (p. ej., F/4 Hz, F/2 Hz y F Hz) como grupos de multidifusión adicionales, respectivamente. Por ejemplo, un dispositivo 102 electrónico puede comenzar a recibir un flujo 110 de bits que incluye un subflujo (F/8 Hz) de grupo de multidifusión solo con imágenes de la capa A 319a temporal (p. ej., temporal_id = 0). Posteriormente, el flujo 110 de bits puede comenzar a incluir adicionalmente un subflujo (F/4 Hz) de grupo de multidifusión con imágenes de la capa A 319a temporal y de la capa B 319b temporal (p. ej., temporal_ids = 1 y 2). Sin embargo, el dispositivo 102 electrónico no puede comenzar inmediatamente a decodificar las imágenes de la capa B 319b temporal. Más bien, el dispositivo 102 electrónico debe descartar las imágenes de la capa B 319b temporal.
Mientras que recibe imágenes de la capa A 319a temporal y de la capa B 319b temporal, el dispositivo 102 electrónico puede recibir una indicación de una imagen 329a GTLA. Por ejemplo, la indicación puede ser un tipo de unidad de NAL que indica una imagen 329a de GTLA. La imagen 329a de GTLA puede indicar un punto de conmutación de capa temporal al dispositivo 102 electrónico. Como este punto, el dispositivo 102 electrónico puede comenzar a decodificar las imágenes de la capa A 319a temporal y de la capa B 319b temporal.
El dispositivo 102 electrónico puede continuar recibiendo imagen de capas 319 temporales adicionales, tales como las imágenes en la capa C 319c temporal y en la capa N 319n temporal. Junto con las capas 319 temporales adicionales, el dispositivo 102 electrónico puede recibir imágenes 319 de GTLA adicionales, tales como la imagen 329b de GTLA y la imagen 329c de GTLA para indicar los puntos de conmutación de capa temporal. Como tal, el dispositivo 102 electrónico puede conmutar a una tasa, F Hz, de tramas completa utilizando las imágenes 329 de GTLA como puntos de conmutación de capa temporal. Por lo tanto, de esta manera, las imágenes 329 de GTLA permiten la selección de tasas de tramas deseadas en una manera de paso por paso.
La Figura 4 es un diagrama de bloques que ilustra una configuración de un codificador 404 en un dispositivo 402 electrónico. El dispositivo 402 electrónico puede ser un ejemplo del dispositivo 102 electrónico descrito en relación con la Figura 1 anterior. Por ejemplo, el dispositivo 402 electrónico y el codificador 404 pueden corresponder al dispositivo A 102a electrónico y al codificador 104 de la Figura 1.
Uno o más de los elementos ilustrados como incluidos dentro del dispositivo 402 electrónico pueden implementarse en hardware, software o una combinación de ambos. El dispositivo 402 electrónico puede incluir el codificador 404, que puede implementarse en hardware, software o una combinación de ambos. El codificador 404 puede implementarse como un circuito, circuito integrado, circuito integrado de aplicación específica (ASIC), procesador en comunicación electrónica con memoria con instrucciones ejecutables, firmware, matriz de puertas programables (FPGA), etc., o una combinación de los mismos. En algunas configuraciones, el codificador 404 puede ser un codificador de HEVC.
El dispositivo 402 electrónico puede incluir una fuente 434. La fuente 434 puede proporcionar imagen o datos de imagen (p. ej., video) como una imagen 406 de entrada al codificador 404. Los ejemplos de la fuente 434 pueden incluir sensores de imagen, memoria, interfaces de comunicación, interfaces de red, receptores inalámbricos, puertos, etc.
Una o más imágenes 406 de entrada pueden proporcionarse a un búfer 440 de módulo de predicción intra-trama y de reconstrucción. Una imagen 406 de entrada puede proporcionarse también a un módulo 466 de estimación de movimiento y de compensación de movimiento y a un módulo 446 de sustracción.
El búfer 440 de módulo de predicción intra-trama y de reconstrucción puede generar información 458 de modo intra y una señal 442 intra en base a una o más imágenes 406 de entrada y a datos 480 reconstruidos. El módulo 466 de estimación de movimiento y de compensación de movimiento puede generar información 468 de modo inter y una señal 444 inter en base a una o más imágenes 406 de entrada y a un búfer 496 de imagen de referencia de señal 498 de salida de búfer de imagen de referencia. En algunas configuraciones, el búfer 496 de imagen de referencia puede incluir datos de una o más imágenes de referencia en el búfer 496 de imagen de referencia.
El codificador 404 puede seleccionar entre la señal 442 intra y la señal 444 inter de acuerdo con un modo. La señal 442 intra se puede utilizar para explotar características espaciales dentro de una imagen en un modo de codificación intra. La señal 444 inter puede utilizarse para explotar características temporales entre imágenes en un modo de codificación inter. Mientras está en el modo de codificación intra, la señal 442 intra puede proporcionarse al módulo 446 de sustracción y la información 458 de modo intra puede proporcionarse a un módulo 460 de codificación de entropía. Mientras está en el modo de codificación inter, la señal 444 inter puede proporcionarse el módulo 446 de sustracción y la información 468 de modo inter puede proporcionarse al módulo 460 de codificación de entropía.
Cualquiera de la señal 442 intra o de la señal 444 inter (dependiendo del modo) se sustrae de una imagen 406 de entrada en el módulo 446 de sustracción para producir un residuo 448 de predicción. El residuo 448 de predicción se proporciona a un módulo 450 de transformación. El módulo 450 de transformación puede comprimir el residuo 448 de predicción para producir una señal 452 transformada que se proporciona a un módulo 454 de cuantización. El módulo 454 de cuantización cuantiza la señal 452 transformada para producir coeficientes 456 transformados y cuantizados (TQC).
Los TQC 456 se proporcionan a un módulo 460 de codificación de entropía y a un módulo 470 de cuantización inversa. El módulo 470 de cuantización inversa realiza la cuantización inversa en los TQC 456 para producir una señal 472 cuantizada inversa que se proporciona a un módulo 474 de transformación inversa. El módulo 474 de transformación inversa descomprime la señal 472 cuantizada inversa para producir una señal 476 descomprimida que se proporciona a un módulo 478 de reconstrucción.
El módulo 478 de reconstrucción puede producir datos 480 reconstruidos en base a la señal 476 descomprimida. Por ejemplo, el módulo 478 de reconstrucción puede reconstruir (modificar) imágenes. Los datos 480 reconstruidos pueden proporcionarse a un filtro 482 de desbloqueo y al búfer 440 de módulo de predicción intra y de reconstrucción. El filtro 482 de desbloqueo puede producir una señal 484 filtrada en base a los datos 480 reconstruidos.
La señal 484 filtrada se puede proporcionar a un módulo 486 de desplazamiento adaptable de muestra (SAO). El módulo 486 de SAO puede producir información 488 de SAO que se proporciona al módulo 460 de codificación de entropía y una señal 490 de SAO que se proporciona a un filtro 492 de bucle adaptable (ALF). El ALF 492 produce una señal 494 de ALF que se proporciona al búfer 496 de imágenes de referencia. La señal 494 de ALF puede incluir datos de una o más imágenes que se pueden utilizar como imágenes de referencia.
El módulo 460 de codificación de entropía puede codificar los TQC 456 para producir un de flujo 410 de bits u otra señal. Además, el módulo 460 de codificación de entropía puede codificar los TQC 456 utilizando la Codificación de Longitud Variable Adaptable al Contexto (CAVLC) o la Codificación Aritmética Binaria Adaptable al Contexto (CABAC). En particular, el módulo 460 de codificación de entropía puede codificar los TQC 456 en base a una o más de la información 458 de modo inter, la información 468 de modo inter y la información 488 de SAO. En algunas configuraciones, el flujo 410 de bits puede incluir datos de imagen codificados. En un ejemplo, el flujo 410 de bits se pasa a un módulo 408 de imagen de GTLA antes de enviarse desde el codificador 404 o a otro dispositivo 102 electrónico.
La cuantización, involucrada en la compresión de video, tal como HEVC, es una técnica de compresión con pérdida que se logra al comprimir un rango de valores a un solo valor cuántico. El parámetro (QP) de cuantización es un parámetro de escala predefinido que se utiliza para realizar la cuantización en base a la calidad del video reconstruido y la relación de compresión. El tipo de bloque se define en HEVC para representar las características de un bloque dado en base al tamaño del bloque y su información de color. El QP, la información de resolución y el tipo de bloque pueden determinarse antes de la codificación de entropía. Por ejemplo, el dispositivo 402 electrónico (p. ej., el codificador 404) puede determinar el QP, la información de resolución y el tipo de bloque, que pueden proporcionarse al módulo 460 de codificación de entropía.
El módulo 460 de codificación de entropía puede determinar el tamaño de bloque en base a un bloque de los TQC 456. Por ejemplo, el tamaño de bloque puede ser el número de TQC 456 a lo largo de una dimensión del bloque de los TQC. En otras palabras, el número de TQC 456 en el bloque de los TQC puede ser igual al tamaño de bloque al cuadrado. Por ejemplo, el tamaño del bloque se puede determinar como la raíz cuadrada del número de TQC 456 en el bloque de los TQC. La resolución se puede definir como un ancho de píxel por una altura de píxel. La información de resolución puede incluir una cantidad de píxeles para el ancho de una imagen, para la altura de una imagen o ambos. El tamaño de bloque se puede definir como el número de TQC 456 a lo largo de una dimensión de un bloque 2D de los TQC.
En algunas configuraciones, el módulo 460 de codificación de entropía envía un flujo 410 de bits u otra señal que incluye una o más imágenes a un módulo 408 de imagen de GTLA. El módulo 408 de imagen de GTLA puede procesar una imagen como una imagen 429 de GTLA. En este caso, el búfer 440 de módulo de predicción intra-trama y de reconstrucción, el módulo 450 de transformación, el módulo 454 de cuantización, el módulo 460 de codificación de entropía y el módulo 466 de estimación de movimiento y de compensación de movimiento han codificado la imagen 429 de GTLA de tal manera que la imagen 429 de GTLA y todas las imágenes codificadas con un identificador temporal (temporal_id) iguales que el identificador temporal de la imagen 429 de GTLA que sigue a la imagen 429 de GTLA en orden de decodificación, no utilizarán la predicción inter de cualquier imagen con un identificador temporal mayor o igual que el identificador temporal de la imagen 429 de GTLA que precede a la imagen 429 de GTLA en orden de decodificación. En algunas configuraciones, el módulo 408 de imagen de GTLA puede generar un nuevo tipo de unidad de NAL, bandera u otro indicador para mostrar la presencia de la imagen 429 de GTLA. Además, el módulo 408 de imagen de GTLA puede modificar o crear un indicador de imagen de GTLA para acompañar o enviar con un flujo 410 de bits de datos para ser almacenado en el dispositivo 402 electrónico o para enviarlos a otro dispositivo 102 electrónico.
El módulo 408 de imagen de GTLA puede incluir además una variedad de módulos o submódulos para generar uno o más indicadores de imagen de GTLA asociados con una imagen 406 de entrada. Por ejemplo, el módulo 408 de imagen de GTLA puede incluir un módulo 424a de indicador de GTLA, módulo 424b de Unidad de NAL (NALU), módulo 424c de conjunto de parámetros u otro módulo para generar un indicador de imagen de GTLA asociado con una imagen 406 de entrada.
En algunas configuraciones, el módulo 424a de indicador de imagen de GTLA puede generar un indicador de imagen de GTLA. El indicador de imagen de GTLA puede generarse después de que una imagen esté parcialmente codificada o pase a través de los componentes de un dispositivo 402 electrónico.
En una configuración, el módulo 408 de imagen de GTLA puede generar un indicador de imagen de GTLA asociado con una o más imágenes 406 de entrada creando o modificando un nuevo tipo de unidad de NAL. En un ejemplo, un módulo 424b de unidad de NAL puede generar una unidad de NAL asociada con una o más imágenes 429 de GTLA. En algunas configuraciones, el módulo 424b de unidad de NAL puede generar una unidad de NAL asociada con una o más imágenes 429 de GTLA para indicar que una imagen 406 de entrada es una imagen 429 de GTLA.
En algunas configuraciones, el indicador de imagen de GTLA puede señalizarse en un conjunto de parámetros. El módulo 424c de conjunto de parámetros puede asociar el indicador de imagen de GTLA con un conjunto de parámetros. Por ejemplo, el conjunto de parámetros puede ser un Conjunto de Parámetros de Secuencia (SPS), Conjunto de Parámetros de Imagen (PPS), Conjunto de Parámetros de Adaptación (APS), Conjunto de Parámetros de Video (VPS) u otro conjunto de parámetros. En algunas configuraciones, el módulo 424c de conjunto de parámetros puede asociar el indicador de imagen de GTLA con un encabezado de segmento. En otras palabras, el indicador de imagen de GTLA puede señalizarse en el SPS, PPS, APS, VPS, algún otro conjunto de parámetros y/o el encabezado de segmento.
En algunas configuraciones, el flujo 410 de bits puede transmitirse a otro dispositivo 102 electrónico. Por ejemplo, el flujo 410 de bits se puede proporcionar a una interfaz de comunicación, interfaz de red, transmisor inalámbrico, puerto, etc. Por ejemplo, el flujo 410 de bits puede transmitirse a otro dispositivo 102 electrónico a través de LAN, la Internet, una estación base de telefonía móvil, etc. El flujo 410 de bits puede almacenarse adicional o alternativamente en memoria o en otro componente del dispositivo 402 electrónico.
La Figura 5 es un diagrama de flujo que ilustra una configuración de un método 500 para señalizar una imagen 429 de acceso de capa temporal gradual (GTLA). Un dispositivo 402 electrónico puede codificar 502 una imagen de acceso de capa temporal gradual (GTLA). La imagen de GTLA puede ser una imagen 406 de entrada o un flujo de imágenes 406 de entrada obtenido por un dispositivo 402 electrónico.
Codificar 502 la primera imagen puede incluir representar una imagen 406 de entrada como datos digitales. Por ejemplo, codificar 502 la primera imagen puede incluir generar una cadena de bits que represente características (p. ej., color, luminancia, ubicación espacial, etc.) de una imagen 406 de entrada. En algunos casos, una imagen 406 de entrada puede codificarse 502 como una imagen 429 de GTLA. Una o más imágenes codificadas pueden incluirse en el flujo 410 de bits y pueden enviarse a otro dispositivo 102 electrónico que incluya un decodificador 112.
El dispositivo 402 electrónico puede enviar 504 la imagen 429 de GTLA. Enviar 504 la imagen de GTLA puede incluir la transferencia de datos (p. ej., un flujo 410 de bits) entre componentes de un dispositivo 102 electrónico o la transmisión de un flujo 410 de bits entre uno o más dispositivos 102 electrónicos. En un ejemplo, un codificador 404 en el dispositivo 402 electrónico puede enviar un flujo 410 de bits que incluye una o más imágenes 429 de GTLA a un dispositivo 102 electrónico. En algunas configuraciones, el flujo 410 de bits puede enviarse a un decodificador 112 en el dispositivo B 102b electrónico. El indicador de GTLA puede enviarse 504 a través de una transmisión cableada o inalámbrica, por ejemplo.
La Figura 6 es un diagrama de flujo que ilustra una configuración más específica de un método 600 para señalizar una imagen 429 de acceso de capa temporal gradual (GTLA). Un dispositivo 402 electrónico puede codificar 602 una imagen 429 de acceso de capa temporal gradual (GTLA). Por ejemplo, el dispositivo 402 electrónico puede codificar una imagen 406 de entrada como la imagen 429 de GTLA. Por ejemplo, el dispositivo 402 electrónico puede codificar 602 la imagen 429 de GTLA, como se describió anteriormente en relación con la Figura 5.
El dispositivo 402 electrónico puede enviar la imagen 429 de GTLA. Por ejemplo, el dispositivo 402 electrónico puede enviar 604 la imagen 429 de GTLA en un flujo 410 de bits.
El dispositivo 402 electrónico puede generar 606 un indicador de imagen de GTLA. El indicador de imagen de GTLA puede corresponder a la imagen 429 de GTLA. En algunas configuraciones, el dispositivo 402 electrónico puede generar 406 un indicador de imagen de GTLA asociado con una imagen 429 de GTLA creando un tipo de unidad de NAL correspondiente a las imágenes 429 de GTLA. Por ejemplo, el dispositivo 402 electrónico puede generar 406 un tipo 9 de unidad de NAL como se ilustra en la Tabla 2 a continuación. Las modificaciones de los enfoques conocidos están en negrita a continuación en la Tabla 2.
[Tabla 2]
Figure imgf000014_0001
Figure imgf000015_0001
La Tabla 2 está organizada en columnas tipo de unidad de NAL (nal_unit_type), contenido de unidad de NAL y estructura de sintaxis de RBSP y clase de tipo de unidad de NAL. Cuando el valor del tipo de unidad de NAL es igual a 9 para todas las unidades de NAL de VCL de una imagen particular, se puede hacer referencia a esa imagen particular como una imagen 429 de GTLA. En la Tabla 2, un tipo de unidad de NAL igual a 9 puede indicar un segmento codificado de una imagen de GTLA. Un tipo de unidad de NAL igual a 9, también puede indicar una imagen no TFD. En otras palabras, una imagen 429 de GTLA con un tipo de unidad de NAL igual a 9 puede denominarse imagen de GTLA no TFD.
Una imagen 429 de GTLA y todas las imágenes codificadas con un identificador temporal (temporal_id) igual que el identificador temporal de la imagen 429 de GTLA que sigue a la imagen 429 de GTLA en orden de decodificación, pueden no utilizar predicción inter de cualquier imagen con identificador temporal mayor o igual que el identificador temporal de la imagen 429 de GTLA que precede a la imagen 429 de GTLA en orden de decodificación. Por ejemplo, volviendo a la Figura 3, el ejemplo B 331, la imagen 18, como se muestra en el orden 323 de salida, es una imagen 329b de GTLA. La imagen 18 está en la capa C 319c temporal. Por lo tanto, en este ejemplo, las imágenes que preceden a la imagen 18, a la imagen 329b de GTLA, en orden de decodificación en la capa C 319c temporal y la capa N 319n temporal (p. ej., las imágenes 1-3, 5-7, 9-11, 13-15 y 17), pueden no utilizarse para la predicción inter de cualquier imágenes en la capa C 319c temporal que siguen la imagen 329b de GTLA en orden de decodificación (p. ej., las imágenes 22, 26 y 30). Señalar que en aras de la simplicidad, este ejemplo asume que el orden 323 de salida es el mismo que el orden de decodificación. Sin embargo, el orden 323 de salida y el orden de decodificación pueden ser diferentes entre sí.
Además, una imagen 429 de GTLA y todas las imágenes codificadas con un identificador temporal igual que el identificador temporal de la imagen de GTLA que sigue a la imagen 429 de GTLA (p. ej., las imágenes posteriores a la imagen 429 de GTLA) en orden de decodificación, pueden utilizar predicción inter solo de imágenes con identificador temporal menor que el identificador temporal de la imagen 429 de GTLA que precede a la imagen 429 de GTLA en orden de decodificación (p. ej., imágenes anteriores a la imagen 429 de GTLA). Por ejemplo, volviendo a la imagen 18 en el ejemplo B 331 de la Figura 3, las imágenes en la capa C 319c temporal que siguen a la imagen 329b de GTLA en orden de decodificación (p. ej., las imágenes 22, 26 y 30), pueden utilizar la predicción inter de imágenes en la capa A 319a temporal y la capa B 319b temporal que preceden a la imagen 329b de GTLA en orden de decodificación (p. ej., las imágenes 0, 4, 8, 12, 16, 20 y 24 y así sucesivamente). De nuevo, en aras de la simplicidad, este ejemplo asume que el orden 323 de salida es el mismo que el orden de decodificación.
En algunos enfoques, si un tipo de unidad de NAL es igual a 9 para una unidad de NAL que incluye un segmento de una imagen particular, todas las unidades de NAL de VCL de esa imagen particular pueden tener un tipo de unidad de NAL igual a 9. En este ejemplo, un tipo de unidad de NAL igual a 9 puede indicar un segmento codificado de una imagen 429 de GTLA. Debe apreciarse que el tipo de unidad de NAL que indica una imagen 429 de GTLA puede ser igual a un valor diferente de 9.
En algunas configuraciones, una imagen 429 de GTLA puede ser una imagen 228 de TLA. En un caso, la imagen 429 de GTLA puede marcarse como una imagen 228 de TLA. En otro caso, la imagen 429 de GTLA puede ser una imagen 228 de TLA y marcarse como una imagen 228 de GTLA.
En algunas configuraciones, se pueden poner restricciones en el conjunto de imágenes de referencia (RPS) de una imagen 429 de GTLA. Por ejemplo, cuando la imagen actual es una imagen 429 de GTLA, ninguna imagen de referencia con un identificador temporal mayor o igual que el identificador temporal de la imagen 429 de GTLA puede incluirse en una lista anterior actual a corto plazo de conjunto de imágenes de referencia (RPS), una lista posterior actual a corto plazo de RPS o una lista actual a largo plazo de RPS para una imagen actual. En otras palabras, es posible que no haya imagen de referencia en el RPS con temporal_id mayor que el de la imagen actual incluida en RefPicSetStCurrBefore, RefPicSetStCurrAfter y/o RefPicSetLtCurr.
Además, en algunas configuraciones, se pueden poner restricciones en el conjunto de imágenes de referencia (RPS) de las imágenes posteriores a la imagen 429 de GTLA que tienen el mismo valor de identificador temporal que el de la imagen 429 de GTLA. Por ejemplo, para imágenes posteriores a una imagen 429 de GTLA que tienen el mismo valor de identificador temporal que el valor de identificador temporal para la imagen 429 de GTLA, ninguna imagen de referencia con un identificador temporal mayor o igual que el identificador temporal de la imagen 429 de GTLA puede incluirse en una lista anterior actual a corto plazo de RPS, una lista posterior actual a corto plazo de RPS o una lista actual a largo plazo de RPS para estas imágenes. En otras palabras, es posible que no haya una imagen de referencia en el RPS con temporal_id mayor que el de la imagen actual incluida en RefPicSetStCurrBefore, RefPicSetStCurrAfter y/o RefPicSetLtCurr para las imágenes posteriores a la imagen 429 de GTLA que tiene el mismo valor de identificador temporal que el de la imagen 429 de GTLA.
Además, cuando la imagen actual es una imagen 228 de TLA, puede no haber imagen de referencia incluida en el RPS con un identificador temporal mayor que o igual que el identificador temporal de la imagen actual. Además, es posible que no haya imagen de referencia incluida en el conjunto de imágenes de referencia que precede, en el orden 222 de salida, a cualquier imagen de CRA que precede a la imagen actual tanto en orden de decodificación como en orden 222 de salida. Además, en algunos casos, cuando la imagen actual es una imagen 228 de TLA, puede que no haya imagen de referencia incluida en el RPS con un identificador temporal mayor o igual que el identificador temporal de la imagen actual. Además, puede que no haya imagen de referencia incluida en el conjunto de imágenes de referencia que precede, en el orden 222 de salida, a cualquier imagen de CRA que precede a la imagen actual tanto en orden de decodificación como en orden 222 de salida.
Además, cuando la primera imagen codificada en el flujo 110 de bits es una imagen de IDR, puede que no haya entrada en una lista anterior actual a corto plazo de RPS, una lista posterior actual a corto plazo de RPS o una lista actual a largo plazo RPS que es igual a “ninguna imagen de referencia”. En otras palabras, cuando la primera imagen codificada en el flujo 110 de bits es una imagen de IDR, puede que no haya entrada en RefPicSetStCurrBefore, RefPicSetStCurrAfter o RefPicSetLtCurr que sea igual a “ninguna imagen de referencia”. Además, una imagen de referencia no se puede incluir en más de una de las cinco listas de RPS.
En algunas configuraciones, un tipo de unidad de NAL que es igual a 3 o 9, puede representar cuando un indicador de anidamiento de identificador temporal es igual a 1 y un identificador temporal es mayor que 0. En otras palabras, si nal_unit_type es igual a 3 o 9, entonces temporal_id_nesting_flag es igual a 1 y temporal_id es mayor que 0.
Una ventaja de generar un indicador de imagen de GTLA como se describe en el presente documento, puede incluir una mayor flexibilidad en la selección de imágenes de referencia al tiempo que proporciona la funcionalidad de conmutación de capa temporal. Esto puede proporcionar una mejor eficiencia de compresión en comparación con el uso de imágenes 228 de TLA.
Las imágenes 429 de GTLA, también pueden permitir la selección de la tasa de tramas deseada en una manera de paso por paso. Además, en algunas configuraciones, el indicador de GTLA se puede obtener (mediante un decodificador 112 o un nodo de red, por ejemplo) sin decodificar el SPS, PPS u otros campos asociados con una imagen 429 de GTLA u otra imagen.
En otras configuraciones, el indicador de imagen de GTLA puede generarse 606 en una cabecera de conjunto de parámetros o un encabezado de segmento, por ejemplo, utilizando el módulo 424c de conjunto de parámetros. Por ejemplo, el indicador de imagen de GTLA puede señalizarse en un SPS, PPS, APS, VPS, algún otro conjunto de parámetros y/o el encabezado de segmento.
El dispositivo 402 electrónico puede enviar 608 el indicador de imagen de GTLA. Enviar 608 el indicador de imagen de GTLA puede incluir transferir datos (p. ej., un flujo 410 de bits) entre componentes de un dispositivo 102 electrónico o transmitir un flujo 410 de bits entre uno o más dispositivos 102 electrónicos. Además, enviar un indicador de imagen de GTLA puede incluir otros enfoques similares para transferir datos entre uno o más dispositivos 102 electrónicos.
La Figura 7 es un diagrama de bloques que ilustra una configuración de un decodificador 712 en un dispositivo 702 electrónico. El dispositivo 702 electrónico y el decodificador 712 pueden ser un ejemplo del dispositivo 102 electrónico y del decodificador 112 descritos en relación con la Figura 1.
El decodificador 712 puede incluir en un dispositivo 702 electrónico. Por ejemplo, el decodificador 712 puede ser un decodificador de HEVC. El decodificador 712 y/o uno o más de los elementos ilustrados incluidos en el decodificador 712 pueden implementarse en hardware, software o una combinación de ambos. El decodificador 712 puede recibir un flujo 710 de bits (p. ej., una o más imágenes codificadas incluidas en el flujo 710 de bits) para la decodificación.
En algunas configuraciones, el flujo 710 de bits recibido puede incluir información de sobrecarga recibida, tal como un encabezado de segmento recibido, PPS recibido, información de descripción de búfer recibida, etc. Las imágenes codificadas incluidas en el flujo 710 de bits pueden incluir una o más imágenes de referencia codificadas y/o una o más imágenes codificadas. En algunas configuraciones, el flujo 710 de bits puede incluir o estar acompañado por uno o más indicadores de imagen de GTLA.
En una configuración, el decodificador 712 incluye un módulo 720 de recepción de imagen de GTLA. En algunas configuraciones, el dispositivo 702 electrónico recibe un flujo 710 de bits y envía el flujo 710 de bits a través del módulo 720 de recepción de imagen de GTLA. El módulo 720 de recepción de imagen de GTLA puede ser parte de un decodificador 712 o de otro componente en el dispositivo 702 electrónico.
El módulo 720 de recepción de imagen de GTLA puede incluir una variedad de módulos o submódulos para recibir una imagen 729 de GTLA del flujo 710 de bits. Por ejemplo, el módulo 720 de recepción de imagen de GTLA puede incluir un módulo 726a de indicador de GTLA, módulo 726b de Unidad de NAL (NALU), módulo 726c de conjunto de parámetros u otro módulo para recibir una imagen 729 de GTLA del flujo 710 de bits antes de pasar a través de ciertos elementos del decodificador 712. El módulo 720 de recepción de imagen de GTLA, también puede incluir una imagen 729 GTLA que puede decodificarse por decodificador 712.
En algunas configuraciones, el módulo 726a de indicador de imagen de GTLA puede recibir un indicador de imagen de GTLA. El indicador de imagen de GTLA puede recibirse después de que una imagen se decodifique parcialmente o pase a través de los componentes de un dispositivo 702 electrónico.
El módulo 726b de unidad de NAL puede determinar si un nuevo tipo de unidad de NAL que indica la presencia de una imagen 729 de GTLA en el flujo 710 de bits. Por ejemplo, la unidad de NAL puede estar asociada con una imagen 729 de GTLA y el módulo 726b de unidad de NAL puede recibir una indicación de imagen de GTLA como un tipo de unidad de NAL. Por ejemplo, un tipo de unidad de NAL igual a 9 puede indicar una imagen 729 de GTLA.
En algunas configuraciones, el módulo 726c de conjunto de parámetros puede determinar si una imagen 729 de GTLA está presente en base a diferentes tipos de indicadores. Por ejemplo, el módulo 726c de conjunto de parámetros puede recibir un indicador de imagen de GTLA en un conjunto de parámetros o encabezado de segmento como el SPS, PPS, APS, VPS, algún otro conjunto de parámetros y/o el encabezado de segmento.
Los símbolos recibidos (en la una o más imágenes codificadas incluidas en el flujo 710 de bits), pueden decodificarse por entropía por un módulo 768 de decodificación de entropía, produciendo así una señal 770 de información de movimiento y coeficientes 772 cuantizados, escalados y/o transformados.
La señal 770 de información de movimiento puede combinarse con una porción de una señal 798 de trama de referencia de una memoria 778 de trama en un módulo 774 de compensación de movimiento, que puede producir una señal 782 de predicción de inter-trama. Los coeficientes 772 cuantizados, desescalados y/o transformados pueden cuantizarse inversamente, escalarse y transformarse inversamente mediante un módulo 762 de inversión, produciendo así una señal 784 residual decodificada. La señal 784 residual decodificada se puede agregar a una señal 792 de predicción para producir una señal 786 combinada. La señal 792 de predicción puede ser una señal seleccionada a partir de la señal 782 de predicción inter-trama producida por el módulo 774 de compensación de movimiento o, alternativamente, la señal 790 de predicción intra-trama, producida por un módulo 788 de predicción intra-trama. En algunas configuraciones, esta selección de señal puede ser en base a (p. ej., controlada por) el flujo 710 de bits.
La señal 790 de predicción intra-trama puede predecirse a partir de información previamente decodificada de la señal 786 combinada (en la trama actual, por ejemplo). La señal 786 combinada, también puede filtrarse mediante un filtro 794 de desbloqueo. La señal 796 filtrada resultante puede escribirse en la memoria 778 de trama. La señal 796 filtrada resultante puede incluir una imagen decodificada.
La memoria 778 de trama puede incluir información de sobrecarga correspondiente a las imágenes decodificadas. Por ejemplo, la memoria 778 de trama puede incluir encabezados de segmento, información de parámetros, parámetros de ciclo, información de descripción de búfer, etc. Una o más de estas piezas de información pueden señalizarse desde un codificador (p. ej., el codificador 104). La memoria 778 de trama puede proporcionar una imagen 718 decodificada u otra señal de salida.
En algunas configuraciones, el decodificador 712 puede incluir un módulo 720a de recepción de imagen de GTLA en comunicación con la memoria 778 de trama. Por ejemplo, la memoria 778 de trama puede proporcionar y/o recuperar una imagen 729 de GTLA decodificada al módulo 720 de recepción de imagen de GTLA.
La Figura 8 es un diagrama de flujo que ilustra una configuración de un método 800 para recibir una imagen 729 de acceso de capa temporal gradual (GTLA). Un dispositivo 702 electrónico puede recibir 802 un flujo 710 de bits. Recibir 802, el flujo 710 de bits puede incluir obtener, leer o acceder de otra manera a un flujo 710 de bits. En algunas configuraciones, el flujo 710 de bits puede recibirse desde un codificador 104 en el mismo dispositivo electrónico o en un dispositivo 102 electrónico diferente. Por ejemplo, el dispositivo B 102b electrónico puede recibir el flujo 110 de bits de un codificador 104 en el dispositivo A 102a electrónico.
En algunas configuraciones, el dispositivo 702 electrónico puede incluir un decodificador 712 que recibe el flujo 710 de bits. El flujo 710 de bits puede incluir datos codificados en base a una o más imágenes 106 de entrada.
El dispositivo 702 electrónico puede obtener 804 una imagen 729 de GTLA. El dispositivo 702 electrónico puede obtener la imagen 729 de GTLA a partir del flujo 710 de bits. En otras palabras, el flujo 710 de bits también puede incluir una imagen 729 de GTLA.
El dispositivo 702 electrónico puede decodificar 806 la imagen 729 de GTLA. Por ejemplo, el decodificador 712 puede decodificar 806 una porción del flujo 710 de bits para producir una imagen de referencia que se almacena en la memoria 778 de trama. Como se describió anteriormente, las imágenes 729 de GTLA proporcionan más flexibilidad en la selección de imágenes de referencia que las imágenes 228 de TLA, porque hay más imágenes de referencia disponibles utilizando una estructura de codificación de imagen 729 de GTLA. Por lo tanto, las imágenes 729 de GTLA permiten que el decodificador 712 almacene y utilice imágenes de referencia adicionales al decodificar una imagen actual. De esta manera, utilizar imágenes 729 de GTLA puede resultar en eficiencia de compresión mejorada en comparación con utilizar imágenes 228 de TLA.
El dispositivo 702 electrónico puede decodificar 808 una imagen actual en base a la imagen 729 de GTLA. Por ejemplo, el decodificador 712 puede decodificar 808 una porción del flujo 710 de bits para producir una imagen actual en base a la imagen 729 de GTLA. La imagen actual puede decodificarse por un decodificador 712 como se describe anteriormente.
La Figura 9 es un diagrama de flujo que ilustra una configuración más específica de un método 900 para recibir una imagen 729 de acceso de capa temporal gradual (GTLA). Un dispositivo 702 electrónico puede recibir 902 un flujo 710 de bits. El flujo 710 de bits puede recibirse como se describe anteriormente en relación con la Figura 8. Por ejemplo, el dispositivo B 702 electrónico puede recibir 902 el flujo 710 de bits del codificador 104 en el dispositivo A 102a electrónico.
El dispositivo 702 electrónico puede obtener 904 una imagen 729 de GTLA. El dispositivo 702 electrónico puede obtener la imagen 729 de GTLA a partir de un flujo 710 de bits. En otras palabras, el flujo 710 de bits también puede incluir una imagen 729 de GTLA.
Una imagen 729 de GTLA y todas las imágenes codificadas con un identificador temporal (temporal_id) igual que el identificador temporal de la imagen 729 de GTLA que sigue a la imagen 729 de GTLA en orden de decodificación, pueden no utilizar predicción inter de cualquier imagen con identificador temporal mayor que o igual que el identificador temporal de la imagen 729 de GTLA que precede a la imagen 729 de GTLA en orden de decodificación.
En otras palabras, una imagen 729 de GTLA y todas las imágenes codificadas con un identificador temporal igual que el identificador temporal de la imagen de GTLA que sigue a la imagen 729 de GTLA en orden de decodificación, pueden utilizar la predicción inter solo de imágenes con un identificador temporal menor que el identificador temporal de la imagen 729 de GTLA que precede a la imagen 729 de GTLA en orden de decodificación.
El dispositivo 702 electrónico puede obtener 906 un indicador de imagen de GTLA. El indicador de imagen de GTLA puede obtenerse 906 a partir del flujo 710 de bits. El indicador de imagen de GTLA puede obtenerse 906 a partir de datos recibidos en el flujo 710 de bits correspondiente a la imagen 729 de GTLA. Por ejemplo, el indicador de imagen de GTLA puede ser un tipo de unidad de NAL correspondiente a la imagen 729 de GTLA. Por ejemplo, el indicador de imagen de GTLA puede ser un tipo de unidad de NAL igual a 9, como se ilustra en la Tabla 2 anterior. En la Tabla 2, un tipo de unidad de NAL igual a 9 indica un segmento codificado de una imagen de GTLA no TFD.
En algunas configuraciones, el indicador de imagen de GTLA puede obtenerse 906 a partir un conjunto de parámetros 0 encabezado de segmento. Por ejemplo, el indicador de imagen de GTLA puede obtenerse 906 a partir de un SPS, PPS, APS, VPS, algún otro conjunto de parámetros y/o el encabezado de segmento.
En algunas configuraciones, el módulo 720 de recepción de imagen de GTLA puede obtener 906 un indicador de imagen de GTLA al ver un tipo de unidad de NAL, una bandera o un indicador asociado con las imágenes 729 de GTLA, segmentos codificados creados o modificados por el módulo 408 de indicador de imagen de GTLA u otro indicador que pueda indicar la presencia de una imagen 729 de GTLA.
El dispositivo 702 electrónico puede decodificar 908 la imagen 729 de GTLA. Por ejemplo, el decodificador 712 puede decodificar 908 una porción del flujo 710 de bits. Decodificar 908 la imagen 729 de GTLA puede ocurrir como se ha descrito anteriormente en relación con la Figura 8.
El dispositivo 702 electrónico puede decodificar 910 una imagen actual en base a la imagen 729 de GTLA. Por ejemplo, el decodificador 712 puede decodificar 910 una porción del flujo 710 de bits para producir una imagen actual en base a la imagen 729 de GTLA.
Como se describió anteriormente, las imágenes 729 de GTLA pueden permitir que el decodificador 712 almacene y utilice imágenes de referencia adicionales al decodificar una imagen actual. Utilizar imágenes 729 de GTLA puede permitir una mayor flexibilidad en la selección de imágenes de referencia que utilizar imágenes 228 de TLA. De esta manera, utilizar imágenes 729 de GTLA puede resultar en una mejor eficiencia de compresión en comparación con utilizar imágenes 228 de TLA.
La Figura 10 es un diagrama de bloques que ilustra una configuración de un dispositivo 1002 electrónico en el que se pueden implementar sistemas y métodos para señalizar una imagen 229 de acceso de capa temporal gradual (GTLA). El dispositivo 1002 electrónico puede incluir un flujo 1010 de bits, medios 1035 de codificación y medios 1037 de transmisión. Los medios 1035 de codificación y los medios 1037 de transmisión pueden estar configurados para realizar una o más funciones descritas en relación con una o más de la Figura 5, la Figura 6 y otra figuras descritas en el presente documento. La Figura 12 a continuación, ilustra un ejemplo de una estructura de aparato concreta de la Figura 10. Pueden implementarse otras diversas estructuras para realizar una o más de las funciones de la Figura 1 y la Figura 4. Por ejemplo, puede realizarse un DSP mediante software.
La Figura 11 es un diagrama de bloques que ilustra una configuración de un dispositivo 1102 electrónico en el que pueden implementarse sistemas y métodos para recibir una imagen 229 de acceso de capa temporal gradual (GTLA). El dispositivo 1102 electrónico puede incluir un flujo 1110 de bits, medios 1139 de recepción y medios 1141 de decodificación. Los medios 1139 de recepción y los medios 1141 de decodificación pueden estar configurados para realizar una o más funciones similares descritas en relación con la Figura 8, la Figura 9 y otras figuras descritas en el presente documento. La Figura 13 a continuación, ilustra un ejemplo de una estructura de aparato concreta de la Figura 11. Pueden implementarse otras diversas estructuras para realizar una o más funciones de la Figura 1 y la Figura 7. Por ejemplo, puede realizarse un DSP mediante software.
La Figura 12 es un diagrama de bloques que ilustra diversos componentes que pueden utilizarse en un dispositivo 1202 electrónico de transmisión. Uno o más de los dispositivos 102, 402, 702, 1002 y 1102 electrónicos descritos en el presente documento pueden implementarse de acuerdo con el dispositivo 1202 electrónico de transmisión ilustrado en la Figura 12.
El dispositivo 1202 electrónico de transmisión incluye un procesador 1217 que controla el funcionamiento del dispositivo 1202 electrónico de transmisión. El procesador 1217 también puede denominarse como una unidad de procesamiento de computadora (CPU). La memoria 1211, que puede incluir tanto memoria de solo lectura (ROM), memoria de acceso aleatorio (RAM) o cualquier tipo de dispositivo que pueda almacenar información, proporciona instrucciones 1213a (p. ej., instrucciones ejecutables) y datos 1215a al procesador 1217. Una parte de la memoria 1211 también puede incluir una memoria de acceso aleatorio no volátil (NVRAM). La memoria 1211 puede estar en comunicación electrónica con el procesador 1217.
Las instrucciones 1213b y los datos 1215b, también pueden residir en el procesador 1217. Las instrucciones 1213b y/o los datos 1215b cargados en el procesador 1217, también pueden incluir las instrucciones 1213a y/o los datos 1215a de la memoria 1211 que se cargaron para la ejecución o el procesamiento por el procesador 1217. Las instrucciones 1213b pueden ejecutarse por el procesador 1217 para implementar uno o más de los métodos 500 y 600 dados a conocer en el presente documento.
El dispositivo 1202 electrónico de transmisión puede incluir una o más interfaces 1209 de comunicación para la comunicación con otros dispositivos electrónicos (p. ej., dispositivo electrónico de recepción). Las interfaces 1209 de comunicación pueden estar basadas en tecnología de comunicación cableada, tecnología de comunicación inalámbrica o ambas. Los ejemplos de una interfaz 1209 de comunicación incluyen un puerto serie, un puerto paralelo, un Bus Serie Universal (USB), un adaptador de Ethernet, una interfaz de bus IEEE 1394, una interfaz de bus de pequeña interfaz de sistema para computadora (SCSI), un puerto de comunicación por infrarrojos (IR), un adaptador de comunicación inalámbrica Bluetooth, un transceptor inalámbrico de acuerdo con las especificaciones del Proyecto de Asociación de Tercera Generación (3GPP), etc.
El dispositivo 1202 electrónico de transmisión puede incluir uno o más dispositivos 1203 de salida y uno o más dispositivos 1201 de entrada. Ejemplos de dispositivos 1203 de salida incluyen un altavoz, una impresora, etc. Un tipo de dispositivo de salida que puede incluirse en un dispositivo 1202 electrónico de transmisión es un dispositivo 1205 de visualización. Los dispositivos 1205 de visualización utilizados con las configuraciones dadas a conocer en el presente documento, pueden utilizar cualquier tecnología de proyección de imágenes adecuada, tal como un tubo de rayos catódicos (CRT), pantalla de cristal líquido (LCD), diodo emisor de luz (LED), plasma de gas, electroluminiscencia o similar. Se puede proporcionar un controlador 1207 de pantalla para convertir los datos almacenados en la memoria 1211 en texto, gráficos y/o imágenes en movimiento (según corresponda) que se muestran en el dispositivo 1205 de visualización. Ejemplos de dispositivos 1201 de entrada incluyen un teclado, ratón, micrófono, dispositivo de control remoto, botón, palanca de mando, rueda de desplazamiento, panel táctil, pantalla táctil, lápiz óptico, etc.
Los diversos componentes del dispositivo 1202 electrónico de transmisión están acoplados entre sí por un sistema 1233 de bus, que puede incluir un bus de potencia, un bus de señal de control y un bus de señal de estado, además de un bus de datos. Sin embargo, en aras de la claridad, los diversos buses se ilustran en la Figura 12 como el sistema 1233 de bus. El dispositivo 1202 electrónico de transmisión, ilustrado en la Figura 12, es un diagrama de bloques funcional en lugar de un listado de componentes específicos.
La Figura 13 es un diagrama de bloques que ilustra diversos componentes que pueden utilizarse en un dispositivo 1302 electrónico de recepción. Uno o más de los dispositivos 102, 402, 702, 1002 y 1102 electrónicos descritos en el presente documento pueden implementarse de acuerdo con el dispositivo 1302 electrónico de recepción ilustrado en la Figura 13.
El dispositivo 1302 electrónico de recepción incluye un procesador 1317 que controla el funcionamiento del dispositivo 1302 electrónico de recepción. El procesador 1317 también puede denominarse como una CPU. La memoria 1311, que puede incluir tanto memoria de solo lectura (ROM), memoria de acceso aleatorio (RAM) o cualquier tipo de dispositivo que pueda almacenar información, proporciona instrucciones 1313a (p. ej., instrucciones ejecutables) y datos 1315a al procesador 1317. Una parte de la memoria 1311 también puede incluir una memoria de acceso aleatorio no volátil (NVRAM). La memoria 1311 puede estar en comunicación electrónica con el procesador 1317.
Las instrucciones 1313b y los datos 1315b también pueden residir en el procesador 1317. Las instrucciones 1313b y/o los datos 1315b cargados en el procesador 1317, también pueden incluir las instrucciones 1313a y/o los datos 1315a de la memoria 1311 que fueron cargados para la ejecución o el procesamiento por el procesador 1317. Las instrucciones 1313b pueden ejecutarse por el procesador 1317 para implementar uno o más de los métodos 800 y 900 dados a conocer en el presente documento.
El dispositivo 1302 electrónico de recepción puede incluir una o más interfaces 1309 de comunicación para la comunicación con otros dispositivos electrónicos (p. ej., el dispositivo electrónico de transmisión). Las interfaces 1309 de comunicación pueden estar basadas en tecnología de comunicación cableada, tecnología de comunicación inalámbrica o ambas. Ejemplos de una interfaz 1309 de comunicación incluyen un puerto serie, un puerto paralelo, un Bus Serie Universal (USB), un adaptador de Ethernet, una interfaz de bus IEEE 1394, una interfaz de bus de pequeña interfaz de sistema para computadora (SCSI), un puerto de comunicación por infrarrojos (IR), un adaptador de comunicación inalámbrica Bluetooth, un transceptor inalámbrico de acuerdo con las especificaciones del Proyecto de Asociación de Tercera Generación (3GPP), etc.
El dispositivo 1302 electrónico receptor puede incluir uno o más dispositivos 1303 de salida y uno o más dispositivos 1301 de entrada. Ejemplos de dispositivos 1303 de salida incluyen un altavoz, una impresora, etc. Un tipo de dispositivo de salida que puede incluirse en un dispositivo 1302 electrónico de recepción es un dispositivo 1305 de visualización. Los dispositivos 1305 de visualización utilizados con las configuraciones dadas a conocer en el presente documento, pueden utilizar cualquier tecnología de proyección de imagen adecuada, como un tubo de rayos catódicos (CRT), pantalla de cristal líquido (LCD), diodo emisor de luz (LED), plasma de gas, electroluminiscencia o similar. Se puede proporcionar un controlador 1307 de pantalla para convertir los datos almacenados en la memoria 1311 en texto, gráficos y/o imágenes en movimiento (según corresponda) que se muestran en el dispositivo 1305 de visualización. Los ejemplos de dispositivos 1301 de entrada incluyen un teclado, ratón, micrófono, dispositivo de control remoto, botón, palanca de mando, rueda de desplazamiento, panel táctil, pantalla táctil, lápiz óptico, etc.
Los diversos componentes del dispositivo 1302 electrónico de recepción están acoplados entre sí por un sistema 1333 de bus, que puede incluir un bus de potencia, un bus de señal de control y un bus de señal de estado, además de un bus de datos. Sin embargo, en aras de la claridad, los diversos buses se ilustran en la Figura 13 como el sistema 1333 de bus. El dispositivo 1302 electrónico de recepción ilustrado en la Figura 13 es un diagrama de bloques funcional en lugar de una lista de componentes específicos.
El término “medio legible por computadora” se refiere a cualquier medio disponible al que se pueda acceder mediante una computadora o un procesador. El término “medio legible por computadora”, como se utiliza en el presente documento, puede denotar un medio legible por computadora y/o procesador que no es transitorio y tangible. A modo de ejemplo y no de limitación, un medio legible por computadora o legible por procesador puede incluir RAM, ROM, EEPROM, CD-ROM u otro almacenamiento de disco óptico, almacenamiento de disco magnético u otros dispositivos de almacenamiento magnético o cualquier otro medio que pueda utilizarse para transportar o almacenar el código de programa deseado en forma de instrucciones o estructuras de datos y al que se puede acceder mediante una computadora o un procesador. Disco, como se utiliza en el presente documento, incluye discos compactos (CD), discos láser, discos ópticos, discos versátiles digitales (DVD), disquete y disco Blu-ray (marca registrada).
Cabe señalar que uno o más de los métodos descritos en el presente documento pueden implementarse en y/o llevarse a cabo utilizando hardware. Por ejemplo, uno o más de los métodos o enfoques descritos en el presente documento pueden implementarse y/o realizarse utilizando un conjunto de chips, un ASIC, un circuito integrado a gran escala (LSI) o circuito integrado, etc.
Cada uno de los métodos dados a conocer en el presente documento incluye uno o más pasos o acciones para lograr el procedimiento descrito. Los pasos y/o las acciones del método pueden intercambiarse entre sí y/o combinarse en un solo paso sin apartarse del alcance de las reivindicaciones. En otras palabras, a menos que se requiera un orden específico de pasos o acciones para el correcto funcionamiento del método que se describe, el orden de pasos y/o acciones específicos pueden modificarse sin apartarse del alcance de las reivindicaciones.

Claims (20)

REIVINDICACIONES
1. Un dispositivo electrónico para decodificar una imagen, que comprende:
un procesador;
una memoria en comunicación electrónica con el procesador, en donde las instrucciones almacenadas en la memoria se pueden ejecutar para
(a) recibir un flujo de datos;
(b) obtener un indicador de imagen de acceso de capa temporal gradual, GTLA, del flujo de datos que indica la presencia de una imagen de GTLA para proporcionar funcionalidad de conmutación de capa temporal; (c) obtener la imagen de GTLA, en donde la imagen de GTLA tiene un identificador temporal, en donde una imagen subsiguiente con un identificador temporal igual al identificador temporal de la imagen de GTLA no utiliza predicción inter de ninguna imagen con un identificador temporal mayor o igual que el identificador temporal de la imagen de GTLA que precede a la imagen de GTLA en orden de decodificación; y en donde una imagen subsiguiente con un identificador temporal mayor que el identificador temporal de la imagen de GTLA puede utilizar predicción inter de cualquier imagen con un identificador temporal mayor o igual que el identificador temporal de la imagen de GTLA que precede a la imagen de GTLA en orden de decodificación; (d) decodificar la imagen de GTLA; y
(e) decodificar una imagen actual en base a la imagen de GTLA.
2. El dispositivo electrónico de la reivindicación 1, en donde una imagen que es posterior a la imagen de GTLA en orden de decodificación y que tiene un identificador temporal igual que el identificador temporal de la imagen de GTLA, utiliza una imagen anterior para la predicción inter que tiene un identificador temporal menor que el identificador temporal de la imagen de GTLA y que precede a la imagen de GTLA en orden de decodificación.
3. El dispositivo electrónico de la reivindicación 1, en donde para la imagen de GTLA, ninguna imagen de referencia con un identificador temporal mayor o igual que el identificador temporal de la imagen actual está comprendida en al menos uno de un grupo que consiste en una lista anterior actual a corto plazo de conjunto de imágenes de referencia, RPS, una lista posterior actual a corto plazo de RPS y una lista actual a largo plazo de RPS
4. El dispositivo electrónico de la reivindicación 1, en donde para una imagen actual que está en orden de decodificación posterior a la imagen de GTLA con identificador temporal igual que el identificador temporal de la imagen actual, ninguna imagen de referencia con un identificador temporal mayor o igual que el identificador temporal de la imagen actual está comprendida en al menos uno de un grupo que consiste en una lista anterior actual a corto plazo de RPS, una lista posterior actual a corto plazo de RPS y una lista actual a largo plazo de RPS.
5. El dispositivo electrónico de la reivindicación 1, en donde el indicador de imagen de GTLA es un tipo de unidad de Capa de Abstracción de Red, NAL.
6. El dispositivo electrónico de la reivindicación 5, en donde el tipo de unidad de NAL comprende un tipo de unidad NAL asociado con la imagen de GTLA.
7. El dispositivo electrónico de la reivindicación 1, la imagen de GTLA no se utiliza como imagen de referencia para una imagen.
8. El dispositivo electrónico de la reivindicación 1, la imagen de GTLA se utiliza como una imagen de referencia para una imagen.
9. Un dispositivo electrónico para codificar una imagen, que comprende:
un procesador;
una memoria en comunicación electrónica con el procesador, en donde las instrucciones almacenadas en la memoria se pueden ejecutar para:
(a) codificar una imagen de acceso de capa temporal gradual, GTLA, en un flujo de bits;
(b) codificar un indicador de imagen de GTLA en el flujo de bits, en donde un identificador de imagen de GTLA se utiliza para indicar la presencia de una imagen de GTLA para proporcionar funcionalidad de conmutación de capa temporal, en donde la imagen de GTLA tiene un identificador temporal, en donde una imagen posterior con un identificador temporal igual que el identificador temporal de la imagen de GTLA no utiliza predicción inter de cualquier imagen con un identificador temporal mayor o igual que el identificador temporal de la imagen de GTLA que precede a la imagen de GTLA en orden de decodificación; y
en donde una imagen posterior con un identificador temporal mayor que el identificador temporal de la imagen de GTLA puede utilizar la predicción inter de cualquier imagen con un identificador temporal mayor o igual que el identificador temporal de la imagen de GTLA que precede a la imagen de GTLA en orden de decodificación;
(c) enviar el flujo de bits.
10. El dispositivo electrónico de la reivindicación 9, en donde una imagen que es posterior a la imagen de GTLA en orden de decodificación que tiene un identificador temporal igual que el identificador temporal de la imagen de GTLA, utiliza una imagen anterior para la predicción inter que tiene un identificador temporal menor que el identificador temporal de la imagen de GTLA y que precede a la imagen de GTLA en orden de decodificación.
11. El dispositivo electrónico de la reivindicación 9, en donde, para una imagen actual que está en orden de decodificación posterior a la imagen de GTLA con identificador temporal igual que el identificador temporal de la imagen actual, ninguna imagen de referencia con un identificador temporal mayor o igual que el identificador temporal de la imagen actual está comprendida en al menos uno de un grupo que consiste en una lista anterior actual a corto plazo de conjunto de imágenes de referencia, RPS, una lista posterior actual a corto plazo de RPS y una lista actual a largo plazo de RPS.
12. El dispositivo electrónico de la reivindicación 9, en donde el indicador de imagen de GTLA es un tipo de unidad de Capa de Abstracción de Red, NAL.
13. El dispositivo electrónico de la reivindicación 12, en donde el tipo de unidad de NAL comprende un tipo de unidad de NAL asociado con la imagen de GTLA.
14. El dispositivo electrónico de la reivindicación 9, en donde la imagen de GTLA no se utiliza como imagen de referencia para la imagen.
15. El dispositivo electrónico de la reivindicación 9, en donde la imagen de GTLA se utiliza como imagen de referencia para la imagen.
16. Un método para decodificar una imagen mediante un dispositivo eléctrico, que comprende:
(a) recibir un flujo de bits;
(b) obtener un indicador de imagen de acceso de capa temporal gradual, GTLA, del flujo de bits que indica la presencia de una imagen de GTLA para proporcionar funcionalidad de conmutación de capa temporal; (c) obtener la imagen de GTLA, en donde la imagen de GTLA tiene un identificador temporal, en donde una imagen posterior con un identificador temporal igual que el identificador temporal de la imagen de GTLA no utiliza predicción inter de ninguna imagen con un identificador temporal mayor o igual que el identificador temporal de la imagen de GTLA que precede a la imagen de GTLA en orden de decodificación; y en donde una imagen posterior con un identificador temporal mayor que el identificador temporal de la imagen de GTLA puede utilizar la predicción inter de cualquier imagen con un identificador temporal mayor o igual que el identificador temporal de la imagen de GTLA que precede a la imagen de GTLA en orden de decodificación; (d) decodificar la imagen de GTLA; y
(e) decodificar una imagen actual en base a la imagen de GTLA.
17. Un método para codificar una imagen mediante un dispositivo electrónico, que comprende:
(a) codificar una imagen de acceso de capa temporal gradual, GTLA, en un flujo de bits;
(b) codificar un indicador de imagen de GTLA en el flujo de bits, en donde el indicador de imagen de GTLA se utiliza para indicar la presencia de una imagen de GTLA para proporcionar la funcionalidad de conmutación de capa temporal, en donde la imagen de GTLA tiene un identificador temporal, en donde una imagen posterior con un identificador igual que el identificador temporal de la imagen de GTLA no utiliza predicción inter de ninguna imagen con un identificador temporal mayor o igual que el identificador temporal de la imagen de GTLA que precede a la imagen de GTLA en orden de decodificación; y
en donde una imagen posterior con un identificador temporal mayor que el identificador temporal de la imagen de GTLA puede utilizar la predicción inter de cualquier imagen con un identificador temporal mayor o igual que el identificador temporal de la imagen de GTLA que precede a la imagen de GTLA en orden de decodificación;
(c) enviar el flujo de bits.
18. Una estructura de flujo de bits de vídeo, incorporada en un medio o en forma de una señal electromagnética y que comprende:
una segunda imagen codificada, que tiene imágenes codificadas anteriores y posteriores en orden de decodificación en la estructura de flujo de bits, en donde ninguna imagen que preceda a la segunda imagen en orden de decodificación con un identificador temporal mayor o igual que un identificador temporal de la segunda imagen se puede utilizar para la predicción inter cuando se decodifica una imagen posterior que sigue a la segunda imagen en orden de decodificación con un identificador temporal igual que el identificador temporal de la segunda imagen; y
en donde una imagen posterior con un identificador temporal mayor que el identificador temporal de la segunda imagen puede utilizar la predicción inter de cualquier imagen, con un identificador temporal mayor o igual que el identificador temporal de la segunda imagen, que precede la segunda imagen en orden de decodificación;
un indicador de imagen, en donde el indicador de imagen se utiliza para indicar la presencia de la segunda imagen para proporcionar la funcionalidad de conmutación de capa temporal.
19. La estructura de flujo de bits de la reivindicación 18, que comprende parámetros de conjunto de imágenes de referencia, RPS, asociados con la segunda imagen que indican que ninguna imagen de referencia con un identificador temporal igual que el identificador temporal de la segunda imagen está incluida en una lista anterior actual a corto plazo de conjunto de imágenes de referencia, RPS, una lista posterior actual a corto plazo de conjunto de imágenes de referencia, RPS y una lista actual a largo plazo de conjunto de imágenes de referencia, RPS.
20. La estructura de flujo de bits de la reivindicación 18, que comprende parámetros de conjunto de imágenes de referencia, RPS, asociados con una imagen que en orden de decodificación es posterior a la segunda imagen con un identificador temporal igual que el de la imagen actual, y los parámetros indican que ninguna imagen de referencia con un identificador temporal igual que el identificador temporal de la imagen actual se incluye en una lista anterior actual a corto plazo de conjunto de imágenes de referencia, RPS, una lista posterior actual a corto plazo de conjunto de imágenes de referencia, RPS, y una lista actual a largo plazo de conjunto de imágenes de referencia, RPS.
ES18184360T 2012-06-25 2013-06-24 Imágenes de acceso de capa temporal gradual en compresión de vídeo Active ES2943647T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201261664140P 2012-06-25 2012-06-25

Publications (1)

Publication Number Publication Date
ES2943647T3 true ES2943647T3 (es) 2023-06-15

Family

ID=49782661

Family Applications (2)

Application Number Title Priority Date Filing Date
ES18184360T Active ES2943647T3 (es) 2012-06-25 2013-06-24 Imágenes de acceso de capa temporal gradual en compresión de vídeo
ES13809644T Active ES2703543T3 (es) 2012-06-25 2013-06-24 Método para señalizar una imagen de acceso de capa temporal gradual

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES13809644T Active ES2703543T3 (es) 2012-06-25 2013-06-24 Método para señalizar una imagen de acceso de capa temporal gradual

Country Status (15)

Country Link
US (4) US9584820B2 (es)
EP (5) EP4436173A2 (es)
CN (3) CN107566838B (es)
DK (3) DK2865177T3 (es)
ES (2) ES2943647T3 (es)
FI (1) FI3471419T3 (es)
HR (1) HRP20230430T1 (es)
HU (2) HUE041444T2 (es)
LT (1) LT3471419T (es)
PL (2) PL2865177T3 (es)
PT (2) PT3471419T (es)
RS (1) RS64224B1 (es)
SI (2) SI3471419T1 (es)
TR (1) TR201820516T4 (es)
WO (1) WO2014002469A1 (es)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4436173A2 (en) * 2012-06-25 2024-09-25 Huawei Technologies Co., Ltd. Method for signaling a gradual temporal layer access picture
EP2863630A4 (en) 2012-07-03 2016-03-09 Samsung Electronics Co Ltd Method and apparatus for video coding with temporal scalability and method and apparatus for video decoding with temporal scalability
EP2858350A4 (en) * 2012-07-06 2016-05-04 Samsung Electronics Co Ltd METHOD AND DEVICE FOR MULTILAYER VIDEO DICTIONING FOR DIRECT ACCESS AND METHOD AND DEVICE FOR MULTILAYER VIDEO DECODING FOR DIRECT ACCESS
US9479774B2 (en) * 2012-09-24 2016-10-25 Qualcomm Incorporated Buffering period and recovery point supplemental enhancement information messages
US20150288975A1 (en) * 2012-09-28 2015-10-08 Samsung Electronics Co., Ltd. Method and apparatus for encoding video and method and appartaus for decoding video for random access
US20140092953A1 (en) 2012-10-02 2014-04-03 Sharp Laboratories Of America, Inc. Method for signaling a step-wise temporal sub-layer access sample
WO2015140401A1 (en) * 2014-03-17 2015-09-24 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
CN117336496A (zh) 2017-10-06 2024-01-02 松下电器(美国)知识产权公司 编码装置、解码装置以及非暂时性计算机可读介质
BR112021024418A2 (pt) 2019-06-21 2022-01-18 Ericsson Telefon Ab L M Métodos para a decodificação de um conjunto de imagens a partir de um fluxo contínuo de bits e para a codificação de uma imagem, decodificador de vídeo, codificador de vídeo, programa de computador, e, portadora

Family Cites Families (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7085230B2 (en) * 1998-12-24 2006-08-01 Mci, Llc Method and system for evaluating the quality of packet-switched voice signals
TW444506B (en) * 1999-09-16 2001-07-01 Ind Tech Res Inst Real-time video transmission method on wireless communication networks
US20020146074A1 (en) * 2001-02-20 2002-10-10 Cute Ltd. Unequal error protection of variable-length data packets based on recursive systematic convolutional coding
US20020157058A1 (en) * 2001-02-20 2002-10-24 Cute Ltd. System and method for feedback-based unequal error protection coding
US20020144209A1 (en) * 2001-02-20 2002-10-03 Cute Ltd. System for enhanced error correction in trellis decoding
JP3930280B2 (ja) * 2001-09-27 2007-06-13 株式会社東芝 符号化画像データ復号装置、方法およびプログラム
US20030103523A1 (en) * 2001-11-30 2003-06-05 International Business Machines Corporation System and method for equal perceptual relevance packetization of data for multimedia delivery
EP1634461A2 (en) * 2003-06-19 2006-03-15 THOMSON Licensing Method and apparatus for low-complexity spatial scalable decoding
US7321565B2 (en) * 2003-08-29 2008-01-22 Ineoquest Technologies System and method for analyzing the performance of multiple transportation streams of streaming media in packet-based networks
KR100834750B1 (ko) 2004-01-29 2008-06-05 삼성전자주식회사 엔코더 단에서 스케일러빌리티를 제공하는 스케일러블비디오 코딩 장치 및 방법
US7145966B2 (en) * 2004-06-30 2006-12-05 Qualcomm, Incorporated Signal quality estimation for continuous phase modulation
FR2903253A1 (fr) * 2006-06-29 2008-01-04 Thales Sa Procede permettant de determiner des parametres de compression et de protection pour la transmission de donnees multimedia sur un canal sans fil.
JP2010507346A (ja) 2006-10-16 2010-03-04 ヴィドヨ,インコーポレーテッド スケーラブルビデオ符号化においてシグナリング及び時間レベルスイッチングを実施するためのシステム及び方法
WO2008130367A1 (en) 2007-04-19 2008-10-30 Thomson Licensing Adaptive reference picture data generation for intra prediction
CN101690229A (zh) * 2007-06-26 2010-03-31 诺基亚公司 用于指示时间层切换点的系统和方法
CN101262596A (zh) * 2008-03-19 2008-09-10 深圳华强信息产业有限公司 一种图像监控装置用图像的播放和导出方法
JP4947389B2 (ja) * 2009-04-03 2012-06-06 ソニー株式会社 画像信号復号装置、画像信号復号方法、および画像信号符号化方法
CN103124351A (zh) 2009-04-28 2013-05-29 松下电器产业株式会社 图像解码装置及图像编码装置
CN102055900A (zh) 2009-10-27 2011-05-11 鸿富锦精密工业(深圳)有限公司 监视器焦距调整方法
JP4823349B2 (ja) * 2009-11-11 2011-11-24 パナソニック株式会社 三次元映像復号装置及び三次元映像復号方法
US20120023040A1 (en) * 2010-07-23 2012-01-26 Grant Thornton Llp Method and system for real-time equity risk premium
US8190677B2 (en) * 2010-07-23 2012-05-29 Seawell Networks Inc. Methods and systems for scalable video delivery
WO2012081193A1 (ja) 2010-12-17 2012-06-21 株式会社Jvcケンウッド 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム、並びに動画像復号装置、動画像復号方法及び動画像復号プログラム
EP2666296A4 (en) * 2011-01-19 2013-12-25 Ericsson Telefon Ab L M INDICATION OF BITS FLOW SUBASSEMBLIES
US20120230409A1 (en) * 2011-03-07 2012-09-13 Qualcomm Incorporated Decoded picture buffer management
US9516379B2 (en) * 2011-03-08 2016-12-06 Qualcomm Incorporated Buffer management in video codecs
US10944994B2 (en) * 2011-06-30 2021-03-09 Telefonaktiebolaget Lm Ericsson (Publ) Indicating bit stream subsets
US20130170561A1 (en) * 2011-07-05 2013-07-04 Nokia Corporation Method and apparatus for video coding and decoding
US20140169449A1 (en) 2011-07-05 2014-06-19 Telefonaktiebolaget L M Ericsson (Publ) Reference picture management for layered video
US20130114743A1 (en) 2011-07-13 2013-05-09 Rickard Sjöberg Encoder, decoder and methods thereof for reference picture management
EP2732626A1 (en) * 2011-07-15 2014-05-21 Telefonaktiebolaget L M Ericsson (PUBL) An encoder and method thereof for assigning a lowest layer identity to clean random access pictures
US9635355B2 (en) 2011-07-28 2017-04-25 Qualcomm Incorporated Multiview video coding
KR101649207B1 (ko) * 2011-08-31 2016-08-19 노키아 테크놀로지스 오와이 멀티뷰 비디오 코딩 및 디코딩을 위한 방법, 장치 및 컴퓨터 프로그램
US9131245B2 (en) * 2011-09-23 2015-09-08 Qualcomm Incorporated Reference picture list construction for video coding
US10674171B2 (en) * 2011-09-27 2020-06-02 Telefonaktiebolaget Lm Ericsson (Publ) Decoders and methods thereof for managing pictures in video decoding process
US9451284B2 (en) * 2011-10-10 2016-09-20 Qualcomm Incorporated Efficient signaling of reference picture sets
US8768079B2 (en) * 2011-10-13 2014-07-01 Sharp Laboratories Of America, Inc. Tracking a reference picture on an electronic device
US20130094774A1 (en) * 2011-10-13 2013-04-18 Sharp Laboratories Of America, Inc. Tracking a reference picture based on a designated picture on an electronic device
US8855433B2 (en) * 2011-10-13 2014-10-07 Sharp Kabushiki Kaisha Tracking a reference picture based on a designated picture on an electronic device
US8787688B2 (en) * 2011-10-13 2014-07-22 Sharp Laboratories Of America, Inc. Tracking a reference picture based on a designated picture on an electronic device
US9264717B2 (en) 2011-10-31 2016-02-16 Qualcomm Incorporated Random access with advanced decoded picture buffer (DPB) management in video coding
US9124895B2 (en) * 2011-11-04 2015-09-01 Qualcomm Incorporated Video coding with network abstraction layer units that include multiple encoded picture partitions
WO2013109178A1 (en) 2012-01-20 2013-07-25 Telefonaktiebolaget L M Ericsson (Publ) Sub-bitstream extraction
US9973749B2 (en) * 2012-01-20 2018-05-15 Nokia Technologies Oy Method for video coding and an apparatus, a computer-program product, a system, and a module for the same
US9648317B2 (en) * 2012-01-30 2017-05-09 Qualcomm Incorporated Method of coding video and storing video content
US20130272619A1 (en) * 2012-04-13 2013-10-17 Sharp Laboratories Of America, Inc. Devices for identifying a leading picture
US20130272372A1 (en) * 2012-04-16 2013-10-17 Nokia Corporation Method and apparatus for video coding
WO2013158020A1 (en) * 2012-04-16 2013-10-24 Telefonaktiebolaget L M Ericsson (Publ) Arrangements and methods thereof for processing video
US9979958B2 (en) * 2012-04-20 2018-05-22 Qualcomm Incorporated Decoded picture buffer processing for random access point pictures in video sequences
US20150139338A1 (en) * 2012-05-03 2015-05-21 Telefonaktiebolaget L M Ericsson (Publ) Identifying Leading Pictures in Video Coding
US20130336405A1 (en) * 2012-06-15 2013-12-19 Qualcomm Incorporated Disparity vector selection in video coding
WO2014003379A1 (ko) * 2012-06-24 2014-01-03 엘지전자 주식회사 영상 디코딩 방법 및 이를 이용하는 장치
EP4436173A2 (en) * 2012-06-25 2024-09-25 Huawei Technologies Co., Ltd. Method for signaling a gradual temporal layer access picture
US20140092953A1 (en) * 2012-10-02 2014-04-03 Sharp Laboratories Of America, Inc. Method for signaling a step-wise temporal sub-layer access sample
CN102932671A (zh) * 2012-11-26 2013-02-13 北京奇虎科技有限公司 向计算终端提供图片数据的方法及服务器
US9445459B2 (en) * 2013-07-11 2016-09-13 Crucible Intellectual Property, Llc Slotted shot sleeve for induction melting of material

Also Published As

Publication number Publication date
EP4436173A2 (en) 2024-09-25
EP2865177B1 (en) 2018-10-03
DK4195667T3 (da) 2024-10-14
EP3471419A1 (en) 2019-04-17
PT3471419T (pt) 2023-06-21
CN107566839B (zh) 2020-06-26
CN107566838B (zh) 2020-03-31
CN107566838A (zh) 2018-01-09
US9584820B2 (en) 2017-02-28
CN104488269B (zh) 2017-09-12
SI2865177T1 (sl) 2019-02-28
PL3471419T3 (pl) 2023-07-17
PT2865177T (pt) 2019-01-11
CN107566839A (zh) 2018-01-09
DK2865177T3 (en) 2019-01-28
EP2865177A1 (en) 2015-04-29
US20200007881A1 (en) 2020-01-02
FI3471419T3 (fi) 2023-05-29
WO2014002469A1 (en) 2014-01-03
US20150189299A1 (en) 2015-07-02
EP2865177A4 (en) 2015-12-16
EP4195667B1 (en) 2024-08-07
EP4195667A1 (en) 2023-06-14
HRP20230430T1 (hr) 2023-07-07
CN104488269A (zh) 2015-04-01
EP3471419B1 (en) 2023-03-22
RS64224B1 (sr) 2023-06-30
US11051032B2 (en) 2021-06-29
DK3471419T3 (da) 2023-06-06
HUE041444T2 (hu) 2019-05-28
ES2703543T3 (es) 2019-03-11
US20210274206A1 (en) 2021-09-02
LT3471419T (lt) 2023-05-10
US20170127076A1 (en) 2017-05-04
PL2865177T3 (pl) 2019-03-29
HUE061859T2 (hu) 2023-08-28
US10448038B2 (en) 2019-10-15
TR201820516T4 (tr) 2019-01-21
SI3471419T1 (sl) 2023-07-31
EP4440109A2 (en) 2024-10-02

Similar Documents

Publication Publication Date Title
ES2943647T3 (es) Imágenes de acceso de capa temporal gradual en compresión de vídeo
US10958915B2 (en) Method of coding video and storing video content
ES2872899T3 (es) Procedimiento y aparato para señalizar selectivamente diferentes números de estructuras de sintaxis de información de señales de vídeo en un conjunto de parámetros
ES2719221T3 (es) Método para señalizar una muestra de acceso a una subcapa temporal de forma escalonada
ES2663444T3 (es) Información de temporización de codificación para codificación de vídeo
ES2715980T3 (es) Codificación de valores de recuento del orden de imágenes que identifican tramas de referencia a largo plazo
ES2657494T3 (es) Acceso aleatorio y señalización de imágenes de referencia a largo plazo en la codificación de vídeo
ES2935979T3 (es) Señalización de índices para estructuras de listas de imágenes de referencia
ES2903013T3 (es) Capas de referencia de señalización para la predicción del color 3D para la escalabilidad de la gama de color
US20170019666A1 (en) Constrained reference picture parameters
US20140092995A1 (en) Electronic devices for signaling a random access point picture message