DELIMI ADOR DE IMAGEN EN LA CODIFICACION DE VIDEO ESCALABLE CAMPO DE LA INVENCION La presente invención se refiere en general al campo de codificación de video. Más particularmente, la presente invención se refiere a la codificación y decodificación de videos escalables. ANTECEDENTES DE LA INVENCION Esta sección pretende proporcionar el antecedente o contexto de la invención que se recita en las reivindicaciones. La descripción de la presente puede incluir conceptos que podrían ser aplicados, pero no son necesariamente los que han sido previamente concebidos o aplicados. Por consiguiente, a menos que se indique lo contrario en la presente, lo que se describe en esta sección no es la técnica anterior a la descripción y las reivindicaciones en esta solicitud y no se admite como siendo la técnica anterior por inclusión en esta sección. Los estándares de codificación de video incluyen
ITU-T H-261, Visual ISO/IEC MPEG-1, ITU.T H.262 o Visual ISO/IEC MPEG-2, ITU-T H.263, Visual ISO/IEC MPEG-4 y ITU-T
H.264 (también conocido como ISO/IEC MPEG-4 AVC) . Además, existen esfuerzos actuales en curso con respecto al desarrollo de nuevos estándares de codificación de video. Uno de los estándares bajo desarrollo es el estándar de la codificación de video escalable (SVC, por sus siglas en REF. : 196993
inglés), que se convertirá en la extensión escalable de H.264/AVC. Otro de los esfuerzos involucra el desarrollo de los estándares de codificación de video de China. SVC puede proporcionar corrientes de bits de videos escalables. Una porción de una corriente de bits de video escalable se puede extraer y decodificar con una calidad visual de reproducción degradada. Actualmente, una corriente de bits de video escalable contiene una capa base no escalable y una o más capas de mejoramiento. Una capa de mejora puede mejorar la resolución temporal (es decir, la velocidad de despliegue de imágenes) , la resolución espacial, o la calidad del contenido de video representado por la capa inferior o parte de la misma. En algunos casos, los datos de una capa de mejora pueden truncarse después de una cierta ubicación, aún en posiciones arbitrarias, y la posición de truncamiento puede incluir algunos datos adicionales que representan una calidad visual cada vez más mejorada. La escalabilidad es referida como una escalabilidad de granos finos (granularidad) (FGS, por sus siglas en inglés). En contraste con FGS, la escalabilidad provista por una capa de mejora de calidad que no proporciona una escalabilidad de grano fino es referida como una escalabilidad de grano grueso (CGS, por sus siglas en inglés) . Las capas base se pueden diseñar como siendo FGS escalables también. El mecanismo para proporcionar una escalabilidad
temporal en la especificación SVC más reciente involucra la "estructura de codificación de imágenes jerárquica B", que es esencialmente similar a la codificación de video avanzada actual (AVC) . Esta característica está completamente soportada por AVC, y la porción de señalización puede implementarse utilizando mensajes de información para el mejoramiento suplementario (SEI) relacionados con la sub-secuencia . Para que los mecanismos proporcionen escalabilidades espaciales y CGS, se utiliza una técnica de codificación estratificada convencional, similar a la técnica utilizada en los estándares anteriores, con un número de nuevos métodos de predicción inter-capa. Los datos que podrían estar pronosticados inter-capa incluyen una intra-textura, movimiento y residual. La decodificación de ciclo individual se habilita a través de un modo de predicción de intra-textura restringido, mientras la predicción de la intra-textura inter-capa puede aplicarse a los macrobloques (MB) para los cuales el bloque correspondiente de la capa base se localiza dentro de los intra MB . Al mismo tiempo, esos intra MB en la capa base utilizan la intra-predicción restringida. En una decodificación de ciclo individual, el decodificador necesita llevar a cabo la compensación del movimiento y la reconstrucción de la imagen completa solamente para la capa escalable deseable para reproducción
(referida como la capa deseada) , por lo tanto reduciendo enormemente la complejidad de la decodificación. Todas las capas diferentes de la capa deseada no necesitar estar completamente decodificadas porque todos o parte de los datos de las MB no utilizados para la predicción inter-capas (ser la predicción intra-textura inter-capa, predicción del movimiento inter-capa o predicción residual inter-capa) no es necesaria para la reconstrucción de la capa deseada. La escalabilidad espacial ha sido generalizada para habilitar la capa base para ser una versión recortada o amplificada de la capa de mejora. Los módulos de codificación de cuantificación y entropía se ajustaron para proporcionar una capacidad FGS . El modo de codificación es referido como un refinamiento progresivo, en donde los refinamientos sucesivos de los coeficientes de transformación se codifican disminuyendo repetidamente el tamaño del paso de cuantificación y aplicando una codificación de entropía "cíclica" similar a la codificación sub-plano de bit. La estructura de la capa escalable en el estándar SVC de diseño actual se caracteriza por tres variables, referidas como temporal_nivel , dependencia_id y calidad_nivel . El temporal_nivel se utiliza para indicar la escalabilidad temporal o velocidad de despliegue de imágenes. Una capa que comprende las imágenes de un valor temporal_nivel más pequeño tiene una velocidad de despliegue
de imágenes menor que una capa que comprende imágenes de un temporal_nivel mayor. Dependencia_id se utiliza para indicar la jerarquía de la dependencia de codificación inter-capa . En cualquier ubicación temporal, una imagen de un valor de dependencia_id más pequeño puede utilizarse para la predicción inter-capa para codificar una imagen con un valor de dependencia_id mayor. Calidad_nivel se utiliza para indicar la jerarquía de la capa FGS. En cualquier ubicación temporal y con un valor de dependencia_id idéntico, una imagen FGS con un valor de calidad_nivel igual a QL utiliza la imagen FGS o la imagen de calidad base (es decir, la imagen no FGS cuando QL-1 =0) con un valor de calidad_nivel igual a QL-1 para la predicción inter-capa. Un objetivo del diseño de SVC es mantener la retro-compatibilidad con AVC . En otras palabras, la capa base deberá estar de acuerdo con AVC. Para realizar este objetivo, se utilizan dos nuevos tipos de unidades NAL que están reservadas en AVC para las divisiones codificadas en las capas de mejora. Las tres variables temporal_nivel , dependencia_id y calidad_nivel entre otra información
(incluyendo simple prioridad_id y descartable_bandera ) se señalizan en la corriente de bits para las capas de mejora. Simple_prioridad_id indica una prioridad de la unidad NAL, y descargable_bandera indica si la unidad NAL se utiliza para la predicción inter-capa a través de cualquier capa con un
valor de dependencia_id mayor. Los estándares de codificación de video convencionales tienen especificada una estructura para una corriente de bits elemental, es decir, una corriente de bits auto-contenida que los decodificadores pueden analizar. La corriente de bits tiene comprendidas varias capas, típicamente incluyendo varias de las siguientes: una capa de secuencia, una capa de grupo de imágenes (GOP, por sus siglas en inglés), una capa de imagen, una capa de división, una capa de macrobloque y una capa de bloque. La corriente de bits para cada capa típicamente incluye un encabezado y datos asociados. La sintaxis para los estándares de cuantificación H.264/AVC y SVC incluyen las unidades de la capa de Abstracción de Red (NAL, por sus siglas en inglés)) . Una corriente de unidades NAL no forma una corriente de bits elemental como tal porque no existen códigos de inicio en las unidades NAL. Más bien, las unidades NAL tienen que estructurarse con códigos de inicio de acuerdo con el Anexo B del estándar de codificación H.264/AVC para formar una corriente de bits elemental. El estándar de codificación H.264/AVC contiene encabezados en la capa de división y por debajo, pero no incluye la imagen GOP, o encabezados de secuencia. Más bien, un concepto de un grupo de parámetros reemplaza los encabezados. Existen dos tipos de grupos de parámetros:
grupos de parámetros de secuencia y grupos de parámetros de imagen. En el estándar de la codificación H.264/AVC, solamente un grupo de parámetros de secuencia está activo en una secuencia de video codificada; es decir, entre una imagen actualizada de decodificación instantánea (IDR, por sus siglas en inglés), inclusive, a la siguiente imagen IDR, exclusiva. Solamente un grupo de parámetros de imagen está activo dentro de una imagen, pero un nuevo grupo de parámetros de imagen puede activarse para cada imagen. En SVC, cada valor de dependencia_id puede dedicarse a su propio grupo de parámetros de secuencia. Una unidad de acceso de acuerdo con el estándar de codificación H.264/AVC comprende una imagen codificada primaria, cero o más imágenes codificadas redundantes, y cero o más imágenes codificadas auxiliares. En algunos sistemas, la detección de los limites de la unidad de acceso puede simplificarse insertando una unidad NAL delimitadora de la unidad de acceso en la corriente de bits. Una unidad de acceso de acuerdo con SVC puede comprender una imagen codificada primaria para la capa base y puede contener múltiples imágenes codificadas mejoradas, pero cuando mucho una imagen codificada mejorada que no es una imagen codificada redundante por cada combinación única de dependencia_id, temporal_nivel y calidad_nivel . La capa base de las corrientes SVC está típicamente
de acuerdo con AVC, es decir decodificadores AVC que pueden decodificar la capa base de una corriente SVC e ignorar los datos específicos SVC. Esta característica se ha realizado especificando los tipos de unidad NAL de división codificados que son específicos para SVC y en donde se reservan para un futuro uso en AVC y requeridos para ser omitidos de acuerdo con la especificación AVC. Un delimitador de unidad de acceso es una unidad NAL especificada en H.264/AVC que puede insertarse como la primera unidad NAL de una unidad de acceso. El delimitador de la unidad de acceso contiene el tipo de codificación de imagen de la imagen primaria de la unidad de acceso. Las variables temporal_nivel , dependencia_id, calidad_nivel , simple_prioridad_id y descargable_bandera se señalizan para las capas de mejora SVC pero no para las capas base. Más bien, las variables ya sea no están especificadas (descartable_bandera ) o se derivan como igual a cero (las otras cuatro variables) para la capa base compatible con AVC de acuerdo con la especificación SVC. Sin embargo, esto causa un problema en que la información importante no puede señalizarse para la capa base tan eficientemente como para las capas de mejora (la capa base compatible con AVC siempre tiene dependencia_id y calidad_nivel igual a cero) . En primer lugar, la jerarquía de escalabilidad temporal de la imagen de la base, es decir cuyos valores de temporal_nivel pertenecen
a una capa base AVC utilizando la característica de sub-secuencia, no pueden señalizarse. En segundo lugar, no se puede señalizar si una imagen de capa base o una parte de la imagen de capa base se utiliza para la predicción inter-capa a través de cualquier capa con un valor de dependencia_id mayor, es decir, el valor de descartable_bandera . En tercer lugar, un valor de prioridad deseado para una imagen de capa base, es decir, el valor simple_prioridad_id, no puede señalizarse . Aunque existen métodos potenciales para efectuar algunas de estas señalizaciones, cada una tiene sus propios inconvenientes. Por ejemplo, aunque el mensaje de la información de mejora suplementario (SEI, por sus siglas en inglés) de la información de la sub-secuencia en AVC podría utilizarse para señalar la jerarquía de escalabilidad temporal de la capa base, el mensaje contiene un número de elementos de sintaxis además de temporal_nivel (correspondiente al elemento de sintaxis subsecuencia_capa en el mensaje SEI de la información de la subsecuencia ) , conduciendo a una ineficiencia potencial en términos de velocidad de bits. Los estándares de codificación de video convencionales utilizan un encabezado de imagen para separar las imágenes codificadas y para llevar los elementos de sintaxis específicos de la imagen.
BREVE DESCRIPCION DE LA INVENCION La presente invención proporciona el uso de un delimitador de imagen que está contenido en un valor de tipo unidad NAL (14 en varias modalidades) que está reservado en la especificación AVC o SVC actual. La invención proporciona la información de escalabilidad para la capa base H.264/AVC en tal forma que las corriente de bits permanecen descifrables con los decodificadores H.264/AVC. Además, la unidad de datos elementales del delimitador de imágenes de la presente invención puede contener muchos otros elementos de sintaxis que pueden ayudar a facilitar el procesamiento de las corrientes de bits comparado con la sintaxis de la corriente de bits H.264/AVC plena. La presente invención posee un número de ventajas significativas sobre los métodos convencionales. La presente invención permite la señalización de la jerarquía de escalabilidad temporal, así como transformación para las corrientes escalables SVC de la capa base compatible con AVC sin interrumpir la retro-compatibilidad, según las unidades NAL del delimitador pueden descartarse a través de un decodificador AVC. La presente invención también hace el análisis de la corriente de bits más fácil, ya que muchas operaciones pueden realizarse con base en imágenes codificadas en lugar de unidades NAL individuales. En contraste los estándares
H.264/AVC y SVC especifican un procedimiento de decodificación que se basa en unidades NAL. En muchos sistemas, no se proporciona la construcción o encapsulación adicional de imágenes, sino más bien el análisis de la corriente de bits se hace de unidad NAL por unidad NAL. Algunas veces se requiere un análisis en profundidad de la corriente de bits para concluir si una imagen es útil para producir un resultado de decodificación deseado. Esto es particularmente cierto en operaciones especiales, tales como la búsqueda y la reproducción hacia adelante rápida. En la operación de búsqueda, por ejemplo, el decodificador tiene que buscar una unidad NAL IDR, después rebobinar de regreso a la posición en donde la unidad de acceso correspondiente inicia (por ejemplo, los grupos de parámetros de unidades NAL SIE pueden predecir una unidad NAL IDR en la unidad de acceso), e iniciar la decodificación después de esto. A diferencia de algunas implementaciones convencionales, el delimitador de imagen de la presente invención se especifica en el contexto de una corriente de bits de video en lugar del formato de archivo o el formato de carga útil RTP. Esto permite que los decodificadores de video hagan uso de la información incluida en el delimitador de imagen (es decir, omitir las decodificaciones de imágenes innecesarias). La información similar en el formato de archivo y en el formato de carga útil RTP puede no estar
disponible para el decodificador . En contraste los encabezados de imágenes, un delimitador de imagen de la presente invención puede contener elementos de sintaxis que afectan el procedimiento de decodificación de H.264/capa base compatible con AVC cuando por lo menos está presente una capa de mejora. La decodificación condicional no ha sido especificada para encabezados de imagen. Un encabezado de imagen es una parte integral de la sintaxis de corriente de bits en los codees de convención (es decir, el encabezado de la imagen siempre está presente para cada imagen en la corriente de bits) . Un delimitador de imagen no está especificado en los decodificadores H.264/AVC, pero los decodificadores H.264/AVC pueden de manera segura ignorarlo (es decir, no afecta el procedimiento de decodificación de H.264/capa base compatible con AVC) . Varias modalidades de la presente invención incluyen un codificador que genera un delimitador de imagen, asi como un decodificador que analiza un delimitador de imagen y omite la decodificación de la imagen en las bases del valor del delimitador de la imagen y el punto de operación deseado, tales como capas/nivel temporal para la reproducción. Las modalidades de la presente invención también incluyen un analizador de la corriente de bits que analiza las unidades NAL para el decodificador y remueve las
imágenes de las bases del valor del limitador de la imagen. Estas y otras ventajas y características de la invención, junto con la organización y la forma de operación de las mismas, serán evidentes a partir de la siguiente descripción detallada cuando se toma en conjunción con las figuras anexas, en donde los elementos similares tienen números similares a lo largo de las varias figuras descritas a continuación. BREVE DESCRIPCION DE LAS FIGURAS La Figura 1 muestra un sistema de comunicaciones multimedia genérico para utilizarse con la presente invención; La Figura 2 es una vista en perspectiva de un teléfono móvil que puede utilizarse en la implementación de la presente invención; La Figura 3 es una representación esquemática del circuito integrado telefónico del teléfono móvil de la Figura
2; y La Figura 4 es una representación de la estructura de una unidad de acceso de acuerdo con varias modalidades de la presente invención. DESCRIPCION DETALLADA DE LA INVENCION La presente invención involucra el uso de un delimitador de imagen en una codificación de video escalable. El delimitador de imagen puede ya sea preceder la primera
imagen codificada en la unidad de acceso o preceder cualquier otra imagen codificada en la unidad de acceso. Debido a ciertas restricciones en la especificación AVC, un tipo de unidad NAL de un intervalo diferente de valores se selecciona para el delimitador de imágenes precediendo la primera imagen codificada (es decir, la imagen codificada primaria en la capa base) en una unidad de acceso del delimitador de imagen que precede cualquier otra imagen codificada en una unidad de acceso. El término "delimitador de imagen" se utiliza colectivamente para ambos tipos de unidad NAL en la presente. Una unidad NAL de delimitador de imagen que precede la primera imagen codificada de una unidad de acceso es referida como una unidad NAL de descripción de imagen codificada primaria, y una unidad NAL de delimitador de imagen que precede cualquier otra imagen codificada de una unidad de acceso es referida como una unidad NAL de descripción de imagen codificada subsecuente. Los valores de tipo unidad NAL se seleccionan entre aquellos reservados en las especificaciones AVC y SVC actuales, tales como 14 para la unidad NAL de la descripción de imagen codificada primaria y 22 para la unidad NAL de descripción de imagen codificada subsecuente . El delimitador de imagen involucra una imagen codificada y es la primera unidad NAL de la imagen codificada en el orden de decodificación. Se deberá observar que una
corriente de bits a ser decodificada se puede recibir de un dispositivo remoto localizado dentro de virtualmente cualquier tipo de red. Adicionalmente , se puede recibir una corriente de bits de hardware o software local. Se deberá también entender que, aunque el texto y los ejemplos contenidos en la presente pueden específicamente describir un procedimiento de codificación, un experto en la técnica fácilmente entenderá que los mismos conceptos y principios también se aplican a los procedimientos de decodificación correspondientes y viceversa. El orden de la decodificación de la unidad NAL de la descripción de imagen codificada primaria precede las unidades NAL VCL de la imagen codificada primaria en la capa base. Un tipo de unidad NAL de 14 se utiliza porque es uno de los valores reservados que pueden iniciar una nueva unidad de acceso. La Figura 4 describe el orden de decodificación de la unidad NAL de descripción de imagen codificada primaria y la unidad de acceso de descripción de imagen codificada subsecuente con relación a las otras unidades NAL en la unidad de acceso. El tipo de unidad NAL 14 utilizado para la unidad NAL de descripción de imagen codificada primaria es un tipo de unidad cuya presencia señala el inicio de una nueva unidad de acceso si es la primera unidad NAL de aquellas que pueden iniciar una nueva unidad de acceso. Por consiguiente se puede
utilizar para la imagen codificada primaria (en la capa base) solamente. En consecuencia, otro tipo de unidad NAL (22) se utiliza para la unidad NAL de descripción de imagen codificada subsecuente. La especificación AVC restringe el tipo de unidad NAL 22 para no preceder a la primera unidad NAL VCL de la imagen codificada primaria (en la capa base) , y por consiguiente el tipo de unidad NAL 22 no puede utilizarse para la unidad NAL de descripción de imagen codificada primaria. La estructura de la sintaxis para las dos unidades NAL (descripción de imagen codificada primaria y descripción de imagen codificada subsecuente) puede o no puede ser idéntica en diferentes modalidades de la presente invención. Por consiguiente se debe entender que tanto la descripción de la imagen codificada primaria como la descripción de la imagen codificada subsecuente de la presente invención pueden incorporar la sintaxis y la información descrita en la presente . El delimitador de imagen de la presente invención contiene por lo menos uno del siguiente grupo de información: 1. Una jerarquía de escalabilidad temporal. 2. Un identificador de prioridad. 3. Un indicador de imagen clave. 4. Un indicador de sí la imagen completa o parte de una imagen o ninguna parte de una imagen se utiliza para la predicción inter-capa a través de cualquier capa con un
valor de dependencia_id mayor. 5. Un indicador de señalización de si la imagen es una imagen no de referencia/de referencia que contiene unidades NAL que no deberán descartarse (tales como grupos de parámetros) y/o los valores máximos de nal_ref_idc de diferentes grupos de unidades NAL. 6. Un indicador de imagen redundante que indica si la imagen es una imagen redundante codificada. 7. Un indicador de imagen auxiliar que indica si la imagen es una imagen auxiliar codificada. 8. Un indicador de imagen actualizada de decodificación instantánea (IDR, por sus siglas en inglés) que hace la señalización de que la imagen y todas las imágenes siguientes, el mismo valor de dependencia_id puede correctamente decodificarse sin referencia a ninguna imagen precedente a ellas y que tienen el mismo valor de dependencia_id . 9. Un indicador de señalización de que la imagen y todas imágenes siguientes con el mismo valor de dependencia_id como la imagen pueden correctamente decodificarse sin referencia a ninguna de esas imágenes que las preceden y que tienen el mismo valor de dependencia_id y que tienen el mismo valor o un valor mayor de temporal_nivel . Este indicador también señala que la corriente de bits puede cambiarse a temporal_nivel de la imagen con este indicador de
una capa temporal con otro valor de temporal_nivel y con el mismo valor de dependencia_id . 10. Un indicador de intra-imagen, la señalización de que la imagen puede decodificarse sin referencia a ninguna imagen precedente a ella. 11. Un indicador que señaliza que la imagen puede ser decodificada sin referencia a ninguna imagen precedente a la misma y que tiene el mismo valor de dependencia_id . 12. Un indicador de imagen de acceso aleatorio auto-contenido, la señalización de que la imagen y todas las imágenes siguientes pueden correctamente decodificarse sin referencia a ninguna imagen precedente a ellas y todos los datos, incluyendo los grupos de parámetros, se incluyen en la corriente de bits para la imagen y las imágenes que la siguen. 13. Un indicador de tipo imagen que indica que tipos de divisiones que pueden estar presente en la imagen codificada . 14. Un indicador que indica que partes del proceso de decodificación son requeridos para la decodificación de la imagen (por ejemplo, si la imagen es una imagen intra-codificada entonces los procedimientos de decodificación inter-predicción no son requeridos). 15. Un indicador de las restricciones aplicadas en la sintaxis y las semánticas de la imagen codificada, tales
como un indicador de ordenación de división arbitraria (señalización de si las divisiones de una imagen están en un orden de matriz-exploración) y un indicador de ordenación de macrobloque flexible (señalización de si los macrobloques en cualquier división de una imagen están siempre enseguida uno del otro en un orden de matriz_exploración) . 16. Modificaciones a un grupo de parámetros de imagen que solamente son aplicables en la imagen actual. Por ejemplo, un mapa de grupo de división que dice la ubicación de cada bloque para un grupo de división. 17. Un indicador para la posible presencia de errores o faltas de coincidencia de la imagen codificada. La sintaxis de ejemplo del delimitador de imagen para la información de escalabilidad de acuerdo con las varias modalidades de la presente invención se describe a continuación. Los valores de estos elementos de sintaxis se aplican para la decodificación de la imagen codificada primaria (en la capa base) en una unidad de acceso SVC. Observar también que las extensiones futuras potenciales para esta unidad NAL se habilitan con la declaración de ciclo "mientras (más_rbsp_datos ( ) ) " .
Primario codificado imagen descr () { C Descriptor
Simple prioridad id 11 u(6) Clave imagen bandera 11 u(l) Temporal nivel 11 u(3) Mientras (más rbsp dato ( ) ) Rbsp ruta bits ( ) 11
En la tabla presentada anteriormente, la columna "C" indica la "Categoría" de los elementos de sintaxis. Debido a que el delimitador de imagen es una nueva estructura de sintaxis, un valor de categoría (11) que no se utilizó previamente se utiliza en estas modalidades particulares. Sin embargo, también podrían utilizarse otros valores de categoría sin utilizar. Simple_prioridad_id especifica un identificador de la propiedad para las unidades NAL VCL de la imagen codificada. Si cada una de las unidades NAL VCL de la imagen está asociada con un elemento de sintaxis simple_prioridad_id en el encabezado de la unidad NAL o en el grupo de parámetros de secuencia referidos, el valor de simple_prioridad_id en el delimitador de imagen es igual al valor de simple_prioridad_id en el encabezado de la unidad NAL o en grupo de parámetros de secuencia. Temporal_nivel especifica un nivel temporal para la imagen codificada. Si cada una de las unidades NAL VCL de la imagen está asociada con un elemento de sintaxis temporal_nivel en el encabezado de la unidad NAL o en el grupo de parámetros de secuencia referidos, el valor de temporal_nivel en el delimitador de la imagen es igual al valor de temporal_nivel en el encabezado de la unidad NAL o el grupo de parámetros de secuencia. Una clave_imagen_bandera igual a 1 en la unidad NAL
de descripción de imagen codificada primaria indica que la imagen codificada primaria en la capa base es una representación base de una imagen clave. Una clave_imagen_bandera igual a 0 en la unidad NAL de descripción de imagen codificada primaria indica que la imagen codificada primaria en la capa base no es una representación base de una imagen clave. Clave_imagen_bandera en la unidad NAL de descripción de imagen codificada subsecuente indica que la imagen codificada correspondiente es una imagen clave. La variable clave_imagen_bandera utilizada en el procedimiento de decodificación SVC se establece igual a clave_imagen_bandera . También se debe observar que, en varias modalidades de la presente invención, la clave_imagen_bandera se adiciona en la sintaxis del encabezado de división para divisiones de acuerdo con la extensión escalable. Cuando se identifica una imagen clave en una capa base AVC, la capa deseada a ser decodificada tiene una dependencia+id igual a 0, y una calidad_nivel mayor que 0. Después, la imagen clave en la capa base AVC está completamente decodificada. Generalmente, cuando se identifica una imagen clave que tiene una calidad_nivel igual a 0, la capa deseada a ser decodificada tiene una calidad_nivel mayor que 0, y la capa deseada a ser decodificada tiene la misma dependencia_id que la imagen clave, la imagen clave está completamente decodificada.
La Figura 1 muestra un sistema de comunicaciones de multimedia genérico para utilizarse con la presente invención. Como se muestra en la Figura 1 una fuente de datos 100 proporciona una señal de origen en un formato análogo, digital no comprimido, o digital comprimido, o cualquier combinación de estos formatos. Un codificador 110 codifica la señal de origen en un corriente de bits de medios codificados. El codificador 110 puede ser capaz de codificar más de un tipo de medios, tal como audio y video, o más de un codificador 110 puede ser requerido para codificar diferentes tipos de medios de la señal de origen. El codificador 110 también puede obtener una captura sintéticamente producida, tales como gráficos y texto, o puede ser capaz de producir corrientes de bits codificadas de medios sintéticos. A continuación, solamente el procedimiento de una corriente de bits de medios codificada para un tipo de medios se considera para simplificar la descripción. Se deberá observar, sin embargo, que los servicios de difusión típicamente en tiempo real comprenden varias corrientes (típicamente por lo menos una corriente de audio, video, y subtitulación de texto) , también se debe observar que el sistema puede incluir muchos codificadores, pero a continuación solamente se considera un codificador 110 para simplificar la descripción sin una falta de generalidad. La corriente de bits de medios codificada se
transfiera a un depósito 120. El depósito 120 puede comprender cualquier tipo de memoria masiva para almacenar la corriente de bits de medios codificada. El formato de la corriente de bits de medios codificada en el depósito 120 puede ser un formato de corriente de bits auto-contenido elemental, o una o más corrientes de bits de medios codificadas pueden encapsularse en un archivo contenedor. Algunos sistemas operan "en vivo", es decir, emiten el almacenamiento y transfieren la corriente de bits de medios codificadas del codificador 110 directamente al remitente 130. La corriente de bits de medios codificados después se transfiere al remitente 130, también referido como el servidor, sobre bases necesarias. El formato utilizado en la transmisión puede ser un formato de corriente de bits auto-contenido elemental, un formato de corriente de paquete, una o más corrientes de bits de medios codificados pueden encapsular en un archivo contenedor. El codificador 110, el depósito 120, y el remitente 130 pueden residir en el mismo dispositivo físico o pueden incluirse en dispositivos separados. El codificador 110 y el remitente 130 pueden operar con un contenido en tiempo real vivo, en cuyo caso la corriente de bits de medios codificada típicamente no se almacena permanentemente, sino más bien se almacena de manera temporal por períodos cortos de tiempo en el codificador de contenido 110 y/o el remitente 130 para suavizar las
variaciones en el retraso del procesamiento, retraso de transferencia, y velocidad de bits de medios codificados. El remitente 130 envía la corriente de bits de medios codificada utilizando un depósito de memoria para el protocolo de comunicación. El depósito de memoria puede incluir pero no se limita a un Protocolo de Transporte en Tiempo Real (RTP, por sus siglas en inglés), un Protocolo de Datagrama de Usuario (UPD, por sus siglas en inglés), y el Protocolo de Internet (IP, por sus siglas en inglés). Cuando el depósito de memoria de protocolo de computación está orientado al paquete, el remitente 130 encapsula la corriente de bits de medios codificada en paquete. Por ejemplo, cuando se utiliza RTP, el remitente 130 encapsula la corriente de bits de medios codificados en paquetes RTP de acuerdo con un formato de carga útil RTP. Típicamente, cada tipo de medio tiene un formato de carga útil RTP dedicado. Se debe observar otra vez que un sistema puede contener más de un remitente 130, pero para el bien de la simplicidad, la siguiente descripción solamente considera un remitente 130. El remitente 130 puede o no puede conectarse a una puerta de enlace 140 a través de una red de comunicaciones. La puerta de enlace 140 puede llevar a cabo diferentes tipos de funciones, tales como la traducción de una corriente en paquete de acuerdo con un depósito de memoria de protocolo de comunicación a otro depósito de memoria de protocolo de
comunicación, fusionar y separar las corrientes de datos, y la manipulación de la corriente de datos de acuerdo con un enlace descendente y/o capacidades del receptor, tales como el control de la velocidad de los bits en la corriente enviada de acuerdo con las condiciones de red de enlace descendente prevalente. Los ejemplos de las puertas de enlace 140 incluyen las unidades de control de conferencia multipunto (MCU, por sus siglas en inglés), las puerta de enlaces entre telefonía de video conmutada por circuito o conmutada en paquetes, impulsar para hablar (PoC, por sus siglas en inglés) sobre servidores celulares, encapsuladores IP en sistemas portátiles de difusión de video digital (DVB-H, por sus siglas en inglés), o cajas arriba del televisor que envía transmisiones de difusión localmente a redes inalámbricas domésticas. Cuando se utiliza RTP la puerta de enlace 140 se denomina un mezclador RTP y actúa como un punto final de una conexión RTP. Alternativamente, la corriente de bits de medios codificada puede transferirse desde el remitente 130 al receptor 150 por otros medios, tales como el almacenamiento de la corriente de bits de medios codificada en un disco de memoria masivo portátil o dispositivo cuando el disco o dispositivo está conectado al remitente 130 y después conectar el disco o dispositivo al receptor 150. El sistema incluye uno más receptores 150,
típicamente capaces de recibir, desmodular, y desencapsular las señales transmitidas en una corriente de bits de medios codificadas. La desencapsulacion puede incluir la remoción de los datos que reciben que los receptores son incapaces de decodificar o que no desean ser decodificados . La corriente de bits de medios codee típicamente se procesa adicionalmente a través de un decodificador 160, cuya salida es una o más corrientes de medios descomprimidos. Finalmente, un convertidor 170 puede reproducir las corrientes de medios sin comprimir con un altavoz o una pantalla, por ejemplo. El receptor 150, el decodificador 160, y el convertidor 170 pueden residir en el mismo dispositivo físico o pueden incluirse en dispositivos separados. La escalabilidad en términos de velocidad de bits, la complejidad de la decodificación, y el tamaño de la imagen es una propiedad deseable para entornos heterogéneos y propensos al error. Esta propiedad es deseable con el fin de contar con limitaciones tales como restricciones a la velocidad de bits, la resolución de la pantalla, el rendimiento de la red, y la energía computacional en un dispositivo receptor. Las Figuras 2 y 3 muestran un teléfono móvil representativo 12 dentro del cual la presente invención se puede implementar. Se debe entender, sin embargo, que la presente invención no pretende estar limitada a un tipo
particular de teléfono móvil 12 u otro dispositivo electrónico. Algunas o todas las características descritas en las Figuras 2 y 3 podrían incorporarse en cualquiera o todos los dispositivos representados en la Figura 1. El teléfono móvil 12 de las Figuras 2 y 3 incluye un alojamiento 30, una pantalla 32 en la forma de una pantalla de cristal líquido, un teclado numérico 34, un micrófono 36, un audífono 38, una batería 40, un puerto infrarrojo 42, una antena 44, una tarjeta inteligente 46 en la forma de una UICC de acuerdo con una modalidad de la invención, un lector de tarjetas 48, un circuito electrónico de interfaz de radio 52, un circuito electrónico de codee 54, un controlador 56, y una memoria 58. Los circuitos y elementos individuales todos son de un tipo bien conocido en la técnica, por ejemplo en la escala de teléfonos móviles de Nokia . Los dispositivos de comunicación de la presente invención pueden comunicarse utilizando varias tecnologías de transmisión incluyendo, pero no limitándose a, el Acceso Múltiple de División de Código (CDMA, por sus siglas en inglés) , Sistema Global para Comunicaciones Móviles (GSM, por sus siglas en inglés), Sistema de Telecomunicaciones Móvil Universal (UMTS, por sus siglas en inglés), Acceso Múltiple de División de Tiempo (TDMA, por sus siglas en inglés), Acceso de Múltiple de División de Frecuencia (FDMA, por sus
siglas en inglés), Protocolo de Control de
Transmisión/Protocolo de Internet (TCP/IP, por sus siglas en inglés), Servicio de Mensajería Corto (SMS, por sus siglas en inglés), Servicio de Mensajería Multimedia (MMS, por sus siglas en inglés), correo electrónico, Servicio de Mensajería Instantáneo (IMS, por sus siglas en inglés), Bluetooth, IEEE 802.11, etc. Un dispositivo de comunicación puede comunicarse utilizando varios medios incluyendo, pero no limitándose a, radio, infrarrojo, láser, conexión por cable, y similares. La presente invención se describe en el contexto general de pasos de método, que pueden implementarse en una modalidad a través de un producto de programa incluyendo instrucciones ejecutables por computadora tales como código de programa, ejecutados por computadoras en entornos comunicados en red. Generalmente, los módulos de programa incluyen rutinas, programas, objetos, componentes, estructuras de datos, etc., que llevan a cabo tareas particulares o implementan tipos de datos abstractos particulares. Las instrucciones ejecutables por computadora, las estructuras de datos asociadas, y los módulos de programas representan ejemplos de un código de programa para ejecutar los pasos de los métodos descritos en la presente. La secuencia particular de las instrucciones ejecutables o las estructuras de datos asociados representan ejemplos de las acciones correspondientes para implementar las funciones
descritas en los pasos. Las implementaciones de software y web de la presente invención podrían lograrse con técnicas de programación estándares con lógica basada en reglas y otra lógica para lograr los pasos de búsqueda de bases de datos, pasos de correlación, pasos de comparación, y pasos de decisión. Se deberá observar que las palabras "componente" y "módulo", como se utilizan en la presente y en las reivindicaciones, pretenden abarcar implementaciones que utilizan una o más líneas de código de software, y/o implementaciones de hardware, y/o equipo para recibir capturas manuales. La descripción anterior a las modalidades de la presente invención ha sido presentada para propósitos de ilustración y descripción. No se pretende ser exhaustivo o limitar la presente invención a la forma descrita precisa, y modificaciones y variaciones son posibles en luz de las enseñanzas anteriores o pueden adquirirse de la práctica de la presente invención. Las modalidades se seleccionaron y describieron con el fin de explicar los principios de la presente invención y su aplicación práctica para permitir a un experto en la técnica utilizar la presente invención en varias modalidades y con varias modificaciones que son
adecuadas para el uso particular contemplado. Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.