ES2383066T3 - Procedimiento de codificación de video - Google Patents

Procedimiento de codificación de video Download PDF

Info

Publication number
ES2383066T3
ES2383066T3 ES10159560T ES10159560T ES2383066T3 ES 2383066 T3 ES2383066 T3 ES 2383066T3 ES 10159560 T ES10159560 T ES 10159560T ES 10159560 T ES10159560 T ES 10159560T ES 2383066 T3 ES2383066 T3 ES 2383066T3
Authority
ES
Spain
Prior art keywords
image
parameter set
unit
random access
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES10159560T
Other languages
English (en)
Inventor
Shinya Kadono
Youji Notoya
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Application granted granted Critical
Publication of ES2383066T3 publication Critical patent/ES2383066T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Color Television Systems (AREA)
  • Television Systems (AREA)

Abstract

Un procedimiento de codificación de imágenes para codificar una señal de imagen basándose en imagenpor imagen y generar un flujo de bits (Str), comprendiendo el procedimiento:una etapa de codificación de conjunto de parámetros de imagen (S102, S103) de codificar un conjunto de parámetros deimagen (PPS) que han de usarse para decodificar una o más imágenes (pic) incluidas en una unidad de acceso aleatorio(RAU) que está constituida por una pluralidad de las imágenes; yuna etapa de codificación de conjunto de parámetros de secuencia (S102) de codificar un conjunto de parámetros desecuencia (SPS) que puede usarse en común para decodificar todas las imágenes de la pluralidad de imágenesincluidas en la unidad de acceso aleatorio (RAU).caracterizado por una etapa de colocación (S104) de colocar, para cada unidad de acceso aleatorio, el conjunto deparámetros de imagen (PPS) y el conjunto de parámetros de secuencia (SPS) que han sido codificados respectivamenteen la etapa de codificación de conjunto de parámetros de imagen (S103) y la etapa de codificación de parámetros desecuencia (S102).

Description

Procedimiento de codificación de vídeo
Campo técnico
La presente invención se refiere a un procedimiento de codificación de imágenes para codificar una imagen.
Técnica anterior
El documento “H.26L OVER IP AND H.324 FRAMEWORK” (ITU Sector de estandarización de telecomunicaciones VCEG-N52, del 18 de septiembre de 2001, págs. 1-13), de S. Wenger y col. discute un posible concepto para el transporte de H.26L sobre redes IP y H.324. Cualquier información que se vea afectada con más de una sola franja es transportada fuera de banda. En particular, toda información transportada previamente en la cabecera de la imagen y las capas de cabecera superiores, como el tamaño de imagen, el procedimiento de codificación de entropía, los modos opcionales y similares nunca se envían en el flujo RTP.
El decodificador mantiene conjuntos de parámetros en ubicaciones de almacenamiento numeradas. Los sistemas más sencillos necesitarán al menos dos posiciones de almacenamiento, una para franjas Intra y otra para franjas Inter. Los sistemas más complejos mantienen una multitud de espacios de almacenamiento de parámetros para diferentes resoluciones de imagen, modelos de codificación y similares. Cada franja contiene en su partición de cabecera la información que ha de usar el espacio de almacenamiento. La sincronización entre actualizaciones del almacenamiento de parámetros (cuando se desea) y los flujos de medios se maneja externamente.
Para la información de parámetros se propone una sintaxis que puede ser convertida de uno a uno en SDP, el lenguaje de descripción usado por los sistemas SIP (como los teléfonos 3GPP).
El documento US6.031.960 describe procedimientos y aparatos para asegurar que un flujo de datos de reproducción con avance rápido y hacia atrás, por ejemplo un flujo de datos usados para una operación de avance rápido o reproducción inversa, cumple con estándares de datos preseleccionados, y en particular el estándar MPEG-2, se desvelan en el documento US6.031.960. Se describen diversos procedimientos para generar valores de PCR, PTS y DTS para un flujo de datos de reproducción con avance rápido y hacia atrás, que se genera a partir de un flujo de datos de reproducción normal, y está pensado para grabar en segmentos reproducción con avance rápido y hacia atrás de una cinta. Los procedimientos descritos incluyen la generación de nuevos valores de PCR, PTS y DTS como una función de la velocidad de reproducción con avance rápido y hacia atrás a la que se pretende que los datos se vuelvan a leer. También se desvelan procedimientos y aparatos para corregir los valores de PCR, PTS y DTS leídos de una cinta durante la operación de reproducción con avance rápido y hacia atrás. Los procedimientos desvelados están dirigidos a generar nuevos PCRs, PTSs y DTSs para proporcionar un flujo de bits conforme al estándar MPEG-2. Los procedimientos y aparatos descritos son aplicables a una pluralidad de dispositivos de almacenamiento y reproducción capaces de implementar la reproducción con avance rápido y hacia atrás incluyendo discos compactos.
Para solucionar los problemas que es difícil asegurar una propiedad en tiempo real del tiempo de grabación en el momento de la reproducción al reproducir datos grabados y la eficiencia de uso de una capacidad disminuye en el caso en que un medio de grabación está provisto de la unidad mínima de grabación de un tamaño fijo, en el documento JP2001285800 se propone que la información de tiempo se superponga al grabar datos y la salida se controle usando la información de tiempo cuando se realiza la reproducción. Además, la información de tiempo y datos adicionales se añaden a los datos y se absorbe la diferencia entre los datos que han de ser grabados y la unidad mínima de grabación. O la información de tiempo y los datos adicionales se añaden a los datos y la grabación se realiza mediante una unidad que es el múltiplo entero de la unidad mínima de grabación.
Recientemente, con la llegada de la era de los multimedia que trata integralmente audio, vídeo y valores de píxeles, los medios de información existentes, por ejemplo, periódicos, revistas, televisiones, radios y teléfonos, y otros medios a través de los cuales se transmite información a la gente, han caído bajo el ámbito de los multimedia.
En general, multimedia se refiere a una representación en la que no sólo los caracteres sino también gráficos, audio y especialmente imágenes y similares están relacionados entre sí. Sin embargo, para incluir los medios de información existentes mencionados anteriormente en el ámbito de los multimedia, aparece como requisito previo representar tal información en forma digital.
Sin embargo, al calcular la cantidad de información contenida en cada uno de los medios de información mencionados anteriormente como la cantidad de información digital, la cantidad de información por carácter requiere de 1 a 2 bytes mientras que el audio requiere más de 64 Kbits por segundo (calidad telefónica) y cuando se trata de la imagen en
movimiento, requiere más de 100 Mbits por segundo (calidad de recepción de televisión actual). Por lo tanto, no es realista tratar la vasta información directamente en forma digital a través de los medios de información mencionados anteriormente. Por ejemplo, ya se ha puesto en uso práctico un videoteléfono a través de la red digital de servicios integrados (RDSI) con una velocidad de transmisión de 64 Kbits/s a 1,5 Mbits/s, sin embargo, es imposible transmitir vídeo captado en la pantalla de TV o tomado por una cámara de TV.
Por lo tanto, esto requiere técnicas de compresión de información y, por ejemplo, en el caso del videoteléfono, se emplean técnicas de compresión de vídeo conformes a los estándares H.261 y H.263 estandarizados internacionalmente por la Unión Internacional de Telecomunicaciones-Sector de Estandarización de Telecomunicaciones (ITU-T). Según las técnicas de compresión de información conformes con el estándar MPEG-1, la información de imagen así como la información de audio pueden ser almacenadas en un CD (disco compacto) de música corriente.
El Grupo de Expertos en Imágenes en Movimiento (MPEG) es un estándar internacional para una compresión de señales de imágenes en movimiento y el MPEG-1 es un estándar que comprime señales de vídeo hasta 1,5 Mbit/s, concretamente, para comprimir la información incluida en las señales de TV aproximadamente hasta una centésima. La calidad que es el objetivo del estándar MPEG-1 era la calidad media para producir una velocidad de transmisión principalmente de aproximadamente 1,5 Mbits/s, por lo tanto, el MPEG-2, estandarizado con vistas a cumplir los requisitos de imagen de alta calidad produce una calidad de emisión de TV para transmitir señales de imágenes en movimiento a una velocidad de transmisión de 2 a 15 Mbits/s. En las circunstancias actuales, un grupo de trabajo (ISO/IEC JTC1/SC29/WG11) previamente a cargo de la estandarización del MPEG-1 y el MPEG-2 ha estandarizado el MPEG-4 que logra una tasa de compresión superior a la lograda por el MPEG-1 y el MPEG-2, permite operaciones de codificación/decodificación según un criterio basado en objeto y produce una nueva función requerida por la era de los multimedia. Al principio, en el proceso de estandarización del MPEG-4, el objetivo era la estandarización de un procedimiento de codificación para una baja velocidad de transmisión de bits, sin embargo, el objetivo se amplía actualmente a una codificación más versátil que incluye una codificación imágenes en movimiento a una alta velocidad de transmisión de bits y una codificación de imágenes entrelazadas. Por otra parte, está en curso una estandarización de MPEG-4 AVC e ITU H.264 como un procedimiento de codificación de próxima generación con una velocidad de compresión más alta, creada conjuntamente por el ITU-T y el ISO/IEC. El procedimiento de codificación de próxima generación se publica bajo el nombre de Borrador de Comité (CD) de agosto de 2002.
En la codificación de una imagen en movimiento, la compresión del volumen de información normalmente se realiza eliminando la redundancia en direcciones tanto espaciales como temporal. Por lo tanto, una codificación por predicción entre imágenes, cuyo propósito es reducir la redundancia temporal, estima un movimiento y genera una imagen predictiva basándose en bloque por bloque con referencia a las imágenes anterior y posterior, y luego codifica un valor diferencial entre la imagen predictiva obtenida y una imagen actual que ha de ser codificada. Aquí, "imagen" es un término para representar una sola pantalla y representa una trama cuando se usa para una imagen progresiva mientras que representa una trama o un campo cuando se usa para una imagen entrelazada. Aquí, la imagen entrelazada es una imagen en la que una trama individual está constituida por dos campos que tienen tiempo diferente. Para codificar y decodificar una imagen entrelazada, son posibles tres maneras: procesar una trama individual como una trama, como dos campos o como una estructura de trama o una estructura de campo dependiendo de un bloque de la trama.
Una imagen en la que se realiza predicción entre imágenes sin imágenes de referencia se denomina "imagen I". Una imagen en la que se realiza codificación por predicción entre imágenes con referencia a una imagen individual se denomina "imagen P". Una imagen en la que se realiza codificación por predicción entre imágenes haciendo referencia simultáneamente a dos imágenes se denomina "imagen B". Dos imágenes cuyo momento de visualización está adelantado o retrasado respecto al de una imagen actual que ha de ser codificada pueden seleccionarse arbitrariamente para codificar la imagen B. Las imágenes de referencia pueden especificarse para cada bloque que es una unidad básica para codificar y decodificar, pero pueden clasificarse como la primera imagen de referencia para una imagen de referencia que se describe en primer lugar en un flujo de bits codificado y una imagen que se describe después como la segunda imagen de referencia. Sin embargo, las imágenes de referencia ya tienen que estar codificadas o decodificadas como condición para codificar o decodificar estas imágenes I, P y B.
Se emplea una codificación de predicción entre imágenes por compensación de movimiento para codificar imágenes P o imágenes B. La codificación de predicción entre imágenes por compensación de movimiento es un procedimiento de codificación que aplica compensación de movimiento a la codificación de predicción entre imágenes. La compensación de movimiento no es un procedimiento simplemente para predecir movimientos usando píxeles en las imágenes de referencia sino para estimar un movimiento (al que se denominará en lo sucesivo “vector de movimiento”) en cada parte dentro de una imagen y mejorar la exactitud de predicción realizando una predicción que tiene en cuenta el vector de movimiento así como para reducir la cantidad de datos. Por ejemplo, la cantidad de datos se reduce estimando el vector de movimiento para una imagen actual que ha de ser codificada y codificando el error de predicción entre un valor predictivo, que se obtiene después de ser desplazado la cantidad equivalente al vector de movimiento, y la imagen actual. En el caso de usar este procedimiento, la información sobre los vectores de movimiento se requiere en el momento de la decodificación, por lo tanto, los vectores de movimiento son codificados y luego grabados o transmitidos.
Un vector de movimiento se estima basándose en bloque por bloque. Más exactamente, un vector de movimiento se estima fijando un bloque en la imagen actual, luego, desplazando un bloque en la imagen de referencia dentro de un intervalo de búsqueda, y encontrando una ubicación del bloque de referencia que se asemeje a un bloque básico.
La Fig. 1 es un diagrama de bloques que muestra la estructura del aparato de codificación de imágenes convencional.
Un aparato de codificación de imágenes 900 produce como salida una señal de imagen codificada (al que se denominará “flujo de bits”) Str9 que es un flujo de bits obtenido codificando una señal de imagen Vin basándose en imagen por imagen, e incluye una unidad de estimación de movimiento 903, una unidad de compensación de movimiento 905, un sustractor 906, una unidad de transformación ortogonal 907, una unidad de cuantificación 908, una unidad de cuantificación inversa 910, una unidad de transformación ortogonal inversa 911, un sumador 912, una memoria de imagen 904, un conmutador 913, una unidad de codificación de longitud variable 909 y una unidad de determinación de punto de acceso 902. Cada componente como la unidad de estimación de movimiento 903 ejecuta el siguiente procesamiento por bloque o por macrobloque que constituye una imagen.
El sustractor 906 calcula un valor diferencial entre la señal de imagen Vin y una imagen predictiva Pre, y produce como salida el valor diferencial hacia la unidad de transformación ortogonal 907. La unidad de transformación ortogonal 907 transforma el valor diferencial en coeficientes de frecuencia y los produce como salida hacia la unidad de cuantificación
908. La unidad de cuantificación 908 cuantifica los coeficientes de frecuencia y produce como salida los valores cuantificados hacia la unidad de codificación de longitud variable 909. La unidad de cuantificación inversa 910 restaura los coeficientes de frecuencia cuantificando inversamente los valores cuantificados y produce como salida los coeficientes de frecuencia hacia la unidad de transformación ortogonal inversa 911.
La unidad de transformación ortogonal inversa 911 realiza transformación de frecuencia inversa sobre los coeficientes de frecuencia producidos desde la unidad de cuantificación inversa 910 en valores diferenciales de píxeles y los produce como salida hacia el sumador 912. El sumador 912 suma los valores diferenciales de píxeles producidos desde la unidad de transformación ortogonal inversa 911 y la imagen predictiva Pre producida desde la unidad de compensación de movimiento 905, y genera una imagen decodificada. El conmutador 913 conecta el sumador 912 y la memoria de imagen 904 de manera que la memoria de imagen 904 almacena la imagen decodificada generada por el sumador 912. La imagen decodificada almacenada en la memoria de imagen se denomina en lo sucesivo simplemente “imagen”.
La unidad de estimación de movimiento 903 hace referencia a la imagen almacenada en la memoria de imagen 904 como una imagen de referencia y especifica un área de imagen que más se asemeja a la señal de imagen Vin entre las imágenes de referencia. Luego, la unidad de estimación de movimiento 903 estima un vector de movimiento MV que indica una posición del área de imagen.
La unidad de estimación de movimiento 903 también identifica una imagen de referencia que se asemeja a la señal de imagen Vin de las imágenes de referencia plurales usando números de identificación (índice relativo Idx) para identificar la imagen de referencia.
La unidad de compensación de movimiento 905 extrae un área de imagen que es la más aplicable a la imagen predictiva Pre de entre las imágenes almacenadas en la memoria de imagen 904 usando el vector de movimiento MV y el índice relativo Idx. La unidad de compensación de movimiento 905 genera entonces una imagen predictiva Pre a partir del área de imagen extraída.
La unidad de determinación de punto de acceso 902 ordena a la unidad de estimación de movimiento 903 y la unidad de compensación de movimiento 905 que codifique (codificación entre imágenes) por unidad predeterminada (unidad de acceso aleatorio) una imagen predeterminada como una imagen especial. Aquí, la imagen especial significa una imagen a partir de la cual puede comenzarse la decodificación en el flujo Str 9. Además, la unidad de determinación de punto de acceso 902 produce como salida un identificador de punto de acceso rapp que indica que una imagen es la imagen especial para la unidad de codificación de longitud variable 909.
La unidad de codificación de longitud variable 909 codifica un conjunto de parámetros PS obtenido a partir de recursos externos, el vector de movimiento MV, los valores cuantificados, el índice relativo Inx y el identificador de punto de acceso rapp, genera un flujo Str9 en el que se pone el conjunto de parámetros codificado únicamente en el lado de encabezamiento, y produce como salida el flujo Str9.
La Fig. 2 es un diagrama estructural que muestra la estructura del flujo Str9 producido por el aparato de codificación de imágenes convencional 900.
El flujo Str9 incluye secuencialmente desde el encabezamiento una señal síncrona sync, un conjunto de parámetros PS, unidades de acceso aleatorio RAU9 plurales. Tal flujo Str9 cumple el estándar JVT (H.264/MPEG-4 AVC) que está actualmente en proceso de estandarización, en el que trabajan conjuntamente el ITU-T y el ISO/IEC.
El conjunto de parámetros PS son datos comunes equivalentes a una cabecera e incluyen un conjunto de parámetros de imagen PPS equivalente a una cabecera de la imagen, un conjunto de parámetros de secuencia SPS equivalente a una cabecera de una unidad con un nivel superior a una unidad de acceso aleatorio RAU9. El conjunto de parámetros de secuencia SPS incluye un número posible máximo de imágenes de referencia, un tamaño de imagen, o similar, mientras que el conjunto de parámetros de imagen PPS incluye un tipo de codificación de longitud variable (una conmutación entre codificación Huffman y codificación aritmética), un valor inicial en la etapa de cuantificación, el número de imágenes de referencia, o similares.
La unidad de acceso aleatorio RAU9 incluye secuencialmente desde el encabezamiento una señal síncrona y una pluralidad de imágenes codificadas pic. La unidad de acceso aleatorio RAU9 como tal es una sola unidad que incluye las imágenes plurales del flujo Str9 e incluye la imagen especial tal como se mencionó anteriormente que puede decodificarse sin depender de otras imágenes. Concretamente, la unidad de acceso aleatorio RAU9 se obtiene dividiendo el flujo Str9 en un grupo de imágenes plurales que incluye una imagen especial.
La imagen pic incluye secuencialmente desde el encabezamiento una señal síncrona Sync y un identificador de conjunto de parámetros PSID y trozos plurales de datos de píxeles pix.
El identificador de conjunto de parámetros PSID indica el conjunto de parámetros de secuencia SPS y el conjunto de parámetros de imagen PPS, que están incluidos en el conjunto de parámetros PS, a los que ha de hacer referencia la imagen pic.
La señal síncrona sync incluida en el encabezamiento del flujo Str9, en el encabezamiento de la unidad de acceso aleatorio RAU9 y en el encabezamiento de la imagen pic indica respectivamente una sección que distingue las unidades como el flujo Str9, la unidad de acceso aleatorio RAU9 y la imagen pic.
Concretamente, en el procedimiento de codificación de imágenes en el que el aparato de codificación de imágenes convencional 900 genera un flujo Str9 codificando la señal de imagen Vin, se genera un flujo Str9 de tal manera que el conjunto de parámetros PS se codifican juntos y luego se ponen en el lado de encabezamiento del flujo Str9, mientras que unidades de acceso aleatorio RAU9 plurales, cada una de las cuales no incluye un conjunto de parámetros de imagen PPS ni un conjunto de parámetros de secuencia SPS, sigue al conjunto de parámetros PS.
Al decodificar tal flujo Str9, el aparato de decodificación de imágenes hace referencia al conjunto de parámetros de secuencia SPS y el conjunto de parámetros de imagen PPS incluidos en el conjunto de parámetros PS indicado por el identificador de conjunto de parámetros PSID en la imagen pic para decodificar la imagen pic.
Un flujo convencional según el estándar MPEG-2 tiene una estructura diferente del flujo Str9.
La Fig. 3 es un diagrama estructural que muestra la estructura del flujo convencional según el estándar MPEG-2.
Un flujo Str8 según el estándar MPEG-2 incluye secuencialmente desde el encabezamiento una señal síncrona sync, una cabecera hed que son datos comunes en el flujo Str8 y una pluralidad de grupos de imágenes GOP.
El grupo de imagen GOP incluye secuencialmente desde el encabezamiento una señal síncrona sync, una cabecera hed que son datos comunes para el grupo de imágenes GOP e imágenes codificadas pic plurales.
El grupo de imagen GOP como tal es una unidad básica para codificación y se usa para editar una imagen en movimiento y realizar acceso aleatorio. La imagen pic incluida en el grupo de imagen GOP es una imagen I, una imagen P o una imagen B.
La imagen pic incluye secuencialmente desde el encabezamiento una señal síncrona sync, una cabecera que son datos comunes a las imágenes pic y trozos plurales de datos de píxeles pix.
Concretamente, en el procedimiento de codificación de imágenes según el estándar MPEG-2 para generar un flujo Str8 codificando la señal de imagen convencional Vin, se genera un flujo Str8 de tal manera que la cabecera hed necesaria para decodificar la imagen pic está incluida respectivamente en los encabezamientos del flujo Str8, cada grupo de imagen GOP y cada imagen pic.
Sin embargo, un problema es que el aparato de decodificación de imágenes no puede decodificar desde un punto de acceso aleatorio que sea un encabezamiento de la unidad de acceso aleatorio RAU9 en el flujo Str9 (es decir, acceso aleatorio) en un intento de comenzar a realizar el acceso aleatorio, por ejemplo, en el caso en que el conjunto de parámetros PS no puede obtenerse puesto que el flujo Str9 se lee desde la mitad, ya que el conjunto de parámetros PS está colocado en un lugar en el lado de encabezamiento del flujo Str9 según el procedimiento de codificación de imágenes convencional tal como se describió anteriormente, empleado por el aparato de codificación de imágenes 900. Concretamente, el aparato de decodificación de imágenes no puede decodificar correctamente la imagen pic porque no se encuentran el conjunto de parámetros de imagen PPS ni el conjunto de parámetros de secuencia SPS correspondientes.
Más exactamente, el flujo Str9 no puede decodificarse desde la mitad cuando el aparato de decodificación de imágenes ha leído en el flujo Str9 desde la mitad bajo la circunstancia en la que el flujo se transmite incesantemente como en un caso de difusión o distribución.
En el caso en que el flujo Str9 se graba en un medio de grabación como una cinta o un disco, el aparato de decodificación de imágenes en primer lugar tiene que leer el conjunto de parámetros PS situado en el encabezamiento del flujo Str9 en el medio de grabación y luego comenzar a leer el flujo Strr9 desde el punto de acceso aleatorio en el intento de comenzar a realizar acceso aleatorio para el flujo Str9. Es decir, que el aparato de decodificación de imágenes tiene que desplazarse a la posición de lectura de los datos desde el encabezamiento del flujo Str9 hasta el punto de acceso aleatorio, y de ese mod, no puede utilizarse un acceso aleatorio inmediato puesto que el tiempo de desplazamiento se convierte en un tiempo de espera para el acceso aleatorio.
En el caso en que el medio de grabación es una cinta, resulta evidente que el tiempo de espera es muy prolongado, y aunque el disco sea capaz de leer a alta velocidad, el tiempo de espera puede prolongarse hasta varios segundos, lo cual no puede ignorarse.
El aparato de decodificación de imágenes puede realizar acceso aleatorio para cada grupo de imagen GOP en el flujo Str8 generado usado el procedimiento de codificación de imágenes según el estándar MPEG-2 usando la cabecera hed en el grupo de imagen GOP y la cabecera hed en cada imagen pic.
Con el uso del procedimiento de codificación de imágenes para generar tal flujo Str8, sin embargo, la velocidad de compresión del flujo Str8 es baja puesto que cada una de las imágenes pic incluida en el grupo de imagen GOP tiene una cabecera hed y muchas de tales cabeceras hed tiene los mismos valores que las otras cabeceras hed. Es decir, el procedimiento de codificación de imágenes para generar un flujo Str8 permite, por una parte, una generación de un flujo Str8 en el que puede realizarse acceso aleatorio, sin embargo, por otra, disminuye la eficiencia de codificación.
Exposición de la invención
Por lo tanto, la presente invención está concebida en vista de las circunstancias anteriores, y un objeto de la presente invención es proporcionar el procedimiento de codificación de imágenes para codificar una imagen de manera que pueda utilizarse un acceso aleatorio inmediato sin reducir la eficiencia de codificación.
Para lograr el objeto anterior, se propone el procedimiento de codificación de imágenes según la presente invención tal como se define en la reivindicación 1. Además, se proponen un aparato de codificación de imágenes tal como se define en la reivindicación 2, un procedimiento de decodificación de imágenes tal como se define en la reivindicación 3, un aparato de decodificación de imágenes tal como se define en la reivindicación 4 y un medio de grabación tal como se define en la reivindicación 5. Además, en la reivindicación 6 se define un procedimiento de grabación.
La presente invención puede realizarse también como un aparato de codificación de imágenes o un programa que usa el procedimiento de codificación de imágenes tal como se describió anteriormente, o incluso como un flujo de bits generado usando el procedimiento de codificación de imágenes.
Breve descripción de los dibujos
La Fig. 1 es un diagrama de bloques que muestra una estructura del aparato de codificación de imágenes convencional.
La Fig. 2 es un diagrama estructural que muestra una estructura del flujo producido por el aparato de codificación de imágenes convencional.
La Fig. 3 es un diagrama estructural que muestra una estructura del flujo según el estándar MPEG-2.
La Fig. 4 es un diagrama de bloques que muestra una estructura del aparato de codificación de imágenes según la primera realización de la presente invención.
La Fig. 5 es un diagrama estructural que muestra la estructura de la señal de imagen codificada producida por el aparato de codificación de imágenes según la primera realización de la presente invención.
La Fig. 6 es un organigrama que muestra el procedimiento de codificación de imágenes según la primera realización de la presente invención.
La Fig. 7 es una ilustración para describir la información producida desde el aparato de codificación de imágenes según la primera realización de la presente invención.
La Fig. 8 es un diagrama estructural que muestra una estructura del flujo Str que incluye información de identificación de estructura según la primera realización de la presente invención.
La Fig. 9 es un diagrama estructural que muestra una estructura del flujo producido por el aparato de codificación de imágenes según una primera variación descrita en la primera realización de la presente invención.
La Fig. 10 es un organigrama que muestra una operación del aparato de codificación de imágenes según la primera variación descrita en la primera realización de la presente invención.
La Fig. 11 es un diagrama estructural que muestra una estructura del flujo producido por el aparato de codificación de imágenes según una segunda variación descrita en la primera realización de la presente invención.
La Fig. 12 es un organigrama que muestra una operación del aparato de codificación de imágenes según la segunda variación descrita en la primera realización.
La Fig. 13 es un diagrama estructural que muestra una estructura del flujo producido por el aparato de codificación de imágenes según una tercera variación de la primera realización.
Las Figs. 14A, 14B y 14C son ilustraciones de un medio de grabación en el que se graba un programa para realizar el procedimiento de codificación de imágenes según la primera realización de la presente invención en un sistema informático, según la segunda realización de la presente invención.
La Fig. 15 es un diagrama de bloques que muestra una estructura completa de un sistema de suministro de contenido para realizar un servicio de distribución de contenido según la tercera realización de la presente invención.
La Fig. 16 es un diagrama que muestra un teléfono móvil según la tercera realización de la presente invención que usa el procedimiento de codificación de imágenes descrito en la primera realización.
La Fig. 17 es un diagrama de bloques que muestra la estructura interna del teléfono móvil según la tercera realización de la presente invención.
La Fig. 18 es un diagrama estructural que muestra la estructura del sistema de difusión digital según la tercera realización de la presente invención.
Mejor modo de llevar a cabo la invención
Lo que viene a continuación describe las realizaciones de la presente invención con referencia a las figuras.
(Primera realización)
La Fig. 4 es un diagrama de bloques que muestra una estructura del aparato de codificación de imágenes según la primera realización de la presente invención.
El aparato de codificación de imágenes 100 según la presente realización codifica una imagen de manera que puede utilizarse un acceso aleatorio inmediato sin reducir la eficiencia de codificación. Más exactamente, el aparato de codificación de imágenes 100 codifica una señal de imagen Vin basándose en imagen por imagen y produce como salida un flujo Str.
El aparato de codificación de imágenes 100 incluye una unidad de estimación de movimiento 103, una unidad de compensación de movimiento 105, un sustractor 106, una unidad de transformación ortogonal 107, una unidad de cuantificación 108, una unidad de cuantificación inversa 110, una unidad de transformación ortogonal inversa 111, un sumador 112, una memoria de imagen 104, un conmutador 113, una unidad de codificación de longitud variable 109, una unidad de determinación de punto de acceso 102 y una memoria de PS 101. Cada uno de los componentes como la unidad de estimación de movimiento 103 ejecuta el siguiente procesamiento por bloque o por macrobloque que constituye una imagen.
El sustractor 106 obtiene una señal de imagen Vin, y también, una imagen predictiva Pre desde la unidad de compensación de movimiento 105, y calcula un diferencial entre la señal de imagen Vin y la imagen predictiva Pre. El sustractor 106 produce luego como salida el valor diferencial para la unidad de transformación ortogonal 107.
La unidad de transformación ortogonal 107 transforma el valor diferencial en coeficientes de frecuencia y los produce como salida hacia la unidad de cuantificación 108.
La unidad de cuantificación 108 cuantifica los coeficientes de frecuencia obtenidos de la unidad de transformación ortogonal 107, y produce como salida los valores cuantificados hacia la unidad de codificación de longitud variable 109.
La unidad de cuantificación inversa 110 restaura los valores cuantificados obtenidos de la unidad de cuantificación 108 en los coeficientes de frecuencia por medio de cuantificación inversa, y los produce como salida hacia la unidad de transformación ortogonal inversa 111.
La unidad de transformación ortogonal inversa 111 realiza transformación de frecuencia inversa sobre los coeficientes de frecuencia producidos desde la unidad de cuantificación inversa 110 para transformarlos en valores diferenciales de píxeles, y los produce como salida hacia el sumador 112.
El sumador 112 suma los valores diferenciales de píxeles producidos desde la unidad de transformación inversa 111 y la imagen predictiva Pre producida desde la unidad de compensación de movimiento 105, para generar una imagen decodificada.
En el caso en que se recibe una instrucción para almacenar la imagen decodificada generada por el sumador 112, el conmutador 113 conecta el sumador 112 y la memoria de imagen 104, y permite que la imagen decodificada generada por el sumador 112 sea almacenada en una memoria de imagen. La imagen decodificada almacenada en la memoria de imagen se denomina simplemente “imagen”.
La unidad de estimación de movimiento 103 obtiene la señal de imagen Vin basándose en macrobloque por macrobloque. La unidad de estimación de movimiento 103, que ha obtenido la señal de imagen Vin, hace referencia a la imagen almacenada en la memoria de imagen 104 como una imagen de referencia, y especifica un área de imagen que más se asemeja a la señal de imagen obtenida Vin dentro de la imagen de referencia. La unidad de estimación de movimiento 103 estima luego un vector de movimiento MV que indica una ubicación del área de imagen.
La unidad de estimación de movimiento 103 estima tal vector de movimiento MV en unidades de bloques, obteniéndose cada uno dividiendo adicionalmente un macrobloque. La unidad de estimación de movimiento 103, entonces, usando números de identificación (índice relativo Idx) para identificar las imágenes de referencia, identifica la imagen de referencia a la que se ha hecho referencia entre candidatos a imagen de referencia plurales, basándose en los números de imagen asignados a cada una de las imágenes almacenadas en la memoria de imagen 104.
La unidad de compensación de movimiento 105 extrae un área de imagen que es la más aplicable para la imagen predictiva Pre de entre las imágenes (imágenes decodificadas) almacenadas en la memoria de imagen 104, usando el vector de movimiento MV estimado en el procesamiento anterior así como el índice relativo Idx. La unidad de compensación de movimiento 105 genera entonces una imagen predictiva Pre usando el área de imagen extraída.
La unidad de determinación de punto de acceso 102 ordena a la unidad de estimación de movimiento 103 y la unidad de compensación de movimiento 105 que codifique (codificación entre imágenes) una imagen predeterminada como imagen especial por unidad predeterminada (es decir, unidad de acceso aleatorio). La unidad de determinación de punto de acceso 102 además produce como salida un identificador de punto de acceso rapp que indica que una imagen es la imagen especial hacia la unidad de codificación de longitud variable 109.
La memoria de PS 101 obtiene el conjunto de parámetros PS y lo almacena temporalmente. La memoria de PS 101 produce luego como salida, basándose en la instrucción procedente de la unidad de determinación de punto de acceso 102, un conjunto de parámetros de imagen y un conjunto de parámetros de secuencia de la imagen indicada en la instrucción desde los conjuntos de parámetros PS almacenados temporalmente hasta la unidad de codificación de longitud variable 109.
La unidad de codificación de longitud variable 109 codifica el conjunto de parámetros PS obtenido de recursos externos, el vector de movimiento MV, los valores cuantificados, el índice relativo Idx y el identificador de punto de acceso rapp. La unidad de codificación de longitud variable 109 genera luego un flujo Str disponiendo para cada unidad de acceso aleatorio el conjunto de parámetros de secuencia así como el conjunto de parámetros de secuencia incluidos en el conjunto de parámetros codificado PS, y produce el flujo Str.
La Fig. 5 es un diagrama estructural que muestra una estructura del flujo Str producido por el aparato de codificación de imágenes 100 según la presente realización.
El flujo Str incluye secuencialmente desde el encabezamiento una señal síncrona sync, un conjunto de parámetros PS y unidades de acceso aleatorio RAU plurales.
El conjunto de parámetros PS incluye conjuntos de parámetros de secuencia SPS plurales y conjuntos de parámetros de imagen PPS plurales.
La unidad de acceso aleatorio RAU incluye secuencialmente desde el encabezamiento una señal síncrona sync, un único conjunto de parámetros de secuencia SPS, conjuntos de parámetros de imagen PPS plurales e imágenes codificadas pic plurales. Concretamente, tal unidad de acceso aleatorio RAU incluye todos los conjuntos de parámetros de secuencia SPS y los conjuntos de parámetros de imagen PPS necesarios para decodificar todas las imágenes pic allí incluidas. Cada uno de los conjuntos de parámetros de imagen PPS tiene un valor diferente y a uno cualquiera de los conjuntos de parámetros de imagen PPS se hace referencia por imágenes pic plurales y se usa para decodificar las imágenes.
La imagen pic incluye secuencialmente desde el encabezamiento una señal síncrona sync, un identificador de conjunto de parámetros PSID y datos de píxeles pix que son una palabra de código para píxeles de la imagen.
El identificador de conjunto de parámetros PSID identifica los conjuntos de parámetros SPS y PPS a los que ha de hacerse referencia por la imagen de entre los conjuntos de parámetros SPS y PPS incluidos en la unidad de acceso aleatorio RAU.
La Fig. 6 es un organigrama que muestra un procedimiento de codificación de imágenes del aparato de codificación de imágenes 100 según la presente realización.
El aparato de codificación de imágenes 100 en primer lugar evalúa si una imagen actual que ha de ser codificada es o no un punto de acceso aleatorio, concretamente, la primera imagen en la unidad de acceso aleatorio RAU (Etapa S100).
Cuando se evalúa que la imagen actual es un punto de acceso aleatorio (Y en la Etapa S100), el aparato de codificación de imágenes 100 codifica el conjunto de parámetros de secuencia SPS (Etapa S102) y además codifica cada conjunto de parámetros de imagen PPS para todas las imágenes de la unidad de acceso aleatorio RAU (Etapa S103). El aparato de codificación de imágenes 100 coloca luego el conjunto de parámetros de secuencia SPS codificado y los conjuntos de parámetros de imagen PPS plurales juntos en el lado de encabezamiento de la unidad de acceso aleatorio RAU (Etapa S104).
El aparato de codificación de imágenes 100 codifica la imagen actual (Etapa S106) bien después de colocar el conjunto de parámetros de secuencia SPS y los conjuntos de parámetros de imagen PPS en la Etapa S104 o bien cuando se evalúa que la imagen actual no es un punto de acceso aleatorio (N en la Etapa S100). El aparato de codificación de imágenes 100 coloca la imagen actual codificada después del conjunto de parámetros de secuencia SPS y los conjuntos de parámetros de imagen PPS mencionados anteriormente. Concretamente, cuando los conjuntos de parámetros SPS, PPS mencionados anteriormente se disponen en la Etapa S104, el aparato de codificación de imágenes 100 coloca los conjuntos de parámetros SPS, PPS antes de cualquiera de las imágenes pic en la unidad de acceso aleatorio RAU. Al codificar la imagen actual, el aparato de codificación de imágenes 100 coloca el identificador de conjunto de parámetros PSID que indica el conjunto de parámetros de imagen PPS necesario para decodificar la imagen pic antes de la palabra de código para los píxeles de la imagen (es decir, los datos de píxeles pix) dentro de la imagen actual codificada (es decir, la imagen pic).
Después de eso, el aparato de codificación de imágenes 100 evalúa si se encuentra o no alguna imagen sin codificar en la señal de imagen Vin obtenida (Etapa S108). Cuando se evalúa que se encuentra una imagen sin codificar (Y en la Etapa S108), el aparato de codificación de imágenes 100 ejecuta repetidamente la operación comenzando desde la Etapa S100. Cuando se evalúa que no se encuentran imágenes sin codificar, concretamente, cuando se evalúa que todas las imágenes están codificadas (N en la Etapa S108), el aparato de codificación de imágenes 100 termina el procesamiento de codificación. El flujo Str se genera usando el procedimiento de codificación de imágenes tal como se describió anteriormente.
De este modo, en el procedimiento de codificación de imágenes según la presente realización, el flujo Str se genera de tal manera que el conjunto de parámetros de secuencia SPS y los conjuntos de parámetros de imagen PPS necesarios para decodificar (codificar) todas las imágenes incluidas en la unidad de acceso aleatorio RAU se colocan en la unidad de acceso aleatorio RAU. Por lo tanto, el aparato de decodificación de imágenes puede comenzar a decodificar correctamente, concretamente, puede comenzar a realizar acceso aleatorio, haciendo referencia al conjunto de parámetros de secuencia SPS y los conjuntos de parámetros de imagen PPS incluidos en el encabezamiento de la unidad de acceso aleatorio RAU en el flujo obtenido Str, incluso cuando el flujo Str se obtiene en el medio. El aparato de codificación de imágenes tampoco tiene que desplazarse a una posición de lectura de los datos, desde el encabezamiento del flujo Str hasta el punto de acceso aleatorio, y de ese modo, puede comenzar a realizar acceso aleatorio rápidamente omitiendo el tiempo de espera para el acceso aleatorio, incluso cuando el acceso aleatorio se realiza leyendo el flujo Str del medio de grabación.
En el procedimiento de codificación de imágenes según la presente realización, se genera el flujo Str, en el que el conjunto de parámetros de secuencia SPS y los conjuntos de parámetros de imagen PPS están incluidos en cada unidad de acceso aleatorio RAU, por lo tanto, se genera un flujo cuya cantidad de bits es mayor que la del flujo Str9 generado usando el procedimiento de codificación de imágenes convencional. Sin embargo, una cabecera necesaria para decodificación no se coloca por imagen como en el procedimiento de codificación de imágenes convencional según el estándar MPEG-2. Por lo tanto, la eficiencia de codificación puede mejorarse más con el presente procedimiento de codificación de imágenes comparado con el procedimiento de codificación de imágenes convencional según el estándar MPEG-2.
El aparato de codificación de imágenes 100 según la presente realización puede generar información de identificación de estructura que indica una estructura del flujo Str.
La Fig. 7 es una ilustración para explicar la información producida desde el aparato de codificación de imágenes 100.
Como se muestra en la Fig. 7, el aparato de codificación de imágenes 100 genera información de identificación de estructura sid como un anexo al flujo Str y la produce como salida.
La información de identificación de estructura sid indica que el conjunto de parámetros de secuencia SPS y los conjuntos de parámetros de imagen PPS están incluidos en todas las unidades de acceso aleatorio RAU del flujo Str. Es decir, que es posible realizar acceso aleatorio desde una unidad de acceso aleatorio RAU arbitraria del flujo Str.
El aparato de decodificación de imágenes, que ha obtenido el flujo Str y la información de identificación de estructura sid, puede comprender fácilmente que el flujo obtenido Str puede decodificarse desde una unidad de acceso aleatorio RAU arbitraria basándose en la información de identificación de estructura sid y realizar acceso aleatorio por el hecho de que el aparato de decodificación de imágenes adjunta tal información de identificación de estructura sid al flujo Str y la produce como salida.
El aparato de codificación de imágenes 100 puede incluir la información de identificación de estructura sid en el flujo Str y producirla como salida.
La Fig. 8 es un diagrama estructural que muestra una estructura del flujo Str que incluye la información de identificación de estructura sid.
Como se muestra en la Fig. 8, el aparato de codificación de imágenes 100 genera un flujo Str de tal manera que la información de identificación de estructura sid se coloca entre una señal síncrona sync y un conjunto de parámetros PS.
(Variación 1)
Lo que viene a continuación describe la primera variación del aparato de codificación de imágenes según la presente realización descrita anteriormente.
El aparato de codificación de imágenes según la primera variación produce un flujo en el que una colocación del conjunto de parámetros de imagen PPS es diferente del flujo Str producido por el aparato de codificación de imágenes 100, según la presente realización, descrito anteriormente.
La Fig. 9 es un diagrama estructural que muestra una estructura del flujo producido por el aparato de codificación de imágenes según la presente variación.
El aparato de codificación de imágenes según la presente variación produce un flujo Str1 que incluye secuencialmente desde el encabezamiento una señal síncrona sync, un conjunto de parámetros PS y unidades de acceso aleatorio RAU1 plurales.
La unidad de acceso aleatorio RAU1 incluye secuencialmente desde el encabezamiento una señal síncrona sync, un conjunto de parámetros de secuencia SPS, un conjunto de parámetros de imagen PPS (PPS1) y dos imágenes pic1, pic2, un conjunto de parámetros de imagen PPS (PPS2) y una imagen pic3.
Al conjunto de parámetros de imagen PPS1 que es necesario para decodificar las dos imágenes pic1 y pic2 se hace referencia por estas imágenes en común. Al conjunto de parámetros de imagen PPS2 que es innecesario para decodificar las imágenes pic1 y pic2 no se hace referencia por estas imágenes. Es decir, al conjunto de parámetros de imagen PPS2 que necesario para decodificar la imagen pic3 se hace referencia por la imagen pic3.
El conjunto de parámetros de imagen PPS2, al que se hace referencia por la imagen pic3 pero no por las imágenes pic1 y pic2, no tiene que estar colocado antes de las imágenes pic1 y pic2.
El conjunto de parámetros PPS1, al que se hace referencia por las imágenes pic1 y pic2, ya está colocado inmediatamente antes de la imagen pic1, por lo tanto, no tiene que ser colocado de nuevo inmediatamente antes de la imagen pic2.
Concretamente, el aparato de codificación de imágenes según la presente variación genera un flujo Str1 de manera que el conjunto de parámetros de imagen PPS al que se hace referencia por una imagen predeterminada está colocado inmediatamente antes de la imagen predeterminada excepto para el caso en que ya está colocado.
La Fig. 10 es un organigrama que muestra el procedimiento de codificación de imágenes empleado por el aparato de codificación de imágenes según la presente variación.
El aparato de codificación de imágenes en primer lugar evalúa si una imagen que ha de ser codificada es o no un punto de acceso aleatorio, es decir, la primera imagen en la unidad de acceso aleatorio RAU1 (Etapa S200).
Cuando se evalúa que la imagen actual es un punto de acceso aleatorio (Y en la Etapa S200), el aparato de codificación de imágenes codifica un conjunto de parámetros de secuencia SPS (Etapa S202) y lo coloca en el lado de encabezamiento de la unidad de acceso aleatorio RAU1 (Etapa S203). El aparato de codificación de imágenes además codifica un conjunto de parámetros de imagen PPS de la imagen actual (Etapa S204) y lo coloca después del conjunto de parámetros de secuencia SPS en la unidad de acceso aleatorio RAU1 (Etapa S205).
Cuando se evalúa que la imagen actual no es un punto de acceso aleatorio (N en la Etapa S200), el aparato de codificación de imágenes además evalúa si el conjunto de parámetros de imagen PPS de la imagen actual ya está o no codificado y colocado después del punto de acceso aleatorio (Etapa S206).
Cuando se evalúa en la Etapa S206 que el conjunto de parámetros de imagen PPS de la imagen actual no está codificado (N en la Etapa S206), el aparato de codificación de imagen codifica el conjunto de parámetros de imagen PPS de la imagen actual y lo coloca (Etapas S204 y S205).
O bien después de la colocación del conjunto de parámetros de imagen PPS de la imagen actual realizada en la Etapa S205 o cuando se evalúa en la Etapa 206 que el conjunto de parámetros de imagen PPS de la imagen actual ya está codificado (Y en la Etapa S206), el aparato de codificación de imágenes codifica la imagen actual (Etapa S208). El aparato de codificación de imágenes coloca la imagen actual codificada (es decir, la imagen pic) inmediatamente después del conjunto de parámetros de imagen PPS correspondiente cuando se codifica la imagen actual después de la colocación del conjunto de parámetros de imagen PPS realizada en la Etapa S205. Concretamente, el aparato de codificación de imágenes 100 coloca el conjunto de parámetros de imagen PPS inmediatamente antes de la imagen actual codificada (es decir, la imagen pic) en la unidad de acceso aleatorio RAU en la colocación del conjunto de parámetros de imagen PPS realizada en la etapa S205. Al codificar la imagen actual, el aparato de codificación de imágenes coloca un identificador de conjunto de parámetros PSID, que indica un conjunto de parámetros de imagen necesario para decodificar la imagen pic, antes de la palabra de código para los píxeles de la imagen (es decir, los datos de píxeles pix) en la imagen actual codificada (es decir, la imagen pic).
Después, el aparato de codificación de imágenes evalúa si se encuentra o no alguna imagen sin codificar en la señal de imagen Vin obtenida (Etapa S210). Cuando se evalúa que se encuentra una imagen sin codificar (Y en la Etapa S210), el aparato de codificación de imágenes utiliza repetidamente la operación comenzando desde la Etapa S200, y cuando se evalúa que no se encuentran imágenes sin codificar, lo que significa que todas las imágenes están codificadas (N en la Etapa S210), el aparato de codificación de imágenes termina el procesamiento de codificación. El flujo Str1 se genera usando el procedimiento de codificación de imágenes tal como se describió anteriormente.
Bajo el procedimiento de codificación de imágenes empleado por el aparato de codificación de imágenes 100 descrito anteriormente, como es después de la determinación, por unidad de acceso aleatorio RAU, de todos los conjuntos de parámetros de imagen PPS necesarios para decodificar cada imagen que estos conjuntos de parámetros de imagen PPS son codificados en un grupo y colocados en el encabezamiento de la unidad de acceso aleatorio RAU, es necesario almacenar temporalmente los parámetros de imagen PPS plurales determinados.
Por el contrario, bajo el procedimiento de codificación de imágenes según la presente variación, como los conjuntos de parámetros de imagen PPS necesarios para decodificar las imágenes se determinan secuencialmente por unidad de acceso aleatorio RAU1 y los conjuntos de parámetros de imagen PPS son codificados y luego colocados en una unidad de acceso aleatorio, no es necesario almacenar los conjuntos de parámetros de imagen PPS como se mencionó anteriormente. Por lo tanto, la estructura del aparato de codificación de imágenes según la presente variación puede ser más simplificada que la del aparato de codificación de imágenes 100.
En la presente realización y variación, el conjunto de parámetros de secuencia SPS puede modificarse usando una unidad superior a la unidad de acceso aleatorio RAU, por lo tanto, es suficiente colocar la unidad de acceso aleatorio RAU por una vez.
(Variación 2)
Lo que viene a continuación describe la segunda variación del aparato de codificación de imágenes según la presente realización.
El aparato de codificación de imágenes según la segunda variación produce un flujo en el que una colocación del conjunto de parámetros de secuencia SPS es diferente de la colocación en el flujo producido por el aparato de codificación de imágenes 100 según la presente realización descrito anteriormente.
La Fig. 11 es un diagrama estructural que muestra una estructura del flujo producido por el aparato de codificación de imágenes según la presente variación.
El aparato de codificación de imágenes según la presente variación produce un flujo Str2 que incluye secuencialmente desde el encabezamiento una señal síncrona sync, un conjunto de parámetros PS y grupos de unidades de acceso aleatorio GRAU plurales.
El grupo de unidades de acceso aleatorio GRAU incluye secuencialmente desde el encabezamiento un conjunto de parámetros de secuencia SPS y unidades de acceso aleatorio RAU2 plurales. Concretamente, el grupo de unidades de acceso aleatorio GRAU está construido como una unidad de que reúne unidades de acceso aleatorio RAU2 plurales por conveniencia de almacenamiento y transmisión.
El conjunto de parámetros de secuencia SPS es un parámetro que puede modificarse usando una unidad superior a la unidad de acceso aleatorio RAU2. Por lo tanto, la modificación no tiene que hacerse necesariamente para cada unidad de acceso aleatorio RAU2. Normalmente, únicamente se requieren varios conjuntos de parámetros de secuencia SPS en el flujo, y en muchos casos, únicamente es suficiente un conjunto de parámetros de secuencia.
El aparato de codificación de imágenes según la presente variación no coloca un conjunto de parámetros de secuencia SPS para cada unidad de acceso aleatorio RAU2, sino para cada grupo de unidades de acceso aleatorio GRAU, es decir, para colocar un solo conjunto de parámetros de secuencia SPS en el encabezamiento de cada grupo de unidades de acceso aleatorio GRAU.
El grupo de unidades de acceso aleatorio GRAU incluye un conjunto de parámetros de secuencia SPS y un conjunto de parámetros de imagen PPS que son necesarios para decodificar todas las imágenes incluidas en él, por lo tanto, el grupo de unidades de acceso aleatorio GRAU es identificable como la unidad de acceso aleatorio RAU o RAU1 según la realización y la variación 1 descritas anteriormente. La RAU2 incluida en tal grupo de unidades de acceso aleatorio GRAU puede considerarse como una subunidad obtenida dividiendo el grupo de unidades de acceso aleatorio GRAU.
La Fig. 12 es un organigrama que muestra una operación del aparato de codificación de imágenes según la presente variación.
El aparato de codificación de imágenes en primer lugar evalúa si una imagen actual que ha de ser codificada es o no la primera imagen incluida en el grupo de unidades de acceso aleatorio GRAU (Etapa S300).
Cuando se evalúa la imagen actual es la primera imagen (Y en la Etapa S300), el aparato de codificación de imágenes
codifica un conjunto de parámetros de secuencia SPS (Etapa S302) y lo coloca en el lado de encabezamiento del grupo de unidades de acceso aleatorio GRAU (Etapa S303). El aparato de codificación de imágenes además codifica el conjunto de parámetros de imagen PPS de la imagen actual (Etapa S304) y lo coloca en el lado de encabezamiento de la unidad de acceso aleatorio RAU2 (Etapa S305).
Cuando se evalúa que la imagen actual no es la primera imagen incluida en el grupo de unidades de acceso aleatorio GRAU (N en la Etapa S300), el aparato de codificación de imágenes además evalúa si el conjunto de parámetros de imagen PPS de la imagen actual ya está o no codificado y colocado después del punto de acceso aleatorio (es decir, un encabezamiento de la unidad de acceso aleatorio RAU2) (Etapa S306).
Cuando se evalúa en la Etapa S306 que el conjunto de parámetros de imagen PPS de la imagen actual no está codificado (N en la Etapa S306), el aparato de codificación de imagen codifica el conjunto de parámetros de imagen PPS de la imagen actual y lo coloca (Etapas S304 y S305).
O bien después de la colocación del conjunto de parámetros de imagen PPS realizada en la Etapa S305 o cuando se evalúa en la Etapa S306 que el conjunto de parámetros de imagen PPS de la imagen actual ya está codificado (N en la Etapa S306), el aparato de codificación de imágenes codifica la imagen actual (Etapa S308).
El aparato de codificación de imágenes evalúa luego si se encuentra o no alguna imagen sin codificar en la señal de imagen Vin obtenida (Etapa S310). Cuando se evalúa que se encuentra una imagen sin codificar (Y en la Etapa S310), el aparato de codificación de imágenes ejecuta repetidamente la operación comenzando desde la Etapa S300. Cuando se evalúa que no se encuentran imágenes sin codificar (N en la Etapa S310), el aparato de codificación de imágenes termina el procesamiento de codificación. El flujo Str2 en el que sólo está incluido un conjunto de parámetros de secuencia SPS en cada grupo de unidades de acceso aleatorio GRAU se genera usando el procedimiento de codificación de imágenes tal como se describió anteriormente.
De este modo, el aparato de codificación de imágenes según la presente variación genera el flujo Str2 en el que se coloca un único conjunto de parámetros de secuencia SPS para unidades de acceso aleatorio RAU2 plurales. Por lo tanto, la cantidad de bits incluidos en el flujo Str2 puede reducirse más que la cantidad de bits incluidos en el flujo Str generado por el aparato de codificación de imágenes 100 descrito anteriormente.
En las variaciones 1 y 2 descritas en la presente realización, un conjunto de parámetros codificado PS (es decir, PPSs y SPSs) se coloca en el lado de encabezamiento del flujo, sin embargo, puede no colocarse como tal puesto que se coloca, cuando sea necesario, en cada unidad de acceso aleatorio RAU.
(Variación 3)
Lo que viene a continuación describe la tercera variación del aparato de codificación de imágenes según la presente realización descrito anteriormente.
El aparato de codificación de imágenes según la tercera variación genera y produce un flujo diferente del flujo producido por el aparato de codificación de imágenes 100 según la presente realización descrito anteriormente.
La Fig. 13 es un diagrama estructural que muestra una estructura del flujo producido por el aparato de codificación de imágenes según la presente variación.
El aparato de codificación de imágenes según la presente variación produce un flujo Str3 que incluye secuencialmente desde el encabezamiento una señal síncrona sync y unidades de acceso aleatorio RAU plurales (RAU0, RAU01, RAU02,...).
La unidad de acceso aleatorio RAU01 incluye secuencialmente desde el encabezamiento una señal síncrona sync, un conjunto de parámetros PS (PS1), imágenes pic1, pic2 y pic3. La unidad de acceso aleatorio RAU2 incluye secuencialmente desde el encabezamiento una señal síncrona sync, información de punto de acceso aleatorio RPS, un conjunto de parámetros PS (PS2), imágenes pic4, pic5 y pic6.
Por ejemplo, la imagen pic1 es una imagen I que se codifica entre imágenes mientras que la imagen pic2 es una imagen P que se codifica con referencia a la imagen pic1. La imagen pic3 es una imagen B que se codifica con referencia a las imágenes pic1 y pic2. La imagen pic4 es una imagen I que se codifica entre imágenes mientras que la imagen pic5 es una imagen B que se codifica con referencia a las imágenes pic2 y pic4. La imagen pic6 es una imagen B que se codifica con referencia a la imagen pic4 y otras imágenes de la unidad de acceso aleatorio RAU02.
El conjunto de parámetros PS1 incluye un conjunto de parámetros de secuencia, conjuntos de parámetros de imagen
para las imágenes pic2 y pic3 y un conjunto de parámetros de imagen para la imagen pic5 que está incluida en la unidad de acceso aleatorio RAU02.
Concretamente, la imagen pic2 se decodifica con referencia al conjunto de parámetros PS1 y la imagen pic 1 mientras que la imagen pic3 se decodifica con referencia al conjunto de parámetros PS1 y las imágenes pic1 y pic2, cuando el acceso aleatorio se realiza sobre el flujo Str3 comenzando desde la unidad de acceso aleatorio RAU01. Después, la imagen pic5 incluida en la unidad de acceso aleatorio RAU02 se decodifica con referencia al conjunto de parámetros PS1 y las imágenes pic2 y pic4 mientras que la imagen pic6 se decodifica con referencia al conjunto de parámetros PS2, la imagen pic4 y otras imágenes incluidas en la unidad de acceso aleatorio RAU02.
Cuando se realiza acceso aleatorio sobre el flujo Str3 comenzando desde la unidad de acceso aleatorio RAU02, la imagen pic5 ni se decodifica ni se visualiza mientras que las imágenes pic4 y pic6 se descodifican secuencialmente y luego se visualizan.
Concretamente, no hay necesidad de colocar el conjunto de parámetros de imagen necesario para la imagen pic5 en la unidad de acceso aleatorio RAU02 puesto que la decodificación de la imagen pic5, una imagen B, incluida en la unidad de acceso aleatorio RAU02 tiene que hacer referencia a las imágenes incluidas en la unidad de acceso aleatorio RAU01 previa. Incluso cuando se realiza acceso aleatorio sobre el flujo Str3 comenzando desde la unidad de acceso aleatorio RAU02, la imagen pic5 no se decodifica. Por lo tanto, no hay necesidad de colocar, en la unidad de acceso aleatorio RAU02, el conjunto de parámetros de imagen necesario para la imagen pic5, como se describió anteriormente.
En las variaciones 1-3 de la presente realización descritas anteriormente, se incluye un identificador de conjunto de parámetros PSID en el flujo basándose en imagen por imagen. Sin embargo, cuando la imagen está compuesta de franjas plurales, puede incluirse un identificador de conjunto de parámetros PSID basándose en franja por franja.
La unidad de acceso aleatorio mostrada en la realización y las variaciones 1-3 descritas anteriormente no tiene que ser necesariamente un grupo de imágenes que incluyan una imagen del tipo especial definido por el estándar JVT. Puede ser un grupo de imágenes que incluya simplemente una imagen codificada entre imágenes (imagen I) en el encabezamiento debido al hecho de que se coloca un conjunto de parámetros PS para cada unidad de acceso aleatorio RAU según sea necesario.
Además, en la realización y las variaciones 1-3 descritas anteriormente, un único conjunto de parámetros de secuencia SPS y conjuntos de parámetros de imagen PPS plurales que son diferentes entre sí son codificados una vez y colocados para cada unidad de acceso aleatorio RAU o cada grupo de unidades de acceso aleatorio GRAU. Sin embargo, realizando codificación sobre estos conjuntos de parámetros varias veces, puede colocarse una pluralidad de los mismos conjuntos de parámetros de secuencia SPS codificados y una pluralidad los mismos conjuntos de parámetros de imagen PPS codificados para cada unidad de acceso aleatorio RAU o cada grupo de unidades de acceso aleatorio GRAU. Por consiguiente, pueden prevenirse errores, por ejemplo, en el momento de la decodificación.
(Segunda realización)
Además, el procesamiento ilustrado en la realización anterior puede llevarse a cabo fácilmente en un sistema informático independiente grabando un programa para realizar el procedimiento de codificación de imágenes descrito en la realización anterior sobre un medio de grabación como un disco flexible o similar.
Las Figs. 14A, 14B y 14C son ilustraciones de un medio de grabación, en el que está grabado un programa para llevar a cabo el procedimiento de codificación de imágenes descrito en la primera realización en el sistema informático.
La Fig. 14B muestra un aspecto completo de un disco flexible FD, su estructura en sección trasversal y un aspecto completo del propio disco FD1 como un cuerpo principal de un medio de grabación mientras que la Fig. 14A muestra un ejemplo de un formato físico del disco flexible FD1.
El disco FD1 está contenido en una caja F con una pluralidad de pistas Tr formadas concéntricamente desde la periferia hasta el interior sobre la superficie del disco FD1, y cada pista está dividida en 16 sectores Se en la dirección angular. De este modo, el procedimiento de codificación de imágenes tal como el programa mencionado anteriormente se graba en un área asignada para ello sobre el disco FD1.
La Fig. 14C muestra una estructura para grabar y leer el programa sobre el disco flexible FD.
Cuando el programa se graba sobre el disco flexible FD, el sistema informático Cs escribe en el procedimiento de codificación de imágenes tal como el programa mencionado anteriormente por medio de una unidad de disco flexible FDD. Cuando el procedimiento de codificación de imágenes se construye en el sistema informático Cs usando el
programa del disco flexible FD, el programa se lee del disco flexible FD y luego se transfiere al sistema informático Cs por la unidad de disco flexible FDD.
En la explicación anterior, el disco flexible FD se usa como ejemplo de un medio de grabación, pero también puede realizarse el mismo procedimiento usando un disco óptico. Además, el medio de grabación no está limitado a estos mencionados anteriormente, sino que puede emplearse cualquier otro medio capaz de grabar un programa como una tarjeta de circuito integrado y una casete de ROM.
(Tercera realización)
Lo que viene a continuación es una descripción para la aplicación del procedimiento de codificación de imágenes ilustrado en la realización anteriormente mencionada y un sistema que usa el procedimiento.
La Fig. 15 es un diagrama de bloques que muestra una configuración general de un sistema de suministro de contenido ex100 para realizar servicio de distribución de contenido. El área para proporcionar servicio de comunicación está dividida en células del tamaño deseado, y las estaciones base ex107-ex110, que son estaciones inalámbricas fijas, están colocadas en células respectivas.
Este sistema de suministro de contenido ex100 está conectado a aparatos como un ordenador ex111, un asistente digital personal (PDA) ex112, una cámara ex113, un teléfono móvil ex114 y un teléfono móvil con una cámara ex115 a través, por ejemplo, de Internet ex101, un proveedor de servicios de Internet ex102, una red telefónica ex104, así como las estaciones base ex107-ex110.
Sin embargo, el sistema de suministro de contenido ex100 no está limitado a la configuración mostrada en la Fig. 15 y puede estar conectado a una combinación de cualquiera de ellos. Además, cada aparato puede estar conectado directamente a la red telefónica ex104, no a través de las estaciones base ex107-ex110.
La cámara ex113 es un aparato capaz de tomar vídeo como una videocámara digital. El teléfono móvil ex114 puede ser un teléfono móvil de cualquiera de los siguientes sistemas: un sistema de Comunicaciones Digitales Personales (PDC), un sistema de Acceso Múltiple por División de Código (CDMA), un sistema de Acceso Múltiple por División de Código de Banda Ancha (W-CDMA) o un sistema de Sistema Global para Comunicaciones Móviles (GSM), un Sistema de Teléfono de mano Personal (PHS) o similar.
Un servidor de descarga y reproducción en tiempo real ex103 está conectado a la cámara ex113 a través de la red telefónica ex104 y también la estación base ex109, que realiza una distribución en directo o similar usando la cámara ex113 basándose en los datos codificados transmitidos desde el usuario. Puede codificar los datos cualquiera de la cámara ex113, el servidor que transmite los datos y similares. Los datos de imágenes en movimiento tomados por una cámara ex116 pueden transmitirse al servidor de descarga y reproducción en tiempo real ex103 a través del ordenador ex111. En este caso, la cámara ex116 o el ordenador ex111 pueden codificar los datos de imágenes en movimiento. Un LSI ex117 incluido en el ordenador ex111 y la cámara ex116 realiza el procesamiento de codificación. El software para codificar y decodificar imágenes puede estar integrado en cualquier tipo de medio de grabación (como un CD-ROM, un disco flexible y un disco duro) que sea un medio de grabación que sea legible por el ordenador ex111 o similar. Además, un teléfono móvil con una cámara ex115 puede transmitir los datos de imágenes en movimiento. Estos datos de imágenes en movimiento son los datos codificados por el LSI incluido en el teléfono móvil ex115.
El sistema de suministro de contenido ex100 codifica contenidos (como un vídeo de música en directo) tomados por un usuario que usa la cámara ex113, la cámara ex116 o similar de la misma manera que la mostrada en la realización anteriormente mencionada y los transmite al servidor de descarga y reproducción en tiempo real ex103, mientras el servidor de descarga y reproducción en tiempo real ex103 realiza distribución de flujo de los datos de contenido a los clientes cuando lo solicitan. Los clientes incluyen el ordenador ex111, el PDA ex112, la cámara ex113, el teléfono móvil ex114, etcétera, capaces de decodificar los datos codificados anteriormente mencionados. En el sistema de suministro de contenido ex100, los clientes pueden así recibir y reproducir los datos codificados, y además pueden recibir, decodificar y reproducir los datos en tiempo real para realizar difusión personal.
Cuando cada aparato del sistema realiza codificación o decodificación, pueden usarse el aparato de codificación de imágenes o el aparato de decodificación de imágenes mostrados en la realización anteriormente mencionada.
Se explicará un teléfono móvil como ejemplo de tal aparato.
La Fig. 16 es un diagrama que muestra el teléfono móvil ex115 que usa el procedimiento de codificación de imágenes explicado en la realización anteriormente mencionada. El teléfono móvil ex115 tiene una antena ex201 para comunicarse con la estación base ex110 por medio de ondas de radio, una unidad de cámara ex203 como una cámara CCD capaz de tomar imágenes en movimiento y fijas, una unidad de visualización ex202 como una pantalla de cristal líquido para visualizar los datos como imágenes decodificadas y similares tomadas por la unidad de cámara ex203 o recibidas por la antena ex201, una unidad de cuerpo que incluye un conjunto de teclas de operación ex204, una unidad de salida de voz ex208 como un altavoz para producir voz, una unidad de entrada de voz ex205 como un micrófono para introducir voz, un medio de grabación ex207 para grabar datos codificados o decodificados como datos de imágenes en movimiento o fijas tomadas por la cámara, datos de correos electrónicos recibidos y de imágenes en movimiento o fijas, y una unidad de ranura ex206 para acoplar el medio de grabación ex207 al teléfono móvil ex115. El medio de grabación ex207 guarda en sí mismo un elemento de memoria flash, una clase de Memoria de Sólo Lectura Borrable y Programable Eléctricamente (EEPROM) que es una memoria no volátil borrable eléctricamente de y regrabable en una caja de plástico como una tarjeta SD.
A continuación se explicará el teléfono móvil ex115 con referencia a la Fig. 17. En el teléfono móvil ex115, una unidad de control principal ex311, diseñada para control general de cada unidad del cuerpo principal que contiene la unidad de visualización ex202 así como las teclas de operación ex204, está conectada mutuamente a una unidad de circuito de suministro de energía ex310, una unidad de control de entrada de operación ex304, una unidad de codificación de imágenes ex312, una unidad de interfaz de cámara ex303, una unidad de control de pantalla de cristal líquido (LCD) ex302, una unidad de decodificación de imágenes ex309, una unidad de multiplexación/demultiplexación ex308, una unidad de lectura/escritura ex307, una unidad de circuito de módem ex306 y una unidad de procesamiento de voz ex305 a través de un bus síncrono ex313.
Cuando una tecla de fin de llamada o una tecla de encendido es activada por la acción de un usuario, la unidad de circuito de suministro de energía ex310 suministra a las unidades respectivas energía procedente de un paquete de baterías para activar el teléfono móvil digital con una cámara ex115 como estado preparado.
En el teléfono móvil ex115, la unidad de procesamiento de voz ex305 convierte las señales de voz recibidas por la unidad de entrada de voz ex205 en modo de conversación en datos de voz digitales bajo el control de la unidad de control principal ex311 que incluye una CPU, ROM y RAM, la unidad de circuito de módem ex306 realiza procesamiento de espectro ensanchado para los datos de voz digitales, y la unidad de circuito de comunicación ex301 realiza conversión digital a analógica y conversión de frecuencia para los datos, para transmitirlos a través de la antena ex201. Además, en el teléfono móvil ex115, la unidad de circuito de comunicación ex301 amplifica los datos recibidos por la antena ex201 en modo de conversación y realiza conversión de frecuencia y la conversión analógica a digital en los datos, la unidad de circuito de módem ex306 realiza procesamiento inverso de espectro ensanchado de los datos, y la unidad de procesamiento de voz ex305 los convierte en datos de voz analógicos para producirlos como salida a través de la unidad de salida de voz ex208.
Además, cuando se transmite un correo electrónico en modo de comunicación de datos, los datos de texto del correo electrónico introducidos utilizando las teclas de operación ex204 del cuerpo principal son enviados a la unidad de control principal ex311 a través de la unidad de control de entrada de operación ex304. En la unidad de control principal ex311, después de que la unidad de circuito de módem ex306 realiza procesamiento de espectro ensanchado de los datos de texto y la unidad de circuito de comunicación ex301 realiza la conversión digital a analógica y la conversión de frecuencia para los datos de texto, los datos se transmiten a la estación base ex110 a través de la antena ex201.
Cuando los datos de imagen se transmiten en modo de comunicación de datos, los datos de imagen tomados por la unidad de cámara ex203 se suministran a la unidad de codificación de imágenes ex312 a través de la unidad de interfaz de cámara ex303. Cuando no se transmiten, también es posible visualizar los datos de imagen tomados por la unidad de cámara ex203 directamente en la unidad de visualización ex202 a través de la unidad de interfaz de cámara ex203 y la unidad de control de LCD ex302.
La unidad de codificación de imágenes ex312, que incluye el aparato de codificación de imágenes tal como se describe para la presente invención, comprime y codifica los datos de imagen suministrados desde la unidad de cámara ex203 usando el procedimiento de codificación empleado por el aparato de codificación de imágenes tal como se muestra en la realización mencionada anteriormente para transformarlos en datos de imagen codificados, y los envía a la unidad de multiplexación/demultiplexación ex308. En este momento, el teléfono móvil ex115 envía la voz recibida por la unidad de entrada de voz ex205 durante la toma con la unidad de cámara ex203 a la unidad de multiplexación/demultiplexación ex302 como datos de voz digitales a través de la unidad de procesamiento de voz ex305.
La unidad de multiplexación/demultiplexación ex308 multiplexa los datos de imagen codificados suministrados desde la unidad de codificación de imágenes ex312 y los datos de voz suministrados desde la unidad de procesamiento de voz ex305, usando un procedimiento predeterminado, luego la unidad de circuito de módem ex306 realiza procesamiento de espectro ensanchado de los datos multiplexados obtenidos como resultado de la multiplexación, y por último la unidad de circuito de comunicación ex301 realiza conversión digital a analógica y transformación de frecuencia de los datos para la transmisión a través de la antena ex201.
En cuanto a la recepción de datos de un archivo de imágenes en movimiento que está enlazado a una página Web o similar en modo de comunicación de datos, la unidad de circuito de módem ex306 realiza procesamiento inverso de espectro ensanchado para los datos recibidos desde la estación base ex110 a través de la antena ex201, y envía los datos multiplexados obtenidos como resultado del procesamiento inverso de espectro ensanchado.
Para decodificar los datos multiplexados recibidos a través de la antena ex201, la unidad de multiplexación/demultiplexación ex308 demultiplexa los datos multiplexados en un flujo de bits de datos de imagen y de datos de voz, y suministra los datos de imagen codificados a la unidad de decodificación de imágenes ex309 y los datos de voz a la unidad de procesamiento de voz ex305, respectivamente a través del bus síncrono ex313.
A continuación, la unidad de decodificación de imágenes ex309, que incluye el aparato de decodificación de imágenes tal como se describe para la presente invención, decodifica el flujo de bits de los datos de imagen usando el procedimiento de decodificación que corresponde al procedimiento de codificación tal como se muestra en las realizaciones anteriormente mencionadas para generar datos de imágenes en movimiento reproducidos, y suministra estos datos a la unidad de visualización ex202 a través de unidad de control de LCD ex302, y de este modo se visualizan los datos de imagen incluidos en el archivo de imágenes en movimiento enlazado a una página Web, por ejemplo. Al mismo tiempo, la unidad de procesamiento de voz ex305 convierte los datos de voz en datos de voz analógicos, y suministra estos datos a la unidad de salida de voz ex208, y de este modo se reproducen los datos de voz incluidos en el archivo de imágenes en movimiento enlazado a una página Web, por ejemplo.
La presente invención no está limitada al sistema anteriormente mencionado puesto que, recientemente, la difusión digital basada en tierra o por satélite ha sido noticia y al menos el aparato de codificación de imágenes o el aparato de decodificación de imágenes descritos en la realización anteriormente mencionada pueden incorporarse a un sistema de difusión digital tal como se muestra en la Fig. 18. Más específicamente, un flujo de bits de información de vídeo se transmite desde una estación de difusión ex409 a o se comunica con un satélite de difusión ex410 a través de ondas de radio. En el momento de su recepción, el satélite de difusión ex410 transmite ondas de radio para difusión. Después, una antena de uso doméstico ex406 con una función de recepción de difusión por satélite recibe las ondas de radio, y una televisión (receptor) ex401 o un decodificador (STB) ex407 decodifica un flujo de bits codificado para su reproducción. El aparato de decodificación de imágenes tal como se muestra en la realización anteriormente mencionada puede implementarse en el aparato reproductor ex403 para leer y decodificar el flujo de bits grabado en un medio de grabación ex402 como un CD o un DVD. En este caso, las señales de imágenes en movimiento reproducidas se visualizan en un monitor ex404. También es concebible implementar el aparato de decodificación de imágenes en el decodificador ex407 conectado a un cable ex405 para una televisión por cable o la antena ex406 para difusión por satélite y/o basada en tierra para reproducirlos en un monitor ex408 de la televisión ex401. El aparato de decodificación de imágenes puede estar incorporado en la televisión, no en el decodificador. También, un coche ex412 que tiene una antena ex411 puede recibir señales procedentes del satélite ex410 o la estación base ex107 para repetir la imagen en movimiento en un dispositivo de visualización como un sistema de navegación para coches ex413 colocado en el coche ex412.
Además, el aparato de codificación de imágenes tal como se muestra en la realización anteriormente mencionada puede codificar señales de imagen y grabarlas en el medio de grabación. Como ejemplo concreto, puede citarse una grabadora ex420 como una grabadora de DVD para grabar señales de imagen en un disco DVD ex421, una grabadora de discos para grabarlas en un disco duro. Pueden grabarse en una tarjeta SD ex422. Cuando la grabador ex420 incluye el aparato de decodificación de imágenes tal como se muestra en la realización anteriormente mencionada, las señales de imagen grabadas en el disco DVD ex421 o la tarjeta SD ex422 pueden reproducirse para visualización en el monitor ex408.
En cuanto a la estructura del sistema de navegación para coches ex413, es concebible la estructura sin la unidad de cámara ex203, la unidad de interfaz de cámara ex303 y la unidad de codificación de imágenes ex312, de los componentes mostrados en la Fig. 17. Se aplica lo mismo para el ordenador ex111, la televisión (receptor) ex401 y otros.
Además, pueden concebirse tres tipos de implementaciones para un terminal como el teléfono móvil ex114: un terminal de envío/recepción implementado tanto con un codificador como un decodificador, un terminal de envío implementado sólo con un codificador, y un terminal de recepción implementado sólo con un decodificador.
Como se describió anteriormente, es posible usar el procedimiento de codificación de imágenes descrito en la realización anteriormente mencionada para cualquiera de los aparatos y sistemas anteriormente mencionados, y haciéndolo así, pueden obtenerse los efectos descritos en la realización anteriormente mencionada.
Aplicabilidad industrial
El procedimiento de codificación de imágenes según la presente invención permite la codificación de imágenes de manera que puede realizarse acceso aleatorio sin reducir la eficiencia de codificación. El presente procedimiento de codificación de imágenes puede ser empleado por un aparato de codificación de imágenes, como una videocámara, un teléfono móvil con una función de grabación, o similares, que codifique imágenes usando el procedimiento.

Claims (5)

  1. REIVINDICACIONES
    1. Un procedimiento de codificación de imágenes para codificar una señal de imagen basándose en imagen por imagen y generar un flujo de bits (Str), comprendiendo el procedimiento:
    una etapa de codificación de conjunto de parámetros de imagen (S102, S103) de codificar un conjunto de parámetros de imagen (PPS) que han de usarse para decodificar una o más imágenes (pic) incluidas en una unidad de acceso aleatorio (RAU) que está constituida por una pluralidad de las imágenes; y
    una etapa de codificación de conjunto de parámetros de secuencia (S102) de codificar un conjunto de parámetros de secuencia (SPS) que puede usarse en común para decodificar todas las imágenes de la pluralidad de imágenes incluidas en la unidad de acceso aleatorio (RAU).
    caracterizado por una etapa de colocación (S104) de colocar, para cada unidad de acceso aleatorio, el conjunto de parámetros de imagen (PPS) y el conjunto de parámetros de secuencia (SPS) que han sido codificados respectivamente en la etapa de codificación de conjunto de parámetros de imagen (S103) y la etapa de codificación de parámetros de secuencia (S102).
  2. 2. Un aparato de codificación de imágenes (100) que codifica una señal de imagen basándose en imagen por imagen y genera un flujo (str) codificado, comprendiendo el aparato:
    una unidad de codificación de conjunto de parámetros de imagen (109) configurada para codificar un conjunto de parámetros de imagen (PSS) que ha de usarse para decodificar una o más imágenes (pic) incluidas en una unidad de acceso aleatorio (RAU) que está constituida por una pluralidad de imágenes; y
    una unidad de codificación de conjunto de parámetros de secuencia (109) configurada para codificar un conjunto de parámetros de secuencia (SPS) que puede usarse en común para decodificar todas las imágenes de la pluralidad de imágenes incluidas en la unidad de acceso aleatorio (RAU).
    caracterizado por una unidad de colocación (109) configurada para colocar, para cada unidad de acceso aleatorio, el conjunto de parámetros de imagen (PPS) y el conjunto de parámetros de secuencia (SPS) que han sido codificados respectivamente por la unidad de codificación de conjunto de parámetros de imagen (109) y la unidad de codificación de conjunto de parámetros de secuencia (109).
  3. 3. Un procedimiento de decodificación para decodificar el flujo (str) codificado generado en el procedimiento de codificación de imágenes según la reivindicación 1, estando caracterizado el procedimiento por:
    una etapa de decodificación de conjunto de parámetros de extraer del flujo (str) codificado, para cada unidad de acceso aleatorio (RAU), el conjunto de parámetros de imagen (PPS) codificado y el conjunto de parámetros de secuencia (SPS) codificado, y decodificar el conjunto de parámetros de imagen (PPS) codificado extraído; y el conjunto de parámetros de secuencia (SPS) codificado extraído; y
    una etapa de decodificación de imagen de decodificar una imagen codificada usando el conjunto de parámetros de imagen (PPS) codificado y el conjunto de parámetros de secuencia (SPS) codificado.
  4. 4. Un aparato de decodificación que decodifica el flujo (str) codificado generado por el aparato de codificación de imágenes (100) según la reivindicación 2, estando caracterizado el aparato por:
    una unidad de decodificación de conjunto de parámetros configurada para extraer del flujo (str) codificado, para cada unidad de acceso aleatorio (RAU), el conjunto de parámetros de imagen (PPS) codificado y el conjunto de parámetros de secuencia (SPS) codificado y decodificar el conjunto de parámetros de imagen (PPS) codificado extraído; y el conjunto de parámetros de secuencia (SPS) codificado extraído; y
    una unidad de decodificación de imágenes configurada para decodificar una imagen codificada usando el conjunto de parámetros de imagen (PPS) codificado y el conjunto de parámetros de secuencia (SPS) codificado.
  5. 5. Un medio de grabación que graba un flujo (str) codificado generado codificando una señal de imagen basándose en imagen por imagen,
    en el que el flujo (str) codificado está caracterizado por (i) un conjunto de parámetros de imagen (PPS) que ha de usarse para decodificar una o más imágenes (pic) incluidas en una unidad de acceso aleatorio (RAU) que está constituida por una pluralidad de imágenes , y (ii) un conjunto de parámetros de secuencia (SPS) que puede usarse en común para decodificar todas las imágenes de la pluralidad de imágenes incluidas en la unidad de acceso aleatorio (RAU), siendo colocados tanto el conjunto de parámetros de imagen (PPS) como el conjunto de parámetros de secuencia (SPS) para cada unidad de acceso aleatorio (RAU).
    5 6. Un procedimiento de grabación para grabar un flujo (str) codificado, en un medio de grabación, generado codificando una señal de imagen basándose en imagen por imagen, comprendiendo el procedimiento de grabación
    una etapa de grabación de grabar el flujo (str) codificado generado por el procedimiento de codificación de imágenes según la reivindicación 1.
ES10159560T 2003-01-17 2003-12-09 Procedimiento de codificación de video Expired - Lifetime ES2383066T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2003010233 2003-01-17
JP2003010233 2003-01-17
JP2003010551 2003-01-20
JP2003010551 2003-01-20

Publications (1)

Publication Number Publication Date
ES2383066T3 true ES2383066T3 (es) 2012-06-18

Family

ID=32775153

Family Applications (8)

Application Number Title Priority Date Filing Date
ES10159562T Expired - Lifetime ES2384234T3 (es) 2003-01-17 2003-12-09 Procedimiento de codificación de vídeo
ES10159561T Expired - Lifetime ES2384233T3 (es) 2003-01-17 2003-12-09 Procedimiento de codificación de vídeo
ES03777371T Expired - Lifetime ES2357427T3 (es) 2003-01-17 2003-12-09 Procedimiento de codificación de video.
ES10159563T Expired - Lifetime ES2392388T3 (es) 2003-01-17 2003-12-09 Procedimiento de codificación de video
ES10159560T Expired - Lifetime ES2383066T3 (es) 2003-01-17 2003-12-09 Procedimiento de codificación de video
ES10152547T Expired - Lifetime ES2383064T3 (es) 2003-01-17 2003-12-09 Procedimiento de codificación de vídeo.
ES10152552T Expired - Lifetime ES2382991T3 (es) 2003-01-17 2003-12-09 Procedimiento de codificación de video
ES10159559T Expired - Lifetime ES2384232T3 (es) 2003-01-17 2003-12-09 Procedimiento de codificación de imágenes

Family Applications Before (4)

Application Number Title Priority Date Filing Date
ES10159562T Expired - Lifetime ES2384234T3 (es) 2003-01-17 2003-12-09 Procedimiento de codificación de vídeo
ES10159561T Expired - Lifetime ES2384233T3 (es) 2003-01-17 2003-12-09 Procedimiento de codificación de vídeo
ES03777371T Expired - Lifetime ES2357427T3 (es) 2003-01-17 2003-12-09 Procedimiento de codificación de video.
ES10159563T Expired - Lifetime ES2392388T3 (es) 2003-01-17 2003-12-09 Procedimiento de codificación de video

Family Applications After (3)

Application Number Title Priority Date Filing Date
ES10152547T Expired - Lifetime ES2383064T3 (es) 2003-01-17 2003-12-09 Procedimiento de codificación de vídeo.
ES10152552T Expired - Lifetime ES2382991T3 (es) 2003-01-17 2003-12-09 Procedimiento de codificación de video
ES10159559T Expired - Lifetime ES2384232T3 (es) 2003-01-17 2003-12-09 Procedimiento de codificación de imágenes

Country Status (12)

Country Link
US (4) US7602526B2 (es)
EP (8) EP2192778B1 (es)
JP (4) JP4002878B2 (es)
KR (4) KR100990789B1 (es)
CN (4) CN101540913B (es)
AT (7) ATE557536T1 (es)
AU (1) AU2003289254A1 (es)
DE (1) DE60336174D1 (es)
ES (8) ES2384234T3 (es)
MY (1) MY137344A (es)
TW (1) TWI287403B (es)
WO (1) WO2004066633A1 (es)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101707707B (zh) * 2002-04-26 2013-07-31 索尼株式会社 编码设备和方法
US9560367B2 (en) * 2004-09-03 2017-01-31 Nokia Technologies Oy Parameter set and picture header in video coding
JP2006203662A (ja) * 2005-01-21 2006-08-03 Toshiba Corp 動画像符号化装置・復号化装置及び符号化ストリーム生成方法
FR2888424A1 (fr) 2005-07-07 2007-01-12 Thomson Licensing Sas Dispositif et procede de codage et de decodage de donnees video et train de donnees
KR100746005B1 (ko) * 2005-10-17 2007-08-06 삼성전자주식회사 다중 목적의 비디오 스트림을 처리하는 장치 및 방법
WO2007142281A2 (en) * 2006-06-02 2007-12-13 Panasonic Corporation Coding device and editing device
JP2008109637A (ja) * 2006-09-25 2008-05-08 Toshiba Corp 動画像符号化装置及びその方法
CN101202923B (zh) * 2006-12-15 2010-09-01 扬智科技股份有限公司 影像解码器的码流错误侦测方法
JP5023739B2 (ja) 2007-02-28 2012-09-12 ソニー株式会社 画像情報符号化装置及び符号化方法
US8170097B2 (en) * 2007-12-04 2012-05-01 Sony Corporation Extension to the AVC standard to support the encoding and storage of high resolution digital still pictures in series with video
JP2009260736A (ja) * 2008-03-24 2009-11-05 Fujitsu Ltd エンコーディング装置、デコーディング装置、動画像処理方法、動画像処理システム、エンコーディングプログラムおよびデコーディングプログラム
US8767840B2 (en) * 2009-02-11 2014-07-01 Taiwan Semiconductor Manufacturing Company, Ltd. Method for detecting errors and recovering video data
JP5341952B2 (ja) 2011-05-30 2013-11-13 株式会社東芝 ビデオサーバ及びデータ収録再生方法
WO2013002709A1 (en) * 2011-06-30 2013-01-03 Telefonaktiebolaget L M Ericsson (Publ) Indicating bit stream subsets
CN102868881B (zh) * 2011-07-05 2015-04-15 富士通株式会社 视频编码系统和方法
CN103797792B (zh) 2011-09-15 2018-06-05 Vid拓展公司 用于空间预测的系统和方法
US20130089152A1 (en) * 2011-10-05 2013-04-11 Qualcomm Incorporated Signaling picture identification for video coding
US8867852B2 (en) 2012-01-19 2014-10-21 Sharp Kabushiki Kaisha Decoding a picture based on a reference picture set on an electronic device
US9736476B2 (en) * 2012-04-27 2017-08-15 Qualcomm Incorporated Full random access from clean random access pictures in video coding
CN104396242B (zh) * 2012-06-29 2017-12-19 瑞典爱立信有限公司 对包括参考图片集的视频序列进行编码和解码
US9479774B2 (en) * 2012-09-24 2016-10-25 Qualcomm Incorporated Buffering period and recovery point supplemental enhancement information messages
US20160105678A1 (en) * 2014-10-13 2016-04-14 Microsoft Technology Licensing, Llc Video Parameter Techniques
US10506244B2 (en) * 2015-03-06 2019-12-10 Qualcomm Incorporated Method and apparatus for video coding using adaptive tile sizes
CN107950031B (zh) * 2015-09-11 2021-02-19 松下知识产权经营株式会社 影像接收方法以及影像接收装置
JP6986670B2 (ja) 2015-09-11 2021-12-22 パナソニックIpマネジメント株式会社 映像受信方法及び映像受信装置
JP6820507B2 (ja) * 2015-09-14 2021-01-27 パナソニックIpマネジメント株式会社 映像受信方法、映像送信方法、映像受信装置及び映像送信装置
CA3005713A1 (en) * 2015-12-14 2017-06-22 Panasonic Intellectual Property Corporation Of America Three-dimensional data encoding method, three-dimensional data decoding method, three-dimensional data encoding device, and three-dimensional data decoding device
CN117336498A (zh) * 2017-10-06 2024-01-02 松下电器(美国)知识产权公司 编码装置、解码装置以及非暂时性计算机可读介质
US10735770B2 (en) * 2018-09-13 2020-08-04 Tencent America LLC Method and device using high layer syntax architecture for coding and decoding
KR102144512B1 (ko) * 2020-04-22 2020-08-13 주식회사 유니넷 다중채널 영상 저장장치

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455629A (en) * 1991-02-27 1995-10-03 Rca Thomson Licensing Corporation Apparatus for concealing errors in a digital video processing system
JP3084811B2 (ja) * 1991-07-24 2000-09-04 ソニー株式会社 記録媒体サーチ方法および装置
JP3257643B2 (ja) 1993-01-18 2002-02-18 ソニー株式会社 画像符号化装置および画像復号化装置
US5793927A (en) * 1995-06-07 1998-08-11 Hitachi America, Ltd. Methods for monitoring and modifying a trick play data stream to insure MPEG compliance
EP0847650A4 (en) * 1996-07-03 2000-01-05 Motorola Inc METHOD AND DEVICE FOR LIMIT-VALUE-BASED ADAPTIVE ENTROPY CODING AND DECODING
JP2000152236A (ja) * 1998-11-18 2000-05-30 Hitachi Ltd 動画像符号化装置および多重化方法とその装置および記録再生装置
GB2352350B (en) * 1999-07-19 2003-11-05 Nokia Mobile Phones Ltd Video coding
JP2001285800A (ja) 2000-04-03 2001-10-12 Mitsubishi Electric Corp データ信号記録再生装置およびデータ信号記録再生方法
EP1198133A4 (en) * 2000-04-21 2004-10-06 Sony Corp INFORMATION PROCESSING DEVICE AND METHOD, PROGRAM AND RECORDED MEDIUM
JP4517267B2 (ja) 2000-04-21 2010-08-04 ソニー株式会社 記録装置および方法、再生装置および方法、プログラム、並びに記録媒体
JP2002010213A (ja) 2000-06-27 2002-01-11 Mitsubishi Electric Corp 符号化データの再生方法および符号化データの再生装置
JP2002077818A (ja) * 2000-09-04 2002-03-15 Pioneer Electronic Corp 蓄積再生システム、トランスポートストリームの蓄積方法及びトランスポートストリームの再生方法
CN100353750C (zh) * 2000-09-15 2007-12-05 北京算通数字技术研究中心有限公司 基于mpeg-2码流的非线性编辑系统编辑方法
CN1131637C (zh) * 2000-10-13 2003-12-17 北京算通数字技术研究中心有限公司 数据流索引文件生成及用该文件访问帧和切变镜头的方法
JP2002176622A (ja) * 2000-12-07 2002-06-21 Victor Co Of Japan Ltd 映像信号の記録方法、及び映像信号記録装置
JP3937788B2 (ja) 2001-04-19 2007-06-27 ソニー株式会社 データ記録方法及び装置、データ再生方法及び装置、データ編集方法及び装置
JP3562484B2 (ja) 2001-05-07 2004-09-08 ソニー株式会社 ディスク状データ記録媒体の製造方法
US7787539B2 (en) * 2002-07-17 2010-08-31 Broadcom Corporation Decoding and presentation time stamps for MPEG-4 advanced video coding
EP1385337A1 (en) * 2002-07-22 2004-01-28 Deutsche Thomson-Brandt Gmbh Method and apparatus for storing and transmitting audio-visual data
US20050013249A1 (en) * 2003-07-14 2005-01-20 Hao-Song Kong Redundant packets for streaming video protection
US7426308B2 (en) * 2003-07-18 2008-09-16 Microsoft Corporation Intraframe and interframe interlace coding and decoding
DE602005016663D1 (de) * 2004-04-28 2009-10-29 Panasonic Corp Stream-erzeugungsvorrichtung für bewegliche bilder, codierungsvorrichtung für bewegliche bilder, multiplex-vorrichtung für bewegliche bilder und decodierungsvorrichtung für bewegliche bilder
ES2405131T3 (es) * 2004-06-02 2013-05-30 Panasonic Corporation Aparato de codificación de imagen y aparato de decodificación de imagen

Also Published As

Publication number Publication date
AU2003289254A1 (en) 2004-08-13
CN101540914B (zh) 2011-06-08
KR100963360B1 (ko) 2010-06-14
KR20100021670A (ko) 2010-02-25
JP2004248255A (ja) 2004-09-02
EP2211547B1 (en) 2012-05-09
US7688471B2 (en) 2010-03-30
KR20050089797A (ko) 2005-09-08
JP5242719B2 (ja) 2013-07-24
MY137344A (en) 2009-01-30
EP2211549B1 (en) 2012-05-09
EP2211551B1 (en) 2012-09-26
ATE557535T1 (de) 2012-05-15
JP4002878B2 (ja) 2007-11-07
ATE557536T1 (de) 2012-05-15
EP2211548A2 (en) 2010-07-28
KR100963359B1 (ko) 2010-06-14
US20090316781A1 (en) 2009-12-24
ES2383064T3 (es) 2012-06-18
ATE557539T1 (de) 2012-05-15
EP1589760A1 (en) 2005-10-26
EP1589760B1 (en) 2011-02-23
ATE499799T1 (de) 2011-03-15
CN101577829B (zh) 2011-04-13
EP2211547A2 (en) 2010-07-28
EP2192779B1 (en) 2012-05-09
EP2211548B1 (en) 2012-05-09
CN100505872C (zh) 2009-06-24
TW200423739A (en) 2004-11-01
ATE557537T1 (de) 2012-05-15
EP2211549A3 (en) 2010-10-06
WO2004066633A1 (ja) 2004-08-05
US7602526B2 (en) 2009-10-13
CN101540913A (zh) 2009-09-23
EP1589760A4 (en) 2006-10-18
EP2192778B1 (en) 2012-05-09
CN1739294A (zh) 2006-02-22
JP4226645B2 (ja) 2009-02-18
ES2384232T3 (es) 2012-07-02
EP2211550A3 (en) 2010-10-06
US20110200095A1 (en) 2011-08-18
TWI287403B (en) 2007-09-21
ES2382991T3 (es) 2012-06-15
US20060056705A1 (en) 2006-03-16
EP2192779A1 (en) 2010-06-02
JP4763663B2 (ja) 2011-08-31
JP2011130494A (ja) 2011-06-30
KR100956914B1 (ko) 2010-05-11
ATE557540T1 (de) 2012-05-15
CN101577829A (zh) 2009-11-11
EP2211547A3 (en) 2010-10-06
EP2211548A3 (en) 2010-10-06
KR20080096584A (ko) 2008-10-30
ES2392388T3 (es) 2012-12-10
EP2192778A1 (en) 2010-06-02
EP2211550B1 (en) 2012-05-09
ES2357427T3 (es) 2011-04-26
CN101540914A (zh) 2009-09-23
EP2211550A2 (en) 2010-07-28
JP2007300667A (ja) 2007-11-15
CN101540913B (zh) 2010-11-17
US20090323815A1 (en) 2009-12-31
KR20100021671A (ko) 2010-02-25
DE60336174D1 (de) 2011-04-07
EP2211551A3 (en) 2010-10-06
KR100990789B1 (ko) 2010-10-29
ATE557538T1 (de) 2012-05-15
JP2008211854A (ja) 2008-09-11
ES2384233T3 (es) 2012-07-02
ES2384234T3 (es) 2012-07-02
EP2211549A2 (en) 2010-07-28
EP2211551A2 (en) 2010-07-28

Similar Documents

Publication Publication Date Title
ES2383066T3 (es) Procedimiento de codificación de video
ES2408245T3 (es) Aparato de decodificación de imágenes en movimiento
JP4733239B1 (ja) 送信・受信システム
JP4405272B2 (ja) 動画像復号化方法、動画像復号化装置及びプログラム