ES2344593T3 - Aparato de codificacion y decodificacion de imagenes. - Google Patents

Aparato de codificacion y decodificacion de imagenes. Download PDF

Info

Publication number
ES2344593T3
ES2344593T3 ES02024381T ES02024381T ES2344593T3 ES 2344593 T3 ES2344593 T3 ES 2344593T3 ES 02024381 T ES02024381 T ES 02024381T ES 02024381 T ES02024381 T ES 02024381T ES 2344593 T3 ES2344593 T3 ES 2344593T3
Authority
ES
Spain
Prior art keywords
data
coding
image
decoding
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES02024381T
Other languages
English (en)
Inventor
Hiroyuki Katata
Hiroshi Kusao
Tomoko Aono
Norio Ito
Shuichi Watanabe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Application granted granted Critical
Publication of ES2344593T3 publication Critical patent/ES2344593T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

Un aparato de codificación de imágenes en movimiento, operable para ejecutar una codificación jerárquica de un objeto de imagen, que comprende: 1) una primera parte de generación de datos de forma operable para codificar los datos de forma de baja resolución generados; 2) una primera porción de codificación de datos de forma, operable para codificar los datos de forma de baja resolución generados; 3) una porción de codificación de capa inferior operable para codificar la parte de la imagen en baja resolución como un objeto de imagen de capa inferior basándose en los primeros datos de forma; 4) una segunda porción de generación de datos de forma operable para generar datos de forma de alta resolución para una porción de la imagen parcial; 5) una segunda porción de codificación de datos de forma operable para los datos de forma de alta resolución generados; y 6) una porción de codificación de la capa superior operable para codificar la porción de la imagen parcial en alta resolución como un objeto de la imagen de la capa superior basándose en los segundos datos de forma, en donde, el aparato es operable para transmitir los datos codificados generados por las mencionadas porciones de codificación superior e inferior.

Description

Aparato de codificación y decodificación de imágenes.
Campo técnico
La presente invención está relacionada con un aparato de codificación de imágenes y un aparato de decodificación de imágenes, y más particularmente con un aparato de codificación de imágenes en movimiento para codificar los datos de las imágenes de una forma eficiente y un aparato de decodificación de imágenes en movimiento para decodificar los datos codificados generados por el aparato de codificación de imágenes en movimiento, utilizados en el campo del procesamiento de imágenes digitales.
Antecedentes de la técnica
En la codificación de imágenes se ha considerado un método de superposición de distintas secuencias de imágenes en movimiento. El artículo titulado "Esquema de codificación de imágenes utilizando la representación por capas y plantillas múltiples" (informe técnico del IEICE, IE94-159, páginas 99-106 (1995), describe un esquema para la superposición de una secuencia de imágenes en movimiento como fondo y otra secuencia de imágenes en movimiento de un componente o imagen parcial (por ejemplo, una imagen de video de una figura humana o un pez cortado mediante la técnica Cromakey) como fondo, para generar una nueva secuencia de imágenes.
La figura 12 es un diagrama de bloques que muestra un aparato de codificación y un aparato de decodificación de acuerdo con la técnica convencional. La parte de codificación de datos de los píxeles 1201 en la figura 12 es una parte para codificar los datos de los píxeles que representan la intensidad y las diferencias de colores, y la parte de codificación de los datos de forma 1202 son para codificar los datos de forma que representan una forma de la imagen parcial. Estas partes constituyen un aparato para codificar una imagen parcial.
Los datos de forma se emplean para codificar los datos de los píxeles. Una parte de decodificación de los datos de los píxeles 1203 en la figura 12 son una parte para decodificar los datos de los píxeles, y la parte de decodificación 1204 de los datos de forma son para decodificar los datos de forma. Estas partes constituyen un aparato para decodificar una imagen parcial. Para decodificar los datos de los píxeles, se emplean los datos de forma decodificados.
La parte 1202 de codificación de los datos de forma expresan primeramente un contorno de una forma utilizando 8 códigos de cadena direccionales, por ejemplo, y codificando después los códigos de cadena mediante la codificación Huffman. La parte 1201 de codificación de los datos de los píxeles codifica los datos de los píxeles mediante el método estándar internacional de codificación de imágenes en movimiento, tal como el MPEG o H.261. Al dividir los datos en bloques, se utiliza una técnica DCT de forma arbitraria o similar para los bloques incluyendo un límite de la imagen parcial.
Cada imagen parcial se decodifica mediante un aparato de decodificación, y después se superponen en una parte de superposición (no mostrada) utilizando los datos de forma, y visualizándose en un dispositivo de visualización como una pantalla. Por ejemplo, cuando se superpone una imagen parcial p (i, j) en una forma arbitraria sobre una imagen de fondo rectangular b (i, j) se utiliza generalmente los datos de forma s (i, j) de acuerdo con la expresión siguiente (1):
... (1)f(i, j) = p (i,j) s ((i,j) + b (i, j) [1-s (i, j)]
en donde (i, j) representa las coordenadas de un píxel, y f(i, j) representa un valor del píxel. El valor de s(i, j) supone que el valor "1" está dentro de una imagen parcial, y que "0" se encuentra fuera de la imagen.
\vskip1.000000\baselineskip
En la técnica convencional, sin embargo, no se ha propuesto una técnica para configurar la jerarquía espacial para una imagen parcial. El estándar internacional MPEG2 ejecuta una jerarquía (es decir, jerarquía espacial) a través de una imagen completa. En el método, los datos en una capa inferior tienen una resolución espacial baja a través de la imagen completa, y los datos en una capa superior para mejorar la resolución se decodifican conjuntamente para conseguir una alta resolución espacial.
En consecuencia, un objeto de la presente invención es proporcionar un aparato de codificación y decodificación de imágenes que pueda realizar la jerarquía espacial en una imagen en parte.
Para obtener los datos de forma de baja resolución, los datos de forma de alta resolución obtenidos mediante la técnica convencional pueden ser reducidos sencillamente. No obstante, si la imagen de baja resolución así obtenida se visualiza en un monitor de pantalla grande que tenga una resolución baja, el contorno de una parte tendrá una apariencia en forma escalonada, lo cual conduce al deterioro en la calidad de la imagen física. El mismo problema surge cuando se amplia una imagen de baja resolución para su visualización en un monitor de pantalla grande que tenga alta resolución.
En consecuencia, es otro objeto de la invención es proporcionar un aparato de codificación y decodificación de imágenes que pueda resolver el problema anterior.
El artículo sobre la codificación de segmentos de imagen conformados arbitrariamente basándose en las transformadas ortogonales generalizadas, por Michael Gilge y otros, comunicación 1 de imagen de procesamiento de señales 8376 (1989), Octubre, numero 2, Amsterdam, Holanda, expone la representación de la imagen orientada a la zona, que ofrece varias ventajas sobre los esquemas orientados a los bloques.
Exposición de la invención
De acuerdo con un primer aspecto de la presente invención, se proporciona un aparato de codificación de imágenes en movimiento que es operativo para ejecutar la codificación jerárquica de un objeto de imagen, que comprende: 1) unos primeros datos de forma que general la porción operativa para generar los datos de forma de baja resolución para una parte de una imagen; 2) una primera porción de codificación de datos operable para codificar los datos de forma de baja resolución generados; 3) una porción de codificación de capa inferior operable para codificar la parte de la imagen en baja resolución como un objeto de imagen de capa inferior basándose en los primeros datos de forma; 4) una segunda porción de generación de datos de forma que genera una porción operable para generar datos de forma de alta resolución para una porción de la imagen de la parte; 5) una segunda porción de codificación de datos de forma operable para codificar los datos generados de forma de alta resolución; y 6) una porción de codificación de la capa superior operable para codificar la porción de una imagen de parte en alta resolución como un objeto de imagen de capa superior basándose en los segundos datos de forma; en donde, el aparato es operable para transmitir los datos codificados generados por las mencionadas porciones de codificación superiores e inferiores.
De acuerdo con un segundo aspecto de la presente invención, se proporciona un aparato de decodificación de imágenes en movimiento, operable para ejecutar la decodificación jerárquica de un objeto de imagen recibido, en donde el aparato comprende: 1) una primera porción de decodificación de datos de forma operable para decodificar datos codificados de datos de forma de una capa inferior correspondientes a una parte de una imagen para obtener datos de forma de baja resolución; 2) una porción de decodificación de capa inferior operable para decodificar la imagen de parte en baja resolución como un objeto de imagen de capa inferior basándose en los primeros datos de forma; 3) una segunda porción de decodificación de datos de forma operable para decodificar los datos codificados correspondientes a una porción de la imagen de parte de unos datos de forma de la capa superior, para poder obtener datos de forma de alta resolución; y 4) una porción de decodificación de capa superior operable para decodificar una porción de imagen de parte en alta resolución como un objeto de imagen de la capa superior basándose en los segundos datos de
forma.
Las características preferidas están expuestas en las reivindicaciones dependientes.
Con el fin de que la presente invención pueda ser comprendida más fácilmente, se describirán a continuación ejemplos específicos y realizaciones. La cuarta realización ilustra en forma óptima la presente invención, no obstante las realizaciones anteriores son útiles para comprender la configuración. Se observará que la tercera realización ha sido suprimida de la solicitud. Los dibujos de la misma se han mantenido como ejemplos comparativos.
Breve descripción de los dibujos
la figura 1 es un diagrama de bloques que muestra un aparato de codificación de acuerdo con una primera realización de la presente invención,
la figura 2 es un diagrama de bloques que muestra un aparato de decodificación de acuerdo con la primera realización de la presente invención,
la figura 3 es un diagrama de bloques que muestra un aparato de codificación de acuerdo con una segunda realización de la presente invención,
la figura 4 es un diagrama de bloques que muestra un aparato de decodificación de acuerdo con la segunda realización de la presente invención,
la figura 5 es un diagrama de bloques que muestra un aparato de codificación de acuerdo con un tercer ejemplo de la presente invención,
la figura 6 es un diagrama de bloques que muestra un aparato de decodificación para una capa inferior de acuerdo con el tercer ejemplo de la presente invención,
la figura 7 es un diagrama para ser utilizado en la información de ilustración sobre la diferencia entre los datos de forma de capa superior y los datos de forma de la capa inferior,
las figuras 8A a 8D son diagramas para utilizar en la ilustración de una técnica para obtener los datos de forma de baja resolución a partir de los datos de forma de alta resolución, de acuerdo con la presente invención,
la figura 9 es un diagrama de bloques que muestra un aparato de codificación de acuerdo con otra realización de la presente invención,
la figura 10 es un diagrama de bloques que muestra un ejemplo de un aparato para ejecutar la codificación jerárquica de una imagen parcial de la presente invención,
la figura 11 es un diagrama de bloques que muestra un aparato de decodificación de la capa inferior de acuerdo con una realización adicional de la presente invención,
la figura 12 es un diagrama de bloques que muestra un aparato de codificación y un aparato de decodificación de la técnica convencional.
En la figura 10 se muestra un aparato como medios para configurar la jerarquía espacial en una imagen parcial. La parte de muestreo baja 1001 en la figura 10 reduce los píxeles de los datos de los píxeles de entrada hasta una resolución espacia menor de los datos de los píxeles. Una segunda parte 1002 de muestreo baja reduce los píxeles de los datos de forma de entrada a una resolución espacial inferior de los datos de las formas. Los datos de forma muestran una forma de una imagen parcial, y se representan como una imagen binaria que tiene un valor del píxel de "1" dentro de una parte y un valor de píxel "0" fuera de la parte, por ejemplo.
La parte 1004 de codificación de la capa inferior codifica los datos de los píxeles en baja resolución.
Para la codificación, se utiliza el método estándar internacional de codificación de imágenes en movimiento, tal como el MPEG ó H.261. Cuando una imagen se divide en bloques, se utiliza una técnica DCT de formas arbitrarias o similares para el bloque que incluye un límite de la imagen parcial. En este caso, la salida de datos de forma de baja resolución de la segunda parte 1002 de muestreo bajo se utilizan como información en el límite de la imagen parcial.
La parte 1003 de codificación de la capa superior codifica los datos de los píxeles de alta resolución, en donde se emplea el método estándar internacional de codificación de imágenes en movimiento tal como el sistema MPEG o H.261. En este caso, se utiliza la predicción de las imágenes decodificadas en la capa inferior así como también en la capa superior. Para los límites de la imagen parcial, se utilizan los datos de forma de alta resolución que no hayan sido muestreados.
La parte de codificación de los datos de forma 1005 codifica los datos de forma de alta resolución que corresponde a la resolución de la capa superior. El contorno de una forma se expresa con 8 códigos de cadena direccional, por ejemplo, y estos códigos de cadena se codifican mediante la codificación Huffman.
Los datos codificados se integran mediante una parte integrada (no mostrada) y transmitida o almacenada. En el aparato de decodificación para decodificar solamente una capa inferior, tal como se muestra en la figura 11, solo se recogen los datos necesarios para decodificar la capa inferior, a partir de los datos codificados que tengan los datos de las capas superior e inferior integrados en las mismas, y se utilizan para el proceso de decodificación. En otras palabras, los "datos codificados de los datos de los píxeles de la capa inferior" y los "datos codificados de los datos de forma" se seleccionan en una parte de la sección (no mostrada) y se decodifican.
En este instante, una parte de decodificación 1103 de los datos de forma en la figura 11 decodifica los datos de forma de alta resolución. Los datos de forma de baja resolución se obtienen en una parte de muestreo baja 1102, utilizando la misma técnica que en la segunda parte de muestreo baja 1002 de la figura 10. Los datos así obtenidos se utilizan para decodificar los datos de los píxeles en una parte de decodificación de la capa inferior 1101. El aparato de decodificación para decodificar hasta una capa superior utiliza todos los datos codificados para llevar a cabo la decodificación hasta la capa superior.
No obstante, el aparato anteriormente descrito adolece del problema siguiente. Es decir, aunque la decodificación convencional de una capa inferior solo requiere los datos de forma de baja resolución, el anterior aparato tiene que utilizar los datos de forma de alta resolución al decodificar datos en la capa inferior, lo que da lugar a datos redundantes. En otras palabras, los datos de forma en una capa superior que tienen una gran cantidad de datos deberán ser utilizados en lugar de los datos de forma en una capa inferior con una cantidad menor de códigos. En consecuencia, llega a ser difícil codificar una capa inferior con buena calidad de imagen con una transmisión limitada o con una capacidad limitada de almacenamiento.
La primera y segunda realizaciones son de ayuda para la comprensión de la presente invención para resolver este problema.
Las figuras 1 y 2 son diagramas de bloques que muestran respectivamente un aparato de codificación y decodificación de acuerdo con la primera realización.
Con referencia a la figura 1, una parte de muestreo inferior 104 reduce los datos de los píxeles de entrada para generar datos de los píxeles de baja resolución para una capa inferior. En la reducción se utiliza un filtro de paso bajo para impedir la distorsión. La parte de codificación de la capa inferior 105 codifica los datos de los píxeles de baja resolución.
Para la codificación se utiliza el método estandarizado internacional de codificación de imágenes en movimiento, tal como el MPEG ó H.261. Cuando una imagen se divide en bloques, se utiliza una técnica DCT de forma arbitraria o similar para un bloque que incluya un límite de la imagen parcial. Para el límite de la imagen parcial, se utilizan los datos de forma de baja resolución obtenidos a partir de una primara parte de generación de los datos de forma 106.
La primera parte 106 de generación de los datos de forma genera datos de forma de baja resolución para una capa inferior. Los datos de forma se extraen mediante la división de los datos de los píxeles en áreas, por ejemplo. Las técnicas utilizadas para la división del área incluyen una técnica de detección de los bordes utilizando una operación diferencial, y una segmentación morfológica.
Al obtener una forma del objeto móvil a partir de un fondo estático, puede utilizarse la detección del área dinámica utilizando diferencias de intra-trama. Alternativamente, los datos de forma pueden ser generados mediante la técnica Chromakey. En la figura 1, los datos de forma de baja resolución se obtienen después de reducir los datos de los píxeles de objetivo en una parte de muestreo bajo 104 para reducir la resolución de la misma. No obstante, puede ser utilizado otro método en el cual los datos de forma se obtienen primero para los datos de los píxeles de alta resolución, y los datos de forma se reducen entonces para obtener los datos de forma de baja resolución.
Los datos de forma generados aquí son imágenes binarias o imágenes que tienen dos o más niveles de gradación. En el último caso, la superposición de una imagen parcial y una imagen de fondo de acuerdo con la expresión anterior (1) puede ser considerada como un medio ponderado de la imagen parcial y la imagen de fondo con los datos de forma que representan una ponderación. Se observará que los datos de forma s(i, j) en la expresión (1) toma un valor de "1" dentro de la imagen parcial de objetivo, "0" fuera de la imagen parcial, y un valor entre "0" y "1" en la parte del límite de la imagen parcial.
Una primera parte 107 de codificación de los datos de forma codifica los datos de forma de baja resolución para una capa inferior. Si los datos de forma son datos binarios, puede utilizar la codificación de longitud fija, codificación MMR, codificación de cadenas, o similar. Si los datos de forma se expresan con dos o más niveles de gradación, puede utilizarse un esquema de codificación utilizando DCT como en el sistema MPEG, un esquema de codificación utilizando un árbol cuaternario y la cuantificación vectorial ("Modelo de verificación de video MPEG-4 Versión 2.0" (ISO/IECTC1/SC29/WG11 N1260)), o similar.
Una segunda parte 102 de generación de datos de forma genera datos de forma de alta resolución para una capa superior a partir de los datos de los píxeles de alta resolución. El método de generación de los datos de forma es el mismo que en la primera parte de generación 106 de datos de forma, y en consecuencia no se repetirá la descripción del mismo. Una segunda parte 103 de codificación de los datos de forma codifica los datos de forma de alta resolución generados por la segunda parte 102 de generación de los datos de forma. El método de codificación de los datos de forma es el mismo que en la primera parte 107 de codificación de los datos de forma, y no se repetirá la descripción del mismo. Se observará que estas dos partes 103, 107 de codificación de los datos de forma no tienen que utilizar el método de codificación idéntico; pueden utilizar métodos independientes para la decodificación.
La parte de codificación 101 de la capa superior codifica los datos de los píxeles de alta resolución. La codificación se ejecuta utilizando el método estándar internacional de codificación de imágenes en movimiento, tal como el sistema MPEG o H.261, como en la técnica descrita en la sección de Antecedentes del Arte. En este caso, no obstante, la codificación utiliza la predicción a partir de las imágenes decodificadas parcialmente que existen en la parte de codificación 105 de la capa inferior, adicionalmente para la predicción a partir de imágenes decodificadas que anteceden o que son siguientes en el tiempo en la capa superior. Para el límite de la imagen parcial, se utiliza la salida de datos de forma de alta resolución de la segunda parte de generación 102 de datos de forma.
A continuación, se describirá el aparato de decodificación de acuerdo con la primera realización con referencia a la figura 2.
El aparato de decodificación de la capa inferior 205 comprende partes rodeadas por una línea de trazos en la figura 2. La primera parte de decodificación de los datos de forma 204 decodifica los datos codificados de los datos de forma de la capa inferior, para obtener los datos de forma de baja resolución. Los datos de forma decodificados son enviados a una parte de decodificación 203 de capa inferior, y se utilizan también para visualizar una imagen de la capa inferior. La parte de decodificación 203 de la capa inferior decodifica los datos codificados de los datos de los píxeles de la capa inferior, y suministra los datos de los píxeles de baja resolución a una parte de visualización de la capa inferior (no mostrada).
A continuación, se describirá la decodificación de una capa superior de la figura 2. Una segunda parte 202 de decodificación de los datos de forma decodifica los datos codificados de los datos de forma de la capa superior, para obtener los datos de forma de alta resolución. Los datos de forma decodificados son enviados a una parte de decodificación 201 de la capa superior, y se utilizan también para visualizar una imagen de la capa superior.
La parte de decodificación de la capa superior 201 decodifica los datos codificados de los datos de los píxeles de la capa superior, y suministra los datos de los píxeles de alta resolución a una parte de visualización de la capa superior (no mostrada). La parte de decodificación 201 de la capa superior utiliza, como en la parte de codificación 101 de codificación de la capa superior mostrada en la figura 1, la predicción de las imágenes decodificadas en la parte de decodificación 203 de la capa inferior, además de la predicción a partir de las imágenes decodificadas anteriores o siguientes en el tiempo en la capa superior.
Se describirá a continuación la segunda realización de la presente invención.
En la primera realización descrita anteriormente, los datos de forma de alta resolución utilizados en una capa superior y los datos de forma de baja resolución utilizados en una capa inferior se codifican independientemente entre sí. Así pues, la información sobre los datos de forma en la capa inferior no está reflejada para codificar los datos de forma en la capa superior, y en consecuencia llega a ser grande la cantidad de datos de forma en la capa superior. Esto conduce a un problema en que la cantidad total de códigos para la capa superior se incrementa más que en el caso en que se utilizaban los métodos mostrados en las figuras 10 y 11. En consecuencia, esta realización está dirigida a resolver el problema anterior mediante la codificación de la diferencia entre los datos de forma de baja resolución y los datos de forma de alta resolución.
Las figuras 3 y 4 son diagramas de bloques que muestran respectivamente un aparato de codificación y un aparato de decodificación de acuerdo con la segunda realización.
El aparato de codificación de la figura 3 difiere del aparato de codificación en la figura 1 en que los datos de forma de baja resolución en una primera parte de codificación de datos de forma 307 se envían a una parte de codificación 303 de datos de forma, y en que la segunda parte 303 de codificación de datos de forma codifica solo la información sobre la diferencia entre los datos de forma de baja resolución y los datos de forma de alta resolución.
Las partes distintas a la parte de codificación de la capa superior 101, a la segunda parte de generación de datos de forma 102, parte de muestreo reducido 104, parte de codificación de la capa inferior 105, y la primera parte de generación 106 de generación de datos de forma, son las mismas que las de la figura 1, y en consecuencia no se repite su descripción.
El aparato de decodificación en la figura 4 es distinto del aparato de decodificación de la figura 2, en que los datos de forma de baja resolución decodificados en una primera parte 404 de decodificación de datos de forma se envían a una segunda parte 402 de decodificación de datos de forma, y en que la segunda parte 402 de decodificación de datos de forma decodifica los datos de forma de alta resolución junto con la información de la diferencia.
Las partes distintas a la parte de decodificación 201 de la capa superior, y la parte de decodificación 203 de la capa inferior son las mismas que las de la figura 2, y por tanto no se repetirá su descripción. Adicionalmente, el aparato de decodificación 405 de la capa inferior es equivalente al aparato de decodificación de la capa inferior 205 en la figura 2.
Cuando se utiliza un árbol cuaternario para representar los datos de forma binarios, por ejemplo, los datos en las jerarquías inferiores del árbol pueden utilizarse como la información antes descrita sobre la diferencia. La figura 7 muestra datos de forma binarios y una representación del árbol cuaternario a modo de ejemplo. El valor más superior del árbol cuaternario es "1" cuando al menos existe un valor "1" del píxel dentro de un bloque de 4 píxeles por 4 píxeles, o bien "0" en caso contrario. Los valores en las jerarquías segunda y tercera del árbol están determinados igualmente para los bloques de 2 píxeles por 2 píxeles y de 1 píxel por 1 píxel, respectivamente.
Los bloques en las respectivas jerarquías son explorados desde la parte izquierda superior a la parte derecha inferior en una secuencia de exploración de tramas. En el ejemplo mostrado en la figura 7, los datos de forma en la capa superior se expresan con tres jerarquías, y los datos de forma en la capa inferior se expresan con dos jerarquías. Los datos en la tercera jerarquía se expresan como la información sobre la diferencia entre las capas superior e inferior. Estos datos expresados con el árbol cuaternario se codifican mediante una codificación aritmética, por ejemplo.
Cuando los datos de forma se expresan con dos o más capas de gradación, pueden ser utilizado otro método de codificación, en el cual los datos de baja resolución se muestrean en forma ascendente en la resolución para una capa superior antes de tomar la diferencia con los datos de forma de alta resolución, y los datos de la diferencia son entonces codificados mediante la codificación por transformación.
Finalmente, se describirá la cuarta realización de la presente invención.
La presente realización está basada en la primera y segunda realizaciones, pero en donde la capa superior está configurada para mejorar la resolución espacial de solo una porción de la imagen parcial codificada en la capa inferior. Mediante esta configuración el área de una cara de una figura puede ser codificada como una imagen parcial en la capa inferior, y solo la parte de la boca puede estar codificada en alta resolución en la capa superior, por ejemplo.
Cuando la cuarta realización está adaptada a la primera realización, los segundos datos de forma de generación de la porción 102 del aparato de codificación mostrado en la figura 1 pueden utilizarse para generar los datos de forma de alta resolución correspondientes a una porción de la imagen parcial, y de esta forma poder implementar la presente invención.
\newpage
Como aparato de decodificación correspondiente, el aparato mostrado en la figura 2 puede utilizarse como tal. De igual forma cuando esta realización está adaptada a la segunda realización, los datos de forma de alta resolución correspondientes a una porción o una imagen parcial pueden generarse por la segunda porción 102 de generación de los datos de forma, del aparato de codificación mostrado en la figura 3, por lo que puede implementarse la presente invención.
En este caso, no obstante, no se utiliza una línea de señal desde la primera porción 307 de codificación de datos de forma a la segunda porción 303 de codificación de datos de forma. En consecuencia, existe la necesidad de proporcionar un conmutador para conmutar entre los métodos descritos en la cuarta y segunda realizaciones. Este conmutador está provisto entre la primera parte 307 de la porción de codificación de datos de forma y la segunda porción 303 de codificación de datos de forma. Al utilizar el método de acuerdo con la cuarta realización, el conmutador se desactiva y los datos de forma de la capa superior (los segundos datos de forma) se codifican en forma independiente. Al utilizar el método según lo descrito en la segunda realización, el conmutador se activa y la información sobre la diferencia entre los datos de forma de la capa superior (los segundos datos de forma) y los datos de forma de la capa inferior (lo primeros datos de forma) se codifican.
Para un aparato de decodificación, el aparato mostrado en la figura 4 está provisto con un conmutador similar, el cual está dispuesto en una línea de señal conectando la primera parte 404 de decodificación de datos de forma y la segunda porción 402 de decodificación de los datos de forma en la figura 4. El conmutador, al igual que el conmutador en el aparato de codificación, controla la conmutación entre el caso en que los datos de forma de la capa superior (los segundos datos de forma) se decodifican en forma independiente, y el caso en donde los datos que representan la diferencia entre los datos de forma de la capa superior (los segundos datos de forma) y los datos de forma de la capa inferior (los primeros datos de forma) se decodifican y entonces los datos diferencia se suman a los datos de forma de la capa inferior (los primeros datos de forma) para decodificar los datos de forma de la capa superior (los segundos datos de forma).
De acuerdo con el aparato de codificación de imágenes en movimiento y el aparato de decodificación de imágenes en movimiento de acuerdo con las anteriores realizaciones, pueden obtenerse los siguientes efectos favorables:
(1)
Puede realizarse la codificación y decodificación de una imagen parcial que tenga una jerarquía espacial.
(2)
En la primera realización, lo datos de forma de baja resolución se codifican como los datos de forma para una capa inferior. En consecuencia, la redundancia asociada con la codificación de los datos de forma de alta resolución en la capa inferior puede ser eliminada. En consecuencia, una imagen en la capa inferior puede ser codificada y decodificada con una calidad de imagen deseable, incluso con transmisión limitada o capacidad de almacenamiento.
(3)
En la segunda realización, la información sobre los datos de forma en la capa inferior se utiliza para codificación los datos de forma en la capa superior, y la información sobre la diferencia entre los datos de forma de baja resolución y los datos de forma de alta resolución se codifican. En consecuencia, la cantidad de datos para codificar los datos de forma en la capa superior puede reducirse. En consecuencia puede realizarse una codificación eficiente en la capa superior.
(4)
En la tercera realización, los datos de forma de la capa superior se transforman para generar datos de forma de la capa inferior que tengan más niveles de gradación. En consecuencia, el límite en forma de pasos existente en la porción del contorno de los datos de forma de la capa inferior puede ser no conspicuo. En consecuencia, el contorno de una imagen parcial en una pantalla llega a ser suave, y por tanto puede obtenerse una imagen físicamente favorable.
(5)
En otra realización de la presente invención, suponiendo que los datos de forma de la capa superior son menores que los datos de forma de la capa inferior, puede realizarse una codificación jerárquica de los datos de forma de la capa inferior, para mejorar la resolución espacial de una parte de la capa inferior utilizando datos en la capa superior. En consecuencia, si existe una necesidad de observar en los contenidos de una imagen solo en una porción de la capa inferior, o si solo una porción en la capa inferior tiene una textura compleja y tiene que visualizarse en alta resolución, será posible ejecutar una codificación jerárquica apropiada.
Aplicabilidad industrial
Tal como se ha descrito anteriormente, la presente invención permite una codificación y decodificación eficientes de una imagen parcial que tiene una jerarquía espacial. En consecuencia, la presente invención es aplicable ventajosamente en el campo de los aparatos de codificación y decodificación de las imágenes.

Claims (2)

1. Un aparato de codificación de imágenes en movimiento, operable para ejecutar una codificación jerárquica de un objeto de imagen, que comprende:
1)
una primera parte de generación de datos de forma operable para codificar los datos de forma de baja resolución generados;
2)
una primera porción de codificación de datos de forma, operable para codificar los datos de forma de baja resolución generados;
3)
una porción de codificación de capa inferior operable para codificar la parte de la imagen en baja resolución como un objeto de imagen de capa inferior basándose en los primeros datos de forma;
4)
una segunda porción de generación de datos de forma operable para generar datos de forma de alta resolución para una porción de la imagen parcial;
5)
una segunda porción de codificación de datos de forma operable para los datos de forma de alta resolución generados; y
6)
una porción de codificación de la capa superior operable para codificar la porción de la imagen parcial en alta resolución como un objeto de la imagen de la capa superior basándose en los segundos datos de forma, en donde,
el aparato es operable para transmitir los datos codificados generados por las mencionadas porciones de codificación superior e inferior.
2. Un aparato de decodificación de imágenes en movimiento, operable para decodificar en forma jerárquica el objeto de la imagen recibida, en donde el aparato comprende:
1)
una primera porción de decodificación de datos de forma operable para decodificar los datos codificados de unos datos de forma de capa inferior correspondiente a una parte de una imagen, para obtener datos de forma de baja resolución;
2)
una porción de decodificación de capa inferior operable para decodificar la imagen parcial en baja resolución como un objeto de imagen de capa inferior basándose en los primeros datos de forma;
3)
una segunda porción de decodificación de datos de forma operable para decodificar los datos codificados correspondientes a una porción de la imagen parcial de unos datos de forma de la capa superior, para obtener datos de forma de alta resolución; y
4)
una porción de decodificación de la capa superior operable para decodificar una porción de la imagen parcial en alta resolución como un objeto de la imagen de la capa superior basándose en los segundos datos de forma.
ES02024381T 1996-06-27 1997-05-07 Aparato de codificacion y decodificacion de imagenes. Expired - Lifetime ES2344593T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP8-166978 1996-06-27
JP16697896A JP3210862B2 (ja) 1996-06-27 1996-06-27 画像符号化装置及び画像復号装置

Publications (1)

Publication Number Publication Date
ES2344593T3 true ES2344593T3 (es) 2010-09-01

Family

ID=15841142

Family Applications (2)

Application Number Title Priority Date Filing Date
ES02024381T Expired - Lifetime ES2344593T3 (es) 1996-06-27 1997-05-07 Aparato de codificacion y decodificacion de imagenes.
ES97918380T Expired - Lifetime ES2227686T3 (es) 1996-06-27 1997-05-07 Codificador de imagenes de decodificador de imagenes.

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES97918380T Expired - Lifetime ES2227686T3 (es) 1996-06-27 1997-05-07 Codificador de imagenes de decodificador de imagenes.

Country Status (9)

Country Link
US (3) US6295381B1 (es)
EP (2) EP1289303B1 (es)
JP (1) JP3210862B2 (es)
KR (1) KR100296716B1 (es)
CN (2) CN1251508C (es)
DE (2) DE69730713T2 (es)
ES (2) ES2344593T3 (es)
HK (1) HK1050979A1 (es)
WO (1) WO1997050253A1 (es)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3210862B2 (ja) 1996-06-27 2001-09-25 シャープ株式会社 画像符号化装置及び画像復号装置
JP4034380B2 (ja) * 1996-10-31 2008-01-16 株式会社東芝 画像符号化/復号化方法及び装置
US6259738B1 (en) 1996-10-31 2001-07-10 Kabushiki Kaisha Toshiba Video encoding apparatus and video decoding apparatus
TW395131B (en) * 1997-01-10 2000-06-21 Matsushita Electric Ind Co Ltd Method and device for processing image, and date recording medium
US6741748B1 (en) * 1997-06-19 2004-05-25 Samsung Electronics Co. Scan interleaving method based on context values of neighboring pixels, improved encoding/decoding method of binary shape data and encoding/decoding apparatus suitable for the same
JP2000013790A (ja) 1998-06-19 2000-01-14 Sony Corp 画像符号化装置および画像符号化方法、画像復号装置および画像復号方法、並びに提供媒体
US8050329B2 (en) * 1998-06-26 2011-11-01 Mediatek Inc. Method and apparatus for generic scalable shape coding
US6459814B1 (en) * 1998-09-08 2002-10-01 Sarnoff Corporation Method and apparatus for generic scalable shape coding by deriving shape information for chrominance components from luminance component
EP1079625A3 (en) 1999-06-15 2003-03-12 Canon Research Centre France S.A. Digital signal coding, decoding and transmission, with decomposition into frequency sub-bands and segmentation
FR2806570B1 (fr) * 2000-03-15 2002-05-17 Thomson Multimedia Sa Procede et dispositif de codage d'images video
JP3561485B2 (ja) * 2000-08-18 2004-09-02 株式会社メディアグルー 符号化信号分離・合成装置、差分符号化信号生成装置、符号化信号分離・合成方法、差分符号化信号生成方法、符号化信号分離・合成プログラムを記録した媒体および差分符号化信号生成プログラムを記録した媒体
US6810086B1 (en) 2001-06-05 2004-10-26 At&T Corp. System and method of filtering noise
US7773670B1 (en) 2001-06-05 2010-08-10 At+T Intellectual Property Ii, L.P. Method of content adaptive video encoding
US6968006B1 (en) 2001-06-05 2005-11-22 At&T Corp. Method of content adaptive video decoding
US6970513B1 (en) 2001-06-05 2005-11-29 At&T Corp. System for content adaptive video decoding
US6909745B1 (en) 2001-06-05 2005-06-21 At&T Corp. Content adaptive video encoder
US7003155B2 (en) * 2001-09-27 2006-02-21 The John Hopkins University System and method for creating unclassified line drawings from classified NTM images
JP2003224846A (ja) * 2002-01-29 2003-08-08 Matsushita Electric Ind Co Ltd 画像処理装置、復号化装置、符号化装置、画像処理システム、画像処理方法、及び、符号化方法
JPWO2003079692A1 (ja) * 2002-03-19 2005-07-21 富士通株式会社 階層符号化装置および復号装置
WO2004080067A1 (en) * 2003-03-03 2004-09-16 Nokia Corporation Method, system and network entity for indicating hierarchical mode for transport streams carried in broadband transmission
EP1730695A2 (en) * 2004-03-09 2006-12-13 Thomson Research Funding Corporation Reduced resolution update mode for advanced video coding
DE102004038110B3 (de) * 2004-08-05 2005-12-29 Siemens Ag Verfahren zum Codieren und Decodieren, sowie Codier- und Decodiervorrichtung zur Videocodierung
JP4371982B2 (ja) * 2004-11-08 2009-11-25 キヤノン株式会社 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
CN100403803C (zh) * 2005-01-19 2008-07-16 威盛电子股份有限公司 具有快取的阶层式搜寻方法与系统
KR100763205B1 (ko) * 2006-01-12 2007-10-04 삼성전자주식회사 모션 역변환을 사용하여 모션 예측을 수행하는 방법 및장치
EP2048887A1 (en) * 2007-10-12 2009-04-15 Thomson Licensing Encoding method and device for cartoonizing natural video, corresponding video signal comprising cartoonized natural video and decoding method and device therefore
KR100997082B1 (ko) 2009-05-21 2010-11-29 (주)테슬라시스템 다해상도 동영상 코덱 방법 및 장치
WO2011087963A1 (en) 2010-01-15 2011-07-21 Dolby Laboratories Licensing Corporation Edge enhancement for temporal scaling with metadata
FR2981781A1 (fr) * 2011-10-19 2013-04-26 France Telecom Codage hierarchique perfectionne

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01141479A (ja) 1987-11-28 1989-06-02 A T R Tsushin Syst Kenkyusho:Kk 視線検出を利用した画像通信装置
JP2584840B2 (ja) 1988-08-30 1997-02-26 キヤノン株式会社 画像の階層的符号化装置
JP2502176B2 (ja) 1990-09-10 1996-05-29 三菱電機株式会社 画像信号の符号化器及びその復号化器
JP3609097B2 (ja) * 1992-01-17 2005-01-12 株式会社リコー 画像暗号化再生装置
NL9201594A (nl) * 1992-09-14 1994-04-05 Nederland Ptt Systeem omvattende ten minste één encoder voor het coderen van een digitaal signaal en ten minste één decoder voor het decoderen van een gecodeerd digitaal signaal, en encoder en decoder voor toepassing in het systeem.
NL9201640A (nl) * 1992-09-22 1994-04-18 Nederland Ptt Systeem omvattende ten minste één encoder voor het coderen van een digitaal signaal en ten minste één decoder voor het decoderen van een digitaal signaal, en encoder en decoder voor toepassing in het systeem volgens de uitvinding.
US6009200A (en) * 1992-12-17 1999-12-28 Sony Corporation Dynamic image processing apparatus and method
JP3189258B2 (ja) 1993-01-11 2001-07-16 ソニー株式会社 画像信号符号化方法および画像信号符号化装置、並びに画像信号復号化方法および画像信号復号化装置
KR100276427B1 (ko) * 1993-01-30 2000-12-15 윤종용 화상데이타의 압축 및 복원장치
CA2115976C (en) * 1993-02-23 2002-08-06 Saiprasad V. Naimpally Digital high definition television video recorder with trick-play features
US5430486A (en) * 1993-08-17 1995-07-04 Rgb Technology High resolution video image transmission and storage
JPH07107488A (ja) 1993-09-30 1995-04-21 Toshiba Corp 動画像符号化装置
JPH07262384A (ja) 1994-03-23 1995-10-13 Nippon Telegr & Teleph Corp <Ntt> 画像領域分割方法及び装置
JPH07288789A (ja) * 1994-04-15 1995-10-31 Hitachi Ltd 知的符号化装置及び画像通信装置
JPH07288806A (ja) * 1994-04-20 1995-10-31 Hitachi Ltd 動画像通信システム
US5640468A (en) * 1994-04-28 1997-06-17 Hsu; Shin-Yi Method for identifying objects and features in an image
JP3758211B2 (ja) 1994-07-19 2006-03-22 ソニー株式会社 ディジタル画像信号の階層符号化装置および方法、並びに復号装置および方法
US6005679A (en) * 1994-08-22 1999-12-21 Fuji Photo Film Co., Ltd. Image data filing system for quickly retrieving an area of interest of an image from a reduced amount of image data
US5828788A (en) * 1995-06-29 1998-10-27 Thomson Multimedia, S.A. System for processing data in variable segments and with variable data resolution
JP3210862B2 (ja) 1996-06-27 2001-09-25 シャープ株式会社 画像符号化装置及び画像復号装置

Also Published As

Publication number Publication date
EP0909096B1 (en) 2004-09-15
CN1501715A (zh) 2004-06-02
US20020009234A1 (en) 2002-01-24
KR20000022218A (ko) 2000-04-25
DE69739846D1 (de) 2010-05-27
DE69730713T2 (de) 2005-09-22
JPH1013829A (ja) 1998-01-16
EP1289303B1 (en) 2010-04-14
KR100296716B1 (ko) 2001-08-07
US6546142B2 (en) 2003-04-08
EP1289303A2 (en) 2003-03-05
CN1251508C (zh) 2006-04-12
CN1223771A (zh) 1999-07-21
HK1050979A1 (en) 2003-07-11
ES2227686T3 (es) 2005-04-01
EP0909096A4 (en) 2000-12-13
US20030113028A1 (en) 2003-06-19
DE69730713D1 (de) 2004-10-21
CN1148969C (zh) 2004-05-05
EP1289303A3 (en) 2003-03-26
JP3210862B2 (ja) 2001-09-25
US6671412B2 (en) 2003-12-30
EP0909096A1 (en) 1999-04-14
WO1997050253A1 (en) 1997-12-31
US6295381B1 (en) 2001-09-25

Similar Documents

Publication Publication Date Title
ES2344593T3 (es) Aparato de codificacion y decodificacion de imagenes.
JP4759284B2 (ja) 3次元体積データの符号化/復号化方法及び装置
US7215709B2 (en) Video encoding apparatus and video decoding apparatus
ES2207455T3 (es) Procedimiento y aparato de decodificacion de imagenes.
ES2299787T3 (es) Codificacion de video mejorada usando codificacion adaptativa de parametros de bloque para bloques codificados/sin codificar.
KR100513732B1 (ko) 3차원 객체 데이터 부호화 및 복호화 방법 및 장치
US20190191170A1 (en) System and method for improving efficiency in encoding/decoding a curved view video
US20180098090A1 (en) Method and Apparatus for Rearranging VR Video Format and Constrained Encoding Parameters
TW201813399A (zh) 使用虛擬參考畫面對虛擬現實視頻進行畫面間編碼之方法及裝置
US20050089230A1 (en) Video coding and video decoding apparatus
KR100574702B1 (ko) 화상부호/복호방법 및 그 프로그램을 기록한 기록매체
ES2211685T3 (es) Decodificador con medios para complementar una imagen digital con un elemento de imagen.
KR20180101123A (ko) 영상 부호화 또는 복호화하기 위한 장치 및 방법
JPH1155665A (ja) 任意形状符号化方法
KR100255754B1 (ko) 이진 형상 신호 부호화 방법
JPH11313211A (ja) 2値形状信号符号化/復号化装置
EP3349460A1 (en) Method and apparatus for coding/decoding a picture of an omnidirectional video
JPH09251554A (ja) 画像処理装置
KR100522171B1 (ko) 임의 형상 프레임 생성기 및 그를 이용한 임의 형상프레임 생성 방법
JP2007195209A (ja) 画像符号化方法及び装置
JP2007166665A (ja) 画像復号化方法及び装置