ES2198058T3

ES2198058T3 - Procedimiento y dispositivo para la codificacion y decodificacion de una imagen digitalizada.

Info

Publication number: ES2198058T3
Application number: ES98933457T
Authority: ES
Inventors: Andre Kaup
Original assignee: Siemens AG
Current assignee: Siemens AG
Priority date: 1997-05-07
Filing date: 1998-05-05
Publication date: 2004-01-16
Anticipated expiration: 2018-05-05
Also published as: CN1255267A; EP0981909B1; EP0981909A1; US7283675B1; JP2000513914A; DE19719383A1; CN1244233C; JP3798432B2; DE59808075D1; WO1998051085A1

Abstract

La misma cantidad de información de codificación para los píxeles contenidos en un bloque de imagen marginal se determina de manera separada para dicho bloque de imagen marginal y se resta de la información de codificación de los píxeles del bloque de imagen marginal, por medio de la que se obtiene una eficiencia de codificación mejorada.

Description

Procedimiento y dispositivo para la codificación y decodificación de una imagen digitalizada.

La invención se refiere a la codificación y decodificación de una corriente de datos de vídeo, que contiene imágenes digitalizadas.

La codificación de señales de vídeo de acuerdo con las normas de codificación de imágenes MPEG (MPEG1, MPEG2) [1], JPEG [2], H.261 [3], H.263 [4], se basa en el principio de la llamada codificación de imágenes basada en bloques.

Los procedimientos de codificación de imágenes basada en bloques utilizan principio de la codificación de predicción y de la codificación de transformación.

En el caso de la predicción se generan imágenes diferenciales a través de la substracción de datos de imágenes de predicción de los datos de imágenes originales a codificar.

Para la predicción se emplea una llamada predicción de movimiento compensado. Los principios de la estimación del movimiento necesarios para ello y su utilización para la predicción de movimiento compensado son conocidos por el técnico [5]. La estimación del movimiento se realiza para un bloque de imágenes a codificar de tal forma que se compara la información de luminosidad (información de claridad), que está asociada en cada caso a cada punto de imagen de la imagen, del bloque de imágenes a codificar con la información de luminosidad de una región de la misma forma en una imagen precedente en el tiempo memorizada. La comparación se realiza habitualmente a través de la formación de las diferencias absolutas de los valores individuales de luminosidad. La comparación se realiza para el bloque de imágenes a codificar con varias regiones de la imagen precedente, que son designadas, por lo demás, como bloques de imágenes precedentes. Las imágenes diferenciales contienen en adelante solamente todavía la diferencia de los valores de luminosidad del bloque de imágenes y de los valores de luminosidad del bloque de imágenes precedente que coincide de una manera ``óptima'' en la estimación del movimiento.

Las correlaciones locales, que están presentes en las imágenes diferenciales entre puntos de imagen vecinos, son utilizadas con la ayuda de una transformación adecuada, por ejemplo con la ayuda de la transformación de coseno discreto (DCT). La codificación de transformación utilizada proporciona coeficientes de codificación por transformación, que son sometidos a una cuantificación y a una codificación por entropía. A continuación se transmiten los coeficientes de codificación por transformación hacia un receptor, en el que se realiza todo el procedimiento de codificación de manera inversa. De esta manera está disponible en el receptor, después de la realización de la decodificación, de nuevo directamente información sobre los puntos de imagen.

En los procedimientos de codificación de imágenes basada en bloques se distingue entre dos modos de codificación de imágenes diferentes.

En el llamado modo Intra de codificación de imágenes, se codifica en cada caso toda la imagen o una sección parcial adecuada de la imagen (por ejemplo, un bloque de imagen) con toda la información de codificación asociada a los puntos de imagen de la imagen y se transmite. En este modo se codifican las llamadas imágenes-I o bloques de imágenes-I.

En el llamado modo Inter de la codificación de imágenes solamente se codifica en cada caso la información diferencial de la imagen de dos imágenes consecutivas en el tiempo. En este modo se codifican las llamadas imágenes P o imágenes-B o bloques de imágenes-P o bloques de imágenes-B.

Por información de codificación se entiende en adelante la información de claridad (información de luminosidad) o la información de color (información de crominancia), que está asociada a los puntos de imagen de la imagen.

Se conocen a partir de [6] procedimientos para la llamada codificación de imágenes basada en el objeto. En la codificación de imágenes basada en el objeto, se lleva a cabo una segmentación de un objeto de acuerdo con los objetos de la imagen que se encuentran en la imagen. Los objetos de la imagen son codificados por separado. En estos procedimientos se emplean igualmente procedimientos para la estimación del movimiento y para la codificación por transformación.

En los procedimientos de codificación de la imagen basada en el objeto, cada objeto de la imagen BO es desintegrado en primer lugar en bloques de imágenes BB de un tamaño fijo, por ejemplo de 8 x 8 puntos de imagen BP. Después de la desintegración, una parte de los bloques de imágenes resultantes se encuentra totalmente dentro de un objeto de la imagen BO, lo que se representa en la figura 4. La imagen B contiene al menos un objeto de la imagen BO, que se designa con un canto de objeto OK del objeto de la imagen BO.

Los bloques de imágenes BB, que contienen al menos una parte del canto de objeto OK, son designados, por lo demás, como bloques marginales de la imagen RBB.

\newpage

Los bloques de imágenes BB, que se encuentran después de la desintegración totalmente dentro del objeto de imagen BO, se pueden codificar por transformación en conexión con los procedimientos de codificación de imágenes basada en bloques mencionados con una transformación discreta de coseno (DCT) habitual basada en bloques.

Pero los bloques marginales de la imagen RBB deben ser codificados con un procedimiento especial.

Para la codificación de bloques marginales de la imagen RBB existen hasta ahora dos principios básicos.

Se conoce a partir de [6] completar la información de codificación de los puntos de imagen del objeto de imagen BO dentro de un bloque marginal de la imagen RBB a través de un procedimiento de extrapolación adecuado de la información de codificación sobre la superficie del bloque marginal completo de la imagen RBB. Este modo de proceder se designa como Padding. La superficie completada es codificada a continuación con una Transformación de Coseno Discreto bidimensional habitual.

Se conoce a partir de [8] una codificación por transformación adaptable empleando una Transformación de Karhunen-Loève (KLT). En este procedimiento, antes de la aplicación de la KLT sobre las informaciones individuales de codificación a transformar se substrae el componente constante de las informaciones de codificación y se aplica la KLT sobre la información de codificación restada en cada caso de un punto de imagen.

Como una alternativa, se conoce a partir de [6], [7] y [9] que el objeto de la imagen BO es transformado separado por líneas y columnas. Esta técnica se designa como codificación por transformación con adaptación de forma, en el caso de que se aplique una DCT, se designa como DCT con adaptación de forma (Shape Adaptive DCT, SA-DCT). Los coeficientes DCT asociados al objeto de la imagen BO son determinados de tal forma que se suprimen los puntos de imagen BP de un bloque marginal de la imagen RBB, que no pertenecen al objeto de la imagen BO. Sobre los puntos de imagen BP restantes se aplica entonces en primer lugar por columnas una DCT unidimensional, cuya longitud corresponde al número de los puntos de imagen BP restantes en la columna respectiva. Los coeficientes DCT resultantes son alineados horizontalmente y a continuación son sometidos a otra DCT unidimensional en dirección horizontal con longitud correspondiente.

La especificación, conocida por [7] de la SA-DCT parte de una matriz de transformación DCT-N con la siguiente estructura:

\underline{DCT-N}(p,k)=\gamma \cdot cos \left[p \cdot \left(k+ \frac{1}{2}\right) \cdot \frac{\pi}{N}\right],

k, p = 0 \rightarrow N – 1

El valor \gamma = 1/\surd2 para el caso p = 0 y \gamma = 1 para todos los otros casos.

Con N se designa una magnitud del vector de la imagen a transformar, en el que están contenidos los puntos de imagen transformados.

Con DCT-N se designa una matriz de transformación de la magnitud N x N.

Con p, k se designan índices con p, k \in [0, N-1].

Según la SA-DCT, cada columna del bloque de la imagen a transformar es transformada verticalmente según la especificación:

\underline{c}_{j}=2 \cdot \frac{2}{N} \cdot \underline{DCT - N \cdot x_{i}}

y a continuación se aplica la misma especificación sobre los datos resultantes en dirección horizontal.

Un inconveniente de la SA-DCT se puede ver en que ninguno de los coeficientes de la transformación resultantes (coeficientes espectrales) representa el componente constante de la información de codificación de los puntos de imagen P del objeto de la imagen BO. El componente constante, que se designa también como coeficiente DC, contiene, sin embargo, en los datos habituales de la imagen, la mayor parte de la energía de la señal y, por lo tanto, tiene una importancia especial para una codificación eficiente de la imagen.

Por lo tanto, la invención se basa en el problema de indicar procedimientos y disposiciones para la codificación y decodificación de imágenes digitales, con los que se posibilita una codificación y decodificación más eficientes.

El problema se soluciona a través del procedimiento según la reivindicación 1 de la patente, a través del procedimiento según la reivindicación 6 de la patente, a través del dispositivo según la reivindicación 11 de la patente, a través del dispositivo según la reivindicación 16 de la patente así como a través de los medios de memoria legibles por ordenador según las reivindicaciones 21 y 22 de la patente.

Los dispositivos pueden ser ordenadores universales con un microprocesador programable, la unidad de procesador. La codificación y decodificación, respectivamente, de las imágenes digitalizadas se realiza en este caso utilizando un programa de ordenador, que está programado de tal forma que las etapas correspondientes del procedimiento son realizadas por el ordenador. Las unidades lógicas descritas a continuación del codificador y del decodificador, respectivamente, están configuradas en este caso, por ejemplo, como procedimientos autónomos del programa de ordenador.

Los dispositivos pueden ser también módulos de hardware, por ejemplo una tarjeta de ordenador especial para el procesamiento digital de la imagen, que contienen, respectivamente, un módulo especial para las unidades lógicas descritas a continuación del codificador y del decodificador, respectivamente.

Una ventaja de los procedimientos y de los dispositivos se puede ver en que a través de la determinación separada del componente constante y la reducción de la información de codificación de los puntos de imagen del bloque respectivo de la imagen o de la parte del mismo, se consigue un ahorro considerable de capacidad de transmisión que es necesaria para la transmisión de una imagen o bien una compresión elevada de los datos de la imagen.

Otra ventaja consiste en que a través de este modo de proceder se posibilita la aplicación de una variante ortonormal descrita a continuación de la SA-DCT. Esto conduce a una eficiencia de la codificación mejorada adicionalmente, es decir, que se eleva en una medida considerable la calidad de la imagen manteniendo la velocidad de los datos.

Está claro que la invención se puede ver en que para un bloque marginal de la imagen, se determina por separado el componente constante de la información de codificación de los puntos de imagen contenidos en el bloque marginal de la imagen y se resta de la información de codificación de los puntos de imagen del bloque marginal de la imagen, con lo que se consigue una eficiencia mejorada de la codificación.

Los desarrollos ventajosos de la invención se deducen de las reivindicaciones dependientes.

En un desarrollo del procedimiento para la codificación es ventajoso realizar la codificación por transformación de tal forma que la energía de la señal de la información de codificación de los puntos de imagen en el campo del espacio sea aproximadamente idéntica a la energía de la señal de la información de codificación transformada de los puntos de imagen en el campo de frecuencia.

En este caso es ventajoso formar los coeficientes de transformación c_{j} a partir de los valores de la diferencia d_{j} de la información de codificación de los puntos de la imagen de acuerdo con la siguiente especificación:

\underline{c}_{j}=\sqrt{\frac{2}{N}} \cdot \underline{DCT - N}(p,k) \cdot \underline{d}_{j}

en la que con

-: d_{j} se designan los valores de la diferencia entre la información de codificación y el componente constante,

-: N se designa una magnitud de un vector de imagen que debe ser transformado, en el que están contenidos los puntos de imagen xj,

-: DCT-N se designa una matriz de transformación del tamaño N x N,

-: p, k se designan índices, donde p, k \in [0, N-1]

A través de la variante ortonormal descrita anteriormente de la SA-DCT se incrementa en una medida considerable la eficiencia de la codificación.

En un desarrollo del procedimiento para la decodificación, es ventajoso de una manera correspondiente realizar la codificación por transformación inversa de tal forma que la energía de la señal de la información de codificación de los puntos de imagen en el campo del espacio sea aproximadamente idéntica a la energía de la señal de la información de codificación transformada de los puntos de imagen en el campo de frecuencia.

En este caso es ventajoso formar los valores de la diferencia d_{j} a partir de los coeficientes de transformación c_{j} de acuerdo con la siguiente especificación:

\underline{d}_{j}= \sqrt{\frac{2}{N}} \cdot (\underline{DCT - N}(p,k))^{-1} \cdot \underline{c}_{j}

en la que con

-: N se designa una magnitud de un vector de la imagen que debe ser transformado, en el que están contenidos los puntos de imagen,

-: DCT-N se designa una matriz de transformación que tiene el tamaño N x N,

-: p, k se designan índices, donde p, k \in [0, N-1]

-: (\bullet)^{-1} se designa una inversión de la matriz.

Los procedimientos son especialmente adecuados para la codificación de bloques de imágenes, que contienen el canto del objeto de un objeto de la imagen, que se designan a continuación como bloques marginales de la imagen.

En las figuras se representa un ejemplo de realización preferido de la invención, que se explica en detalle a continuación.

En este caso:

La figura 1 muestra un diagrama de flujo, en el que se representan las etapas individuales del procedimiento para la codificación y del procedimiento para la decodificación.

La figura 2 muestra un esbozo de una disposición de ordenador con dos ordenadores, una cámara y un medio de transmisión para el registro, codificación, transmisión y decodificación de datos de la imagen.

La figura 3 muestra un esbozo de una disposición habitual para la codificación de imágenes basada en bloques con las unidades lógicas empleadas habitualmente.

La figura 4 muestra de forma simbólica una representación de una imagen con un objeto de la imagen y bloques de la imagen y bloques marginales de la imagen.

La figura 2 muestra una cámara K, con la que se toma una secuencia de imágenes B y se alimenta a un primer ordenador R1 a través de una conexión V.

En el primer ordenador R1 son digitalizadas y codificadas las imágenes de la secuencia de imágenes B según el procedimiento descrito en [6] de la futura Norma MPEG4.

El primer ordenador R1 está conectado a través de un medio de transmisión UM, por ejemplo un cable o un trayecto de transmisión por radio, con un segundo ordenador R2. A través del medio de transmisión UM se transmiten los datos de la imagen codificados por el primer ordenador R1 al segundo ordenador R2 y son decodificados allí.

El primer ordenador R1 y el segundo ordenador R2 presentan en cada caso una memoria SP y una unidad de cálculo RE, que están conectadas entre sí a través de un bus BU. La unidad de cálculo RE del primer ordenador R1 está configurada de tal forma que se llevan a cabo las etapas del procedimiento explicadas a continuación para la codificación de las imágenes digitalizadas. La unidad de cálculo RE del segundo ordenador R2 está configurada de tal forma que los datos codificados recibidos don decodificados de acuerdo con el procedimiento MPEG2. El primer ordenador R1 y el segundo ordenador R2 presentan, además, en cada caso una pantalla BS para la representación de las imágenes B así como un teclado TA y un ratón MA para el control de los ordenadores R1, R2.

En el marco de MPEG4 se lleva a cabo una segmentación de una imagen B de acuerdo con los objetos de la imagen BO que están presentes en la imagen B (ver la figura 4). Los objetos de la imagen BO son codificados por separado.

Para la codificación de un objeto de la imagen BO se descompone el objeto de la imagen BO en primer lugar en bloques de la imagen BB de un tamaño fijo, en este caso de 8 x 8 puntos de imagen BP. Después de la desintegración, una parte de los bloques resultantes de la imagen se encuentra totalmente dentro de un objeto de la imagen BO, lo que se representa en la figura 4. La imagen B contiene al menos un objeto de la imagen BO, que es enmarcado con un canto de objeto OK del objeto de la imagen BO.

Los bloques de la imagen BB, que se encuentran después de la desintegración totalmente fuera del objeto de la imagen BO, se pueden codificar por transformación con relación a los procedimientos de codificación de la imagen mencionados anteriormente con una Transformación de coseno discreto (DCT) (ver la figura 3).

Los bloques de la imagen BB son codificados en un modo Intra de codificación de imágenes o en un modo Inter de la codificación de imágenes. Para la conmutación entre los modos están previstas dos unidades de conmutación SE.

Para la realización del modo Inter de la codificación de imágenes está prevista una unidad de substracción S, en la que de la información de luminosidad de los puntos de imagen BP del bloque de la imagen BB se resta la información de luminosidad de puntos de imagen de un bloque de la imagen PBB predicho que se explica a continuación.

Un bloque de imagen diferencial DBB, que resulta a través de la formación de la diferencia, es alimentado a una unidad para la codificación por transformación DCT, en la que se aplica sobre el bloque de imagen diferencial DBB una Transformación de Coseno discreto (DCT) para la formación de coeficientes de transformación TK. Los coeficientes de transformación TK son cuantificados QTK en una unidad de cuantificación Q. Los coeficientes de transformación cuantificados QTK son alimentados a una unidad para la codificación por entropía VLC, en la que se realiza una llamada codificación de longitud de ejecución (Run Length Coding) y/o una llamada codificación de longitud variable (Variable Length Coding).

En la codificación, los coeficientes de transformación cuantificados QTK son alimentados, además, a una unidad para la cuantificación inversa IQ, en la que se forman coeficientes de transformación cuantificados invertidos IQTK.

En una unidad para la codificación por transformación inversa IDCT se transforman de forma inversa los coeficientes de transformación cuantificados invertidos IQTK. Resultan coeficientes de transformación inversos ITK, que son alimentados a una unidad de adición AE.

A la unidad de adición se alimenta, además, el bloque de la imagen de predicción PBB. El bloque de la imagen de predicción PBB contiene coeficientes de transformación predichos, que son sumados a los coeficientes de transformación inversos ITK. Los coeficientes de transformación reconstruidos RTK que resultan de ello son memorizados en una memoria SP:

En la memoria SP se memoriza en cada caso al menos una imagen reconstruida precedente en el tiempo. La imagen precedente presenta bloques de imágenes precedentes con los coeficientes de transformación reconstruidos RTK, que representan la información de luminosidad precedente de puntos de imagen precedentes BP de la imagen precedente.

La imagen memorizada en la memoria SP es utilizada para una estimación del movimiento, que se lleva a cabo en una unidad para la estimación del movimiento BSC.

La estimación del movimiento BSC se realiza de tal forma que para los puntos de imagen BP, respectivamente, de un bloque de la imagen BB se lleva a cabo una comparación de la información de luminosidad con la información de luminosidad de puntos de imagen BP de la imagen precedente. En la imagen precedente se utilizan en cada caso puntos de imagen precedentes, que se agrupan en un bloque de la imagen precedente.

Para el bloque de la imagen BB se forma una diferencia absoluta de la información de luminosidad de los puntos de imagen BP, que están contenidos en el bloque de la imagen BB, con información de luminosidad de puntos de imagen de una región en la imagen precedente, que presenta la misma forma que el bloque de la imagen BB. La diferencia se designa en adelante como cota de error.

La cota de error se forma para un bloque de la imagen BB según la especificación siguiente:

F= \sum^{8}_{i=1} \sum^{8}_{j=1} \;|\; x_{ij}-y_{ij}\;|,

en la que con

-: i se designa un índice de líneas para la identificación clara de una línea dentro del bloque de la imagen BB,

-: j se designa un línea de líneas para la identificación clara de una columna dentro del bloque de la imagen BB,

-: x_{ij} se designa un valor de luminosidad, que está asociado a un punto de imagen BP, que se encuentra en la posición indicada a través de i, j, dentro del bloque de la imagen BB,

-: y_{ij} se designa un valor de luminosidad, que está asociado a un punto de imagen BP precedente, que se encuentra en la posición indicada a través de i, j, dentro de la región de la imagen precedente, que se compara con el bloque de la imagen BB.

La cota de error se forma para un número predeterminable de regiones dentro de la imagen precedente, la llamada región de búsqueda.

Como resultado de la estimación del movimiento BSC se selecciona la región de la imagen B precedente como bloque predicho de la imagen PBB, para el que la cota de error es mínima, puesto que para esta región la coincidencia con el bloque de la imagen BB es óptima.

Además, en el marco de la estimación del movimiento se determina el desplazamiento local del bloque de la imagen BB con respecto al bloque predicho de la imagen PBB en la imagen precedente. El desplazamiento es designado a continuación como vector de movimiento BV.

En el marco de la estimación del movimiento BSC se conduce una ADR a la memoria SP en cada caso para el direccionamiento claro de la región de la imagen precedente.

El vector de movimiento BV es memorizado en la memoria SP después de la estimación completa del movimiento BSC.

Los valores de luminosidad de los puntos de imagen del bloque predicho de la imagen PBB son alimentados a la unidad de substracción SE y son restados de los valores de luminosidad de los puntos de imagen BP del bloque de la imagen BB.

En el modo Intra de codificación de imágenes, los bloques de la imagen BB son sometidos completamente a la DCT, con cuantificados y son codificados por entropía. En este modo no se lleva a cabo una estimación del movimiento BSC.

Sin embargo, los bloques marginales de la imagen RBB deben ser codificados con un procedimiento especial. La invención se describe a continuación para bloques marginales de la imagen RBB y para el modo Intra de la codificación de imágenes.

La figura 1 muestra un diagrama de flujo, en el que están representadas las etapas individuales del procedimiento.

En una primera etapa 101 se alimenta un bloque marginal de la imagen RBB en el modo Intra de codificación de imágenes a la unidad para la codificación por transformación DCT.

En la unidad para la codificación por transformación DCT se determina un componente constante DC de la información de codificación de los puntos de imagen BP del bloque marginal de la imagen RBB, que pertenecen al objeto de la imagen BO (etapa 102). El componente constante DC se forma de acuerdo con la siguiente especificación:

DC= \frac{1}{N} \cdot \sum_{i,j \in BO} f(i, \;j),

en la que con

-: N se designa un número de los puntos de imagen BP, que pertenecen al objeto de la imagen BO, del bloque marginal de la imagen RBB,

-: F(i, j) se designa el valor de la información de codificación, que está asociada al punto de imagen BP que se encuentra en la posición indicada a través de los índices i, j.

En una tercera etapa, se resta el componente constante DC determinado de la información de codificación de cada punto de imagen BP del bloque marginal de la imagen RBB, que pertenece al objeto de la imagen BO.

Resultan valores diferenciales d(i, j) de la información de codificación, respectivamente, para un punto de imagen en la posición (i, j) dentro del bloque marginal de la imagen RBB según la siguiente especificación.

d(i,\;\; j) = f(i, \; j) - DC \qquad \forall (I, \;j) \in BO

Los valores diferenciales d(i, j) son sometidos a una variante de la SA-DCT (etapa 104). Agrupados en un vector diferencial dj resulta la siguiente especificación para la formación de los coeficientes de transformación cj a partir del vector dj de los valores diferenciales d(i, j) de la información de codificación de los puntos de imagen según la especificación siguiente:

\underline{c}_{j}= \sqrt{\frac{2}{N}} \cdot \underline{DCT-N}(p,k) \cdot \underline{d}_{j}

en el que con

-: N se designa una magnitud de un vector de imagen que debe ser transformado, en el que están contenidos los puntos de imagen BP,

-: p, k se designan índices, donde p, k \in [0, N-1].

Como se deduce claramente, la especificación para la formación de los coeficientes de transformación significa que la energía de la señal de la información de codificación de los puntos de imagen BP en el campo del espacio es aproximadamente idéntica a la energía de la señal de la información de codificación transformada de los puntos de imagen BP en el campo de frecuencia.

\newpage

El componente constante DC se ha multiplicado por un factor \alpha predeterminable para obtener un componente constante DC' puesto a escala (etapa 105):

DC = \alpha \cdot DC.

Se ha revelado que es ventajoso un valor para el factor \alpha = sqrt(n), donde n es el número de los puntos de imagen BP, que pertenecen al objeto de la imagen BO, en el bloque marginal de la imagen RBB.

Los coeficientes de transformación cj y el componente constante puesto a escala DC' son cuantificados en otras etapas (etapa 106) y son sometidos a una codificación por entropía. (etapa 107).

La información codificada de la imagen es transmitida desde el primer ordenador R1 hacia el segundo ordenador R2 a través del medio de transmisión UM (etapa 108).

En el segundo ordenador R2 son recibidos los datos codificados de la imagen y se lleva a cabo una decodificación de la imagen con las siguientes etapas del procedimiento para los bloques marginales de la imagen RBB. Los bloques restantes de la imagen son decodificados con el procedimiento inverso habitual, es decir, que se lleva a cabo una decodificación por entropía, una cuantificación inversa y una codificación por transformación inversa y eventualmente una compensación del movimiento.

Cada bloque marginal de la imagen RBB es sometido igualmente a una decodificación por entropía (etapa 109) y a una cuantificación (etapa 110).

A partir del componente constante DC' puesto a escala transmitido al mismo tiempo se reconstruye el componente constante DC a través de la multiplicación por el valor recíproco \alpha^{-1} del factor \alpha (etapa 111).

A partir de los coeficientes de transformación c_{j}cuantificados inversos se determinan en otra etapa 112 los valores diferenciales d(i, j). Agrupados en un vector diferencial dj resulta la siguiente especificación para la formación del vector dj de los valores diferenciales d(i, j) de la información de codificación de los puntos de imagen a partir de los coeficientes de transformación cj según la especificación siguiente:

\underline{d}_{j}= \sqrt{\frac{2}{N}} \cdot (\underline{DCT-N}(p,k))^{-1} \cdot \underline{c}_{j}

En la última etapa 113 se añade el componente constante Dc de nuevo a los valores diferenciales d(i, j) de la información de codificación de los puntos de imagen, con lo que se ha reconstruido la información de codificación original de los puntos de imagen y de esta manera está decodificado el bloque marginal de la imagen.

A continuación se muestran algunas alternativas al ejemplo de realización descrito anteriormente.

La invención no se limita al procedimiento según MPEG-4. Se puede emplear de manera ventajosa para cualquier procedimiento de codificación de imágenes basada en el objeto, puesto que en estos procedimientos aparece siempre la problemática de la codificación y decodificación, respectivamente, de bloques marginales de la imagen, que se soluciona de una manera extraordinariamente ventajosa a través de la invención.

La invención se puede aplicar para cualquier codificación por transformación basada en el objeto, que no proporciona por sí misma ningún componente constante, por ejemplo la transformación sinusoidal discreta (DST) o también una Tranformación de Wavelet.

La invención está limitada a la variante de la SA-DCT descrita anteriormente. La SA-DCT se puede aplicar también inalterada en el marco de la invención.

Está claro que la invención se puede ver en que para un bloque marginal de la invención se determina por separado el componente constante de la información de codificación de los puntos de imagen contenidos en el bloque marginal de la imagen y se resta de la información de codificación de los puntos de imagen del bloque marginal de la imagen, con lo que se consigue una eficiencia elevada de la codificación.

En el marco de este documento se han citado las siguientes publicaciones:

[1] D. Le Gall, The Video Compression Standard for Multimedia Applicationes, Communications of the ACM, Vol. 34, Nº 4, Páginas 47-58, Abril de 1991.

\newpage

[2] G. Wallace, The JPEG Still Picture Compression Standard, Communications of the ACM, Vol. 34, Nº 4, Páginas 31-44, Abril de 1991.

[3] Ming Liou, Overview of the px64 kbit/s Video Coding Standard, Communications of the ACM, Vol. 34, Nº 4, Páginas 60-63, Abril de 1991.

[4] ITU-T Rec. H.263, Video Coding for Low Bitrate Communication, Marzo de 1997, Páginas 1-25.

[5] A. N. Netravali und J.D. Robbins, Motion Compensated Television Coding: Part I, Bell System Technical Journal, Vol. 58, Páginas 631-690, Marzo de 1979.

[6] ISO/IEC JTC1/SC29/WG11, MPEG-4 Video Verification Model Version 5.0 Doc. 1469, Páginas 55-59, Nov. de 1996.

[7] T. Sikora und B. Makai, Shape Adaptive DCT for Generic Coding of Video, IEEE Transactions on Circuits and Systems for Video Technology, Vol. 5, Páginas 59-62, Febrero de 1995.

[8] Susumu Itoh y col., ``Adaptive Tranform Coding of Images based on Variable-Shape-Blocks'', Signal Processing Theories and Applications, Brussels, 24-27 de Agosto, 1992, Vol. 3 Nr Conf. 6, 24. Agosto de 1992, Páginas 1251-1254, XP000356468.

[9] MPEG-4 Video Verification Model Version 7.0, ISO/IEC JTC1/SC29/WG11, MPEG97/N1642, XP002144264, páginas 56-60, Abril de 1997.

Claims

1. Procedimiento para la codificación de una imagen digitalizada que presenta al menos un objeto de imagen con un número discrecional de puntos de imagen a los que está asignada la información de codificación,

-: en el que los puntos de imagen están agrupados en bloques de imágenes,

-: en el que se determina para al menos una parte de un bloque de imágenes un componente constante de la información de codificación de cada punto de imagen contenido en al menos una parte del bloque de imágenes,

-: en el que el componente constante es substraído de la información de codificación de cada punto de imagen de al menos una parte del bloque de imágenes, y

-: en el que la información de codificación de los puntos de imagen de al menos una parte del bloque de imágenes, que está reducida en la medida del componente constante, es sometida a una codificación de transformación con adaptación de forma,

caracterizado porque la reducción de la información de codificación en la medida del componente constante es aplicada solamente a bloques de imágenes que contienen un borde del objeto de imagen.

2. Procedimiento según la reivindicación 1, en el que la codificación de transformación es efectuada de tal manera que una energía de la señal de la información de codificación de los puntos de imagen en el campo del espacio es aproximadamente idéntica a una energía de la señal de la información de codificación transformada de los puntos de imagen en el campo de frecuencia.

3. Procedimiento según la reivindicación 1 ó 2, en el que los coeficientes de transformación c_{j} están formados a partir de valores de la diferencia d_{j}de la información de codificación de los puntos de imagen de acuerdo con la siguiente especificación:

\underline{c}_{j}= \sqrt{\frac{2}{N}} \cdot \underline{DCT - N} (p,k) \cdot \underline{d}_{j}

en el que con

-: N se designa una magnitud de un vector de imagen que debe ser transformado, en el que están contenidos los puntos de imagen,

-: p, k se designan índices, donde p, k \in [0, N-1].

4. Procedimiento según una de las reivindicaciones precedentes, en el que la reducción de la información de codificación en la medida del componente constante es aplicada solamente a bloques de imágenes que son codificados en el modo Intra de la codificación.

5. Procedimiento según una de las reivindicaciones precedentes, en el que el componente constante es puesto a escala.

6. Procedimiento para la decodificación de una imagen digitalizada que presenta al menos un objeto de imagen con un número discrecional de puntos de imagen a los que está asignada la información de codificación, codificada por transformación con adaptación de forma, estando agrupados los puntos de imagen en los bloques de imágenes y siendo asignado al menos un bloque de imágenes a un componente constante de la información de codificación de los puntos de imagen contenidos en el bloque de imágenes,

-: en el que la información de codificación, codificada por transformación con adaptación de forma de los puntos de imagen de al menos una parte del bloque de imágenes, que es asignada a un componente constante, es sometida a una codificación de transformación inversa con adaptación de forma, y

-: en el que el componente constante es añadido a la información de codificación de cada punto de imagen de al menos una parte del bloque de imágenes,

caracterizado porque la adición del componente constante a la información de codificación es aplicada solamente a los bloques de imágenes que contienen un borde del objeto de imagen.

7. Procedimiento según la reivindicación 6, en el que la codificación de transformación inversa se efectúa de tal modo que una energía de la señal de la información de codificación de los puntos de imagen en el campo de espacio es aproximadamente idéntica a una energía de la señal de la información de codificación de transformación de los puntos de imagen en el campo de frecuencia.

8. Procedimiento según la reivindicación 6 ó 7, en el que los valores de la diferencia d_{j} están formados a partir de los coeficientes de transformación c_{j} de acuerdo con la siguiente especificación:

\underline{d}_{j}= \sqrt{\frac{2}{N}} \cdot (\underline{DCT - N} (p,k))^{-1} \cdot \underline{c}_{j}

en la que con

-: p, k se designan índices, donde p, k \in [0, N-1]

-: (\bullet)^{-1} se designa una inversión de la matriz.

9. Procedimiento según una de las reivindicaciones 6 a 8, en el que la reducción de la información de codificación en la medida del componente constante es aplicada solamente a los bloques de imágenes que son codificados en el modo de intracodificación.

10. Procedimiento según una de las reivindicaciones 6 a 9, en el que el componente constante es puesto a escala.

11. Aparato para la codificación de una imagen digitalizada que presenta al menos un objeto de imagen con un número discrecional de puntos de imagen a los que es asignada la información de codificación, con una unidad de procesador que está ajustada de tal manera que

-: los puntos de imagen están agrupados en bloques de imágenes,

-: se determina para al menos una parte del bloque de imágenes un componente constante de la información de codificación de los puntos de imagen contenidos al menos en una parte del bloque de imágenes,

-: el componente constante es substraído de la información de codificación de cada punto de imagen de al menos una parte del bloque de imágenes, y

-: la información de codificación de los puntos de imagen de al menos una parte del bloque de imágenes que se reduce en la medida del componente constante es sometida a una codificación de transformación con adaptación de forma (SA- DCT),

caracterizado porque la unidad de procesador es ajustada de tal modo que la reducción de la información de codificación en la medida del componente constante es aplicada solamente a los bloques de imágenes que contienen un borde del objeto de la imagen (bloques de imágenes de borde).

12. Aparato según la reivindicación 11, en el que la unidad de procesador es ajustada de tal modo que la codificación de transformación es efectuada de tal manera que una energía de la señal de la información de codificación de los puntos de imagen en el campo del espacio es aproximadamente idéntica a una energía de la señal de la información de codificación de transformación de los puntos de imagen en el campo de frecuencia.

13. Aparato según la reivindicación 11 ó 12, en el que la unidad de procesador es ajustada de modo que los coeficientes de transformación c_{j} están formados a partir de los valores de la diferencia d_{j}de la información de codificación de los puntos de imagen de acuerdo con la siguiente especificación:

en la que con

-: DCT-N se designa una matriz de transformación que tiene el tamaño NxN,

-: p, k de designan índices, donde p, k \in [0, N-1].

\newpage

14. Aparato según una de las reivindicaciones 11 a 13, en el que la unidad del procesador es ajustada de tal modo que la reducción de la información de codificación en la medida del componente constante es aplicada solamente a los bloques de imágenes que son codificados en el modo de intracodificación.

15. Aparato según una de las reivindicaciones 11 a 14, en el que la unidad del procesador es ajustada de tal modo que el componente constante es puesto a escala.

16. Aparato para la decodificación de una imagen digitalizada con al menos un objeto de imagen con un número discrecional de puntos de imagen, a los que es asignada la información de codificación, codificada por transformación con adaptación de forma, siendo agrupados los puntos de imagen en bloques de imágenes y al menos siendo asignado un bloque de imágenes a un componente constante de la información de codificación de los puntos de imagen contenidos en el bloque de imágenes, teniendo una unidad de procesador que es ajustada de tal modo que

-: la información de codificación codificada por transformación con adaptación de la forma de los puntos de imagen de al menos una parte del bloque de imágenes, que está asignada a un componente constante, está sometida a una codificación de transformación con adaptación de forma inversa,

-: el componente constante es añadido a la información de codificación de cada punto de imagen de al menos una parte del bloque de imágenes,

caracterizado porque la unidad del procesador es ajustada de tal modo que la adición del componente constante a la información de codificación es aplicada solamente a bloques de imágenes que contienen un borde del objeto de imagen.

17. Aparato según la reivindicación 16, en el que la unidad de procesador es ajustada de tal modo que la codificación de transformación inversa es efectuada de tal modo que una energía de la señal de la información de codificación de los puntos de imagen en el campo de espacio es aproximadamente idéntica a una energía de la señal de la información de codificación de transformación de los puntos de imagen en el campo de frecuencia.

18. Aparato según la reivindicación 16 ó 16, en el que la unidad de procesador es ajustada de tal manera que los valores de la diferencia d_{j} están formados a partir de los coeficientes de transformación c_{j} de acuerdo con la siguiente especificación:

\underline{d}_{j}= \sqrt{\frac{2}{N}}(\underline{DCT - N} (p,k))^{-1} \cdot \underline{c}_{j}

en la que con

-: N se designa una magnitud de un vector de imagen que debe ser transformado, en el que están contenidos los puntos de imagen, tamaño NxN,

-: p, k se designan índices, donde p, k \in [0, N-1]

-: (\bullet)^{-1} se designa una inversión de la matriz.

19. Aparato según una de las reivindicaciones 16 a 18, en el que la unidad de procesador está ajustada de tal modo que la reducción de la información de codificación en la medida del componente constante es aplicada solamente a los bloques de imágenes que son codificados en el modo de intracodificación.

20. Aparato según una de las reivindicaciones 16 a 19, en el que la unidad de procesador es ajustada de tal modo que el componente constante es puesto a escala.

21. Medio de memoria legible por ordenador sobre el que se memoriza un programa que, cuando ha sido cargado en una memoria de ordenador, permite al ordenador llevar a cabo las siguientes etapas del procedimiento para la codificación de una imagen digitalizada, que presenta al menos un objeto de imagen con un número discrecional de puntos de imagen, a los que está asignada una información de codificación:

-: los puntos de imagen están agrupados en bloques de imágenes,

-: se determina para al menos una parte de un bloque de imágenes un componente constante de la información de codificación de los puntos de imagen contenidos en al menos una parte del bloque de imágenes,

-: la información de codificación de los puntos de imágenes de al menos una parte del bloque de imágenes, que es reducida en la medida del componente constante, es sometida a una codificación por transformación con adaptación de forma (SA-DCT),

caracterizado porque la reducción de la información de codificación en la medida del componente constante es aplicada solamente a bloques de imágenes que contienen un borde del objeto de la imagen.

22. Medio de memoria legible por ordenador sobre el que es memoriza un programa que, cuando ha sido cargado en una memoria del ordenador, permite al ordenador llevar a cabo las siguientes etapas del procedimiento para la decodificación de una imagen digitalizada que presenta al menos un objeto de imagen con un número discrecional de puntos de imagen a los que es asignada la información de codificación, codificada por transformación con adaptación de forma

-: estando agrupados los puntos de imagen en los bloques de imágenes y

-: estando asignado al menos un bloque de imágenes a un componente constante de la información de codificación de los puntos de imagen contenidos en el bloque de imágenes,

-: la información de codificación, codificada por transformación con adaptación de forma, de los puntos de imagen de al menos una parte del bloque de imágenes, que es asignada a un componente constante, es sometida a una codificación de transformación inversa con adaptación de forma, y

caracterizado porque la adición del componente constante a la información de codificación es aplicada solamente a los bloques de imágenes que contienen un borde del objeto de la imagen.