ES2339257T3

ES2339257T3 - Procedimiento y aparato para la codificacion/decodificacion de audio sin perdida.

Info

Publication number: ES2339257T3
Application number: ES05251452T
Authority: ES
Inventors: Oh Ennmi; Junghoe Kim; Miao Lei; Shihwa Lee; Sangwook Kim
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2004-03-10
Filing date: 2005-03-10
Publication date: 2010-05-18
Anticipated expiration: 2025-03-10
Also published as: JP4744899B2; EP1575032A3; CN1681213B; US7660720B2; EP1575032A2; JP2005260969A; US20050203731A1; CN1681213A; DE602005019643D1; JP2011048388A; EP1575032B1; KR100561869B1; JP5372886B2; KR20050090941A

Abstract

Un procedimiento de codificación de audio sin pérdida que comprende: correlacionar (600) una señal espectral de audio en el dominio frecuencial que tiene valores de número entero en una señal de plano de bits con respecto a la frecuencia; obtener (610) un bit más significativo y un parámetro Golomb para cada plano de bits; seleccionar (620) una muestra binaria de un plano de bits para ser codificada en el orden desde el bit más significativo hasta el bit menos significativo y desde un componente de menor frecuencia hasta un componente de mayor frecuencia; calcular (630) el contexto de la muestra binaria seleccionada; seleccionar (640) un modelo de probabilidad de la muestra binaria utilizando el parámetro Golomb y los contextos calculados; y codificar aritméticamente sin pérdida (650) la muestra binaria utilizando el modelo seleccionado de probabilidad; caracterizado porque el contexto de la muestra binaria seleccionada está calculado utilizando las significaciones de muestras binarias ya codificadas para cada una de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada; en el que la significación de una muestra binaria es "1" si hay al menos un "1" en planos de bit ya codificados en la línea de frecuencia de la muestra binaria y, si no hay "1" en la línea de frecuencia de la muestra binaria, la significación de la muestra binaria es "0".

Description

Procedimiento y aparato para la codificación/decodificación de audio sin pérdida.

La presente invención versa acerca de la codificación y/o decodificación de una señal de audio, y más en particular, acerca de un procedimiento y un aparato para la codificación/decodificación de audio sin pérdida capaces de proporcionar una mayor relación de compresión que en un código Golomb en planos de bit (BPGC) utilizando un procedimiento de codificación basado en texto.

Los procedimientos de codificación de audio sin pérdida incluyen la codificación Meridian de compresión sin pérdida de audio, la codificación Monkey de audio, y la codificación libre de audio sin pérdida. Se aplica una compresión Meridian sin pérdida (MLP) y se utiliza en un disco versátil digital-audio (DVD-A).

Según aumenta el ancho de banda de la red de Internet, se puede proporcionar un gran volumen de contenidos multimedia. En el caso de contenidos de audio, se necesita un procedimiento de audio sin pérdida. En la Unión Europea (UE), ya se ha comenzado la emisión de audio digital a través de una emisión de audio digital (DAB), y para esto las estaciones emisoras y los proveedores de contenidos están utilizando procedimientos de codificación de audio sin pérdida. En respuesta a esto, el grupo MPEG también está continuando con la normalización de la compresión de audio sin pérdida bajo el nombre de ISO/IEC 14496-3:2001/AMD5, codificación escalable de audio sin pérdida (SLS). Esto proporciona una escalabilidad de grano fino (FGS) y permite la compresión de audio sin pérdida.

Se puede mejorar una relación de compresión, que es el factor más importante en una tecnología de compresión de audio sin pérdida, al eliminar información redundante entre elementos de datos. La información redundante puede ser eliminada mediante la predicción entre elementos contiguos de datos y también puede ser eliminada por un contexto entre elementos contiguos de datos.

Los coeficientes de la transformada discreta del coseno modificada (MDCT) en enteros muestran una distribución de Laplace, y en esta distribución, un procedimiento de compresión denominado código de Golomb muestra un resultado óptimo. Para proporcionar la FGS, se necesita una codificación en planos de bit y una combinación del código de Golomb y de la codificación en planos de bit se denomina una codificación Golomb en planos de bit (BPGC), que proporciona una relación óptima de compresión y de FGS. Sin embargo, en algunos casos la suposición de que los coeficientes de MDCT en enteros muestran una distribución de Laplace no es correcta en una distribución real de datos. Dado que la BPGC es un algoritmo concebido suponiendo que los coeficientes de la MDCT en enteros muestran una distribución de Laplace, si los coeficientes de la MDCT en enteros no muestran una distribución de Laplace, la BPGC no puede proporcionar una relación óptima de compresión sin tener en cuenta la suposición de que se necesitan que los coeficientes de la MDCT en enteros muestren una distribución de Laplace.

En el documento ISO/IEC JTC/SC29/WG11 titulado "Improvement of coding efficiency in MPEG-4 audio scalable lossless coding", Eunmi Oh Et al, presentado en MPEG 2003 en diciembre de 2003, Hawái, EE. UU., páginas 1 a 11 se sugiere un procedimiento para mejorar la eficacia de codificación. En este procedimiento, se utilizan los contextos para mejorar la eficacia de codificación.

El documento WO03/077565 enseña un modelador de bits de coeficiente previsto para su uso en JPEG 2000. Los planos de bit están codificados en orden desde el bit más significativo hasta el bit menos significativo utilizando tres ciclos. Los bits están marcados como significativo o no significativo y se cambia este estado a significativo durante los primeros dos ciclos cuando se encuentra el bit más significativo para ese coeficiente.

En Yu et al, "A fine granular scalable perceptually lossy and lossless audio codec", presentado en la congreso internacional IEEE de 2003 sobre multimedia y exposiciones, julio de 2003, Baltimore, Maryland, EE. UU., y consignado en las actas correspondientes del congreso en el volumen 1 páginas 1-65 a 1-68, publicado por el IEEE, ISBN 0-7893-7965-9 se presentan códecs de audio. Los códecs utilizan una codificación Golomb en planos de bit.

La presente invención proporciona un procedimiento y un aparato de codificación/decodificación de audio sin pérdida que son capaces de proporcionar una mejor relación de compresión sin tener en cuenta la suposición de que los coeficientes de la MDCT en enteros muestren una distribución de Laplace.

Conforme a un aspecto de la presente invención, se proporciona un procedimiento de codificación de audio sin pérdida conforme a la reivindicación 1.

En el cálculo del contexto de la muestra binaria seleccionada, se obtienen las significaciones de las muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia que existen en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada, y, al pasar las significaciones a binario, se concatena el valor del contexto de la muestra binaria.

En el cálculo del contexto de la muestra binaria seleccionada, se obtienen las significaciones de las muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia que existen anterior a una línea de frecuencia a la que pertenece la muestra binaria seleccionada; una relación acerca de cuántas líneas entre la pluralidad de líneas de frecuencia tienen significación se expresa en un número entero, al multiplicar la relación por un valor predeterminado de número entero; y luego, se calcula el valor del contexto utilizando el número entero.

Conforme a aún otro aspecto de la presente invención, se proporciona un aparato de codificación de audio sin pérdida conforme a la reivindicación 7.

Conforme a un aspecto adicional de la presente invención, se proporciona un procedimiento de decodificación de audio sin pérdida conforme a la reivindicación 13.

El cálculo del contexto puede incluir: calcular un primer contexto utilizando las significaciones de las muestras ya decodificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia que existen en el entorno de una línea de frecuencia a la que pertenece una muestra que va a ser decodificada; y calcular un segundo contexto utilizando las significaciones de muestras ya decodificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia antes de una línea de frecuencia a la que pertenece una muestra que va a ser decodificada.

Conforme a un aspecto adicional de la presente invención, se proporciona un aparato de decodificación de audio sin pérdida conforme a la reivindicación 15.

La unidad de decodificación sin pérdida puede incluir: una unidad para obtener un parámetro que obtiene un parámetro Golomb de una corriente de bits de datos de audio; una unidad para obtener un parámetro que obtiene un parámetro Golomb de una corriente de bits de datos de audio; una unidad de selección de muestras que selecciona una muestra binaria que se va a decodificar en el orden desde un bit más significativo hasta un bit menos significativo y desde una menor frecuencia a una mayor frecuencia; una unidad de cálculo del contexto que calcula el contexto de la muestra binaria seleccionada al utilizar la significación de los planos de bit ya codificados para cada una de una pluralidad de líneas de frecuencia que existen en el entorno a la que pertenece la muestra binaria seleccionada; una unidad de selección de modelo de probabilidad que selecciona un modelo de probabilidad al utilizar el parámetro Golomb y el contexto; y una unidad de decodificación aritmética que lleva a cabo una decodificación aritmética al utilizar el modelo seleccionado de probabilidad.

La unidad de cálculo del contexto puede incluir: una primera unidad de cálculo del contexto que obtiene las significaciones de muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia que existen en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada, y al pasar las significaciones a binario, calculando un primer contexto; y una segunda unidad de cálculo del contexto que obtiene las significaciones de muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia que existen antes de una línea de frecuencia a la que pertenece la muestra binaria seleccionada, que expresan una relación acerca de cuántas líneas entre la pluralidad de líneas de frecuencia tienen significación, en un número entero, al multiplicar la relación por un valor predeterminado de número entero, y luego, calcular un segundo contexto utilizando el número entero.

Conforme a un aspecto adicional de la presente invención, se proporciona un medio de grabación legible por ordenador que tiene plasmado en el mismo un programa informático para los procedimientos.

Lo anterior y otras características y ventajas de la presente invención serán más evidentes al describir realizaciones ejemplares detalladas de la misma con referencia a los dibujos adjuntos en los que:

La Fig. 1 es un diagrama de bloques de la estructura de una realización preferente de un aparato de codificación de audio sin pérdida conforme a la presente invención;

la Fig. 2 es un diagrama de bloques de la estructura de una unidad de codificación sin pérdida de la Fig. 1;

la Fig. 3 es un diagrama de bloques de la estructura de otra realización preferente del aparato de codificación de audio sin pérdida conforme a la presente invención;

la Fig. 4 es un diagrama de bloques de la estructura de una unidad de codificación sin pérdida de la Fig. 3;

la Fig. 5 es un diagrama de flujo de las operaciones llevadas a cabo por el aparato de codificación de audio sin pérdida mostrado en la Fig. 1;

la Fig. 6 es un diagrama de flujo de las operaciones llevadas a cabo por la unidad de codificación sin pérdida mostrada en la Fig. 1;

la Fig. 7 es un diagrama de flujo de las operaciones llevadas a cabo por el aparato de codificación de audio sin pérdida mostrado en la Fig. 3;

la Fig. 8 es un diagrama que muestra un contexto global en una unidad de cálculo del contexto;

\newpage

la Fig. 9 es un gráfico que muestra una probabilidad de que aparezca 1 cuando se calcula un contexto global en una unidad de cálculo del contexto;

la Fig. 10 es un diagrama que muestra un contexto local en una unidad de cálculo del contexto;

la Fig. 11 es un gráfico que muestra una probabilidad de que aparezca 1 cuando se calcula un contexto local en una unidad de cálculo del contexto;

la Fig. 12 es un diagrama que muestra un modo de contexto completo de una realización preferente conforme a la presente invención;

la Fig. 13 es un diagrama que muestra un modo de contexto parcial de una realización preferente conforme a la presente invención;

la Fig. 14 es un tipo de ejemplo de un pseudocódigo para la codificación basada en el contexto conforme a la presente invención;

la Fig. 15 es un diagrama de bloques de la estructura de una realización preferente de un aparato de decodificación de audio sin pérdida conforme a la presente invención;

la Fig. 16 es un diagrama de bloques de la estructura de una unidad de cálculo del contexto mostrada en la Fig. 15;

la Fig. 17 es un diagrama de bloques de la estructura de otra realización preferente del aparato de decodificación de audio sin pérdida conforme a la presente invención;

la Fig. 18 es un diagrama de bloques de la estructura de una unidad de decodificación sin pérdida de la Fig. 17;

la Fig. 19 es un diagrama de flujo de las operaciones llevadas a cabo por el aparato de decodificación de audio sin pérdida mostrado en la Fig. 15; y

la Fig. 20 es un diagrama de flujo de las operaciones llevadas a cabo por el aparato de decodificación de audio sin pérdida mostrado en la Fig. 17.

Se describirán ahora un procedimiento y un aparato de codificación/decodificación de audio sin pérdida con más detalle con referencia a los dibujos adjuntos, en los que se muestran las realizaciones ejemplares de la invención.

En la codificación de audio, para proporcionar una escalabilidad de grano fino (FGS) y una codificación sin pérdida, se utiliza una transformada discreta del coseno modificada (MDCT) en enteros. En particular, se conoce que si la distribución de muestras de entrada de la señal de audio sigue una distribución de Laplace, un procedimiento de codificación Golomb en planos de bit (BPGC) muestra un resultado de compresión óptima, y esto proporciona un resultado equivalente a un código Golomb. Se puede obtener un parámetro Golomb mediante el siguiente procedimiento:

For(L = 0;(N << L +1)) <= A; L + +);

Conforme al procedimiento, se puede obtener el parámetro Golomb L y debido a la característica del código Golomb, la probabilidad de que 0 o 1 aparezca en un plano de bits menor que L es igual a 1/2. En el caso de una distribución de Laplace este resultado es óptimo pero si la distribución no es una distribución de Laplace, no se puede proporcionar una relación óptima de compresión. En consecuencia, la idea básica de la presente invención es proporcionar una relación óptima de compresión utilizando un contexto por medio de un análisis estadístico mediante una distribución de datos que no sigue una distribución de Laplace.

La Fig. 1 es un diagrama de bloques de la estructura de una realización preferente de un aparato de codificación de audio sin pérdida conforme a la presente invención. El aparato de codificación de audio sin pérdida incluye una unidad 100 de transformación entera tiempo/frecuencia y una unidad 120 de codificación sin pérdida. La unidad 100 de transformación entera tiempo/frecuencia transforma una señal de audio en el dominio temporal en una señal espectral de audio en el dominio frecuencial que tiene un valor de número entero, y preferentemente, utiliza una MDCT en enteros. La unidad 120 de codificación sin pérdida correlaciona la señal de audio en el dominio frecuencial en datos de planos de bit con respecto a la frecuencia, y codifica sin pérdida muestras binarias que forman el plano de bits utilizando un contexto predeterminado. La unidad 120 de codificación sin pérdida está dotada de una unidad 200 de correlación de planos de bit, una unidad 210 de obtención de parámetros, una unidad 220 de selección de muestras binarias, una unidad 230 de cálculo del contexto, una unidad 240 de selección de modelos de probabilidad y una unidad 250 de codificación de muestras binarias.

La unidad 200 de correlación de planos de bit correlaciona la señal de audio en el dominio frecuencial en datos de planos de bit con respecto a la frecuencia. Las Figuras 8 y 10 ilustran ejemplos de señales de audio correlacionadas en datos de planos de bit con respecto a la frecuencia.

La unidad 210 de obtención de parámetros obtiene el bit más significativo (MSB) del plano de bits y un parámetro Golomb. La unidad 220 de selección de muestras binarias selecciona una muestra binaria en un plano de bits para que sea codificada en el orden desde un MSB hasta un bit menos significativo (LSB) y desde un componente de menor frecuencia hasta un componente de mayor frecuencia.

La unidad 230 de cálculo del contexto calcula el contexto de la muestra binaria seleccionada utilizando las significaciones de planos de bit ya codificados para cada una de una pluralidad de líneas de frecuencia que existen en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada. La unidad 240 de selección de modelos de probabilidad selecciona un modelo de probabilidad utilizando el parámetro Golomb y los contextos calculados. La unidad 250 de codificación de muestras binarias codifica sin pérdida la muestra binaria utilizando el modelo seleccionado de probabilidad.

En la Fig. 2 todas las muestras binarias están codificadas utilizando una codificación sin pérdida basada en el contexto. Sin embargo, en otra realización, en aras de la complejidad algunas muestras binarias en el plano de bits están codificadas utilizando codificación sin pérdida basada en el contexto y otras muestras binarias en el plano de bits están codificadas utilizando una compresión de bits. El parámetro Golomb se utiliza para determinar muestras binarias en un plano de bits para ser codificadas utilizando una compresión de bits dado que una probabilidad de ser "1" de la muestra binaria bajo el parámetro Golomb es de 1/2.

La Fig. 3 es un diagrama de bloques de la estructura de otra realización preferente del aparato de codificación de audio sin pérdida conforme a la presente invención. El aparato está dotado de una unidad 300 de transformación entera tiempo/frecuencia, una unidad 310 de escalado, una unidad 320 de codificación con pérdida, una unidad 330 de correlación de errores, una unidad 340 de codificación sin pérdida, y un multiplexor 350.

La unidad 300 de transformación entera tiempo/frecuencia transforma una señal de audio en el dominio temporal en una señal espectral de audio en el dominio frecuencial que tiene un valor de número entero, y preferentemente utiliza MDCT en enteros. La unidad 310 de escalado escala la señal de frecuencia de audio de la unidad 300 de transformación entera tiempo/frecuencia para ser utilizada como una señal de entrada de la unidad 320 de codificación con pérdida. Dado que la señal de salida de la unidad 300 de transformación entera tiempo/frecuencia está representada como un número entero, no puede ser utilizada directamente como una entrada de la unidad 320 de codificación con pérdida. En consecuencia, se escala la señal de frecuencia de audio de la unidad 300 de transformación entera tiempo/frecuencia en la unidad de escalado, de forma que se puede utilizar como una señal de entrada de la unidad 320 de codificación con pérdida.

La unidad 320 de codificación con pérdida codifica con pérdida la señal de frecuencia escalada y preferentemente, utiliza un codificador de núcleo AAC. La unidad 330 de correlación de errores obtiene una señal correlacionada de error correspondiente a la diferencia de la señal codificada con pérdida y la señal de la unidad 300 de transformación entera tiempo/frecuencia. La unidad 340 de codificación sin pérdida codifica sin pérdida la señal correlacionada de error utilizando un contexto. El multiplexor 350 transmite simultáneamente la señal codificada sin pérdida de la unidad 340 de codificación sin pérdida y la señal codificada con pérdida de la unidad 320 de codificación con pérdida, y genera una corriente de bits.

La Fig. 4 es un diagrama de bloques de la estructura de la unidad 340 de codificación sin pérdida, que está dotada de una unidad 400 de correlación de planos de bit, una unidad 410 de obtención de parámetros, una unidad 420 de selección de muestras binarias, una unidad 430 de cálculo del contexto, una unidad 440 de selección de modelos de probabilidad, y una unidad 450 de codificación de muestras binarias.

La unidad 400 de correlación de planos de bit correlaciona la señal correlacionada de error de la unidad 330 de correlación de errores en datos de planos de bit con respecto a la frecuencia. La unidad 410 de obtención de parámetros obtiene el MSB del plano de bits y un parámetro Golomb. La unidad 420 de selección de muestras binarias selecciona una muestra binaria en un plano de bits para ser codificada en el orden desde un MSB a un LSB, y desde un componente de menor frecuencia a un componente de mayor frecuencia. La unidad 430 de cálculo del contexto calcula el contexto de la muestra binaria seleccionada, al utilizar las significaciones de planos de bit ya codificados para cada una de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada. La unidad 440 de selección de modelos de probabilidad selecciona un modelo de probabilidad utilizando el parámetro Golomb obtenido y los contextos calculados. La unidad 450 de codificación de muestras binarias codifica sin pérdida la muestra binaria utilizando el modelo seleccionado de probabilidad.

En la Fig. 4 todas las muestras binarias están codificadas utilizadas codificación sin pérdida basada en el contexto. Sin embargo, en otra realización, de cara a la reducción de la complejidad, algunas muestras binarias en el plano de bits están codificadas utilizando una codificación sin pérdida basada en el contexto y otras muestras binarias en el plano de bits están codificadas utilizando una compresión de bits. El parámetro Golomb se utiliza para determinar muestras binarias en planos de bit para ser codificadas utilizando una compresión de bits dado que una probabilidad de tener "1" de la muestra binaria bajo el parámetro Golomb es de 1/2.

Se explicará ahora el cálculo de un valor de contexto de la muestra binaria en las unidades 230 y 430 de cálculo del contexto mostradas en las Figuras 2 y 4. La significación que se utiliza en relación a la realización de la presente invención está definido como 1 si un componente espectral está codificado como 1 al menos una vez entre muestras anteriores codificadas en planos de bit en una línea de frecuencia idéntica a un momento actual, y está definido como 0 si no hay ningún componente espectral codificado como 1.

Además, las unidades 230 y 430 de cálculo del contexto pueden calcular el contexto de la muestra binaria utilizando, por ejemplo, un cálculo del contexto global. El cálculo del contexto global considera la distribución del espectro completo, y utiliza el hecho de que la forma de la envolvente del espectro no cambia rápidamente en el eje de la frecuencia, y llega a tener una apariencia similar a la forma de la envolvente anterior. En el cálculo del contexto global, tomando la línea de frecuencia de la muestra binaria seleccionada como una base, las unidades 230 y 430 de cálculo del contexto obtienen un valor de probabilidad de que la significación es "1" al utilizar muestras predeterminadas ya codificadas entre planos de bit en cada línea de frecuencia existente antes de la línea de frecuencia de la muestra binaria seleccionada. Entonces, las unidades 230 y 430 de cálculo del contexto multiplican el valor de probabilidad por un valor predeterminado de número entero para expresarlo en un número entero, y al utilizar el número entero, calcular el valor del contexto de la muestra binaria.

Además, las unidades 230 y 430 de cálculo del contexto pueden calcular el contexto de la muestra binaria utilizando un cálculo del contexto local. El cálculo del contexto local utiliza la correlación de muestras binarias adyacentes, y la significación como el cálculo del contexto global. Se pasa a binario la significación de una muestra en cada una de las N corrientes de bits predeterminados en una frecuencia idéntica de una muestra binaria que va a ser codificada en ese momento y, luego, se convierte de nuevo a un número decimal, y, después, se calcula el contexto. En el cálculo del contexto local, tomando la línea de frecuencia de la muestra binaria seleccionada como la base, la unidad 230 y 430 de cálculo del contexto obtiene significaciones respectivas utilizando muestras predeterminadas entre planos de bit en cada una de las líneas de frecuencia que existen en un intervalo predeterminado antes y después de la línea de frecuencia de la muestra binaria seleccionada, y al convertir las significaciones en valores escalares, calcular el valor del contexto de la muestra binaria. El valor N utilizado en este cálculo es menor que el valor M utilizado en el cálculo del contexto global.

La Fig. 5 es un diagrama de flujo de las operaciones llevadas a cabo por el aparato de codificación de audio sin pérdida mostrado en la Fig. 1. En primer lugar, se introduce una señal PCM correspondiente a una señal de audio en el dominio temporal a la unidad 100 de transformación entera tiempo/frecuencia, esta se transforma en una señal de audio espectral en el dominio frecuencial que tiene un valor de número entero en la operación 500. Preferentemente, aquí se utiliza MDCT. Entonces, como en las Figuras 8 y 10, se correlaciona la señal de audio en el dominio frecuencial en una señal del plano de bits con respecto a la frecuencia en la operación 520. Entonces, se codifica sin pérdida una muestra binaria que forma el plano de bits utilizando un modelo de probabilidad determinado utilizando un contexto predeterminado en la operación 540.

La Fig. 6 es un diagrama de flujo de las operaciones llevadas a cabo por la unidad 120 de codificación sin pérdida mostrada en la Fig. 1.

En primer lugar, se introduce la señal de audio en el dominio frecuencial en la unidad 200 de correlación de planos de bit, se correlaciona la señal de audio en el dominio frecuencial en datos de planos de bit con respecto a la frecuencia en la operación 600. Además, por medio de la unidad 210 de obtención de parámetros Golomb, se obtienen el MSB y un parámetro Golomb en cada plano de bits en la operación 610. Entonces, por medio de la unidad 220 de selección de muestras binarias se selecciona, en la operación 620, una muestra binaria en un plano de bits que va a ser codificada en el orden desde un MSB hasta un LSB y desde un componente de menor frecuencia hasta un componente de mayor frecuencia. Con respecto a la muestra binaria seleccionada, se calcula el contexto de la muestra binaria seleccionada en la unidad 220 de selección de muestras binarias utilizando las significaciones de los planos de bit ya codificados para cada una de una pluralidad de líneas de frecuencia que existen en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada, en la operación 630. Se selecciona un modelo de probabilidad utilizando el parámetro Golomb obtenido en la unidad 210 de obtención de parámetros Golomb y se calculan los contextos en la unidad 230 de cálculo del contexto en la operación 640. Al utilizar el modelo seleccionado de probabilidad en la unidad 240 de selección de modelos de probabilidad, se codifica sin pérdida la muestra binaria en la operación 650.

En la Fig. 6 se codifican todas las muestras binarias utilizando una codificación sin pérdida basada en el contexto. Sin embargo, en otra realización, de cara a la reducción de la complejidad, se codifican algunas muestras binarias en el plano de bits utilizando una codificación sin pérdida basada en el contexto y se codifican las otras muestras binarias en el plano de bits utilizando una compresión de bits. El parámetro Golomb se utiliza para determinar muestras binarias en planos de bit para ser codificadas utilizando una compresión de bits dado que una probabilidad de ser "1" de la muestra binaria bajo el parámetro Golomb es de 1/2.

La Fig. 7 es un diagrama de flujo de las operaciones llevadas a cabo por el aparato de codificación de audio sin pérdida mostrado en la Fig. 3, y se explicará ahora con referencia a la Fig. 7, la operación de otra realización preferente del aparato de codificación de audio sin pérdida. En primer lugar, por medio de la unidad 300 de transformación entera tiempo/frecuencia, se transforma una señal de audio en el dominio temporal en una señal espectral de audio en el dominio frecuencial que tiene un valor de número entero en la operación 710.

Entonces, se escala la señal espectral de audio en el dominio frecuencial en la unidad 310 de escalado para ser utilizada como una señal de entrada de la unidad 320 de codificación con pérdida en la operación 720. La señal escalada de frecuencia en la unidad 310 de escalado está codificada con una compresión con pérdida en la unidad 320 de codificación de compresión con pérdida en la operación 730. Preferentemente, la codificación de compresión con pérdida se lleva a cabo por medio de un codificador de núcleo AAC.

Se obtienen una señal correlacionada de error correspondiente a la diferencia de los datos codificados con pérdida en la unidad 320 de codificación con pérdida y la señal espectral de audio en el dominio frecuencial que tiene un valor de número entero en la unidad 330 de correlación de errores en la operación 740. La señal correlacionada de error está codificada sin pérdida utilizando un contexto en la unidad 340 de codificación sin pérdida en la operación
750.

La señal codificada sin pérdida en la unidad 340 de codificación sin pérdida y la señal codificada con pérdida en la unidad 320 de codificación con pérdida se transmiten simultáneamente en el multiplexor 350 y se generan como una corriente de bits en la operación 760. En la codificación sin pérdida en la operación 750, se correlaciona la señal correlacionada de error en datos de plano de bits con respecto a la frecuencia. Entonces, el procedimiento para obtener el MSB y el parámetro Golomb es el mismo que el descrito con referencia a la Fig. 6 y se omitirá aquí.

En general, debido a la pérdida espectral por MDCT, hay una correlación de las muestras colindantes en el eje de frecuencia. Es decir, si el valor de una muestra adyacente es X, es muy probable que el valor de una muestra actual sea un valor en el entorno de X. En consecuencia, si se selecciona una muestra adyacente en el entorno de X como un contexto, se puede mejorar la relación de compresión utilizando la correlación.

Además, se puede conocer a través de análisis estadísticos que el valor de un plano de bits tiene una mayor correlación con la distribución de probabilidades de una muestra de menor orden. En consecuencia, si se selecciona una muestra adyacente en el entorno de X como un contexto, se puede mejorar la relación de compresión utilizando la correlación.

Se explicará ahora un procedimiento para calcular un contexto.

La Fig. 8 es un diagrama para obtener un contexto utilizando un contexto global en una unidad de cálculo del contexto. Al utilizar la parte indicada por las líneas discontinuas, la distribución de probabilidades de una muestra actual se obtiene de muestras ya codificadas. La Fig. 9 es un gráfico que muestra una probabilidad de que 1 aparezca cuando se calcula un contexto en una unidad de cálculo del contexto utilizando un contexto global.

Con referencia a la Fig. 8, se supone que se va a codificar un símbolo en la caja indicada por las líneas del cuadriculado. En la Fig. 8, el contexto global está expresado como la parte del óvalo de líneas discontinuas. Con referencia a la Fig. 9, los otros dos tipos de contexto están fijados como contexto de Golomb (Contexto 1) = 1, y contexto local (Contexto 2) = 0. El gráfico muestra que en el cálculo del contexto utilizando la BPGC, la probabilidad de que aparezca 1 se mantiene a un nivel constante, mientras que en el cálculo del contexto utilizando el contexto global, la probabilidad de que aparezca 1 aumenta de forma gradual según crece el índice del contexto.

La Fig. 10 es un diagrama para obtener un contexto utilizando un contexto local en una unidad de cálculo del contexto. La Fig. 11 es un gráfico que muestra una probabilidad de que aparezca 1 cuando se calcula un contexto en una unidad de cálculo del contexto utilizando un contexto local.

Con referencia a la Fig. 10, en el cálculo del contexto local, se obtienen las significaciones en tres líneas de frecuencia colindantes. Se correlaciona el patrón binario en un valor en un intervalo desde 0 hasta 7 (es decir, 000, 001, 010, 011, 100, 110, 111 en números binarios) para computar la probabilidad del símbolo. En el cálculo del contexto local, utilizando las tres partes indicadas por las líneas discontinuas, como se muestra en la Fig. 10, se calcula la distribución de probabilidad de una muestra actual de muestras ya codificadas. Aquí, la probabilidad de que aparezca 1 en la codificación actual es en el intervalo desde 0 a 7 como se ha mostrado anteriormente, y se determina por los tres valores como un patrón binario [0, 1, 1]. La Fig. 11 muestra la probabilidad de que aparezca 1 cuando se calcula un contexto utilizando un contexto local cuando los otros dos contextos están fijados como contexto de Golomb (Contexto 1) = 1 y contexto global (Contexto 2) = 4. Aquí, el gráfico muestra que cuando se utiliza la BPGC, la probabilidad de que aparezca 1 está fijada a un nivel constante. Mientras tanto, cuando se calcula el contexto mediante un contexto global, la probabilidad de que aparezca 1 es mayor en la primera mitad que la de la BPGC, pero es menor en la segunda mitad que la de la BPGC.

En un ejemplo real de codificación, si entre 10 muestras colindantes que van a ser codificadas para calcular un contexto global, cinco muestras tienen una significación de 1, la probabilidad es de 0,5 y si esta se escala con un valor de 8, se vuelve un valor de 4. En consecuencia, el contexto global es 4. Mientras tanto, cuando se comprueban las significaciones de 2 muestras antes y después para calcular un contexto local, si la muestra número (i-2) es 1, la muestra número (i-1) es 0, la muestra número (i+1) es 0 y la muestra número (i+2) es 1, el resultado del paso a binario es 1001, y es igual a 9 en la expresión decimal. Si el parámetro Golomb de datos que van a ser codificados en ese momento es 4, el parámetro Golomb (contexto 1) = 4, el contexto global (Contexto 2) = 4, y el contexto local (Contexto 3) = 9. Al utilizar el parámetro Golomb, el contexto global y el contexto local, se selecciona un modelo de probabilidad.

\newpage

Los modelos de probabilidades varían con respecto a la implementación, y entre ellos, utilizando un conjunto tridimensional, un procedimiento de implementación puede expresarse como:

Prob[Golomb][Contextol][Contexto2]

Utilizando el modelo de probabilidad obtenido de esta manera, se lleva a cabo la codificación sin pérdida. Como un procedimiento representativo de codificación sin pérdida, se puede utilizar un procedimiento de codificación aritmética.

Por medio de la presente invención, la compresión total se mejora un 0,8% cuando se compara con el procedimiento anterior, que no utiliza el contexto.

La Fig. 12 es un diagrama que muestra un modo de contexto completo de una realización preferente conforme a la presente invención. La Fig. 13 es un diagrama que muestra un modo de contexto parcial de una realización preferente conforme a la presente invención.

Con referencia a la Fig. 12, todas las muestras binarias están codificadas utilizando una codificación aritmética basada en el contexto. Sin embargo, con referencia a la Fig. 13, en otra realización, en aras de la complejidad, algunas muestras binarias en el plano de bits están codificadas utilizando una codificación aritmética basada en el contexto y otras muestras binarias en el plano de bits están codificadas utilizando una compresión de bits, es decir, se asigna una probabilidad de 1/2 para esas muestras binarias.

La Fig. 14 muestra un pseudocódigo para una codificación basada en el contexto en relación a una realización de la presente invención.

Se explicará ahora un aparato y un procedimiento de decodificación de audio sin pérdida conformes a la presente invención.

La Fig. 15 es un diagrama de bloques de la estructura de una realización preferente de un aparato de decodificación de audio sin pérdida conforme a la presente invención. El aparato incluye una unidad 1500 de obtención de parámetros, una unidad 1510 de selección de muestras, una unidad 1520 de cálculo del contexto, una unidad 1530 de selección de modelos de probabilidad, y una unidad 1540 de decodificación aritmética.

Cuando se introduce una corriente de bits de datos de audio, la unidad 1500 de obtención de parámetros obtiene el MSB y el parámetro Golomb de la corriente de bits. La unidad 1510 de selección de muestras selecciona una muestra binaria para ser decodificada en el orden desde un MSB hasta un LSB y desde una menor frecuencia hasta una mayor frecuencia.

La unidad 1520 de cálculo del contexto calcula un contexto predeterminado utilizando muestras ya decodificadas, y como se muestra en la Fig. 16, está dotada de una primera unidad 1600 de cálculo del contexto y una segunda unidad 1620 de cálculo del contexto. La primera unidad 1600 de cálculo del contexto obtiene significaciones de muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia que existen antes de la línea de frecuencia a la que pertenece la muestra binaria seleccionada, pasa las significaciones a binario, y calcula un primer contexto. La segunda unidad 1620 de cálculo del contexto obtiene significaciones de muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia que existen en el entorno de la línea de frecuencia a la que pertenece la muestra binaria seleccionada; expresa una relación en cuántas líneas entre la pluralidad de líneas de frecuencia hay significaciones, en un número entero, al multiplicar la relación por un valor predeterminado de número entero; y luego, calcula un segundo contexto utilizando el número entero.

La unidad 1530 de selección de modelos de probabilidad selecciona un modelo de probabilidad utilizando el parámetro Golomb de la unidad 1500 de obtención de parámetros y el contexto calculado en la unidad 1520 de cálculo del contexto. La unidad 1540 de decodificación aritmética lleva a cabo una decodificación aritmética utilizando el modelo de probabilidad seleccionado en la unidad 1530 de selección de modelo de probabilidad.

En la Fig. 15 todas las muestras están decodificadas utilizando una decodificación sin pérdida basada en el contexto. Sin embargo, en otra realización, de cara a la reducción de la complejidad, se decodifican algunas muestras binarias en el plano de bits utilizando una decodificación sin pérdida basada en el contexto y las otras muestras binarias en el plano de bits están decodificadas utilizando una compresión de bits. El parámetro Golomb se utiliza para determinar muestras binarias en el plano de bits para ser decodificadas utilizando una compresión de bits dado que una probabilidad de que la muestra binaria sea "1" bajo el parámetro Golomb es de 1/2.

La Fig. 17 es un diagrama de bloques de la estructura de otra realización preferente del aparato de decodificación de audio sin pérdida conforme a la presente invención. El aparato incluye una unidad 1700 de desmultiplexión, una unidad 1710 de decodificación con pérdida, una unidad 1720 de decodificación sin pérdida, una unidad 1730 de síntesis de señal de audio, y una unidad 1740 de transformación inversa entera de tiempo/frecuencia y preferentemente, incluye además una unidad 1750 de transformación inversa de tiempo/frecuencia.

Cuando se introduce una corriente de bits de audio, la unidad 1700 de desmultiplexión desmultiplexa la corriente de bits de audio y extrae una corriente de bits con pérdida formada por un procedimiento predeterminado de codificación con pérdida utilizado cuando se codifica una corriente de bits, y una corriente de bits de error de los datos de error.

La unidad 1710 de decodificación con pérdida decodifica con pérdida la corriente de bits con pérdida extraída en la unidad 1700 de desmultiplexión, mediante un procedimiento predeterminado de decodificación con pérdida que se corresponde con un procedimiento predeterminado de codificación con pérdida utilizado cuando se codifica la corriente de bits. La unidad 1720 de decodificación sin pérdida decodifica sin pérdida la corriente de bits de error extraída en la unidad 1700 de desmultiplexión, también mediante un procedimiento de decodificación sin pérdida correspondiente a una codificación sin pérdida.

La unidad 1730 de síntesis de señal de audio sintetiza la corriente de bits decodificada con pérdida y la corriente de bits de error y restablece una señal espectral de frecuencia. La unidad 1740 de transformación inversa entera de tiempo/frecuencia transforma inversamente el entero tiempo/frecuencia de la señal espectral de frecuencia restablecida en la unidad 1730 de síntesis de señal de audio, y restablece una señal de audio en el dominio temporal.

Entonces, la unidad 1750 de transformación inversa de tiempo/frecuencia restablece la señal de audio en el dominio frecuencial decodificada en la unidad 1710 de decodificación con pérdida, en una señal de audio en el dominio temporal, y la señal restablecida de esta manera es la señal decodificada con pérdida.

La Fig. 18 es un diagrama de bloques de la estructura de la unidad 1720 de decodificación sin pérdida de la Fig. 17, que incluye una unidad 1800 de obtención de parámetros, una unidad 1810 de selección de muestras, una unidad 1820 de cálculo del contexto, una unidad 1830 de selección de modelos de probabilidad, y una unidad 1840 de decodificación aritmética.

La unidad 1800 de obtención de parámetros obtiene el MSB y el parámetro Golomb de una corriente de bits de datos de audio. La unidad 1810 de selección de muestras selecciona una muestra binaria para ser decodificada en el orden desde un MSB hasta un LSB y desde una menor frecuencia hasta una mayor frecuencia.

La unidad 1820 de cálculo del contexto calcula un contexto predeterminado utilizando muestras ya decodificadas, y está dotada de una primera unidad de cálculo del contexto y una segunda unidad de cálculo del contexto. La primera unidad 1600 de cálculo del contexto obtiene significaciones de muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia existentes antes de la línea de frecuencia a la que pertenece la muestra binaria seleccionada, pasa las significaciones a binario, y calcula un primer contexto. La segunda unidad 1620 de cálculo del contexto obtiene significaciones de muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada; expresa una relación de cuántas líneas entre la pluralidad de líneas de frecuencia tienen significación, en un número entero, al multiplicar la relación por un valor predeterminado de número entero; y luego, calcula un segundo contexto utilizando el número entero.

La unidad 1830 de selección de modelos de probabilidad selecciona un modelo de probabilidad utilizando el parámetro Golomb y el contexto. La unidad 1840 de decodificación aritmética lleva a cabo una decodificación aritmética utilizando el modelo seleccionado de probabilidad.

En la Fig. 18, todas las muestras binarias están decodificadas utilizando una decodificación sin pérdida basada en el contexto. Sin embargo, en otra realización, de cara a la reducción de la complejidad, se decodifican algunas muestras binarias en el plano de bits utilizando una decodificación sin pérdida basada en el contexto y las otras muestras binarias en el plano de bits están decodificadas utilizando una compresión de bits. El parámetro Golomb se utiliza para determinar muestras binarias en el plano de bits para ser decodificadas utilizando una compresión de bits dado que una probabilidad de que la muestra binaria sea "1" bajo el parámetro Golomb es de 1/2.

La Fig. 19 es un diagrama de flujo de las operaciones llevadas a cabo por el aparato de decodificación de audio sin pérdida mostrado en la Fig. 15.

En primer lugar, se introduce una corriente de bits de datos de audio en la unidad 1500 de obtención de parámetros, se obtiene un parámetro Golomb de la corriente de bits de datos de audio en la operación 1900.

Entonces, se selecciona una muestra binaria para ser decodificada en el orden desde un MSB hasta un LSB y desde una menor frecuencia hasta una mayor frecuencia en la unidad 1510 de selección de muestras en la operación 1910.

Si se selecciona una muestra para ser decodificada en la unidad 1510 de selección de muestras, se calcula un contexto predeterminado utilizando muestras ya decodificadas en la unidad 1520 de cálculo del contexto en la operación 1920. Aquí, el contexto está formado con un primer contexto y un segundo contexto, y como se muestra en la Fig. 16, la primera unidad 1600 de cálculo del contexto obtiene significaciones de muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia existentes antes de la línea de frecuencia a la que pertenece la muestra binaria seleccionada, pasa las significaciones a binario, y calcula un primer contexto. Entonces, la segunda unidad 1620 de cálculo del contexto obtiene significaciones de muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia existentes en el entorno de la línea de frecuencia a la que pertenece la muestra binaria seleccionada; expresa una relación de cuántas líneas entre la pluralidad de líneas de frecuencia tienen significaciones en un número entero, al multiplicar la relación por un valor predeterminado de número entero; y luego, calcula un segundo contexto utilizando el número entero.

Entonces, por medio de la unidad 1530 de selección de modelo de probabilidad, se selecciona un modelo de probabilidad utilizando el parámetro Golomb y los contextos primero y segundo en la operación 1930. Si se selecciona el modelo de probabilidad en la unidad 1530 de selección de modelo de probabilidad, se lleva a cabo una decodificación aritmética utilizando el modelo seleccionado de probabilidad en la operación 1940. Las operaciones 1910 a 1940 se llevan a cabo de forma reiterada hasta que se decodifican todas las muestras en la operación 1950.

En la Fig. 19 todas las muestras binarias están decodificadas utilizando una decodificación sin pérdida basada en el contexto. Sin embargo, en otra realización, de cara a la reducción de la complejidad, algunas muestras binarias en el plano de bits están decodificadas utilizando una decodificación sin pérdida basada en el contexto y otras muestras binarias en el plano de bits están decodificadas utilizando una compresión de bits. El parámetro Golomb se utiliza para determinar muestras binarias en planos de bit para ser decodificadas utilizando una compresión de bits dado que la probabilidad de que la muestra binaria sea "1" bajo el parámetro Golomb es de 1/2.

La diferencia entre los datos de audio codificados con pérdida y una señal espectral de audio en el dominio frecuencial que tiene un valor de número entero se definirá como datos de error. En primer lugar, si se introduce una corriente de bits de audio en la unidad 1700 de desmultiplexión, la corriente de bits se desmultiplexa y se extraen una corriente de bits con pérdida generada mediante una codificación con pérdida predeterminada y la corriente de bits de error de los datos de error en la operación 2000.

Se introduce la corriente de bits con pérdida extraída en la unidad 1710 de decodificación con pérdida, y se decodifica con pérdida por medio de un procedimiento predeterminado de decodificación con pérdida correspondiente a la codificación con pérdida cuando se codifican los datos en la operación 2010. Además, se introduce la corriente de bits de error extraído en la unidad 1720 de decodificación sin pérdida y se decodifica sin pérdida en la operación 2020. El procedimiento más detallado de la decodificación sin pérdida en la operación 2020 es el mismo que se ha mostrado en la Fig. 19.

Se introducen la corriente de bits con pérdida decodificada con pérdida en la unidad 1710 de decodificación con pérdida y la corriente de bits de error decodificada sin pérdida en la unidad 1720 de decodificación sin pérdida en la unidad 1730 de síntesis de señal de audio y son restablecidas en una señal espectral de frecuencia en la operación 2030. Se introduce la señal espectral de frecuencia en la unidad 1740 de transformación inversa entera de tiempo/frecuencia y se restablece a una señal de audio en el dominio temporal en la operación 2040.

La presente invención también puede plasmarse como códigos legibles por ordenador en un medio de grabación legible por ordenador. El medio de grabación legible por ordenador es cualquier dispositivo de almacenamiento de datos que pueda almacenar datos que pueden ser leídos a partir de entonces por un sistema informático. Los ejemplos del medio de grabación legible por un ordenador incluyen la memoria de solo lectura (ROM), la memoria de acceso aleatorio (RAM), el CD-ROM, las cintas magnéticas, los disquetes, y los dispositivos ópticos de almacenamiento de datos.

Aunque se ha mostrado y descrito la presente invención particularmente con referencia a realizaciones ejemplares de la misma, las personas con un nivel normal de dominio de la técnica comprenderán que se pueden llevar a cabo diversos cambios en la forma y en los detalles sin alejarse del alcance de la presente invención según se define por las siguientes reivindicaciones. Las realizaciones preferentes deberían ser consideradas únicamente en sentido descriptivo y no con fines de limitación. Por lo tanto, el alcance de la invención está definido no por la descripción detallada de la invención sino por las reivindicaciones adjuntas, y se interpretará que todas las diferencias en el ámbito como que están incluidas en la presente invención.

En el procedimiento y en el aparato de codificación/decodificación de audio sin pérdida conforme a la presente invención, se proporciona un rendimiento óptimo por medio de un modelo basado en distribuciones estadísticas utilizando un contexto global y un contexto local sin tener en cuenta la distribución de una entrada cuando se lleva a cabo la codificación y/o la decodificación de audio sin pérdida. Además, sin tener en cuenta la suposición de que los coeficientes de la MDCT en enteros muestren una distribución de Laplace, se proporciona una relación óptima de compresión y mediante un procedimiento de codificación basado en contexto, se proporciona una relación de compresión mejor que la de la BPGC.

Claims

1. Un procedimiento de codificación de audio sin pérdida que comprende:

\quad: correlacionar (600) una señal espectral de audio en el dominio frecuencial que tiene valores de número entero en una señal de plano de bits con respecto a la frecuencia;

\quad: obtener (610) un bit más significativo y un parámetro Golomb para cada plano de bits;

\quad: seleccionar (620) una muestra binaria de un plano de bits para ser codificada en el orden desde el bit más significativo hasta el bit menos significativo y desde un componente de menor frecuencia hasta un componente de mayor frecuencia; calcular (630) el contexto de la muestra binaria seleccionada;

\quad: seleccionar (640) un modelo de probabilidad de la muestra binaria utilizando el parámetro Golomb y los contextos calculados; y

\quad: codificar aritméticamente sin pérdida (650) la muestra binaria utilizando el modelo seleccionado de probabilidad;

\quad: caracterizado porque el contexto de la muestra binaria seleccionada está calculado utilizando las significaciones de muestras binarias ya codificadas para cada una de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada;

\quad: en el que la significación de una muestra binaria es "1" si hay al menos un "1" en planos de bit ya codificados en la línea de frecuencia de la muestra binaria y, si no hay "1" en la línea de frecuencia de la muestra binaria, la significación de la muestra binaria es "0".

\vskip1.000000\baselineskip

2. El procedimiento de la reivindicación 1, en el que en la etapa de calcular (630) el contexto de la muestra binaria seleccionada, se obtienen las significaciones de muestras binarias ya codificadas de planos de bit en cada línea de frecuencia en una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada, y al pasar la significación a binario, se calcula el valor del contexto de la muestra binaria.

3. El procedimiento de cualquier reivindicación precedente, en el que en el cálculo (630) del contexto de la muestra binaria seleccionada, se obtienen las significaciones de muestras binarias ya codificadas de planos de bit en cada línea de frecuencia en una pluralidad de líneas de frecuencia existentes antes de una línea de frecuencia a la que pertenece la muestra binaria seleccionada; una relación de cuántas muestras binarias entre la pluralidad de muestras binarias tienen una significación de "1" se expresa en un número entero, al multiplicar la relación por un valor predeterminado de número entero; y, luego, se calcula el valor del contexto de la muestra binaria utilizando el número entero.

4. El procedimiento de cualquier reivindicación precedente, en el que el cálculo del contexto de la muestra binaria seleccionada comprende

calcular un primer contexto utilizando las significaciones de muestras binarias ya codificadas de planos de bit en cada línea de frecuencia en una primera pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria que va a ser codificada; y

calcular un segundo contexto utilizando las significaciones de muestras binarias ya codificadas de planos de bit en cada línea de frecuencia en una segunda pluralidad de líneas de frecuencia anteriores a una línea de frecuencia a la que pertenece una muestra binaria que va a ser codificada.

5. El procedimiento de cualquier reivindicación precedente, en el que algunas muestras binarias en el plano de bits están codificadas con una probabilidad de 0,5.

6. Un procedimiento de codificación de audio sin pérdida conforme a cualquiera de las reivindicaciones 1 a 5 que comprende:

\quad: escalar (720) una señal espectral de audio en el dominio frecuencial que tiene valores de número entero para ser utilizada como una señal de entrada de un codificador con pérdida;

\quad: codificar (730) con compresión con pérdida la señal escalada de frecuencia;

\quad: obtener (740) una señal correlacionada de error correspondiente a la diferencia de los datos codificados con pérdida y la señal espectral de audio en el dominio frecuencial que tiene un valor de número entero;

\quad: codificar sin pérdida (750) la señal correlacionada de error utilizando un procedimiento conforme a cualquiera de las reivindicaciones 1 a 6 utilizando la señal correlacionada de error como la señal espectral de audio; y

\quad: generar una corriente de bits al transmitir simultáneamente (760) la señal codificada sin pérdida y la señal codificada con pérdida.

\vskip1.000000\baselineskip

7. Un aparato de codificación de audio sin pérdida que comprende:

\quad: una unidad (200) de correlación de planos de bit dispuesta para correlacionar una señal de audio en el dominio frecuencial que tiene valores de número entero en datos de planos de bit con respecto a la frecuencia;

\quad: una unidad (210) de obtención de parámetros dispuesta para obtener un bit más significativo y un parámetro Golomb para el plano de bits;

\quad: una unidad (220) de selección de muestras binarias dispuesta para seleccionar una muestra binaria en un plano de bits para ser codificada en el orden desde el bit más significativo hasta el bit menos significativo y desde un componente de menor frecuencia hasta un componente de mayor frecuencia;

\quad: una unidad (230) de cálculo del contexto dispuesta para calcular el contexto de la muestra binaria seleccionada utilizando significaciones de muestras binarias ya codificadas para cada una de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada;

\quad: una unidad (240) de selección de modelos de probabilidad dispuesta para seleccionar un modelo de probabilidad de la muestra binaria utilizando el parámetro Golomb obtenido y los contextos calculados; y

\quad: una unidad (250) de codificación de muestras binarias dispuesta para codificar sin pérdida la muestra binaria utilizando el modelo seleccionado de probabilidad,

\quad: caracterizado porque la significación de una muestra binaria es "1" si hay al menos un "1" en los planos de bit ya codificados en la línea de frecuencia de la muestra binaria y, si no hay "1" en la línea de frecuencia de la muestra binaria, la significación de la muestra binaria es "0".

\vskip1.000000\baselineskip

8. El aparato de la reivindicación 7, que comprende, además, una unidad (300) de transformación de número entero/frecuencia que transforma una señal de audio en el dominio temporal en la señal espectral de audio en el dominio frecuencial que tiene valores de número entero.

9. El aparato de la reivindicación 8, en el que la unidad (300) transformación entera tiempo/frecuencia es una unidad transformada discreta del coseno modificada (MDCT) en enteros.

10. El aparato de la reivindicación 7, en el que la unidad de cálculo del contexto comprende:

\quad: una primera unidad de cálculo del contexto dispuesta para calcular un primer contexto al obtener las significaciones de muestras binarias ya codificadas de planos de bit en cada línea de frecuencia en una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada y pasar las significaciones a binario; y

\quad: una segunda unidad de cálculo del contexto dispuesta para calcular un segundo contexto al obtener las significaciones de muestras binarias ya codificadas de planos de bit en cada línea de frecuencia en una pluralidad de líneas de frecuencia existentes anteriores a una línea de frecuencia a la que pertenece la muestra binaria seleccionada, expresando una relación acerca de cuántas líneas entre la pluralidad de líneas de frecuencia tienen una significación de "1", en un número entero al multiplicar la relación por un valor predeterminado de número entero, y, luego, calcular el segundo contexto utilizando el número entero.

11. El aparato de la reivindicación 7, en el que el aparato está dispuesto para codificar algunas muestras binarias en el plano de bits con la probabilidad de 0,5.

12. Un aparato de codificación de audio sin pérdida conforme a cualquiera de las reivindicaciones 7 a 9, que comprende además:

\quad: una unidad (310) de escalado dispuesta para escalar la señal espectral de audio en el dominio frecuencial que tiene un valor de número entero para ser utilizado como una señal de entrada de un codificador con pérdida;

\quad: una unidad (320) de codificación con pérdida dispuesta para codificar con compresión con pérdida la señal escalada de frecuencia;

\quad: una unidad (330) de correlación de errores dispuesta para obtener la diferencia de la señal codificada con pérdida y la señal de la unidad de transformación entera tiempo/frecuencia; y

\quad: un multiplexor (350) dispuesto para generar una corriente de bits al transmitir simultáneamente la señal codificada sin pérdida y la señal codificada con pérdida;

\quad: en el que el aparato de codificación de audio sin pérdida es una unidad (340) de codificación aritmética sin pérdida que es un aparato conforme a cualquiera de las reivindicaciones 8 a 12.

13. Un procedimiento de decodificación de audio sin pérdida que comprende:

\quad: obtener (1900) un parámetro Golomb de una corriente de bits de datos de audio;

\quad: seleccionar (1910) una muestra binaria para ser decodificada en el orden desde un bit más significativo hasta un bit menos significativo y desde una menor frecuencia hasta una mayor frecuencia;

\quad: calcular (1920) el contexto de una muestra binaria para ser decodificada utilizando las significaciones de muestras binarias ya decodificadas de planos de bit para cada una de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria que va a ser decodificada; seleccionar (1930) un modelo de probabilidad de la muestra binaria utilizando el parámetro Golomb y el contexto;

\quad: llevar a cabo una decodificación aritmética (1940) utilizando el modelo seleccionado de probabilidad; y

\quad: llevar a cabo de forma reiterada las operaciones desde la selección de una muestra binaria para ser decodificada hasta la decodificación aritmética, hasta que todas las muestras binarias están decodificadas

\quad: en el que la significación de una muestra binaria es "1" si hay al menos un "1" en planos de bit ya decodificados en la línea de frecuencia de la muestra binaria y, si no hay "1" en los planos de bit ya decodificados en la línea de frecuencia de la muestra binaria, la significación de la muestra binaria es "0".

\vskip1.000000\baselineskip

14. Un procedimiento de decodificación de audio sin pérdida conforme a la reivindicación 13, en el que la diferencia de datos de audio codificado con pérdida y una señal espectral de audio en el dominio frecuencial que tiene un valor de número entero es denominada datos de error, comprendiendo el procedimiento:

\quad: extraer (2000) una corriente de bits con pérdida codificada con pérdida en un procedimiento predeterminado y una corriente de bits de error de los datos de error, al desmultiplexar una corriente de bits de audio;

\quad: decodificar con pérdida (2010) la corriente de bits con pérdida extraída en un

\quad: procedimiento predeterminado;

\quad: decodificar sin pérdida (2020) la corriente de bits de error extraída, utilizando un procedimiento conforme a cualquiera de las reivindicaciones 15 a 19; y

\quad: restablecer (2030) una señal espectral de frecuencia utilizando la corriente de bits con pérdida decodificada y la corriente de bits de error extraída; y

\quad: restablecer (2040) una señal de audio en el dominio temporal al transformar inversamente el entero tiempo/frecuencia de la señal espectral de frecuencia.

\vskip1.000000\baselineskip

15. Un aparato de decodificación de audio sin pérdida que comprende:

\quad: una unidad (1500) de obtención de parámetros dispuesta para obtener un parámetro Golomb de una corriente de bits de datos de audio;

\quad: una unidad (1510) de selección de muestras dispuesta para seleccionar una muestra binaria para ser decodificada en el orden desde un bit más significativo hasta un bit menos significativo y desde una menor frecuencia hasta una mayor frecuencia;

\quad: una unidad (1520) de cálculo del contexto dispuesta para calcular el contexto de una muestra binaria para ser decodificada utilizando las significaciones de muestras binarias ya decodificadas para cada una de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria que se va a decodificar;

\quad: una unidad (1530) de selección del modelo de probabilidad dispuesta para seleccionar un modelo de probabilidad utilizando el parámetro Golomb y el contexto; y

\quad: una unidad (1540) de decodificación aritmética dispuesta para llevar a cabo una decodificación aritmética utilizando el modelo seleccionado de probabilidad;

\vskip1.000000\baselineskip

16. El aparato de la reivindicación 15, en el que la unidad de cálculo del contexto comprende:

\quad: una primera unidad (1600) de cálculo del contexto dispuesta para calcular un primer

\quad: contexto al obtener las significaciones de muestras binarias ya decodificadas en cada línea de frecuencia en una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria que se va a decodificar y pasar las significaciones a binario; y

\quad: una segunda unidad (1620) de cálculo del contexto dispuesta para calcular un segundo contexto al obtener las significaciones de muestras binarias ya decodificadas en cada línea de frecuencia en una pluralidad de líneas de frecuencia existentes anteriores a una línea de frecuencia a la que pertenece la muestra binaria que se va a decodificar, expresando una relación de cuántas líneas entre la pluralidad de líneas de frecuencia tienen significación, en un número entero al multiplicar la relación por un valor predeterminado de número entero, y luego, al utilizar el número entero para calcular el segundo contexto.

\vskip1.000000\baselineskip

17. El aparato de la reivindicación 15 o 16, en el que se decodifican algunas muestras binarias en el plano de bits con una probabilidad de 0,5.

18. Un aparato de decodificación de audio sin pérdida conforme a cualquiera de las reivindicaciones 15 a 17, en el que la diferencia de los datos de audio codificado con pérdida y la señal espectral de audio en el dominio frecuencial que tiene un valor de número entero se denomina datos de error, comprendiendo el aparato:

\quad: una unidad (1700) de desmultiplexión dispuesta para extraer una corriente de bits con pérdida codificada con pérdida en un procedimiento predeterminado y una corriente de bits de error de los datos de error, al desmultiplexar una corriente de bits de audio;

\quad: una unidad (1710) de decodificación con pérdida dispuesta para decodificar con pérdida la corriente de bits con pérdida extraída en un procedimiento predeterminado;

\quad: una unidad (1720) de decodificación sin pérdida dispuesta para decodificar sin pérdida la corriente de bits de error extraído, utilizando un contexto basado en las significaciones de muestras binarias ya decodificadas de planos de bit en cada línea de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece una muestra binaria que va a ser decodificada; y

\quad: una unidad (1730) de síntesis de señales de audio dispuesta para restablecer una señal espectral de frecuencia al sintetizar la corriente de bits con pérdida decodificada y la corriente de bits de error.

\vskip1.000000\baselineskip

19. El aparato de la reivindicación 18, en el que la unidad de decodificación con pérdida es una unidad de decodificación AAC.

20. El aparato de la reivindicación 18 o 19, que comprende además:

\quad: una unidad (1740) de transformación inversa de tiempo/frecuencia dispuesta para restablecer una señal de audio en el dominio temporal al transformar inversamente el entero tiempo/frecuencia de la señal espectral de frecuencia.

21. El aparato de la reivindicación 18, 19 o 20, que comprende además:

\quad: una unidad (1750) de transformación inversa de tiempo/frecuencia dispuesta para restablecer una señal de audio en el dominio temporal a partir de la señal de audio en el dominio frecuencial decodificada por la unidad de decodificación con pérdida.

22. Un medio de grabación legible por ordenador que tiene plasmado en el mismo un programa informático que comprende instrucciones que, cuando son ejecutadas en un ordenador, harán que dicho ordenador lleve a cabo el procedimiento de la reivindicación 1 o 6.

23. Un medio de grabación legible por ordenador que tiene plasmado en el mismo un programa informático que comprende instrucciones que, cuando son ejecutadas en un ordenador, harán que dicho ordenador lleve a cabo el procedimiento de la reivindicación 13 o 14.