ES2339257T3 - Procedimiento y aparato para la codificacion/decodificacion de audio sin perdida. - Google Patents

Procedimiento y aparato para la codificacion/decodificacion de audio sin perdida. Download PDF

Info

Publication number
ES2339257T3
ES2339257T3 ES05251452T ES05251452T ES2339257T3 ES 2339257 T3 ES2339257 T3 ES 2339257T3 ES 05251452 T ES05251452 T ES 05251452T ES 05251452 T ES05251452 T ES 05251452T ES 2339257 T3 ES2339257 T3 ES 2339257T3
Authority
ES
Spain
Prior art keywords
frequency
binary
quad
sample
context
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES05251452T
Other languages
English (en)
Inventor
Oh Ennmi
Junghoe Kim
Miao Lei
Shihwa Lee
Sangwook Kim
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Application granted granted Critical
Publication of ES2339257T3 publication Critical patent/ES2339257T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un procedimiento de codificación de audio sin pérdida que comprende: correlacionar (600) una señal espectral de audio en el dominio frecuencial que tiene valores de número entero en una señal de plano de bits con respecto a la frecuencia; obtener (610) un bit más significativo y un parámetro Golomb para cada plano de bits; seleccionar (620) una muestra binaria de un plano de bits para ser codificada en el orden desde el bit más significativo hasta el bit menos significativo y desde un componente de menor frecuencia hasta un componente de mayor frecuencia; calcular (630) el contexto de la muestra binaria seleccionada; seleccionar (640) un modelo de probabilidad de la muestra binaria utilizando el parámetro Golomb y los contextos calculados; y codificar aritméticamente sin pérdida (650) la muestra binaria utilizando el modelo seleccionado de probabilidad; caracterizado porque el contexto de la muestra binaria seleccionada está calculado utilizando las significaciones de muestras binarias ya codificadas para cada una de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada; en el que la significación de una muestra binaria es "1" si hay al menos un "1" en planos de bit ya codificados en la línea de frecuencia de la muestra binaria y, si no hay "1" en la línea de frecuencia de la muestra binaria, la significación de la muestra binaria es "0".

Description

Procedimiento y aparato para la codificación/decodificación de audio sin pérdida.
La presente invención versa acerca de la codificación y/o decodificación de una señal de audio, y más en particular, acerca de un procedimiento y un aparato para la codificación/decodificación de audio sin pérdida capaces de proporcionar una mayor relación de compresión que en un código Golomb en planos de bit (BPGC) utilizando un procedimiento de codificación basado en texto.
Los procedimientos de codificación de audio sin pérdida incluyen la codificación Meridian de compresión sin pérdida de audio, la codificación Monkey de audio, y la codificación libre de audio sin pérdida. Se aplica una compresión Meridian sin pérdida (MLP) y se utiliza en un disco versátil digital-audio (DVD-A).
Según aumenta el ancho de banda de la red de Internet, se puede proporcionar un gran volumen de contenidos multimedia. En el caso de contenidos de audio, se necesita un procedimiento de audio sin pérdida. En la Unión Europea (UE), ya se ha comenzado la emisión de audio digital a través de una emisión de audio digital (DAB), y para esto las estaciones emisoras y los proveedores de contenidos están utilizando procedimientos de codificación de audio sin pérdida. En respuesta a esto, el grupo MPEG también está continuando con la normalización de la compresión de audio sin pérdida bajo el nombre de ISO/IEC 14496-3:2001/AMD5, codificación escalable de audio sin pérdida (SLS). Esto proporciona una escalabilidad de grano fino (FGS) y permite la compresión de audio sin pérdida.
Se puede mejorar una relación de compresión, que es el factor más importante en una tecnología de compresión de audio sin pérdida, al eliminar información redundante entre elementos de datos. La información redundante puede ser eliminada mediante la predicción entre elementos contiguos de datos y también puede ser eliminada por un contexto entre elementos contiguos de datos.
Los coeficientes de la transformada discreta del coseno modificada (MDCT) en enteros muestran una distribución de Laplace, y en esta distribución, un procedimiento de compresión denominado código de Golomb muestra un resultado óptimo. Para proporcionar la FGS, se necesita una codificación en planos de bit y una combinación del código de Golomb y de la codificación en planos de bit se denomina una codificación Golomb en planos de bit (BPGC), que proporciona una relación óptima de compresión y de FGS. Sin embargo, en algunos casos la suposición de que los coeficientes de MDCT en enteros muestran una distribución de Laplace no es correcta en una distribución real de datos. Dado que la BPGC es un algoritmo concebido suponiendo que los coeficientes de la MDCT en enteros muestran una distribución de Laplace, si los coeficientes de la MDCT en enteros no muestran una distribución de Laplace, la BPGC no puede proporcionar una relación óptima de compresión sin tener en cuenta la suposición de que se necesitan que los coeficientes de la MDCT en enteros muestren una distribución de Laplace.
En el documento ISO/IEC JTC/SC29/WG11 titulado "Improvement of coding efficiency in MPEG-4 audio scalable lossless coding", Eunmi Oh Et al, presentado en MPEG 2003 en diciembre de 2003, Hawái, EE. UU., páginas 1 a 11 se sugiere un procedimiento para mejorar la eficacia de codificación. En este procedimiento, se utilizan los contextos para mejorar la eficacia de codificación.
El documento WO03/077565 enseña un modelador de bits de coeficiente previsto para su uso en JPEG 2000. Los planos de bit están codificados en orden desde el bit más significativo hasta el bit menos significativo utilizando tres ciclos. Los bits están marcados como significativo o no significativo y se cambia este estado a significativo durante los primeros dos ciclos cuando se encuentra el bit más significativo para ese coeficiente.
En Yu et al, "A fine granular scalable perceptually lossy and lossless audio codec", presentado en la congreso internacional IEEE de 2003 sobre multimedia y exposiciones, julio de 2003, Baltimore, Maryland, EE. UU., y consignado en las actas correspondientes del congreso en el volumen 1 páginas 1-65 a 1-68, publicado por el IEEE, ISBN 0-7893-7965-9 se presentan códecs de audio. Los códecs utilizan una codificación Golomb en planos de bit.
La presente invención proporciona un procedimiento y un aparato de codificación/decodificación de audio sin pérdida que son capaces de proporcionar una mejor relación de compresión sin tener en cuenta la suposición de que los coeficientes de la MDCT en enteros muestren una distribución de Laplace.
Conforme a un aspecto de la presente invención, se proporciona un procedimiento de codificación de audio sin pérdida conforme a la reivindicación 1.
En el cálculo del contexto de la muestra binaria seleccionada, se obtienen las significaciones de las muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia que existen en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada, y, al pasar las significaciones a binario, se concatena el valor del contexto de la muestra binaria.
En el cálculo del contexto de la muestra binaria seleccionada, se obtienen las significaciones de las muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia que existen anterior a una línea de frecuencia a la que pertenece la muestra binaria seleccionada; una relación acerca de cuántas líneas entre la pluralidad de líneas de frecuencia tienen significación se expresa en un número entero, al multiplicar la relación por un valor predeterminado de número entero; y luego, se calcula el valor del contexto utilizando el número entero.
Conforme a aún otro aspecto de la presente invención, se proporciona un aparato de codificación de audio sin pérdida conforme a la reivindicación 7.
Conforme a un aspecto adicional de la presente invención, se proporciona un procedimiento de decodificación de audio sin pérdida conforme a la reivindicación 13.
El cálculo del contexto puede incluir: calcular un primer contexto utilizando las significaciones de las muestras ya decodificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia que existen en el entorno de una línea de frecuencia a la que pertenece una muestra que va a ser decodificada; y calcular un segundo contexto utilizando las significaciones de muestras ya decodificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia antes de una línea de frecuencia a la que pertenece una muestra que va a ser decodificada.
Conforme a un aspecto adicional de la presente invención, se proporciona un aparato de decodificación de audio sin pérdida conforme a la reivindicación 15.
La unidad de decodificación sin pérdida puede incluir: una unidad para obtener un parámetro que obtiene un parámetro Golomb de una corriente de bits de datos de audio; una unidad para obtener un parámetro que obtiene un parámetro Golomb de una corriente de bits de datos de audio; una unidad de selección de muestras que selecciona una muestra binaria que se va a decodificar en el orden desde un bit más significativo hasta un bit menos significativo y desde una menor frecuencia a una mayor frecuencia; una unidad de cálculo del contexto que calcula el contexto de la muestra binaria seleccionada al utilizar la significación de los planos de bit ya codificados para cada una de una pluralidad de líneas de frecuencia que existen en el entorno a la que pertenece la muestra binaria seleccionada; una unidad de selección de modelo de probabilidad que selecciona un modelo de probabilidad al utilizar el parámetro Golomb y el contexto; y una unidad de decodificación aritmética que lleva a cabo una decodificación aritmética al utilizar el modelo seleccionado de probabilidad.
La unidad de cálculo del contexto puede incluir: una primera unidad de cálculo del contexto que obtiene las significaciones de muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia que existen en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada, y al pasar las significaciones a binario, calculando un primer contexto; y una segunda unidad de cálculo del contexto que obtiene las significaciones de muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia que existen antes de una línea de frecuencia a la que pertenece la muestra binaria seleccionada, que expresan una relación acerca de cuántas líneas entre la pluralidad de líneas de frecuencia tienen significación, en un número entero, al multiplicar la relación por un valor predeterminado de número entero, y luego, calcular un segundo contexto utilizando el número entero.
Conforme a un aspecto adicional de la presente invención, se proporciona un medio de grabación legible por ordenador que tiene plasmado en el mismo un programa informático para los procedimientos.
Lo anterior y otras características y ventajas de la presente invención serán más evidentes al describir realizaciones ejemplares detalladas de la misma con referencia a los dibujos adjuntos en los que:
La Fig. 1 es un diagrama de bloques de la estructura de una realización preferente de un aparato de codificación de audio sin pérdida conforme a la presente invención;
la Fig. 2 es un diagrama de bloques de la estructura de una unidad de codificación sin pérdida de la Fig. 1;
la Fig. 3 es un diagrama de bloques de la estructura de otra realización preferente del aparato de codificación de audio sin pérdida conforme a la presente invención;
la Fig. 4 es un diagrama de bloques de la estructura de una unidad de codificación sin pérdida de la Fig. 3;
la Fig. 5 es un diagrama de flujo de las operaciones llevadas a cabo por el aparato de codificación de audio sin pérdida mostrado en la Fig. 1;
la Fig. 6 es un diagrama de flujo de las operaciones llevadas a cabo por la unidad de codificación sin pérdida mostrada en la Fig. 1;
la Fig. 7 es un diagrama de flujo de las operaciones llevadas a cabo por el aparato de codificación de audio sin pérdida mostrado en la Fig. 3;
la Fig. 8 es un diagrama que muestra un contexto global en una unidad de cálculo del contexto;
\newpage
la Fig. 9 es un gráfico que muestra una probabilidad de que aparezca 1 cuando se calcula un contexto global en una unidad de cálculo del contexto;
la Fig. 10 es un diagrama que muestra un contexto local en una unidad de cálculo del contexto;
la Fig. 11 es un gráfico que muestra una probabilidad de que aparezca 1 cuando se calcula un contexto local en una unidad de cálculo del contexto;
la Fig. 12 es un diagrama que muestra un modo de contexto completo de una realización preferente conforme a la presente invención;
la Fig. 13 es un diagrama que muestra un modo de contexto parcial de una realización preferente conforme a la presente invención;
la Fig. 14 es un tipo de ejemplo de un pseudocódigo para la codificación basada en el contexto conforme a la presente invención;
la Fig. 15 es un diagrama de bloques de la estructura de una realización preferente de un aparato de decodificación de audio sin pérdida conforme a la presente invención;
la Fig. 16 es un diagrama de bloques de la estructura de una unidad de cálculo del contexto mostrada en la Fig. 15;
la Fig. 17 es un diagrama de bloques de la estructura de otra realización preferente del aparato de decodificación de audio sin pérdida conforme a la presente invención;
la Fig. 18 es un diagrama de bloques de la estructura de una unidad de decodificación sin pérdida de la Fig. 17;
la Fig. 19 es un diagrama de flujo de las operaciones llevadas a cabo por el aparato de decodificación de audio sin pérdida mostrado en la Fig. 15; y
la Fig. 20 es un diagrama de flujo de las operaciones llevadas a cabo por el aparato de decodificación de audio sin pérdida mostrado en la Fig. 17.
Se describirán ahora un procedimiento y un aparato de codificación/decodificación de audio sin pérdida con más detalle con referencia a los dibujos adjuntos, en los que se muestran las realizaciones ejemplares de la invención.
En la codificación de audio, para proporcionar una escalabilidad de grano fino (FGS) y una codificación sin pérdida, se utiliza una transformada discreta del coseno modificada (MDCT) en enteros. En particular, se conoce que si la distribución de muestras de entrada de la señal de audio sigue una distribución de Laplace, un procedimiento de codificación Golomb en planos de bit (BPGC) muestra un resultado de compresión óptima, y esto proporciona un resultado equivalente a un código Golomb. Se puede obtener un parámetro Golomb mediante el siguiente procedimiento:
For(L = 0;(N << L +1)) <= A; L + +);
Conforme al procedimiento, se puede obtener el parámetro Golomb L y debido a la característica del código Golomb, la probabilidad de que 0 o 1 aparezca en un plano de bits menor que L es igual a 1/2. En el caso de una distribución de Laplace este resultado es óptimo pero si la distribución no es una distribución de Laplace, no se puede proporcionar una relación óptima de compresión. En consecuencia, la idea básica de la presente invención es proporcionar una relación óptima de compresión utilizando un contexto por medio de un análisis estadístico mediante una distribución de datos que no sigue una distribución de Laplace.
La Fig. 1 es un diagrama de bloques de la estructura de una realización preferente de un aparato de codificación de audio sin pérdida conforme a la presente invención. El aparato de codificación de audio sin pérdida incluye una unidad 100 de transformación entera tiempo/frecuencia y una unidad 120 de codificación sin pérdida. La unidad 100 de transformación entera tiempo/frecuencia transforma una señal de audio en el dominio temporal en una señal espectral de audio en el dominio frecuencial que tiene un valor de número entero, y preferentemente, utiliza una MDCT en enteros. La unidad 120 de codificación sin pérdida correlaciona la señal de audio en el dominio frecuencial en datos de planos de bit con respecto a la frecuencia, y codifica sin pérdida muestras binarias que forman el plano de bits utilizando un contexto predeterminado. La unidad 120 de codificación sin pérdida está dotada de una unidad 200 de correlación de planos de bit, una unidad 210 de obtención de parámetros, una unidad 220 de selección de muestras binarias, una unidad 230 de cálculo del contexto, una unidad 240 de selección de modelos de probabilidad y una unidad 250 de codificación de muestras binarias.
La unidad 200 de correlación de planos de bit correlaciona la señal de audio en el dominio frecuencial en datos de planos de bit con respecto a la frecuencia. Las Figuras 8 y 10 ilustran ejemplos de señales de audio correlacionadas en datos de planos de bit con respecto a la frecuencia.
La unidad 210 de obtención de parámetros obtiene el bit más significativo (MSB) del plano de bits y un parámetro Golomb. La unidad 220 de selección de muestras binarias selecciona una muestra binaria en un plano de bits para que sea codificada en el orden desde un MSB hasta un bit menos significativo (LSB) y desde un componente de menor frecuencia hasta un componente de mayor frecuencia.
La unidad 230 de cálculo del contexto calcula el contexto de la muestra binaria seleccionada utilizando las significaciones de planos de bit ya codificados para cada una de una pluralidad de líneas de frecuencia que existen en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada. La unidad 240 de selección de modelos de probabilidad selecciona un modelo de probabilidad utilizando el parámetro Golomb y los contextos calculados. La unidad 250 de codificación de muestras binarias codifica sin pérdida la muestra binaria utilizando el modelo seleccionado de probabilidad.
En la Fig. 2 todas las muestras binarias están codificadas utilizando una codificación sin pérdida basada en el contexto. Sin embargo, en otra realización, en aras de la complejidad algunas muestras binarias en el plano de bits están codificadas utilizando codificación sin pérdida basada en el contexto y otras muestras binarias en el plano de bits están codificadas utilizando una compresión de bits. El parámetro Golomb se utiliza para determinar muestras binarias en un plano de bits para ser codificadas utilizando una compresión de bits dado que una probabilidad de ser "1" de la muestra binaria bajo el parámetro Golomb es de 1/2.
La Fig. 3 es un diagrama de bloques de la estructura de otra realización preferente del aparato de codificación de audio sin pérdida conforme a la presente invención. El aparato está dotado de una unidad 300 de transformación entera tiempo/frecuencia, una unidad 310 de escalado, una unidad 320 de codificación con pérdida, una unidad 330 de correlación de errores, una unidad 340 de codificación sin pérdida, y un multiplexor 350.
La unidad 300 de transformación entera tiempo/frecuencia transforma una señal de audio en el dominio temporal en una señal espectral de audio en el dominio frecuencial que tiene un valor de número entero, y preferentemente utiliza MDCT en enteros. La unidad 310 de escalado escala la señal de frecuencia de audio de la unidad 300 de transformación entera tiempo/frecuencia para ser utilizada como una señal de entrada de la unidad 320 de codificación con pérdida. Dado que la señal de salida de la unidad 300 de transformación entera tiempo/frecuencia está representada como un número entero, no puede ser utilizada directamente como una entrada de la unidad 320 de codificación con pérdida. En consecuencia, se escala la señal de frecuencia de audio de la unidad 300 de transformación entera tiempo/frecuencia en la unidad de escalado, de forma que se puede utilizar como una señal de entrada de la unidad 320 de codificación con pérdida.
La unidad 320 de codificación con pérdida codifica con pérdida la señal de frecuencia escalada y preferentemente, utiliza un codificador de núcleo AAC. La unidad 330 de correlación de errores obtiene una señal correlacionada de error correspondiente a la diferencia de la señal codificada con pérdida y la señal de la unidad 300 de transformación entera tiempo/frecuencia. La unidad 340 de codificación sin pérdida codifica sin pérdida la señal correlacionada de error utilizando un contexto. El multiplexor 350 transmite simultáneamente la señal codificada sin pérdida de la unidad 340 de codificación sin pérdida y la señal codificada con pérdida de la unidad 320 de codificación con pérdida, y genera una corriente de bits.
La Fig. 4 es un diagrama de bloques de la estructura de la unidad 340 de codificación sin pérdida, que está dotada de una unidad 400 de correlación de planos de bit, una unidad 410 de obtención de parámetros, una unidad 420 de selección de muestras binarias, una unidad 430 de cálculo del contexto, una unidad 440 de selección de modelos de probabilidad, y una unidad 450 de codificación de muestras binarias.
La unidad 400 de correlación de planos de bit correlaciona la señal correlacionada de error de la unidad 330 de correlación de errores en datos de planos de bit con respecto a la frecuencia. La unidad 410 de obtención de parámetros obtiene el MSB del plano de bits y un parámetro Golomb. La unidad 420 de selección de muestras binarias selecciona una muestra binaria en un plano de bits para ser codificada en el orden desde un MSB a un LSB, y desde un componente de menor frecuencia a un componente de mayor frecuencia. La unidad 430 de cálculo del contexto calcula el contexto de la muestra binaria seleccionada, al utilizar las significaciones de planos de bit ya codificados para cada una de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada. La unidad 440 de selección de modelos de probabilidad selecciona un modelo de probabilidad utilizando el parámetro Golomb obtenido y los contextos calculados. La unidad 450 de codificación de muestras binarias codifica sin pérdida la muestra binaria utilizando el modelo seleccionado de probabilidad.
En la Fig. 4 todas las muestras binarias están codificadas utilizadas codificación sin pérdida basada en el contexto. Sin embargo, en otra realización, de cara a la reducción de la complejidad, algunas muestras binarias en el plano de bits están codificadas utilizando una codificación sin pérdida basada en el contexto y otras muestras binarias en el plano de bits están codificadas utilizando una compresión de bits. El parámetro Golomb se utiliza para determinar muestras binarias en planos de bit para ser codificadas utilizando una compresión de bits dado que una probabilidad de tener "1" de la muestra binaria bajo el parámetro Golomb es de 1/2.
Se explicará ahora el cálculo de un valor de contexto de la muestra binaria en las unidades 230 y 430 de cálculo del contexto mostradas en las Figuras 2 y 4. La significación que se utiliza en relación a la realización de la presente invención está definido como 1 si un componente espectral está codificado como 1 al menos una vez entre muestras anteriores codificadas en planos de bit en una línea de frecuencia idéntica a un momento actual, y está definido como 0 si no hay ningún componente espectral codificado como 1.
Además, las unidades 230 y 430 de cálculo del contexto pueden calcular el contexto de la muestra binaria utilizando, por ejemplo, un cálculo del contexto global. El cálculo del contexto global considera la distribución del espectro completo, y utiliza el hecho de que la forma de la envolvente del espectro no cambia rápidamente en el eje de la frecuencia, y llega a tener una apariencia similar a la forma de la envolvente anterior. En el cálculo del contexto global, tomando la línea de frecuencia de la muestra binaria seleccionada como una base, las unidades 230 y 430 de cálculo del contexto obtienen un valor de probabilidad de que la significación es "1" al utilizar muestras predeterminadas ya codificadas entre planos de bit en cada línea de frecuencia existente antes de la línea de frecuencia de la muestra binaria seleccionada. Entonces, las unidades 230 y 430 de cálculo del contexto multiplican el valor de probabilidad por un valor predeterminado de número entero para expresarlo en un número entero, y al utilizar el número entero, calcular el valor del contexto de la muestra binaria.
Además, las unidades 230 y 430 de cálculo del contexto pueden calcular el contexto de la muestra binaria utilizando un cálculo del contexto local. El cálculo del contexto local utiliza la correlación de muestras binarias adyacentes, y la significación como el cálculo del contexto global. Se pasa a binario la significación de una muestra en cada una de las N corrientes de bits predeterminados en una frecuencia idéntica de una muestra binaria que va a ser codificada en ese momento y, luego, se convierte de nuevo a un número decimal, y, después, se calcula el contexto. En el cálculo del contexto local, tomando la línea de frecuencia de la muestra binaria seleccionada como la base, la unidad 230 y 430 de cálculo del contexto obtiene significaciones respectivas utilizando muestras predeterminadas entre planos de bit en cada una de las líneas de frecuencia que existen en un intervalo predeterminado antes y después de la línea de frecuencia de la muestra binaria seleccionada, y al convertir las significaciones en valores escalares, calcular el valor del contexto de la muestra binaria. El valor N utilizado en este cálculo es menor que el valor M utilizado en el cálculo del contexto global.
La Fig. 5 es un diagrama de flujo de las operaciones llevadas a cabo por el aparato de codificación de audio sin pérdida mostrado en la Fig. 1. En primer lugar, se introduce una señal PCM correspondiente a una señal de audio en el dominio temporal a la unidad 100 de transformación entera tiempo/frecuencia, esta se transforma en una señal de audio espectral en el dominio frecuencial que tiene un valor de número entero en la operación 500. Preferentemente, aquí se utiliza MDCT. Entonces, como en las Figuras 8 y 10, se correlaciona la señal de audio en el dominio frecuencial en una señal del plano de bits con respecto a la frecuencia en la operación 520. Entonces, se codifica sin pérdida una muestra binaria que forma el plano de bits utilizando un modelo de probabilidad determinado utilizando un contexto predeterminado en la operación 540.
La Fig. 6 es un diagrama de flujo de las operaciones llevadas a cabo por la unidad 120 de codificación sin pérdida mostrada en la Fig. 1.
En primer lugar, se introduce la señal de audio en el dominio frecuencial en la unidad 200 de correlación de planos de bit, se correlaciona la señal de audio en el dominio frecuencial en datos de planos de bit con respecto a la frecuencia en la operación 600. Además, por medio de la unidad 210 de obtención de parámetros Golomb, se obtienen el MSB y un parámetro Golomb en cada plano de bits en la operación 610. Entonces, por medio de la unidad 220 de selección de muestras binarias se selecciona, en la operación 620, una muestra binaria en un plano de bits que va a ser codificada en el orden desde un MSB hasta un LSB y desde un componente de menor frecuencia hasta un componente de mayor frecuencia. Con respecto a la muestra binaria seleccionada, se calcula el contexto de la muestra binaria seleccionada en la unidad 220 de selección de muestras binarias utilizando las significaciones de los planos de bit ya codificados para cada una de una pluralidad de líneas de frecuencia que existen en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada, en la operación 630. Se selecciona un modelo de probabilidad utilizando el parámetro Golomb obtenido en la unidad 210 de obtención de parámetros Golomb y se calculan los contextos en la unidad 230 de cálculo del contexto en la operación 640. Al utilizar el modelo seleccionado de probabilidad en la unidad 240 de selección de modelos de probabilidad, se codifica sin pérdida la muestra binaria en la operación 650.
En la Fig. 6 se codifican todas las muestras binarias utilizando una codificación sin pérdida basada en el contexto. Sin embargo, en otra realización, de cara a la reducción de la complejidad, se codifican algunas muestras binarias en el plano de bits utilizando una codificación sin pérdida basada en el contexto y se codifican las otras muestras binarias en el plano de bits utilizando una compresión de bits. El parámetro Golomb se utiliza para determinar muestras binarias en planos de bit para ser codificadas utilizando una compresión de bits dado que una probabilidad de ser "1" de la muestra binaria bajo el parámetro Golomb es de 1/2.
La Fig. 7 es un diagrama de flujo de las operaciones llevadas a cabo por el aparato de codificación de audio sin pérdida mostrado en la Fig. 3, y se explicará ahora con referencia a la Fig. 7, la operación de otra realización preferente del aparato de codificación de audio sin pérdida. En primer lugar, por medio de la unidad 300 de transformación entera tiempo/frecuencia, se transforma una señal de audio en el dominio temporal en una señal espectral de audio en el dominio frecuencial que tiene un valor de número entero en la operación 710.
Entonces, se escala la señal espectral de audio en el dominio frecuencial en la unidad 310 de escalado para ser utilizada como una señal de entrada de la unidad 320 de codificación con pérdida en la operación 720. La señal escalada de frecuencia en la unidad 310 de escalado está codificada con una compresión con pérdida en la unidad 320 de codificación de compresión con pérdida en la operación 730. Preferentemente, la codificación de compresión con pérdida se lleva a cabo por medio de un codificador de núcleo AAC.
Se obtienen una señal correlacionada de error correspondiente a la diferencia de los datos codificados con pérdida en la unidad 320 de codificación con pérdida y la señal espectral de audio en el dominio frecuencial que tiene un valor de número entero en la unidad 330 de correlación de errores en la operación 740. La señal correlacionada de error está codificada sin pérdida utilizando un contexto en la unidad 340 de codificación sin pérdida en la operación
750.
La señal codificada sin pérdida en la unidad 340 de codificación sin pérdida y la señal codificada con pérdida en la unidad 320 de codificación con pérdida se transmiten simultáneamente en el multiplexor 350 y se generan como una corriente de bits en la operación 760. En la codificación sin pérdida en la operación 750, se correlaciona la señal correlacionada de error en datos de plano de bits con respecto a la frecuencia. Entonces, el procedimiento para obtener el MSB y el parámetro Golomb es el mismo que el descrito con referencia a la Fig. 6 y se omitirá aquí.
En general, debido a la pérdida espectral por MDCT, hay una correlación de las muestras colindantes en el eje de frecuencia. Es decir, si el valor de una muestra adyacente es X, es muy probable que el valor de una muestra actual sea un valor en el entorno de X. En consecuencia, si se selecciona una muestra adyacente en el entorno de X como un contexto, se puede mejorar la relación de compresión utilizando la correlación.
Además, se puede conocer a través de análisis estadísticos que el valor de un plano de bits tiene una mayor correlación con la distribución de probabilidades de una muestra de menor orden. En consecuencia, si se selecciona una muestra adyacente en el entorno de X como un contexto, se puede mejorar la relación de compresión utilizando la correlación.
Se explicará ahora un procedimiento para calcular un contexto.
La Fig. 8 es un diagrama para obtener un contexto utilizando un contexto global en una unidad de cálculo del contexto. Al utilizar la parte indicada por las líneas discontinuas, la distribución de probabilidades de una muestra actual se obtiene de muestras ya codificadas. La Fig. 9 es un gráfico que muestra una probabilidad de que 1 aparezca cuando se calcula un contexto en una unidad de cálculo del contexto utilizando un contexto global.
Con referencia a la Fig. 8, se supone que se va a codificar un símbolo en la caja indicada por las líneas del cuadriculado. En la Fig. 8, el contexto global está expresado como la parte del óvalo de líneas discontinuas. Con referencia a la Fig. 9, los otros dos tipos de contexto están fijados como contexto de Golomb (Contexto 1) = 1, y contexto local (Contexto 2) = 0. El gráfico muestra que en el cálculo del contexto utilizando la BPGC, la probabilidad de que aparezca 1 se mantiene a un nivel constante, mientras que en el cálculo del contexto utilizando el contexto global, la probabilidad de que aparezca 1 aumenta de forma gradual según crece el índice del contexto.
La Fig. 10 es un diagrama para obtener un contexto utilizando un contexto local en una unidad de cálculo del contexto. La Fig. 11 es un gráfico que muestra una probabilidad de que aparezca 1 cuando se calcula un contexto en una unidad de cálculo del contexto utilizando un contexto local.
Con referencia a la Fig. 10, en el cálculo del contexto local, se obtienen las significaciones en tres líneas de frecuencia colindantes. Se correlaciona el patrón binario en un valor en un intervalo desde 0 hasta 7 (es decir, 000, 001, 010, 011, 100, 110, 111 en números binarios) para computar la probabilidad del símbolo. En el cálculo del contexto local, utilizando las tres partes indicadas por las líneas discontinuas, como se muestra en la Fig. 10, se calcula la distribución de probabilidad de una muestra actual de muestras ya codificadas. Aquí, la probabilidad de que aparezca 1 en la codificación actual es en el intervalo desde 0 a 7 como se ha mostrado anteriormente, y se determina por los tres valores como un patrón binario [0, 1, 1]. La Fig. 11 muestra la probabilidad de que aparezca 1 cuando se calcula un contexto utilizando un contexto local cuando los otros dos contextos están fijados como contexto de Golomb (Contexto 1) = 1 y contexto global (Contexto 2) = 4. Aquí, el gráfico muestra que cuando se utiliza la BPGC, la probabilidad de que aparezca 1 está fijada a un nivel constante. Mientras tanto, cuando se calcula el contexto mediante un contexto global, la probabilidad de que aparezca 1 es mayor en la primera mitad que la de la BPGC, pero es menor en la segunda mitad que la de la BPGC.
En un ejemplo real de codificación, si entre 10 muestras colindantes que van a ser codificadas para calcular un contexto global, cinco muestras tienen una significación de 1, la probabilidad es de 0,5 y si esta se escala con un valor de 8, se vuelve un valor de 4. En consecuencia, el contexto global es 4. Mientras tanto, cuando se comprueban las significaciones de 2 muestras antes y después para calcular un contexto local, si la muestra número (i-2) es 1, la muestra número (i-1) es 0, la muestra número (i+1) es 0 y la muestra número (i+2) es 1, el resultado del paso a binario es 1001, y es igual a 9 en la expresión decimal. Si el parámetro Golomb de datos que van a ser codificados en ese momento es 4, el parámetro Golomb (contexto 1) = 4, el contexto global (Contexto 2) = 4, y el contexto local (Contexto 3) = 9. Al utilizar el parámetro Golomb, el contexto global y el contexto local, se selecciona un modelo de probabilidad.
\newpage
Los modelos de probabilidades varían con respecto a la implementación, y entre ellos, utilizando un conjunto tridimensional, un procedimiento de implementación puede expresarse como:
Prob[Golomb][Contextol][Contexto2]
Utilizando el modelo de probabilidad obtenido de esta manera, se lleva a cabo la codificación sin pérdida. Como un procedimiento representativo de codificación sin pérdida, se puede utilizar un procedimiento de codificación aritmética.
Por medio de la presente invención, la compresión total se mejora un 0,8% cuando se compara con el procedimiento anterior, que no utiliza el contexto.
La Fig. 12 es un diagrama que muestra un modo de contexto completo de una realización preferente conforme a la presente invención. La Fig. 13 es un diagrama que muestra un modo de contexto parcial de una realización preferente conforme a la presente invención.
Con referencia a la Fig. 12, todas las muestras binarias están codificadas utilizando una codificación aritmética basada en el contexto. Sin embargo, con referencia a la Fig. 13, en otra realización, en aras de la complejidad, algunas muestras binarias en el plano de bits están codificadas utilizando una codificación aritmética basada en el contexto y otras muestras binarias en el plano de bits están codificadas utilizando una compresión de bits, es decir, se asigna una probabilidad de 1/2 para esas muestras binarias.
La Fig. 14 muestra un pseudocódigo para una codificación basada en el contexto en relación a una realización de la presente invención.
Se explicará ahora un aparato y un procedimiento de decodificación de audio sin pérdida conformes a la presente invención.
La Fig. 15 es un diagrama de bloques de la estructura de una realización preferente de un aparato de decodificación de audio sin pérdida conforme a la presente invención. El aparato incluye una unidad 1500 de obtención de parámetros, una unidad 1510 de selección de muestras, una unidad 1520 de cálculo del contexto, una unidad 1530 de selección de modelos de probabilidad, y una unidad 1540 de decodificación aritmética.
Cuando se introduce una corriente de bits de datos de audio, la unidad 1500 de obtención de parámetros obtiene el MSB y el parámetro Golomb de la corriente de bits. La unidad 1510 de selección de muestras selecciona una muestra binaria para ser decodificada en el orden desde un MSB hasta un LSB y desde una menor frecuencia hasta una mayor frecuencia.
La unidad 1520 de cálculo del contexto calcula un contexto predeterminado utilizando muestras ya decodificadas, y como se muestra en la Fig. 16, está dotada de una primera unidad 1600 de cálculo del contexto y una segunda unidad 1620 de cálculo del contexto. La primera unidad 1600 de cálculo del contexto obtiene significaciones de muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia que existen antes de la línea de frecuencia a la que pertenece la muestra binaria seleccionada, pasa las significaciones a binario, y calcula un primer contexto. La segunda unidad 1620 de cálculo del contexto obtiene significaciones de muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia que existen en el entorno de la línea de frecuencia a la que pertenece la muestra binaria seleccionada; expresa una relación en cuántas líneas entre la pluralidad de líneas de frecuencia hay significaciones, en un número entero, al multiplicar la relación por un valor predeterminado de número entero; y luego, calcula un segundo contexto utilizando el número entero.
La unidad 1530 de selección de modelos de probabilidad selecciona un modelo de probabilidad utilizando el parámetro Golomb de la unidad 1500 de obtención de parámetros y el contexto calculado en la unidad 1520 de cálculo del contexto. La unidad 1540 de decodificación aritmética lleva a cabo una decodificación aritmética utilizando el modelo de probabilidad seleccionado en la unidad 1530 de selección de modelo de probabilidad.
En la Fig. 15 todas las muestras están decodificadas utilizando una decodificación sin pérdida basada en el contexto. Sin embargo, en otra realización, de cara a la reducción de la complejidad, se decodifican algunas muestras binarias en el plano de bits utilizando una decodificación sin pérdida basada en el contexto y las otras muestras binarias en el plano de bits están decodificadas utilizando una compresión de bits. El parámetro Golomb se utiliza para determinar muestras binarias en el plano de bits para ser decodificadas utilizando una compresión de bits dado que una probabilidad de que la muestra binaria sea "1" bajo el parámetro Golomb es de 1/2.
La Fig. 17 es un diagrama de bloques de la estructura de otra realización preferente del aparato de decodificación de audio sin pérdida conforme a la presente invención. El aparato incluye una unidad 1700 de desmultiplexión, una unidad 1710 de decodificación con pérdida, una unidad 1720 de decodificación sin pérdida, una unidad 1730 de síntesis de señal de audio, y una unidad 1740 de transformación inversa entera de tiempo/frecuencia y preferentemente, incluye además una unidad 1750 de transformación inversa de tiempo/frecuencia.
Cuando se introduce una corriente de bits de audio, la unidad 1700 de desmultiplexión desmultiplexa la corriente de bits de audio y extrae una corriente de bits con pérdida formada por un procedimiento predeterminado de codificación con pérdida utilizado cuando se codifica una corriente de bits, y una corriente de bits de error de los datos de error.
La unidad 1710 de decodificación con pérdida decodifica con pérdida la corriente de bits con pérdida extraída en la unidad 1700 de desmultiplexión, mediante un procedimiento predeterminado de decodificación con pérdida que se corresponde con un procedimiento predeterminado de codificación con pérdida utilizado cuando se codifica la corriente de bits. La unidad 1720 de decodificación sin pérdida decodifica sin pérdida la corriente de bits de error extraída en la unidad 1700 de desmultiplexión, también mediante un procedimiento de decodificación sin pérdida correspondiente a una codificación sin pérdida.
La unidad 1730 de síntesis de señal de audio sintetiza la corriente de bits decodificada con pérdida y la corriente de bits de error y restablece una señal espectral de frecuencia. La unidad 1740 de transformación inversa entera de tiempo/frecuencia transforma inversamente el entero tiempo/frecuencia de la señal espectral de frecuencia restablecida en la unidad 1730 de síntesis de señal de audio, y restablece una señal de audio en el dominio temporal.
Entonces, la unidad 1750 de transformación inversa de tiempo/frecuencia restablece la señal de audio en el dominio frecuencial decodificada en la unidad 1710 de decodificación con pérdida, en una señal de audio en el dominio temporal, y la señal restablecida de esta manera es la señal decodificada con pérdida.
La Fig. 18 es un diagrama de bloques de la estructura de la unidad 1720 de decodificación sin pérdida de la Fig. 17, que incluye una unidad 1800 de obtención de parámetros, una unidad 1810 de selección de muestras, una unidad 1820 de cálculo del contexto, una unidad 1830 de selección de modelos de probabilidad, y una unidad 1840 de decodificación aritmética.
La unidad 1800 de obtención de parámetros obtiene el MSB y el parámetro Golomb de una corriente de bits de datos de audio. La unidad 1810 de selección de muestras selecciona una muestra binaria para ser decodificada en el orden desde un MSB hasta un LSB y desde una menor frecuencia hasta una mayor frecuencia.
La unidad 1820 de cálculo del contexto calcula un contexto predeterminado utilizando muestras ya decodificadas, y está dotada de una primera unidad de cálculo del contexto y una segunda unidad de cálculo del contexto. La primera unidad 1600 de cálculo del contexto obtiene significaciones de muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia existentes antes de la línea de frecuencia a la que pertenece la muestra binaria seleccionada, pasa las significaciones a binario, y calcula un primer contexto. La segunda unidad 1620 de cálculo del contexto obtiene significaciones de muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada; expresa una relación de cuántas líneas entre la pluralidad de líneas de frecuencia tienen significación, en un número entero, al multiplicar la relación por un valor predeterminado de número entero; y luego, calcula un segundo contexto utilizando el número entero.
La unidad 1830 de selección de modelos de probabilidad selecciona un modelo de probabilidad utilizando el parámetro Golomb y el contexto. La unidad 1840 de decodificación aritmética lleva a cabo una decodificación aritmética utilizando el modelo seleccionado de probabilidad.
En la Fig. 18, todas las muestras binarias están decodificadas utilizando una decodificación sin pérdida basada en el contexto. Sin embargo, en otra realización, de cara a la reducción de la complejidad, se decodifican algunas muestras binarias en el plano de bits utilizando una decodificación sin pérdida basada en el contexto y las otras muestras binarias en el plano de bits están decodificadas utilizando una compresión de bits. El parámetro Golomb se utiliza para determinar muestras binarias en el plano de bits para ser decodificadas utilizando una compresión de bits dado que una probabilidad de que la muestra binaria sea "1" bajo el parámetro Golomb es de 1/2.
La Fig. 19 es un diagrama de flujo de las operaciones llevadas a cabo por el aparato de decodificación de audio sin pérdida mostrado en la Fig. 15.
En primer lugar, se introduce una corriente de bits de datos de audio en la unidad 1500 de obtención de parámetros, se obtiene un parámetro Golomb de la corriente de bits de datos de audio en la operación 1900.
Entonces, se selecciona una muestra binaria para ser decodificada en el orden desde un MSB hasta un LSB y desde una menor frecuencia hasta una mayor frecuencia en la unidad 1510 de selección de muestras en la operación 1910.
Si se selecciona una muestra para ser decodificada en la unidad 1510 de selección de muestras, se calcula un contexto predeterminado utilizando muestras ya decodificadas en la unidad 1520 de cálculo del contexto en la operación 1920. Aquí, el contexto está formado con un primer contexto y un segundo contexto, y como se muestra en la Fig. 16, la primera unidad 1600 de cálculo del contexto obtiene significaciones de muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia existentes antes de la línea de frecuencia a la que pertenece la muestra binaria seleccionada, pasa las significaciones a binario, y calcula un primer contexto. Entonces, la segunda unidad 1620 de cálculo del contexto obtiene significaciones de muestras ya codificadas de planos de bit en cada línea de frecuencia idéntica en una pluralidad de líneas de frecuencia existentes en el entorno de la línea de frecuencia a la que pertenece la muestra binaria seleccionada; expresa una relación de cuántas líneas entre la pluralidad de líneas de frecuencia tienen significaciones en un número entero, al multiplicar la relación por un valor predeterminado de número entero; y luego, calcula un segundo contexto utilizando el número entero.
Entonces, por medio de la unidad 1530 de selección de modelo de probabilidad, se selecciona un modelo de probabilidad utilizando el parámetro Golomb y los contextos primero y segundo en la operación 1930. Si se selecciona el modelo de probabilidad en la unidad 1530 de selección de modelo de probabilidad, se lleva a cabo una decodificación aritmética utilizando el modelo seleccionado de probabilidad en la operación 1940. Las operaciones 1910 a 1940 se llevan a cabo de forma reiterada hasta que se decodifican todas las muestras en la operación 1950.
En la Fig. 19 todas las muestras binarias están decodificadas utilizando una decodificación sin pérdida basada en el contexto. Sin embargo, en otra realización, de cara a la reducción de la complejidad, algunas muestras binarias en el plano de bits están decodificadas utilizando una decodificación sin pérdida basada en el contexto y otras muestras binarias en el plano de bits están decodificadas utilizando una compresión de bits. El parámetro Golomb se utiliza para determinar muestras binarias en planos de bit para ser decodificadas utilizando una compresión de bits dado que la probabilidad de que la muestra binaria sea "1" bajo el parámetro Golomb es de 1/2.
La Fig. 20 es un diagrama de flujo de las operaciones llevadas a cabo por el aparato de decodificación de audio sin pérdida mostrado en la Fig. 17.
La diferencia entre los datos de audio codificados con pérdida y una señal espectral de audio en el dominio frecuencial que tiene un valor de número entero se definirá como datos de error. En primer lugar, si se introduce una corriente de bits de audio en la unidad 1700 de desmultiplexión, la corriente de bits se desmultiplexa y se extraen una corriente de bits con pérdida generada mediante una codificación con pérdida predeterminada y la corriente de bits de error de los datos de error en la operación 2000.
Se introduce la corriente de bits con pérdida extraída en la unidad 1710 de decodificación con pérdida, y se decodifica con pérdida por medio de un procedimiento predeterminado de decodificación con pérdida correspondiente a la codificación con pérdida cuando se codifican los datos en la operación 2010. Además, se introduce la corriente de bits de error extraído en la unidad 1720 de decodificación sin pérdida y se decodifica sin pérdida en la operación 2020. El procedimiento más detallado de la decodificación sin pérdida en la operación 2020 es el mismo que se ha mostrado en la Fig. 19.
Se introducen la corriente de bits con pérdida decodificada con pérdida en la unidad 1710 de decodificación con pérdida y la corriente de bits de error decodificada sin pérdida en la unidad 1720 de decodificación sin pérdida en la unidad 1730 de síntesis de señal de audio y son restablecidas en una señal espectral de frecuencia en la operación 2030. Se introduce la señal espectral de frecuencia en la unidad 1740 de transformación inversa entera de tiempo/frecuencia y se restablece a una señal de audio en el dominio temporal en la operación 2040.
La presente invención también puede plasmarse como códigos legibles por ordenador en un medio de grabación legible por ordenador. El medio de grabación legible por ordenador es cualquier dispositivo de almacenamiento de datos que pueda almacenar datos que pueden ser leídos a partir de entonces por un sistema informático. Los ejemplos del medio de grabación legible por un ordenador incluyen la memoria de solo lectura (ROM), la memoria de acceso aleatorio (RAM), el CD-ROM, las cintas magnéticas, los disquetes, y los dispositivos ópticos de almacenamiento de datos.
Aunque se ha mostrado y descrito la presente invención particularmente con referencia a realizaciones ejemplares de la misma, las personas con un nivel normal de dominio de la técnica comprenderán que se pueden llevar a cabo diversos cambios en la forma y en los detalles sin alejarse del alcance de la presente invención según se define por las siguientes reivindicaciones. Las realizaciones preferentes deberían ser consideradas únicamente en sentido descriptivo y no con fines de limitación. Por lo tanto, el alcance de la invención está definido no por la descripción detallada de la invención sino por las reivindicaciones adjuntas, y se interpretará que todas las diferencias en el ámbito como que están incluidas en la presente invención.
En el procedimiento y en el aparato de codificación/decodificación de audio sin pérdida conforme a la presente invención, se proporciona un rendimiento óptimo por medio de un modelo basado en distribuciones estadísticas utilizando un contexto global y un contexto local sin tener en cuenta la distribución de una entrada cuando se lleva a cabo la codificación y/o la decodificación de audio sin pérdida. Además, sin tener en cuenta la suposición de que los coeficientes de la MDCT en enteros muestren una distribución de Laplace, se proporciona una relación óptima de compresión y mediante un procedimiento de codificación basado en contexto, se proporciona una relación de compresión mejor que la de la BPGC.

Claims (23)

1. Un procedimiento de codificación de audio sin pérdida que comprende:
\quad
correlacionar (600) una señal espectral de audio en el dominio frecuencial que tiene valores de número entero en una señal de plano de bits con respecto a la frecuencia;
\quad
obtener (610) un bit más significativo y un parámetro Golomb para cada plano de bits;
\quad
seleccionar (620) una muestra binaria de un plano de bits para ser codificada en el orden desde el bit más significativo hasta el bit menos significativo y desde un componente de menor frecuencia hasta un componente de mayor frecuencia; calcular (630) el contexto de la muestra binaria seleccionada;
\quad
seleccionar (640) un modelo de probabilidad de la muestra binaria utilizando el parámetro Golomb y los contextos calculados; y
\quad
codificar aritméticamente sin pérdida (650) la muestra binaria utilizando el modelo seleccionado de probabilidad;
\quad
caracterizado porque el contexto de la muestra binaria seleccionada está calculado utilizando las significaciones de muestras binarias ya codificadas para cada una de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada;
\quad
en el que la significación de una muestra binaria es "1" si hay al menos un "1" en planos de bit ya codificados en la línea de frecuencia de la muestra binaria y, si no hay "1" en la línea de frecuencia de la muestra binaria, la significación de la muestra binaria es "0".
\vskip1.000000\baselineskip
2. El procedimiento de la reivindicación 1, en el que en la etapa de calcular (630) el contexto de la muestra binaria seleccionada, se obtienen las significaciones de muestras binarias ya codificadas de planos de bit en cada línea de frecuencia en una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada, y al pasar la significación a binario, se calcula el valor del contexto de la muestra binaria.
3. El procedimiento de cualquier reivindicación precedente, en el que en el cálculo (630) del contexto de la muestra binaria seleccionada, se obtienen las significaciones de muestras binarias ya codificadas de planos de bit en cada línea de frecuencia en una pluralidad de líneas de frecuencia existentes antes de una línea de frecuencia a la que pertenece la muestra binaria seleccionada; una relación de cuántas muestras binarias entre la pluralidad de muestras binarias tienen una significación de "1" se expresa en un número entero, al multiplicar la relación por un valor predeterminado de número entero; y, luego, se calcula el valor del contexto de la muestra binaria utilizando el número entero.
4. El procedimiento de cualquier reivindicación precedente, en el que el cálculo del contexto de la muestra binaria seleccionada comprende
calcular un primer contexto utilizando las significaciones de muestras binarias ya codificadas de planos de bit en cada línea de frecuencia en una primera pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria que va a ser codificada; y
calcular un segundo contexto utilizando las significaciones de muestras binarias ya codificadas de planos de bit en cada línea de frecuencia en una segunda pluralidad de líneas de frecuencia anteriores a una línea de frecuencia a la que pertenece una muestra binaria que va a ser codificada.
5. El procedimiento de cualquier reivindicación precedente, en el que algunas muestras binarias en el plano de bits están codificadas con una probabilidad de 0,5.
6. Un procedimiento de codificación de audio sin pérdida conforme a cualquiera de las reivindicaciones 1 a 5 que comprende:
\quad
escalar (720) una señal espectral de audio en el dominio frecuencial que tiene valores de número entero para ser utilizada como una señal de entrada de un codificador con pérdida;
\quad
codificar (730) con compresión con pérdida la señal escalada de frecuencia;
\quad
obtener (740) una señal correlacionada de error correspondiente a la diferencia de los datos codificados con pérdida y la señal espectral de audio en el dominio frecuencial que tiene un valor de número entero;
\quad
codificar sin pérdida (750) la señal correlacionada de error utilizando un procedimiento conforme a cualquiera de las reivindicaciones 1 a 6 utilizando la señal correlacionada de error como la señal espectral de audio; y
\quad
generar una corriente de bits al transmitir simultáneamente (760) la señal codificada sin pérdida y la señal codificada con pérdida.
\vskip1.000000\baselineskip
7. Un aparato de codificación de audio sin pérdida que comprende:
\quad
una unidad (200) de correlación de planos de bit dispuesta para correlacionar una señal de audio en el dominio frecuencial que tiene valores de número entero en datos de planos de bit con respecto a la frecuencia;
\quad
una unidad (210) de obtención de parámetros dispuesta para obtener un bit más significativo y un parámetro Golomb para el plano de bits;
\quad
una unidad (220) de selección de muestras binarias dispuesta para seleccionar una muestra binaria en un plano de bits para ser codificada en el orden desde el bit más significativo hasta el bit menos significativo y desde un componente de menor frecuencia hasta un componente de mayor frecuencia;
\quad
una unidad (230) de cálculo del contexto dispuesta para calcular el contexto de la muestra binaria seleccionada utilizando significaciones de muestras binarias ya codificadas para cada una de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada;
\quad
una unidad (240) de selección de modelos de probabilidad dispuesta para seleccionar un modelo de probabilidad de la muestra binaria utilizando el parámetro Golomb obtenido y los contextos calculados; y
\quad
una unidad (250) de codificación de muestras binarias dispuesta para codificar sin pérdida la muestra binaria utilizando el modelo seleccionado de probabilidad,
\quad
caracterizado porque la significación de una muestra binaria es "1" si hay al menos un "1" en los planos de bit ya codificados en la línea de frecuencia de la muestra binaria y, si no hay "1" en la línea de frecuencia de la muestra binaria, la significación de la muestra binaria es "0".
\vskip1.000000\baselineskip
8. El aparato de la reivindicación 7, que comprende, además, una unidad (300) de transformación de número entero/frecuencia que transforma una señal de audio en el dominio temporal en la señal espectral de audio en el dominio frecuencial que tiene valores de número entero.
9. El aparato de la reivindicación 8, en el que la unidad (300) transformación entera tiempo/frecuencia es una unidad transformada discreta del coseno modificada (MDCT) en enteros.
10. El aparato de la reivindicación 7, en el que la unidad de cálculo del contexto comprende:
\quad
una primera unidad de cálculo del contexto dispuesta para calcular un primer contexto al obtener las significaciones de muestras binarias ya codificadas de planos de bit en cada línea de frecuencia en una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada y pasar las significaciones a binario; y
\quad
una segunda unidad de cálculo del contexto dispuesta para calcular un segundo contexto al obtener las significaciones de muestras binarias ya codificadas de planos de bit en cada línea de frecuencia en una pluralidad de líneas de frecuencia existentes anteriores a una línea de frecuencia a la que pertenece la muestra binaria seleccionada, expresando una relación acerca de cuántas líneas entre la pluralidad de líneas de frecuencia tienen una significación de "1", en un número entero al multiplicar la relación por un valor predeterminado de número entero, y, luego, calcular el segundo contexto utilizando el número entero.
11. El aparato de la reivindicación 7, en el que el aparato está dispuesto para codificar algunas muestras binarias en el plano de bits con la probabilidad de 0,5.
12. Un aparato de codificación de audio sin pérdida conforme a cualquiera de las reivindicaciones 7 a 9, que comprende además:
\quad
una unidad (310) de escalado dispuesta para escalar la señal espectral de audio en el dominio frecuencial que tiene un valor de número entero para ser utilizado como una señal de entrada de un codificador con pérdida;
\quad
una unidad (320) de codificación con pérdida dispuesta para codificar con compresión con pérdida la señal escalada de frecuencia;
\quad
una unidad (330) de correlación de errores dispuesta para obtener la diferencia de la señal codificada con pérdida y la señal de la unidad de transformación entera tiempo/frecuencia; y
\quad
un multiplexor (350) dispuesto para generar una corriente de bits al transmitir simultáneamente la señal codificada sin pérdida y la señal codificada con pérdida;
\quad
en el que el aparato de codificación de audio sin pérdida es una unidad (340) de codificación aritmética sin pérdida que es un aparato conforme a cualquiera de las reivindicaciones 8 a 12.
13. Un procedimiento de decodificación de audio sin pérdida que comprende:
\quad
obtener (1900) un parámetro Golomb de una corriente de bits de datos de audio;
\quad
seleccionar (1910) una muestra binaria para ser decodificada en el orden desde un bit más significativo hasta un bit menos significativo y desde una menor frecuencia hasta una mayor frecuencia;
\quad
calcular (1920) el contexto de una muestra binaria para ser decodificada utilizando las significaciones de muestras binarias ya decodificadas de planos de bit para cada una de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria que va a ser decodificada; seleccionar (1930) un modelo de probabilidad de la muestra binaria utilizando el parámetro Golomb y el contexto;
\quad
llevar a cabo una decodificación aritmética (1940) utilizando el modelo seleccionado de probabilidad; y
\quad
llevar a cabo de forma reiterada las operaciones desde la selección de una muestra binaria para ser decodificada hasta la decodificación aritmética, hasta que todas las muestras binarias están decodificadas
\quad
en el que la significación de una muestra binaria es "1" si hay al menos un "1" en planos de bit ya decodificados en la línea de frecuencia de la muestra binaria y, si no hay "1" en los planos de bit ya decodificados en la línea de frecuencia de la muestra binaria, la significación de la muestra binaria es "0".
\vskip1.000000\baselineskip
14. Un procedimiento de decodificación de audio sin pérdida conforme a la reivindicación 13, en el que la diferencia de datos de audio codificado con pérdida y una señal espectral de audio en el dominio frecuencial que tiene un valor de número entero es denominada datos de error, comprendiendo el procedimiento:
\quad
extraer (2000) una corriente de bits con pérdida codificada con pérdida en un procedimiento predeterminado y una corriente de bits de error de los datos de error, al desmultiplexar una corriente de bits de audio;
\quad
decodificar con pérdida (2010) la corriente de bits con pérdida extraída en un
\quad
procedimiento predeterminado;
\quad
decodificar sin pérdida (2020) la corriente de bits de error extraída, utilizando un procedimiento conforme a cualquiera de las reivindicaciones 15 a 19; y
\quad
restablecer (2030) una señal espectral de frecuencia utilizando la corriente de bits con pérdida decodificada y la corriente de bits de error extraída; y
\quad
restablecer (2040) una señal de audio en el dominio temporal al transformar inversamente el entero tiempo/frecuencia de la señal espectral de frecuencia.
\vskip1.000000\baselineskip
15. Un aparato de decodificación de audio sin pérdida que comprende:
\quad
una unidad (1500) de obtención de parámetros dispuesta para obtener un parámetro Golomb de una corriente de bits de datos de audio;
\quad
una unidad (1510) de selección de muestras dispuesta para seleccionar una muestra binaria para ser decodificada en el orden desde un bit más significativo hasta un bit menos significativo y desde una menor frecuencia hasta una mayor frecuencia;
\quad
una unidad (1520) de cálculo del contexto dispuesta para calcular el contexto de una muestra binaria para ser decodificada utilizando las significaciones de muestras binarias ya decodificadas para cada una de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria que se va a decodificar;
\quad
una unidad (1530) de selección del modelo de probabilidad dispuesta para seleccionar un modelo de probabilidad utilizando el parámetro Golomb y el contexto; y
\quad
una unidad (1540) de decodificación aritmética dispuesta para llevar a cabo una decodificación aritmética utilizando el modelo seleccionado de probabilidad;
\quad
en el que la significación de una muestra binaria es "1" si hay al menos un "1" en planos de bit ya decodificados en la línea de frecuencia de la muestra binaria y, si no hay "1" en los planos de bit ya decodificados en la línea de frecuencia de la muestra binaria, la significación de la muestra binaria es "0".
\vskip1.000000\baselineskip
16. El aparato de la reivindicación 15, en el que la unidad de cálculo del contexto comprende:
\quad
una primera unidad (1600) de cálculo del contexto dispuesta para calcular un primer
\quad
contexto al obtener las significaciones de muestras binarias ya decodificadas en cada línea de frecuencia en una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria que se va a decodificar y pasar las significaciones a binario; y
\quad
una segunda unidad (1620) de cálculo del contexto dispuesta para calcular un segundo contexto al obtener las significaciones de muestras binarias ya decodificadas en cada línea de frecuencia en una pluralidad de líneas de frecuencia existentes anteriores a una línea de frecuencia a la que pertenece la muestra binaria que se va a decodificar, expresando una relación de cuántas líneas entre la pluralidad de líneas de frecuencia tienen significación, en un número entero al multiplicar la relación por un valor predeterminado de número entero, y luego, al utilizar el número entero para calcular el segundo contexto.
\vskip1.000000\baselineskip
17. El aparato de la reivindicación 15 o 16, en el que se decodifican algunas muestras binarias en el plano de bits con una probabilidad de 0,5.
18. Un aparato de decodificación de audio sin pérdida conforme a cualquiera de las reivindicaciones 15 a 17, en el que la diferencia de los datos de audio codificado con pérdida y la señal espectral de audio en el dominio frecuencial que tiene un valor de número entero se denomina datos de error, comprendiendo el aparato:
\quad
una unidad (1700) de desmultiplexión dispuesta para extraer una corriente de bits con pérdida codificada con pérdida en un procedimiento predeterminado y una corriente de bits de error de los datos de error, al desmultiplexar una corriente de bits de audio;
\quad
una unidad (1710) de decodificación con pérdida dispuesta para decodificar con pérdida la corriente de bits con pérdida extraída en un procedimiento predeterminado;
\quad
una unidad (1720) de decodificación sin pérdida dispuesta para decodificar sin pérdida la corriente de bits de error extraído, utilizando un contexto basado en las significaciones de muestras binarias ya decodificadas de planos de bit en cada línea de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece una muestra binaria que va a ser decodificada; y
\quad
una unidad (1730) de síntesis de señales de audio dispuesta para restablecer una señal espectral de frecuencia al sintetizar la corriente de bits con pérdida decodificada y la corriente de bits de error.
\vskip1.000000\baselineskip
19. El aparato de la reivindicación 18, en el que la unidad de decodificación con pérdida es una unidad de decodificación AAC.
20. El aparato de la reivindicación 18 o 19, que comprende además:
\quad
una unidad (1740) de transformación inversa de tiempo/frecuencia dispuesta para restablecer una señal de audio en el dominio temporal al transformar inversamente el entero tiempo/frecuencia de la señal espectral de frecuencia.
21. El aparato de la reivindicación 18, 19 o 20, que comprende además:
\quad
una unidad (1750) de transformación inversa de tiempo/frecuencia dispuesta para restablecer una señal de audio en el dominio temporal a partir de la señal de audio en el dominio frecuencial decodificada por la unidad de decodificación con pérdida.
22. Un medio de grabación legible por ordenador que tiene plasmado en el mismo un programa informático que comprende instrucciones que, cuando son ejecutadas en un ordenador, harán que dicho ordenador lleve a cabo el procedimiento de la reivindicación 1 o 6.
23. Un medio de grabación legible por ordenador que tiene plasmado en el mismo un programa informático que comprende instrucciones que, cuando son ejecutadas en un ordenador, harán que dicho ordenador lleve a cabo el procedimiento de la reivindicación 13 o 14.
ES05251452T 2004-03-10 2005-03-10 Procedimiento y aparato para la codificacion/decodificacion de audio sin perdida. Active ES2339257T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US55135904P 2004-03-10 2004-03-10
US551359P 2004-03-10
KR1020040050479A KR100561869B1 (ko) 2004-03-10 2004-06-30 무손실 오디오 부호화/복호화 방법 및 장치
KR10-2004-0050479 2004-06-30

Publications (1)

Publication Number Publication Date
ES2339257T3 true ES2339257T3 (es) 2010-05-18

Family

ID=34829555

Family Applications (1)

Application Number Title Priority Date Filing Date
ES05251452T Active ES2339257T3 (es) 2004-03-10 2005-03-10 Procedimiento y aparato para la codificacion/decodificacion de audio sin perdida.

Country Status (7)

Country Link
US (1) US7660720B2 (es)
EP (1) EP1575032B1 (es)
JP (2) JP4744899B2 (es)
KR (1) KR100561869B1 (es)
CN (1) CN1681213B (es)
DE (1) DE602005019643D1 (es)
ES (1) ES2339257T3 (es)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070037945A (ko) * 2005-10-04 2007-04-09 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
KR101237413B1 (ko) * 2005-12-07 2013-02-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치
JP4732203B2 (ja) * 2006-03-17 2011-07-27 キヤノン株式会社 画像符号化装置及び復号装置及びそれらの制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
EP1883067A1 (en) * 2006-07-24 2008-01-30 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
KR101346358B1 (ko) 2006-09-18 2013-12-31 삼성전자주식회사 대역폭 확장 기법을 이용한 오디오 신호의 부호화/복호화방법 및 장치
US20080071550A1 (en) * 2006-09-18 2008-03-20 Samsung Electronics Co., Ltd. Method and apparatus to encode and decode audio signal by using bandwidth extension technique
JP2010506207A (ja) * 2006-10-06 2010-02-25 エージェンシー フォー サイエンス,テクノロジー アンド リサーチ エンコード方法、デコード方法、エンコーダ、デコーダ、及びコンピュータプログラム製品
KR101261524B1 (ko) * 2007-03-14 2013-05-06 삼성전자주식회사 노이즈를 포함하는 오디오 신호를 저비트율로부호화/복호화하는 방법 및 이를 위한 장치
US7991622B2 (en) * 2007-03-20 2011-08-02 Microsoft Corporation Audio compression and decompression using integer-reversible modulated lapped transforms
US8086465B2 (en) * 2007-03-20 2011-12-27 Microsoft Corporation Transform domain transcoding and decoding of audio data using integer-reversible modulated lapped transforms
KR100889750B1 (ko) * 2007-05-17 2009-03-24 한국전자통신연구원 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법
WO2009027606A1 (fr) * 2007-08-24 2009-03-05 France Telecom Codage/decodage par plans de symboles, avec calcul dynamique de tables de probabilites
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
WO2010003479A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and audio decoder
WO2010032934A2 (ko) * 2008-09-16 2010-03-25 에스케이텔레콤 주식회사 B-변환을 위한 부호화 방법 및 장치와 그를 위한 부호화 데이터
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
KR20100136890A (ko) * 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
FR2947944A1 (fr) * 2009-07-07 2011-01-14 France Telecom Codage/decodage perfectionne de signaux audionumeriques
CN102667923B (zh) 2009-10-20 2014-11-05 弗兰霍菲尔运输应用研究公司 音频编码器、音频解码器、用于将音频信息编码的方法、用于将音频信息解码的方法
CA2786944C (en) * 2010-01-12 2016-03-15 Fraunhofer Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a hash table describing both significant state values and interval boundaries
US8374858B2 (en) * 2010-03-09 2013-02-12 Dts, Inc. Scalable lossless audio codec and authoring tool
JP5600805B2 (ja) * 2010-07-20 2014-10-01 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 最適化されたハッシュテーブルを用いるオーディオエンコーダ、オーディオデコーダ、オーディオ情報を符号化するための方法、オーディオ情報を復号化するための方法およびコンピュータプログラム
KR101676477B1 (ko) 2010-07-21 2016-11-15 삼성전자주식회사 컨텍스트 기반의 무손실 부호화 장치 및 방법, 그리고 복호화 장치 및 방법
CN102074243B (zh) * 2010-12-28 2012-09-05 武汉大学 一种基于比特平面的感知音频分级编码系统及方法
GB2524682B (en) * 2011-10-24 2016-04-27 Graham Craven Peter Lossless buried data
CN103248367B (zh) * 2012-02-03 2016-03-16 展讯通信(上海)有限公司 码流数据的编码、解码方法和装置
CN104509130B (zh) * 2012-05-29 2017-03-29 诺基亚技术有限公司 立体声音频信号编码器
ES2934591T3 (es) * 2013-09-13 2023-02-23 Samsung Electronics Co Ltd Procedimiento de codificación sin pérdidas
WO2015037961A1 (ko) 2013-09-13 2015-03-19 삼성전자 주식회사 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치
CN103595503B (zh) * 2013-10-25 2016-08-17 福建升腾资讯有限公司 一种基于串口装置的频率编解码通讯系统
CN104934034B (zh) 2014-03-19 2016-11-16 华为技术有限公司 用于信号处理的方法和装置
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
CN105187071B (zh) * 2015-09-29 2018-04-06 东北大学 一种管道毫秒级在线数据的复合压缩/解压缩方法
WO2018235418A1 (ja) * 2017-06-22 2018-12-27 日本電信電話株式会社 符号化装置、復号装置、符号化方法、復号方法、およびプログラム
WO2019091576A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6778965B1 (en) * 1996-10-10 2004-08-17 Koninklijke Philips Electronics N.V. Data compression and expansion of an audio signal
CN1179348C (zh) * 1996-11-07 2004-12-08 皇家菲利浦电子有限公司 比特流信号的数据处理
IL122714A (en) * 1997-04-02 2011-06-30 Samsung Electronics Co Ltd Digital data coding/decoding method and apparatus
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
US6314136B1 (en) * 1997-08-01 2001-11-06 Creative Technology Ltd. Method for performing wavelet-based image compaction losslessly and low bit precision requirements
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
US6121904A (en) 1998-03-12 2000-09-19 Liquid Audio, Inc. Lossless data compression with low complexity
US6757659B1 (en) * 1998-11-16 2004-06-29 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US6223162B1 (en) * 1998-12-14 2001-04-24 Microsoft Corporation Multi-level run length coding for frequency-domain audio coding
US6400289B1 (en) * 2000-03-01 2002-06-04 Hughes Electronics Corporation System and method for performing lossless data compression and decompression
FI109393B (fi) * 2000-07-14 2002-07-15 Nokia Corp Menetelmä mediavirran enkoodaamiseksi skaalautuvasti, skaalautuva enkooderi ja päätelaite
BR0107420A (pt) * 2000-11-03 2002-10-08 Koninkl Philips Electronics Nv Processos de codificação de um sinal de entrada e de decodificação, sinal modificado modelado, meio de armazenagem, decodificador, reprodutor de áudio, e ,aparelho para codificação de sinais
US6675148B2 (en) * 2001-01-05 2004-01-06 Digital Voice Systems, Inc. Lossless audio coder
US6735254B2 (en) * 2001-06-29 2004-05-11 Qualcomm, Inc. DCT compression using Golomb-Rice coding
US6650784B2 (en) * 2001-07-02 2003-11-18 Qualcomm, Incorporated Lossless intraframe encoding using Golomb-Rice
US6856701B2 (en) * 2001-09-14 2005-02-15 Nokia Corporation Method and system for context-based adaptive binary arithmetic coding
AU2003217995A1 (en) * 2002-03-07 2003-09-22 Aware, Inc. Jpeg 2000 coder using selective group modeling according to coding passes
KR100908114B1 (ko) * 2002-03-09 2009-07-16 삼성전자주식회사 스케일러블 무손실 오디오 부호화/복호화 장치 및 그 방법
US7110941B2 (en) * 2002-03-28 2006-09-19 Microsoft Corporation System and method for embedded audio coding with implicit auditory masking
US7424434B2 (en) * 2002-09-04 2008-09-09 Microsoft Corporation Unified lossy and lossless audio compression
US7536305B2 (en) * 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
US7328150B2 (en) * 2002-09-04 2008-02-05 Microsoft Corporation Innovations in pure lossless audio compression
KR101015497B1 (ko) * 2003-03-22 2011-02-16 삼성전자주식회사 디지털 데이터의 부호화/복호화 방법 및 장치
EP1939863A3 (en) * 2003-10-10 2008-07-16 Agency for Science, Technology and Research Method for encoding a digital signal into a scalable bitstream; method for decoding a scalable bitstream
JP2005173201A (ja) * 2003-12-11 2005-06-30 Canon Inc オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、及びオーディオ復号プログラムを記録したコンピュータ可読記録媒体
KR100576548B1 (ko) * 2003-12-26 2006-05-03 한국전자통신연구원 문맥기반 적응 가변길이 복호화 장치 및 그 방법
KR20050087956A (ko) * 2004-02-27 2005-09-01 삼성전자주식회사 무손실 오디오 부호화/복호화 방법 및 장치

Also Published As

Publication number Publication date
CN1681213B (zh) 2010-05-26
US7660720B2 (en) 2010-02-09
JP2011048388A (ja) 2011-03-10
US20050203731A1 (en) 2005-09-15
JP2005260969A (ja) 2005-09-22
EP1575032A2 (en) 2005-09-14
EP1575032B1 (en) 2010-03-03
EP1575032A3 (en) 2006-09-27
CN1681213A (zh) 2005-10-12
JP5372886B2 (ja) 2013-12-18
DE602005019643D1 (de) 2010-04-15
KR100561869B1 (ko) 2006-03-17
JP4744899B2 (ja) 2011-08-10
KR20050090941A (ko) 2005-09-14

Similar Documents

Publication Publication Date Title
ES2339257T3 (es) Procedimiento y aparato para la codificacion/decodificacion de audio sin perdida.
JP5384780B2 (ja) 無損失オーディオ符号化方法、無損失オーディオ符号化装置、無損失オーディオ復号化方法、無損失オーディオ復号化装置及び記録媒体
ES2717606T3 (es) Codificación y decodificación de audio escalable usando un banco de filtros jerárquico
CN101027717B (zh) 无损多通道音频编解码器
ES2321147T3 (es) Codificacion de habla de tasa de transmision variable.
ES2587999T3 (es) Procedimiento, aparato y soporte de registro legible por ordenador para decodificar una señal de audio multicanal
WO2002103685A1 (fr) Appareil et procede de codage, appareil et procede de decodage et programme
TW201007699A (en) Compression of audio scale-factors by two-dimensional transformation
JPH08328599A (ja) Mpegオーディオ復号器
KR20060121655A (ko) 넓은-뜻의 지각적 유사성을 이용하는 디지털 미디어스펙트럼 데이터의 효과적인 코딩
JP2008519991A (ja) 音声の符号化及び復号化
ES2575693T3 (es) Un método y un aparato para detectar tasa de muestreo de audio
US8239210B2 (en) Lossless multi-channel audio codec
US7197454B2 (en) Audio coding
ES2248549T3 (es) Edicion de señales de audio.
US8494843B2 (en) Encoding and decoding apparatuses for improving sound quality of G.711 codec
WO2015096789A1 (zh) 一种用于音频信号的矢量量化编解码方法及装置
Yang et al. A lossless audio compression scheme with random access property
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
ES2338801T3 (es) Procedimiento de cuantificacion de un codificador de palabra de flujo muy bajo.
Chang et al. Dither-like data hiding in multistage vector quantization of MELP and G. 729 speech coding
US20120102035A1 (en) Data Embedding Methods, Embedded Data Extraction Methods, Truncation Methods, Data Embedding Devices, Embedded Data Extraction Devices And Truncation Devices
Kandadai et al. Scalable audio compression at low bitrates
KR20070030878A (ko) 무손실 오디오 부호화/복호화 방법 및 장치
ES2296489B1 (es) Metodo escalable de compresion de audio e imagenes.