ES2339257T3 - Procedimiento y aparato para la codificacion/decodificacion de audio sin perdida. - Google Patents
Procedimiento y aparato para la codificacion/decodificacion de audio sin perdida. Download PDFInfo
- Publication number
- ES2339257T3 ES2339257T3 ES05251452T ES05251452T ES2339257T3 ES 2339257 T3 ES2339257 T3 ES 2339257T3 ES 05251452 T ES05251452 T ES 05251452T ES 05251452 T ES05251452 T ES 05251452T ES 2339257 T3 ES2339257 T3 ES 2339257T3
- Authority
- ES
- Spain
- Prior art keywords
- frequency
- binary
- quad
- sample
- context
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 230000003595 spectral effect Effects 0.000 claims abstract description 27
- 238000004364 calculation method Methods 0.000 claims description 61
- 230000006835 compression Effects 0.000 claims description 37
- 238000007906 compression Methods 0.000 claims description 37
- 230000005236 sound signal Effects 0.000 claims description 30
- 230000009466 transformation Effects 0.000 claims description 20
- 230000002596 correlated effect Effects 0.000 claims description 13
- 230000002123 temporal effect Effects 0.000 claims description 8
- 230000000875 corresponding effect Effects 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 238000003786 synthesis reaction Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 22
- 238000009826 distribution Methods 0.000 description 22
- 230000009467 reduction Effects 0.000 description 5
- 238000013500 data storage Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Un procedimiento de codificación de audio sin pérdida que comprende: correlacionar (600) una señal espectral de audio en el dominio frecuencial que tiene valores de número entero en una señal de plano de bits con respecto a la frecuencia; obtener (610) un bit más significativo y un parámetro Golomb para cada plano de bits; seleccionar (620) una muestra binaria de un plano de bits para ser codificada en el orden desde el bit más significativo hasta el bit menos significativo y desde un componente de menor frecuencia hasta un componente de mayor frecuencia; calcular (630) el contexto de la muestra binaria seleccionada; seleccionar (640) un modelo de probabilidad de la muestra binaria utilizando el parámetro Golomb y los contextos calculados; y codificar aritméticamente sin pérdida (650) la muestra binaria utilizando el modelo seleccionado de probabilidad; caracterizado porque el contexto de la muestra binaria seleccionada está calculado utilizando las significaciones de muestras binarias ya codificadas para cada una de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada; en el que la significación de una muestra binaria es "1" si hay al menos un "1" en planos de bit ya codificados en la línea de frecuencia de la muestra binaria y, si no hay "1" en la línea de frecuencia de la muestra binaria, la significación de la muestra binaria es "0".
Description
Procedimiento y aparato para la
codificación/decodificación de audio sin pérdida.
La presente invención versa acerca de la
codificación y/o decodificación de una señal de audio, y más en
particular, acerca de un procedimiento y un aparato para la
codificación/decodificación de audio sin pérdida capaces de
proporcionar una mayor relación de compresión que en un código
Golomb en planos de bit (BPGC) utilizando un procedimiento de
codificación basado en texto.
Los procedimientos de codificación de audio sin
pérdida incluyen la codificación Meridian de compresión sin pérdida
de audio, la codificación Monkey de audio, y la codificación libre
de audio sin pérdida. Se aplica una compresión Meridian sin pérdida
(MLP) y se utiliza en un disco versátil
digital-audio (DVD-A).
Según aumenta el ancho de banda de la red de
Internet, se puede proporcionar un gran volumen de contenidos
multimedia. En el caso de contenidos de audio, se necesita un
procedimiento de audio sin pérdida. En la Unión Europea (UE), ya se
ha comenzado la emisión de audio digital a través de una emisión de
audio digital (DAB), y para esto las estaciones emisoras y los
proveedores de contenidos están utilizando procedimientos de
codificación de audio sin pérdida. En respuesta a esto, el grupo
MPEG también está continuando con la normalización de la compresión
de audio sin pérdida bajo el nombre de ISO/IEC
14496-3:2001/AMD5, codificación escalable de audio
sin pérdida (SLS). Esto proporciona una escalabilidad de grano fino
(FGS) y permite la compresión de audio sin pérdida.
Se puede mejorar una relación de compresión, que
es el factor más importante en una tecnología de compresión de
audio sin pérdida, al eliminar información redundante entre
elementos de datos. La información redundante puede ser eliminada
mediante la predicción entre elementos contiguos de datos y también
puede ser eliminada por un contexto entre elementos contiguos de
datos.
Los coeficientes de la transformada discreta del
coseno modificada (MDCT) en enteros muestran una distribución de
Laplace, y en esta distribución, un procedimiento de compresión
denominado código de Golomb muestra un resultado óptimo. Para
proporcionar la FGS, se necesita una codificación en planos de bit y
una combinación del código de Golomb y de la codificación en planos
de bit se denomina una codificación Golomb en planos de bit (BPGC),
que proporciona una relación óptima de compresión y de FGS. Sin
embargo, en algunos casos la suposición de que los coeficientes de
MDCT en enteros muestran una distribución de Laplace no es correcta
en una distribución real de datos. Dado que la BPGC es un algoritmo
concebido suponiendo que los coeficientes de la MDCT en enteros
muestran una distribución de Laplace, si los coeficientes de la MDCT
en enteros no muestran una distribución de Laplace, la BPGC no
puede proporcionar una relación óptima de compresión sin tener en
cuenta la suposición de que se necesitan que los coeficientes de la
MDCT en enteros muestren una distribución de Laplace.
En el documento ISO/IEC JTC/SC29/WG11 titulado
"Improvement of coding efficiency in MPEG-4 audio
scalable lossless coding", Eunmi Oh Et al, presentado en
MPEG 2003 en diciembre de 2003, Hawái, EE. UU., páginas 1 a 11 se
sugiere un procedimiento para mejorar la eficacia de codificación.
En este procedimiento, se utilizan los contextos para mejorar la
eficacia de codificación.
El documento WO03/077565 enseña un modelador de
bits de coeficiente previsto para su uso en JPEG 2000. Los planos
de bit están codificados en orden desde el bit más significativo
hasta el bit menos significativo utilizando tres ciclos. Los bits
están marcados como significativo o no significativo y se cambia
este estado a significativo durante los primeros dos ciclos cuando
se encuentra el bit más significativo para ese coeficiente.
En Yu et al, "A fine granular scalable
perceptually lossy and lossless audio codec", presentado en la
congreso internacional IEEE de 2003 sobre multimedia y
exposiciones, julio de 2003, Baltimore, Maryland, EE. UU., y
consignado en las actas correspondientes del congreso en el volumen
1 páginas 1-65 a 1-68, publicado por
el IEEE, ISBN
0-7893-7965-9 se
presentan códecs de audio. Los códecs utilizan una codificación
Golomb en planos de bit.
La presente invención proporciona un
procedimiento y un aparato de codificación/decodificación de audio
sin pérdida que son capaces de proporcionar una mejor relación de
compresión sin tener en cuenta la suposición de que los
coeficientes de la MDCT en enteros muestren una distribución de
Laplace.
Conforme a un aspecto de la presente invención,
se proporciona un procedimiento de codificación de audio sin
pérdida conforme a la reivindicación 1.
En el cálculo del contexto de la muestra binaria
seleccionada, se obtienen las significaciones de las muestras ya
codificadas de planos de bit en cada línea de frecuencia idéntica en
una pluralidad de líneas de frecuencia que existen en el entorno de
una línea de frecuencia a la que pertenece la muestra binaria
seleccionada, y, al pasar las significaciones a binario, se
concatena el valor del contexto de la muestra binaria.
En el cálculo del contexto de la muestra binaria
seleccionada, se obtienen las significaciones de las muestras ya
codificadas de planos de bit en cada línea de frecuencia idéntica en
una pluralidad de líneas de frecuencia que existen anterior a una
línea de frecuencia a la que pertenece la muestra binaria
seleccionada; una relación acerca de cuántas líneas entre la
pluralidad de líneas de frecuencia tienen significación se expresa
en un número entero, al multiplicar la relación por un valor
predeterminado de número entero; y luego, se calcula el valor del
contexto utilizando el número entero.
Conforme a aún otro aspecto de la presente
invención, se proporciona un aparato de codificación de audio sin
pérdida conforme a la reivindicación 7.
Conforme a un aspecto adicional de la presente
invención, se proporciona un procedimiento de decodificación de
audio sin pérdida conforme a la reivindicación 13.
El cálculo del contexto puede incluir: calcular
un primer contexto utilizando las significaciones de las muestras
ya decodificadas de planos de bit en cada línea de frecuencia
idéntica en una pluralidad de líneas de frecuencia que existen en
el entorno de una línea de frecuencia a la que pertenece una muestra
que va a ser decodificada; y calcular un segundo contexto
utilizando las significaciones de muestras ya decodificadas de
planos de bit en cada línea de frecuencia idéntica en una
pluralidad de líneas de frecuencia antes de una línea de frecuencia
a la que pertenece una muestra que va a ser decodificada.
Conforme a un aspecto adicional de la presente
invención, se proporciona un aparato de decodificación de audio sin
pérdida conforme a la reivindicación 15.
La unidad de decodificación sin pérdida puede
incluir: una unidad para obtener un parámetro que obtiene un
parámetro Golomb de una corriente de bits de datos de audio; una
unidad para obtener un parámetro que obtiene un parámetro Golomb de
una corriente de bits de datos de audio; una unidad de selección de
muestras que selecciona una muestra binaria que se va a decodificar
en el orden desde un bit más significativo hasta un bit menos
significativo y desde una menor frecuencia a una mayor frecuencia;
una unidad de cálculo del contexto que calcula el contexto de la
muestra binaria seleccionada al utilizar la significación de los
planos de bit ya codificados para cada una de una pluralidad de
líneas de frecuencia que existen en el entorno a la que pertenece
la muestra binaria seleccionada; una unidad de selección de modelo
de probabilidad que selecciona un modelo de probabilidad al
utilizar el parámetro Golomb y el contexto; y una unidad de
decodificación aritmética que lleva a cabo una decodificación
aritmética al utilizar el modelo seleccionado de probabilidad.
La unidad de cálculo del contexto puede incluir:
una primera unidad de cálculo del contexto que obtiene las
significaciones de muestras ya codificadas de planos de bit en cada
línea de frecuencia idéntica en una pluralidad de líneas de
frecuencia que existen en el entorno de una línea de frecuencia a la
que pertenece la muestra binaria seleccionada, y al pasar las
significaciones a binario, calculando un primer contexto; y una
segunda unidad de cálculo del contexto que obtiene las
significaciones de muestras ya codificadas de planos de bit en cada
línea de frecuencia idéntica en una pluralidad de líneas de
frecuencia que existen antes de una línea de frecuencia a la que
pertenece la muestra binaria seleccionada, que expresan una relación
acerca de cuántas líneas entre la pluralidad de líneas de
frecuencia tienen significación, en un número entero, al multiplicar
la relación por un valor predeterminado de número entero, y luego,
calcular un segundo contexto utilizando el número entero.
Conforme a un aspecto adicional de la presente
invención, se proporciona un medio de grabación legible por
ordenador que tiene plasmado en el mismo un programa informático
para los procedimientos.
Lo anterior y otras características y ventajas
de la presente invención serán más evidentes al describir
realizaciones ejemplares detalladas de la misma con referencia a
los dibujos adjuntos en los que:
La Fig. 1 es un diagrama de bloques de la
estructura de una realización preferente de un aparato de
codificación de audio sin pérdida conforme a la presente
invención;
la Fig. 2 es un diagrama de bloques de la
estructura de una unidad de codificación sin pérdida de la Fig.
1;
la Fig. 3 es un diagrama de bloques de la
estructura de otra realización preferente del aparato de
codificación de audio sin pérdida conforme a la presente
invención;
la Fig. 4 es un diagrama de bloques de la
estructura de una unidad de codificación sin pérdida de la Fig.
3;
la Fig. 5 es un diagrama de flujo de las
operaciones llevadas a cabo por el aparato de codificación de audio
sin pérdida mostrado en la Fig. 1;
la Fig. 6 es un diagrama de flujo de las
operaciones llevadas a cabo por la unidad de codificación sin
pérdida mostrada en la Fig. 1;
la Fig. 7 es un diagrama de flujo de las
operaciones llevadas a cabo por el aparato de codificación de audio
sin pérdida mostrado en la Fig. 3;
la Fig. 8 es un diagrama que muestra un contexto
global en una unidad de cálculo del contexto;
\newpage
la Fig. 9 es un gráfico que muestra una
probabilidad de que aparezca 1 cuando se calcula un contexto global
en una unidad de cálculo del contexto;
la Fig. 10 es un diagrama que muestra un
contexto local en una unidad de cálculo del contexto;
la Fig. 11 es un gráfico que muestra una
probabilidad de que aparezca 1 cuando se calcula un contexto local
en una unidad de cálculo del contexto;
la Fig. 12 es un diagrama que muestra un modo de
contexto completo de una realización preferente conforme a la
presente invención;
la Fig. 13 es un diagrama que muestra un modo de
contexto parcial de una realización preferente conforme a la
presente invención;
la Fig. 14 es un tipo de ejemplo de un
pseudocódigo para la codificación basada en el contexto conforme a
la presente invención;
la Fig. 15 es un diagrama de bloques de la
estructura de una realización preferente de un aparato de
decodificación de audio sin pérdida conforme a la presente
invención;
la Fig. 16 es un diagrama de bloques de la
estructura de una unidad de cálculo del contexto mostrada en la
Fig. 15;
la Fig. 17 es un diagrama de bloques de la
estructura de otra realización preferente del aparato de
decodificación de audio sin pérdida conforme a la presente
invención;
la Fig. 18 es un diagrama de bloques de la
estructura de una unidad de decodificación sin pérdida de la Fig.
17;
la Fig. 19 es un diagrama de flujo de las
operaciones llevadas a cabo por el aparato de decodificación de
audio sin pérdida mostrado en la Fig. 15; y
la Fig. 20 es un diagrama de flujo de las
operaciones llevadas a cabo por el aparato de decodificación de
audio sin pérdida mostrado en la Fig. 17.
Se describirán ahora un procedimiento y un
aparato de codificación/decodificación de audio sin pérdida con más
detalle con referencia a los dibujos adjuntos, en los que se
muestran las realizaciones ejemplares de la invención.
En la codificación de audio, para proporcionar
una escalabilidad de grano fino (FGS) y una codificación sin
pérdida, se utiliza una transformada discreta del coseno modificada
(MDCT) en enteros. En particular, se conoce que si la distribución
de muestras de entrada de la señal de audio sigue una distribución
de Laplace, un procedimiento de codificación Golomb en planos de
bit (BPGC) muestra un resultado de compresión óptima, y esto
proporciona un resultado equivalente a un código Golomb. Se puede
obtener un parámetro Golomb mediante el siguiente procedimiento:
For(L =
0;(N << L +1)) <= A; L +
+);
Conforme al procedimiento, se puede obtener el
parámetro Golomb L y debido a la característica del código Golomb,
la probabilidad de que 0 o 1 aparezca en un plano de bits menor que
L es igual a 1/2. En el caso de una distribución de Laplace este
resultado es óptimo pero si la distribución no es una distribución
de Laplace, no se puede proporcionar una relación óptima de
compresión. En consecuencia, la idea básica de la presente
invención es proporcionar una relación óptima de compresión
utilizando un contexto por medio de un análisis estadístico
mediante una distribución de datos que no sigue una distribución de
Laplace.
La Fig. 1 es un diagrama de bloques de la
estructura de una realización preferente de un aparato de
codificación de audio sin pérdida conforme a la presente invención.
El aparato de codificación de audio sin pérdida incluye una unidad
100 de transformación entera tiempo/frecuencia y una unidad 120 de
codificación sin pérdida. La unidad 100 de transformación entera
tiempo/frecuencia transforma una señal de audio en el dominio
temporal en una señal espectral de audio en el dominio frecuencial
que tiene un valor de número entero, y preferentemente, utiliza una
MDCT en enteros. La unidad 120 de codificación sin pérdida
correlaciona la señal de audio en el dominio frecuencial en datos
de planos de bit con respecto a la frecuencia, y codifica sin
pérdida muestras binarias que forman el plano de bits utilizando un
contexto predeterminado. La unidad 120 de codificación sin pérdida
está dotada de una unidad 200 de correlación de planos de bit, una
unidad 210 de obtención de parámetros, una unidad 220 de selección
de muestras binarias, una unidad 230 de cálculo del contexto, una
unidad 240 de selección de modelos de probabilidad y una unidad 250
de codificación de muestras binarias.
La unidad 200 de correlación de planos de bit
correlaciona la señal de audio en el dominio frecuencial en datos
de planos de bit con respecto a la frecuencia. Las Figuras 8 y 10
ilustran ejemplos de señales de audio correlacionadas en datos de
planos de bit con respecto a la frecuencia.
La unidad 210 de obtención de parámetros obtiene
el bit más significativo (MSB) del plano de bits y un parámetro
Golomb. La unidad 220 de selección de muestras binarias selecciona
una muestra binaria en un plano de bits para que sea codificada en
el orden desde un MSB hasta un bit menos significativo (LSB) y desde
un componente de menor frecuencia hasta un componente de mayor
frecuencia.
La unidad 230 de cálculo del contexto calcula el
contexto de la muestra binaria seleccionada utilizando las
significaciones de planos de bit ya codificados para cada una de una
pluralidad de líneas de frecuencia que existen en el entorno de una
línea de frecuencia a la que pertenece la muestra binaria
seleccionada. La unidad 240 de selección de modelos de probabilidad
selecciona un modelo de probabilidad utilizando el parámetro Golomb
y los contextos calculados. La unidad 250 de codificación de
muestras binarias codifica sin pérdida la muestra binaria
utilizando el modelo seleccionado de probabilidad.
En la Fig. 2 todas las muestras binarias están
codificadas utilizando una codificación sin pérdida basada en el
contexto. Sin embargo, en otra realización, en aras de la
complejidad algunas muestras binarias en el plano de bits están
codificadas utilizando codificación sin pérdida basada en el
contexto y otras muestras binarias en el plano de bits están
codificadas utilizando una compresión de bits. El parámetro Golomb
se utiliza para determinar muestras binarias en un plano de bits
para ser codificadas utilizando una compresión de bits dado que una
probabilidad de ser "1" de la muestra binaria bajo el parámetro
Golomb es de 1/2.
La Fig. 3 es un diagrama de bloques de la
estructura de otra realización preferente del aparato de
codificación de audio sin pérdida conforme a la presente invención.
El aparato está dotado de una unidad 300 de transformación entera
tiempo/frecuencia, una unidad 310 de escalado, una unidad 320 de
codificación con pérdida, una unidad 330 de correlación de errores,
una unidad 340 de codificación sin pérdida, y un multiplexor
350.
La unidad 300 de transformación entera
tiempo/frecuencia transforma una señal de audio en el dominio
temporal en una señal espectral de audio en el dominio frecuencial
que tiene un valor de número entero, y preferentemente utiliza MDCT
en enteros. La unidad 310 de escalado escala la señal de frecuencia
de audio de la unidad 300 de transformación entera
tiempo/frecuencia para ser utilizada como una señal de entrada de la
unidad 320 de codificación con pérdida. Dado que la señal de salida
de la unidad 300 de transformación entera tiempo/frecuencia está
representada como un número entero, no puede ser utilizada
directamente como una entrada de la unidad 320 de codificación con
pérdida. En consecuencia, se escala la señal de frecuencia de audio
de la unidad 300 de transformación entera tiempo/frecuencia en la
unidad de escalado, de forma que se puede utilizar como una señal
de entrada de la unidad 320 de codificación con pérdida.
La unidad 320 de codificación con pérdida
codifica con pérdida la señal de frecuencia escalada y
preferentemente, utiliza un codificador de núcleo AAC. La unidad
330 de correlación de errores obtiene una señal correlacionada de
error correspondiente a la diferencia de la señal codificada con
pérdida y la señal de la unidad 300 de transformación entera
tiempo/frecuencia. La unidad 340 de codificación sin pérdida
codifica sin pérdida la señal correlacionada de error utilizando un
contexto. El multiplexor 350 transmite simultáneamente la señal
codificada sin pérdida de la unidad 340 de codificación sin pérdida
y la señal codificada con pérdida de la unidad 320 de codificación
con pérdida, y genera una corriente de bits.
La Fig. 4 es un diagrama de bloques de la
estructura de la unidad 340 de codificación sin pérdida, que está
dotada de una unidad 400 de correlación de planos de bit, una unidad
410 de obtención de parámetros, una unidad 420 de selección de
muestras binarias, una unidad 430 de cálculo del contexto, una
unidad 440 de selección de modelos de probabilidad, y una unidad
450 de codificación de muestras binarias.
La unidad 400 de correlación de planos de bit
correlaciona la señal correlacionada de error de la unidad 330 de
correlación de errores en datos de planos de bit con respecto a la
frecuencia. La unidad 410 de obtención de parámetros obtiene el MSB
del plano de bits y un parámetro Golomb. La unidad 420 de selección
de muestras binarias selecciona una muestra binaria en un plano de
bits para ser codificada en el orden desde un MSB a un LSB, y desde
un componente de menor frecuencia a un componente de mayor
frecuencia. La unidad 430 de cálculo del contexto calcula el
contexto de la muestra binaria seleccionada, al utilizar las
significaciones de planos de bit ya codificados para cada una de
una pluralidad de líneas de frecuencia existentes en el entorno de
una línea de frecuencia a la que pertenece la muestra binaria
seleccionada. La unidad 440 de selección de modelos de probabilidad
selecciona un modelo de probabilidad utilizando el parámetro Golomb
obtenido y los contextos calculados. La unidad 450 de codificación
de muestras binarias codifica sin pérdida la muestra binaria
utilizando el modelo seleccionado de probabilidad.
En la Fig. 4 todas las muestras binarias están
codificadas utilizadas codificación sin pérdida basada en el
contexto. Sin embargo, en otra realización, de cara a la reducción
de la complejidad, algunas muestras binarias en el plano de bits
están codificadas utilizando una codificación sin pérdida basada en
el contexto y otras muestras binarias en el plano de bits están
codificadas utilizando una compresión de bits. El parámetro Golomb
se utiliza para determinar muestras binarias en planos de bit para
ser codificadas utilizando una compresión de bits dado que una
probabilidad de tener "1" de la muestra binaria bajo el
parámetro Golomb es de 1/2.
Se explicará ahora el cálculo de un valor de
contexto de la muestra binaria en las unidades 230 y 430 de cálculo
del contexto mostradas en las Figuras 2 y 4. La significación que se
utiliza en relación a la realización de la presente invención está
definido como 1 si un componente espectral está codificado como 1 al
menos una vez entre muestras anteriores codificadas en planos de
bit en una línea de frecuencia idéntica a un momento actual, y está
definido como 0 si no hay ningún componente espectral codificado
como 1.
Además, las unidades 230 y 430 de cálculo del
contexto pueden calcular el contexto de la muestra binaria
utilizando, por ejemplo, un cálculo del contexto global. El cálculo
del contexto global considera la distribución del espectro
completo, y utiliza el hecho de que la forma de la envolvente del
espectro no cambia rápidamente en el eje de la frecuencia, y llega
a tener una apariencia similar a la forma de la envolvente anterior.
En el cálculo del contexto global, tomando la línea de frecuencia
de la muestra binaria seleccionada como una base, las unidades 230
y 430 de cálculo del contexto obtienen un valor de probabilidad de
que la significación es "1" al utilizar muestras
predeterminadas ya codificadas entre planos de bit en cada línea de
frecuencia existente antes de la línea de frecuencia de la muestra
binaria seleccionada. Entonces, las unidades 230 y 430 de cálculo
del contexto multiplican el valor de probabilidad por un valor
predeterminado de número entero para expresarlo en un número
entero, y al utilizar el número entero, calcular el valor del
contexto de la muestra binaria.
Además, las unidades 230 y 430 de cálculo del
contexto pueden calcular el contexto de la muestra binaria
utilizando un cálculo del contexto local. El cálculo del contexto
local utiliza la correlación de muestras binarias adyacentes, y la
significación como el cálculo del contexto global. Se pasa a binario
la significación de una muestra en cada una de las N corrientes de
bits predeterminados en una frecuencia idéntica de una muestra
binaria que va a ser codificada en ese momento y, luego, se
convierte de nuevo a un número decimal, y, después, se calcula el
contexto. En el cálculo del contexto local, tomando la línea de
frecuencia de la muestra binaria seleccionada como la base, la
unidad 230 y 430 de cálculo del contexto obtiene significaciones
respectivas utilizando muestras predeterminadas entre planos de bit
en cada una de las líneas de frecuencia que existen en un intervalo
predeterminado antes y después de la línea de frecuencia de la
muestra binaria seleccionada, y al convertir las significaciones en
valores escalares, calcular el valor del contexto de la muestra
binaria. El valor N utilizado en este cálculo es menor que el valor
M utilizado en el cálculo del contexto global.
La Fig. 5 es un diagrama de flujo de las
operaciones llevadas a cabo por el aparato de codificación de audio
sin pérdida mostrado en la Fig. 1. En primer lugar, se introduce una
señal PCM correspondiente a una señal de audio en el dominio
temporal a la unidad 100 de transformación entera tiempo/frecuencia,
esta se transforma en una señal de audio espectral en el dominio
frecuencial que tiene un valor de número entero en la operación
500. Preferentemente, aquí se utiliza MDCT. Entonces, como en las
Figuras 8 y 10, se correlaciona la señal de audio en el dominio
frecuencial en una señal del plano de bits con respecto a la
frecuencia en la operación 520. Entonces, se codifica sin pérdida
una muestra binaria que forma el plano de bits utilizando un modelo
de probabilidad determinado utilizando un contexto predeterminado en
la operación 540.
La Fig. 6 es un diagrama de flujo de las
operaciones llevadas a cabo por la unidad 120 de codificación sin
pérdida mostrada en la Fig. 1.
En primer lugar, se introduce la señal de audio
en el dominio frecuencial en la unidad 200 de correlación de planos
de bit, se correlaciona la señal de audio en el dominio frecuencial
en datos de planos de bit con respecto a la frecuencia en la
operación 600. Además, por medio de la unidad 210 de obtención de
parámetros Golomb, se obtienen el MSB y un parámetro Golomb en cada
plano de bits en la operación 610. Entonces, por medio de la unidad
220 de selección de muestras binarias se selecciona, en la operación
620, una muestra binaria en un plano de bits que va a ser
codificada en el orden desde un MSB hasta un LSB y desde un
componente de menor frecuencia hasta un componente de mayor
frecuencia. Con respecto a la muestra binaria seleccionada, se
calcula el contexto de la muestra binaria seleccionada en la unidad
220 de selección de muestras binarias utilizando las
significaciones de los planos de bit ya codificados para cada una de
una pluralidad de líneas de frecuencia que existen en el entorno de
una línea de frecuencia a la que pertenece la muestra binaria
seleccionada, en la operación 630. Se selecciona un modelo de
probabilidad utilizando el parámetro Golomb obtenido en la unidad
210 de obtención de parámetros Golomb y se calculan los contextos en
la unidad 230 de cálculo del contexto en la operación 640. Al
utilizar el modelo seleccionado de probabilidad en la unidad 240 de
selección de modelos de probabilidad, se codifica sin pérdida la
muestra binaria en la operación 650.
En la Fig. 6 se codifican todas las muestras
binarias utilizando una codificación sin pérdida basada en el
contexto. Sin embargo, en otra realización, de cara a la reducción
de la complejidad, se codifican algunas muestras binarias en el
plano de bits utilizando una codificación sin pérdida basada en el
contexto y se codifican las otras muestras binarias en el plano de
bits utilizando una compresión de bits. El parámetro Golomb se
utiliza para determinar muestras binarias en planos de bit para ser
codificadas utilizando una compresión de bits dado que una
probabilidad de ser "1" de la muestra binaria bajo el parámetro
Golomb es de 1/2.
La Fig. 7 es un diagrama de flujo de las
operaciones llevadas a cabo por el aparato de codificación de audio
sin pérdida mostrado en la Fig. 3, y se explicará ahora con
referencia a la Fig. 7, la operación de otra realización preferente
del aparato de codificación de audio sin pérdida. En primer lugar,
por medio de la unidad 300 de transformación entera
tiempo/frecuencia, se transforma una señal de audio en el dominio
temporal en una señal espectral de audio en el dominio frecuencial
que tiene un valor de número entero en la operación 710.
Entonces, se escala la señal espectral de audio
en el dominio frecuencial en la unidad 310 de escalado para ser
utilizada como una señal de entrada de la unidad 320 de codificación
con pérdida en la operación 720. La señal escalada de frecuencia en
la unidad 310 de escalado está codificada con una compresión con
pérdida en la unidad 320 de codificación de compresión con pérdida
en la operación 730. Preferentemente, la codificación de compresión
con pérdida se lleva a cabo por medio de un codificador de núcleo
AAC.
Se obtienen una señal correlacionada de error
correspondiente a la diferencia de los datos codificados con
pérdida en la unidad 320 de codificación con pérdida y la señal
espectral de audio en el dominio frecuencial que tiene un valor de
número entero en la unidad 330 de correlación de errores en la
operación 740. La señal correlacionada de error está codificada sin
pérdida utilizando un contexto en la unidad 340 de codificación sin
pérdida en la operación
750.
750.
La señal codificada sin pérdida en la unidad 340
de codificación sin pérdida y la señal codificada con pérdida en la
unidad 320 de codificación con pérdida se transmiten simultáneamente
en el multiplexor 350 y se generan como una corriente de bits en la
operación 760. En la codificación sin pérdida en la operación 750,
se correlaciona la señal correlacionada de error en datos de plano
de bits con respecto a la frecuencia. Entonces, el procedimiento
para obtener el MSB y el parámetro Golomb es el mismo que el
descrito con referencia a la Fig. 6 y se omitirá aquí.
En general, debido a la pérdida espectral por
MDCT, hay una correlación de las muestras colindantes en el eje de
frecuencia. Es decir, si el valor de una muestra adyacente es X, es
muy probable que el valor de una muestra actual sea un valor en el
entorno de X. En consecuencia, si se selecciona una muestra
adyacente en el entorno de X como un contexto, se puede mejorar la
relación de compresión utilizando la correlación.
Además, se puede conocer a través de análisis
estadísticos que el valor de un plano de bits tiene una mayor
correlación con la distribución de probabilidades de una muestra de
menor orden. En consecuencia, si se selecciona una muestra
adyacente en el entorno de X como un contexto, se puede mejorar la
relación de compresión utilizando la correlación.
Se explicará ahora un procedimiento para
calcular un contexto.
La Fig. 8 es un diagrama para obtener un
contexto utilizando un contexto global en una unidad de cálculo del
contexto. Al utilizar la parte indicada por las líneas discontinuas,
la distribución de probabilidades de una muestra actual se obtiene
de muestras ya codificadas. La Fig. 9 es un gráfico que muestra una
probabilidad de que 1 aparezca cuando se calcula un contexto en una
unidad de cálculo del contexto utilizando un contexto global.
Con referencia a la Fig. 8, se supone que se va
a codificar un símbolo en la caja indicada por las líneas del
cuadriculado. En la Fig. 8, el contexto global está expresado como
la parte del óvalo de líneas discontinuas. Con referencia a la Fig.
9, los otros dos tipos de contexto están fijados como contexto de
Golomb (Contexto 1) = 1, y contexto local (Contexto 2) = 0. El
gráfico muestra que en el cálculo del contexto utilizando la BPGC,
la probabilidad de que aparezca 1 se mantiene a un nivel constante,
mientras que en el cálculo del contexto utilizando el contexto
global, la probabilidad de que aparezca 1 aumenta de forma gradual
según crece el índice del contexto.
La Fig. 10 es un diagrama para obtener un
contexto utilizando un contexto local en una unidad de cálculo del
contexto. La Fig. 11 es un gráfico que muestra una probabilidad de
que aparezca 1 cuando se calcula un contexto en una unidad de
cálculo del contexto utilizando un contexto local.
Con referencia a la Fig. 10, en el cálculo del
contexto local, se obtienen las significaciones en tres líneas de
frecuencia colindantes. Se correlaciona el patrón binario en un
valor en un intervalo desde 0 hasta 7 (es decir, 000, 001, 010,
011, 100, 110, 111 en números binarios) para computar la
probabilidad del símbolo. En el cálculo del contexto local,
utilizando las tres partes indicadas por las líneas discontinuas,
como se muestra en la Fig. 10, se calcula la distribución de
probabilidad de una muestra actual de muestras ya codificadas.
Aquí, la probabilidad de que aparezca 1 en la codificación actual es
en el intervalo desde 0 a 7 como se ha mostrado anteriormente, y se
determina por los tres valores como un patrón binario [0, 1, 1]. La
Fig. 11 muestra la probabilidad de que aparezca 1 cuando se calcula
un contexto utilizando un contexto local cuando los otros dos
contextos están fijados como contexto de Golomb (Contexto 1) = 1 y
contexto global (Contexto 2) = 4. Aquí, el gráfico muestra que
cuando se utiliza la BPGC, la probabilidad de que aparezca 1 está
fijada a un nivel constante. Mientras tanto, cuando se calcula el
contexto mediante un contexto global, la probabilidad de que
aparezca 1 es mayor en la primera mitad que la de la BPGC, pero es
menor en la segunda mitad que la de la BPGC.
En un ejemplo real de codificación, si entre 10
muestras colindantes que van a ser codificadas para calcular un
contexto global, cinco muestras tienen una significación de 1, la
probabilidad es de 0,5 y si esta se escala con un valor de 8, se
vuelve un valor de 4. En consecuencia, el contexto global es 4.
Mientras tanto, cuando se comprueban las significaciones de 2
muestras antes y después para calcular un contexto local, si la
muestra número (i-2) es 1, la muestra número
(i-1) es 0, la muestra número (i+1) es 0 y la
muestra número (i+2) es 1, el resultado del paso a binario es 1001,
y es igual a 9 en la expresión decimal. Si el parámetro Golomb de
datos que van a ser codificados en ese momento es 4, el parámetro
Golomb (contexto 1) = 4, el contexto global (Contexto 2) = 4, y el
contexto local (Contexto 3) = 9. Al utilizar el parámetro Golomb, el
contexto global y el contexto local, se selecciona un modelo de
probabilidad.
\newpage
Los modelos de probabilidades varían con
respecto a la implementación, y entre ellos, utilizando un conjunto
tridimensional, un procedimiento de implementación puede expresarse
como:
Prob[Golomb][Contextol][Contexto2]
Utilizando el modelo de probabilidad obtenido de
esta manera, se lleva a cabo la codificación sin pérdida. Como un
procedimiento representativo de codificación sin pérdida, se puede
utilizar un procedimiento de codificación aritmética.
Por medio de la presente invención, la
compresión total se mejora un 0,8% cuando se compara con el
procedimiento anterior, que no utiliza el contexto.
La Fig. 12 es un diagrama que muestra un modo de
contexto completo de una realización preferente conforme a la
presente invención. La Fig. 13 es un diagrama que muestra un modo de
contexto parcial de una realización preferente conforme a la
presente invención.
Con referencia a la Fig. 12, todas las muestras
binarias están codificadas utilizando una codificación aritmética
basada en el contexto. Sin embargo, con referencia a la Fig. 13, en
otra realización, en aras de la complejidad, algunas muestras
binarias en el plano de bits están codificadas utilizando una
codificación aritmética basada en el contexto y otras muestras
binarias en el plano de bits están codificadas utilizando una
compresión de bits, es decir, se asigna una probabilidad de 1/2
para esas muestras binarias.
La Fig. 14 muestra un pseudocódigo para una
codificación basada en el contexto en relación a una realización de
la presente invención.
Se explicará ahora un aparato y un procedimiento
de decodificación de audio sin pérdida conformes a la presente
invención.
La Fig. 15 es un diagrama de bloques de la
estructura de una realización preferente de un aparato de
decodificación de audio sin pérdida conforme a la presente
invención. El aparato incluye una unidad 1500 de obtención de
parámetros, una unidad 1510 de selección de muestras, una unidad
1520 de cálculo del contexto, una unidad 1530 de selección de
modelos de probabilidad, y una unidad 1540 de decodificación
aritmética.
Cuando se introduce una corriente de bits de
datos de audio, la unidad 1500 de obtención de parámetros obtiene
el MSB y el parámetro Golomb de la corriente de bits. La unidad 1510
de selección de muestras selecciona una muestra binaria para ser
decodificada en el orden desde un MSB hasta un LSB y desde una menor
frecuencia hasta una mayor frecuencia.
La unidad 1520 de cálculo del contexto calcula
un contexto predeterminado utilizando muestras ya decodificadas, y
como se muestra en la Fig. 16, está dotada de una primera unidad
1600 de cálculo del contexto y una segunda unidad 1620 de cálculo
del contexto. La primera unidad 1600 de cálculo del contexto obtiene
significaciones de muestras ya codificadas de planos de bit en cada
línea de frecuencia idéntica en una pluralidad de líneas de
frecuencia que existen antes de la línea de frecuencia a la que
pertenece la muestra binaria seleccionada, pasa las significaciones
a binario, y calcula un primer contexto. La segunda unidad 1620 de
cálculo del contexto obtiene significaciones de muestras ya
codificadas de planos de bit en cada línea de frecuencia idéntica en
una pluralidad de líneas de frecuencia que existen en el entorno de
la línea de frecuencia a la que pertenece la muestra binaria
seleccionada; expresa una relación en cuántas líneas entre la
pluralidad de líneas de frecuencia hay significaciones, en un
número entero, al multiplicar la relación por un valor
predeterminado de número entero; y luego, calcula un segundo
contexto utilizando el número entero.
La unidad 1530 de selección de modelos de
probabilidad selecciona un modelo de probabilidad utilizando el
parámetro Golomb de la unidad 1500 de obtención de parámetros y el
contexto calculado en la unidad 1520 de cálculo del contexto. La
unidad 1540 de decodificación aritmética lleva a cabo una
decodificación aritmética utilizando el modelo de probabilidad
seleccionado en la unidad 1530 de selección de modelo de
probabilidad.
En la Fig. 15 todas las muestras están
decodificadas utilizando una decodificación sin pérdida basada en el
contexto. Sin embargo, en otra realización, de cara a la reducción
de la complejidad, se decodifican algunas muestras binarias en el
plano de bits utilizando una decodificación sin pérdida basada en el
contexto y las otras muestras binarias en el plano de bits están
decodificadas utilizando una compresión de bits. El parámetro
Golomb se utiliza para determinar muestras binarias en el plano de
bits para ser decodificadas utilizando una compresión de bits dado
que una probabilidad de que la muestra binaria sea "1" bajo el
parámetro Golomb es de 1/2.
La Fig. 17 es un diagrama de bloques de la
estructura de otra realización preferente del aparato de
decodificación de audio sin pérdida conforme a la presente
invención. El aparato incluye una unidad 1700 de desmultiplexión,
una unidad 1710 de decodificación con pérdida, una unidad 1720 de
decodificación sin pérdida, una unidad 1730 de síntesis de señal de
audio, y una unidad 1740 de transformación inversa entera de
tiempo/frecuencia y preferentemente, incluye además una unidad 1750
de transformación inversa de tiempo/frecuencia.
Cuando se introduce una corriente de bits de
audio, la unidad 1700 de desmultiplexión desmultiplexa la corriente
de bits de audio y extrae una corriente de bits con pérdida formada
por un procedimiento predeterminado de codificación con pérdida
utilizado cuando se codifica una corriente de bits, y una corriente
de bits de error de los datos de error.
La unidad 1710 de decodificación con pérdida
decodifica con pérdida la corriente de bits con pérdida extraída en
la unidad 1700 de desmultiplexión, mediante un procedimiento
predeterminado de decodificación con pérdida que se corresponde con
un procedimiento predeterminado de codificación con pérdida
utilizado cuando se codifica la corriente de bits. La unidad 1720
de decodificación sin pérdida decodifica sin pérdida la corriente de
bits de error extraída en la unidad 1700 de desmultiplexión,
también mediante un procedimiento de decodificación sin pérdida
correspondiente a una codificación sin pérdida.
La unidad 1730 de síntesis de señal de audio
sintetiza la corriente de bits decodificada con pérdida y la
corriente de bits de error y restablece una señal espectral de
frecuencia. La unidad 1740 de transformación inversa entera de
tiempo/frecuencia transforma inversamente el entero
tiempo/frecuencia de la señal espectral de frecuencia restablecida
en la unidad 1730 de síntesis de señal de audio, y restablece una
señal de audio en el dominio temporal.
Entonces, la unidad 1750 de transformación
inversa de tiempo/frecuencia restablece la señal de audio en el
dominio frecuencial decodificada en la unidad 1710 de decodificación
con pérdida, en una señal de audio en el dominio temporal, y la
señal restablecida de esta manera es la señal decodificada con
pérdida.
La Fig. 18 es un diagrama de bloques de la
estructura de la unidad 1720 de decodificación sin pérdida de la
Fig. 17, que incluye una unidad 1800 de obtención de parámetros, una
unidad 1810 de selección de muestras, una unidad 1820 de cálculo
del contexto, una unidad 1830 de selección de modelos de
probabilidad, y una unidad 1840 de decodificación aritmética.
La unidad 1800 de obtención de parámetros
obtiene el MSB y el parámetro Golomb de una corriente de bits de
datos de audio. La unidad 1810 de selección de muestras selecciona
una muestra binaria para ser decodificada en el orden desde un MSB
hasta un LSB y desde una menor frecuencia hasta una mayor
frecuencia.
La unidad 1820 de cálculo del contexto calcula
un contexto predeterminado utilizando muestras ya decodificadas, y
está dotada de una primera unidad de cálculo del contexto y una
segunda unidad de cálculo del contexto. La primera unidad 1600 de
cálculo del contexto obtiene significaciones de muestras ya
codificadas de planos de bit en cada línea de frecuencia idéntica
en una pluralidad de líneas de frecuencia existentes antes de la
línea de frecuencia a la que pertenece la muestra binaria
seleccionada, pasa las significaciones a binario, y calcula un
primer contexto. La segunda unidad 1620 de cálculo del contexto
obtiene significaciones de muestras ya codificadas de planos de bit
en cada línea de frecuencia idéntica en una pluralidad de líneas de
frecuencia existentes en el entorno de una línea de frecuencia a la
que pertenece la muestra binaria seleccionada; expresa una relación
de cuántas líneas entre la pluralidad de líneas de frecuencia tienen
significación, en un número entero, al multiplicar la relación por
un valor predeterminado de número entero; y luego, calcula un
segundo contexto utilizando el número entero.
La unidad 1830 de selección de modelos de
probabilidad selecciona un modelo de probabilidad utilizando el
parámetro Golomb y el contexto. La unidad 1840 de decodificación
aritmética lleva a cabo una decodificación aritmética utilizando el
modelo seleccionado de probabilidad.
En la Fig. 18, todas las muestras binarias están
decodificadas utilizando una decodificación sin pérdida basada en
el contexto. Sin embargo, en otra realización, de cara a la
reducción de la complejidad, se decodifican algunas muestras
binarias en el plano de bits utilizando una decodificación sin
pérdida basada en el contexto y las otras muestras binarias en el
plano de bits están decodificadas utilizando una compresión de bits.
El parámetro Golomb se utiliza para determinar muestras binarias en
el plano de bits para ser decodificadas utilizando una compresión
de bits dado que una probabilidad de que la muestra binaria sea
"1" bajo el parámetro Golomb es de 1/2.
La Fig. 19 es un diagrama de flujo de las
operaciones llevadas a cabo por el aparato de decodificación de
audio sin pérdida mostrado en la Fig. 15.
En primer lugar, se introduce una corriente de
bits de datos de audio en la unidad 1500 de obtención de parámetros,
se obtiene un parámetro Golomb de la corriente de bits de datos de
audio en la operación 1900.
Entonces, se selecciona una muestra binaria para
ser decodificada en el orden desde un MSB hasta un LSB y desde una
menor frecuencia hasta una mayor frecuencia en la unidad 1510 de
selección de muestras en la operación 1910.
Si se selecciona una muestra para ser
decodificada en la unidad 1510 de selección de muestras, se calcula
un contexto predeterminado utilizando muestras ya decodificadas en
la unidad 1520 de cálculo del contexto en la operación 1920. Aquí,
el contexto está formado con un primer contexto y un segundo
contexto, y como se muestra en la Fig. 16, la primera unidad 1600
de cálculo del contexto obtiene significaciones de muestras ya
codificadas de planos de bit en cada línea de frecuencia idéntica en
una pluralidad de líneas de frecuencia existentes antes de la línea
de frecuencia a la que pertenece la muestra binaria seleccionada,
pasa las significaciones a binario, y calcula un primer contexto.
Entonces, la segunda unidad 1620 de cálculo del contexto obtiene
significaciones de muestras ya codificadas de planos de bit en cada
línea de frecuencia idéntica en una pluralidad de líneas de
frecuencia existentes en el entorno de la línea de frecuencia a la
que pertenece la muestra binaria seleccionada; expresa una relación
de cuántas líneas entre la pluralidad de líneas de frecuencia tienen
significaciones en un número entero, al multiplicar la relación por
un valor predeterminado de número entero; y luego, calcula un
segundo contexto utilizando el número entero.
Entonces, por medio de la unidad 1530 de
selección de modelo de probabilidad, se selecciona un modelo de
probabilidad utilizando el parámetro Golomb y los contextos primero
y segundo en la operación 1930. Si se selecciona el modelo de
probabilidad en la unidad 1530 de selección de modelo de
probabilidad, se lleva a cabo una decodificación aritmética
utilizando el modelo seleccionado de probabilidad en la operación
1940. Las operaciones 1910 a 1940 se llevan a cabo de forma
reiterada hasta que se decodifican todas las muestras en la
operación 1950.
En la Fig. 19 todas las muestras binarias están
decodificadas utilizando una decodificación sin pérdida basada en
el contexto. Sin embargo, en otra realización, de cara a la
reducción de la complejidad, algunas muestras binarias en el plano
de bits están decodificadas utilizando una decodificación sin
pérdida basada en el contexto y otras muestras binarias en el plano
de bits están decodificadas utilizando una compresión de bits. El
parámetro Golomb se utiliza para determinar muestras binarias en
planos de bit para ser decodificadas utilizando una compresión de
bits dado que la probabilidad de que la muestra binaria sea "1"
bajo el parámetro Golomb es de 1/2.
La Fig. 20 es un diagrama de flujo de las
operaciones llevadas a cabo por el aparato de decodificación de
audio sin pérdida mostrado en la Fig. 17.
La diferencia entre los datos de audio
codificados con pérdida y una señal espectral de audio en el dominio
frecuencial que tiene un valor de número entero se definirá como
datos de error. En primer lugar, si se introduce una corriente de
bits de audio en la unidad 1700 de desmultiplexión, la corriente de
bits se desmultiplexa y se extraen una corriente de bits con
pérdida generada mediante una codificación con pérdida
predeterminada y la corriente de bits de error de los datos de
error en la operación 2000.
Se introduce la corriente de bits con pérdida
extraída en la unidad 1710 de decodificación con pérdida, y se
decodifica con pérdida por medio de un procedimiento predeterminado
de decodificación con pérdida correspondiente a la codificación con
pérdida cuando se codifican los datos en la operación 2010. Además,
se introduce la corriente de bits de error extraído en la unidad
1720 de decodificación sin pérdida y se decodifica sin pérdida en
la operación 2020. El procedimiento más detallado de la
decodificación sin pérdida en la operación 2020 es el mismo que se
ha mostrado en la Fig. 19.
Se introducen la corriente de bits con pérdida
decodificada con pérdida en la unidad 1710 de decodificación con
pérdida y la corriente de bits de error decodificada sin pérdida en
la unidad 1720 de decodificación sin pérdida en la unidad 1730 de
síntesis de señal de audio y son restablecidas en una señal
espectral de frecuencia en la operación 2030. Se introduce la señal
espectral de frecuencia en la unidad 1740 de transformación inversa
entera de tiempo/frecuencia y se restablece a una señal de audio en
el dominio temporal en la operación 2040.
La presente invención también puede plasmarse
como códigos legibles por ordenador en un medio de grabación
legible por ordenador. El medio de grabación legible por ordenador
es cualquier dispositivo de almacenamiento de datos que pueda
almacenar datos que pueden ser leídos a partir de entonces por un
sistema informático. Los ejemplos del medio de grabación legible
por un ordenador incluyen la memoria de solo lectura (ROM), la
memoria de acceso aleatorio (RAM), el CD-ROM, las
cintas magnéticas, los disquetes, y los dispositivos ópticos de
almacenamiento de datos.
Aunque se ha mostrado y descrito la presente
invención particularmente con referencia a realizaciones ejemplares
de la misma, las personas con un nivel normal de dominio de la
técnica comprenderán que se pueden llevar a cabo diversos cambios
en la forma y en los detalles sin alejarse del alcance de la
presente invención según se define por las siguientes
reivindicaciones. Las realizaciones preferentes deberían ser
consideradas únicamente en sentido descriptivo y no con fines de
limitación. Por lo tanto, el alcance de la invención está definido
no por la descripción detallada de la invención sino por las
reivindicaciones adjuntas, y se interpretará que todas las
diferencias en el ámbito como que están incluidas en la presente
invención.
En el procedimiento y en el aparato de
codificación/decodificación de audio sin pérdida conforme a la
presente invención, se proporciona un rendimiento óptimo por medio
de un modelo basado en distribuciones estadísticas utilizando un
contexto global y un contexto local sin tener en cuenta la
distribución de una entrada cuando se lleva a cabo la codificación
y/o la decodificación de audio sin pérdida. Además, sin tener en
cuenta la suposición de que los coeficientes de la MDCT en enteros
muestren una distribución de Laplace, se proporciona una relación
óptima de compresión y mediante un procedimiento de codificación
basado en contexto, se proporciona una relación de compresión mejor
que la de la BPGC.
Claims (23)
1. Un procedimiento de codificación de audio sin
pérdida que comprende:
- \quad
- correlacionar (600) una señal espectral de audio en el dominio frecuencial que tiene valores de número entero en una señal de plano de bits con respecto a la frecuencia;
- \quad
- obtener (610) un bit más significativo y un parámetro Golomb para cada plano de bits;
- \quad
- seleccionar (620) una muestra binaria de un plano de bits para ser codificada en el orden desde el bit más significativo hasta el bit menos significativo y desde un componente de menor frecuencia hasta un componente de mayor frecuencia; calcular (630) el contexto de la muestra binaria seleccionada;
- \quad
- seleccionar (640) un modelo de probabilidad de la muestra binaria utilizando el parámetro Golomb y los contextos calculados; y
- \quad
- codificar aritméticamente sin pérdida (650) la muestra binaria utilizando el modelo seleccionado de probabilidad;
- \quad
- caracterizado porque el contexto de la muestra binaria seleccionada está calculado utilizando las significaciones de muestras binarias ya codificadas para cada una de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada;
- \quad
- en el que la significación de una muestra binaria es "1" si hay al menos un "1" en planos de bit ya codificados en la línea de frecuencia de la muestra binaria y, si no hay "1" en la línea de frecuencia de la muestra binaria, la significación de la muestra binaria es "0".
\vskip1.000000\baselineskip
2. El procedimiento de la reivindicación 1, en
el que en la etapa de calcular (630) el contexto de la muestra
binaria seleccionada, se obtienen las significaciones de muestras
binarias ya codificadas de planos de bit en cada línea de
frecuencia en una pluralidad de líneas de frecuencia existentes en
el entorno de una línea de frecuencia a la que pertenece la muestra
binaria seleccionada, y al pasar la significación a binario, se
calcula el valor del contexto de la muestra binaria.
3. El procedimiento de cualquier reivindicación
precedente, en el que en el cálculo (630) del contexto de la
muestra binaria seleccionada, se obtienen las significaciones de
muestras binarias ya codificadas de planos de bit en cada línea de
frecuencia en una pluralidad de líneas de frecuencia existentes
antes de una línea de frecuencia a la que pertenece la muestra
binaria seleccionada; una relación de cuántas muestras binarias
entre la pluralidad de muestras binarias tienen una significación
de "1" se expresa en un número entero, al multiplicar la
relación por un valor predeterminado de número entero; y, luego, se
calcula el valor del contexto de la muestra binaria utilizando el
número entero.
4. El procedimiento de cualquier reivindicación
precedente, en el que el cálculo del contexto de la muestra binaria
seleccionada comprende
calcular un primer contexto utilizando las
significaciones de muestras binarias ya codificadas de planos de
bit en cada línea de frecuencia en una primera pluralidad de líneas
de frecuencia existentes en el entorno de una línea de frecuencia a
la que pertenece la muestra binaria que va a ser codificada; y
calcular un segundo contexto utilizando las
significaciones de muestras binarias ya codificadas de planos de
bit en cada línea de frecuencia en una segunda pluralidad de líneas
de frecuencia anteriores a una línea de frecuencia a la que
pertenece una muestra binaria que va a ser codificada.
5. El procedimiento de cualquier reivindicación
precedente, en el que algunas muestras binarias en el plano de bits
están codificadas con una probabilidad de 0,5.
6. Un procedimiento de codificación de audio sin
pérdida conforme a cualquiera de las reivindicaciones 1 a 5 que
comprende:
- \quad
- escalar (720) una señal espectral de audio en el dominio frecuencial que tiene valores de número entero para ser utilizada como una señal de entrada de un codificador con pérdida;
- \quad
- codificar (730) con compresión con pérdida la señal escalada de frecuencia;
- \quad
- obtener (740) una señal correlacionada de error correspondiente a la diferencia de los datos codificados con pérdida y la señal espectral de audio en el dominio frecuencial que tiene un valor de número entero;
- \quad
- codificar sin pérdida (750) la señal correlacionada de error utilizando un procedimiento conforme a cualquiera de las reivindicaciones 1 a 6 utilizando la señal correlacionada de error como la señal espectral de audio; y
- \quad
- generar una corriente de bits al transmitir simultáneamente (760) la señal codificada sin pérdida y la señal codificada con pérdida.
\vskip1.000000\baselineskip
7. Un aparato de codificación de audio sin
pérdida que comprende:
- \quad
- una unidad (200) de correlación de planos de bit dispuesta para correlacionar una señal de audio en el dominio frecuencial que tiene valores de número entero en datos de planos de bit con respecto a la frecuencia;
- \quad
- una unidad (210) de obtención de parámetros dispuesta para obtener un bit más significativo y un parámetro Golomb para el plano de bits;
- \quad
- una unidad (220) de selección de muestras binarias dispuesta para seleccionar una muestra binaria en un plano de bits para ser codificada en el orden desde el bit más significativo hasta el bit menos significativo y desde un componente de menor frecuencia hasta un componente de mayor frecuencia;
- \quad
- una unidad (230) de cálculo del contexto dispuesta para calcular el contexto de la muestra binaria seleccionada utilizando significaciones de muestras binarias ya codificadas para cada una de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada;
- \quad
- una unidad (240) de selección de modelos de probabilidad dispuesta para seleccionar un modelo de probabilidad de la muestra binaria utilizando el parámetro Golomb obtenido y los contextos calculados; y
- \quad
- una unidad (250) de codificación de muestras binarias dispuesta para codificar sin pérdida la muestra binaria utilizando el modelo seleccionado de probabilidad,
- \quad
- caracterizado porque la significación de una muestra binaria es "1" si hay al menos un "1" en los planos de bit ya codificados en la línea de frecuencia de la muestra binaria y, si no hay "1" en la línea de frecuencia de la muestra binaria, la significación de la muestra binaria es "0".
\vskip1.000000\baselineskip
8. El aparato de la reivindicación 7, que
comprende, además, una unidad (300) de transformación de número
entero/frecuencia que transforma una señal de audio en el dominio
temporal en la señal espectral de audio en el dominio frecuencial
que tiene valores de número entero.
9. El aparato de la reivindicación 8, en el que
la unidad (300) transformación entera tiempo/frecuencia es una
unidad transformada discreta del coseno modificada (MDCT) en
enteros.
10. El aparato de la reivindicación 7, en el que
la unidad de cálculo del contexto comprende:
- \quad
- una primera unidad de cálculo del contexto dispuesta para calcular un primer contexto al obtener las significaciones de muestras binarias ya codificadas de planos de bit en cada línea de frecuencia en una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria seleccionada y pasar las significaciones a binario; y
- \quad
- una segunda unidad de cálculo del contexto dispuesta para calcular un segundo contexto al obtener las significaciones de muestras binarias ya codificadas de planos de bit en cada línea de frecuencia en una pluralidad de líneas de frecuencia existentes anteriores a una línea de frecuencia a la que pertenece la muestra binaria seleccionada, expresando una relación acerca de cuántas líneas entre la pluralidad de líneas de frecuencia tienen una significación de "1", en un número entero al multiplicar la relación por un valor predeterminado de número entero, y, luego, calcular el segundo contexto utilizando el número entero.
11. El aparato de la reivindicación 7, en el que
el aparato está dispuesto para codificar algunas muestras binarias
en el plano de bits con la probabilidad de 0,5.
12. Un aparato de codificación de audio sin
pérdida conforme a cualquiera de las reivindicaciones 7 a 9, que
comprende además:
- \quad
- una unidad (310) de escalado dispuesta para escalar la señal espectral de audio en el dominio frecuencial que tiene un valor de número entero para ser utilizado como una señal de entrada de un codificador con pérdida;
- \quad
- una unidad (320) de codificación con pérdida dispuesta para codificar con compresión con pérdida la señal escalada de frecuencia;
- \quad
- una unidad (330) de correlación de errores dispuesta para obtener la diferencia de la señal codificada con pérdida y la señal de la unidad de transformación entera tiempo/frecuencia; y
- \quad
- un multiplexor (350) dispuesto para generar una corriente de bits al transmitir simultáneamente la señal codificada sin pérdida y la señal codificada con pérdida;
- \quad
- en el que el aparato de codificación de audio sin pérdida es una unidad (340) de codificación aritmética sin pérdida que es un aparato conforme a cualquiera de las reivindicaciones 8 a 12.
13. Un procedimiento de decodificación de audio
sin pérdida que comprende:
- \quad
- obtener (1900) un parámetro Golomb de una corriente de bits de datos de audio;
- \quad
- seleccionar (1910) una muestra binaria para ser decodificada en el orden desde un bit más significativo hasta un bit menos significativo y desde una menor frecuencia hasta una mayor frecuencia;
- \quad
- calcular (1920) el contexto de una muestra binaria para ser decodificada utilizando las significaciones de muestras binarias ya decodificadas de planos de bit para cada una de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria que va a ser decodificada; seleccionar (1930) un modelo de probabilidad de la muestra binaria utilizando el parámetro Golomb y el contexto;
- \quad
- llevar a cabo una decodificación aritmética (1940) utilizando el modelo seleccionado de probabilidad; y
- \quad
- llevar a cabo de forma reiterada las operaciones desde la selección de una muestra binaria para ser decodificada hasta la decodificación aritmética, hasta que todas las muestras binarias están decodificadas
- \quad
- en el que la significación de una muestra binaria es "1" si hay al menos un "1" en planos de bit ya decodificados en la línea de frecuencia de la muestra binaria y, si no hay "1" en los planos de bit ya decodificados en la línea de frecuencia de la muestra binaria, la significación de la muestra binaria es "0".
\vskip1.000000\baselineskip
14. Un procedimiento de decodificación de audio
sin pérdida conforme a la reivindicación 13, en el que la
diferencia de datos de audio codificado con pérdida y una señal
espectral de audio en el dominio frecuencial que tiene un valor de
número entero es denominada datos de error, comprendiendo el
procedimiento:
- \quad
- extraer (2000) una corriente de bits con pérdida codificada con pérdida en un procedimiento predeterminado y una corriente de bits de error de los datos de error, al desmultiplexar una corriente de bits de audio;
- \quad
- decodificar con pérdida (2010) la corriente de bits con pérdida extraída en un
- \quad
- procedimiento predeterminado;
- \quad
- decodificar sin pérdida (2020) la corriente de bits de error extraída, utilizando un procedimiento conforme a cualquiera de las reivindicaciones 15 a 19; y
- \quad
- restablecer (2030) una señal espectral de frecuencia utilizando la corriente de bits con pérdida decodificada y la corriente de bits de error extraída; y
- \quad
- restablecer (2040) una señal de audio en el dominio temporal al transformar inversamente el entero tiempo/frecuencia de la señal espectral de frecuencia.
\vskip1.000000\baselineskip
15. Un aparato de decodificación de audio sin
pérdida que comprende:
- \quad
- una unidad (1500) de obtención de parámetros dispuesta para obtener un parámetro Golomb de una corriente de bits de datos de audio;
- \quad
- una unidad (1510) de selección de muestras dispuesta para seleccionar una muestra binaria para ser decodificada en el orden desde un bit más significativo hasta un bit menos significativo y desde una menor frecuencia hasta una mayor frecuencia;
- \quad
- una unidad (1520) de cálculo del contexto dispuesta para calcular el contexto de una muestra binaria para ser decodificada utilizando las significaciones de muestras binarias ya decodificadas para cada una de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria que se va a decodificar;
- \quad
- una unidad (1530) de selección del modelo de probabilidad dispuesta para seleccionar un modelo de probabilidad utilizando el parámetro Golomb y el contexto; y
- \quad
- una unidad (1540) de decodificación aritmética dispuesta para llevar a cabo una decodificación aritmética utilizando el modelo seleccionado de probabilidad;
- \quad
- en el que la significación de una muestra binaria es "1" si hay al menos un "1" en planos de bit ya decodificados en la línea de frecuencia de la muestra binaria y, si no hay "1" en los planos de bit ya decodificados en la línea de frecuencia de la muestra binaria, la significación de la muestra binaria es "0".
\vskip1.000000\baselineskip
16. El aparato de la reivindicación 15, en el
que la unidad de cálculo del contexto comprende:
- \quad
- una primera unidad (1600) de cálculo del contexto dispuesta para calcular un primer
- \quad
- contexto al obtener las significaciones de muestras binarias ya decodificadas en cada línea de frecuencia en una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece la muestra binaria que se va a decodificar y pasar las significaciones a binario; y
- \quad
- una segunda unidad (1620) de cálculo del contexto dispuesta para calcular un segundo contexto al obtener las significaciones de muestras binarias ya decodificadas en cada línea de frecuencia en una pluralidad de líneas de frecuencia existentes anteriores a una línea de frecuencia a la que pertenece la muestra binaria que se va a decodificar, expresando una relación de cuántas líneas entre la pluralidad de líneas de frecuencia tienen significación, en un número entero al multiplicar la relación por un valor predeterminado de número entero, y luego, al utilizar el número entero para calcular el segundo contexto.
\vskip1.000000\baselineskip
17. El aparato de la reivindicación 15 o 16, en
el que se decodifican algunas muestras binarias en el plano de bits
con una probabilidad de 0,5.
18. Un aparato de decodificación de audio sin
pérdida conforme a cualquiera de las reivindicaciones 15 a 17, en
el que la diferencia de los datos de audio codificado con pérdida y
la señal espectral de audio en el dominio frecuencial que tiene un
valor de número entero se denomina datos de error, comprendiendo el
aparato:
- \quad
- una unidad (1700) de desmultiplexión dispuesta para extraer una corriente de bits con pérdida codificada con pérdida en un procedimiento predeterminado y una corriente de bits de error de los datos de error, al desmultiplexar una corriente de bits de audio;
- \quad
- una unidad (1710) de decodificación con pérdida dispuesta para decodificar con pérdida la corriente de bits con pérdida extraída en un procedimiento predeterminado;
- \quad
- una unidad (1720) de decodificación sin pérdida dispuesta para decodificar sin pérdida la corriente de bits de error extraído, utilizando un contexto basado en las significaciones de muestras binarias ya decodificadas de planos de bit en cada línea de una pluralidad de líneas de frecuencia existentes en el entorno de una línea de frecuencia a la que pertenece una muestra binaria que va a ser decodificada; y
- \quad
- una unidad (1730) de síntesis de señales de audio dispuesta para restablecer una señal espectral de frecuencia al sintetizar la corriente de bits con pérdida decodificada y la corriente de bits de error.
\vskip1.000000\baselineskip
19. El aparato de la reivindicación 18, en el
que la unidad de decodificación con pérdida es una unidad de
decodificación AAC.
20. El aparato de la reivindicación 18 o 19, que
comprende además:
- \quad
- una unidad (1740) de transformación inversa de tiempo/frecuencia dispuesta para restablecer una señal de audio en el dominio temporal al transformar inversamente el entero tiempo/frecuencia de la señal espectral de frecuencia.
21. El aparato de la reivindicación 18, 19 o 20,
que comprende además:
- \quad
- una unidad (1750) de transformación inversa de tiempo/frecuencia dispuesta para restablecer una señal de audio en el dominio temporal a partir de la señal de audio en el dominio frecuencial decodificada por la unidad de decodificación con pérdida.
22. Un medio de grabación legible por ordenador
que tiene plasmado en el mismo un programa informático que
comprende instrucciones que, cuando son ejecutadas en un ordenador,
harán que dicho ordenador lleve a cabo el procedimiento de la
reivindicación 1 o 6.
23. Un medio de grabación legible por ordenador
que tiene plasmado en el mismo un programa informático que
comprende instrucciones que, cuando son ejecutadas en un ordenador,
harán que dicho ordenador lleve a cabo el procedimiento de la
reivindicación 13 o 14.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US55135904P | 2004-03-10 | 2004-03-10 | |
US551359P | 2004-03-10 | ||
KR1020040050479A KR100561869B1 (ko) | 2004-03-10 | 2004-06-30 | 무손실 오디오 부호화/복호화 방법 및 장치 |
KR10-2004-0050479 | 2004-06-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2339257T3 true ES2339257T3 (es) | 2010-05-18 |
Family
ID=34829555
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES05251452T Active ES2339257T3 (es) | 2004-03-10 | 2005-03-10 | Procedimiento y aparato para la codificacion/decodificacion de audio sin perdida. |
Country Status (7)
Country | Link |
---|---|
US (1) | US7660720B2 (es) |
EP (1) | EP1575032B1 (es) |
JP (2) | JP4744899B2 (es) |
KR (1) | KR100561869B1 (es) |
CN (1) | CN1681213B (es) |
DE (1) | DE602005019643D1 (es) |
ES (1) | ES2339257T3 (es) |
Families Citing this family (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070037945A (ko) * | 2005-10-04 | 2007-04-09 | 삼성전자주식회사 | 오디오 신호의 부호화/복호화 방법 및 장치 |
KR101237413B1 (ko) * | 2005-12-07 | 2013-02-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치 |
JP4732203B2 (ja) * | 2006-03-17 | 2011-07-27 | キヤノン株式会社 | 画像符号化装置及び復号装置及びそれらの制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 |
EP1883067A1 (en) * | 2006-07-24 | 2008-01-30 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
KR101346358B1 (ko) | 2006-09-18 | 2013-12-31 | 삼성전자주식회사 | 대역폭 확장 기법을 이용한 오디오 신호의 부호화/복호화방법 및 장치 |
US20080071550A1 (en) * | 2006-09-18 | 2008-03-20 | Samsung Electronics Co., Ltd. | Method and apparatus to encode and decode audio signal by using bandwidth extension technique |
KR20090089304A (ko) * | 2006-10-06 | 2009-08-21 | 에이전시 포 사이언스, 테크놀로지 앤드 리서치 | 부호화 방법, 복호화 방법, 부호화기, 복호화기 및 컴퓨터 프로그램 제품 |
KR101261524B1 (ko) * | 2007-03-14 | 2013-05-06 | 삼성전자주식회사 | 노이즈를 포함하는 오디오 신호를 저비트율로부호화/복호화하는 방법 및 이를 위한 장치 |
US7991622B2 (en) * | 2007-03-20 | 2011-08-02 | Microsoft Corporation | Audio compression and decompression using integer-reversible modulated lapped transforms |
US8086465B2 (en) * | 2007-03-20 | 2011-12-27 | Microsoft Corporation | Transform domain transcoding and decoding of audio data using integer-reversible modulated lapped transforms |
KR100889750B1 (ko) * | 2007-05-17 | 2009-03-24 | 한국전자통신연구원 | 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법 |
US20110116542A1 (en) * | 2007-08-24 | 2011-05-19 | France Telecom | Symbol plane encoding/decoding with dynamic calculation of probability tables |
KR101505831B1 (ko) * | 2007-10-30 | 2015-03-26 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 방법 및 장치 |
DK3573056T3 (da) | 2008-07-11 | 2022-10-03 | Fraunhofer Ges Forschung | Audiokoder og audioafkoder |
WO2010032934A2 (ko) * | 2008-09-16 | 2010-03-25 | 에스케이텔레콤 주식회사 | B-변환을 위한 부호화 방법 및 장치와 그를 위한 부호화 데이터 |
US8666752B2 (en) * | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
KR20100136890A (ko) * | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
FR2947944A1 (fr) * | 2009-07-07 | 2011-01-14 | France Telecom | Codage/decodage perfectionne de signaux audionumeriques |
RU2605677C2 (ru) | 2009-10-20 | 2016-12-27 | Франхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен | Аудио кодер, аудио декодер, способ кодирования аудио информации, способ декодирования аудио информации и компьютерная программа, использующая итеративное уменьшение размера интервала |
PL2524372T3 (pl) * | 2010-01-12 | 2015-08-31 | Fraunhofer Ges Forschung | Koder audio. dekoder audio, sposób kodowania i dekodowania informacji audio i program komputerowy uzyskujący wartość podobszaru kontekstu w oparciu o normę uprzednio zdekodowanych wartości widmowych |
US8374858B2 (en) * | 2010-03-09 | 2013-02-12 | Dts, Inc. | Scalable lossless audio codec and authoring tool |
EP4131258A1 (en) * | 2010-07-20 | 2023-02-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, audio decoding method, audio encoder, audio encoding method and computer program |
KR101676477B1 (ko) | 2010-07-21 | 2016-11-15 | 삼성전자주식회사 | 컨텍스트 기반의 무손실 부호화 장치 및 방법, 그리고 복호화 장치 및 방법 |
CN102074243B (zh) * | 2010-12-28 | 2012-09-05 | 武汉大学 | 一种基于比特平面的感知音频分级编码系统及方法 |
GB2524424B (en) * | 2011-10-24 | 2016-04-27 | Graham Craven Peter | Lossless buried data |
CN103248367B (zh) * | 2012-02-03 | 2016-03-16 | 展讯通信(上海)有限公司 | 码流数据的编码、解码方法和装置 |
US9799339B2 (en) | 2012-05-29 | 2017-10-24 | Nokia Technologies Oy | Stereo audio signal encoder |
EP3660843B1 (en) | 2013-09-13 | 2022-11-09 | Samsung Electronics Co., Ltd. | Lossless coding method |
KR102270106B1 (ko) | 2013-09-13 | 2021-06-28 | 삼성전자주식회사 | 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치 |
CN103595503B (zh) * | 2013-10-25 | 2016-08-17 | 福建升腾资讯有限公司 | 一种基于串口装置的频率编解码通讯系统 |
CN104934034B (zh) * | 2014-03-19 | 2016-11-16 | 华为技术有限公司 | 用于信号处理的方法和装置 |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
CN105187071B (zh) * | 2015-09-29 | 2018-04-06 | 东北大学 | 一种管道毫秒级在线数据的复合压缩/解压缩方法 |
JP6766264B2 (ja) | 2017-06-22 | 2020-10-07 | 日本電信電話株式会社 | 符号化装置、復号装置、符号化方法、復号方法、およびプログラム |
WO2019091576A1 (en) * | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6778965B1 (en) * | 1996-10-10 | 2004-08-17 | Koninklijke Philips Electronics N.V. | Data compression and expansion of an audio signal |
PT1603244E (pt) * | 1996-11-07 | 2007-11-23 | Koninkl Philips Electronics Nv | Transmissão de um sinal em modo binário |
IL122714A (en) * | 1997-04-02 | 2011-06-30 | Samsung Electronics Co Ltd | Digital data coding/decoding method and apparatus |
KR100261254B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치 |
US6314136B1 (en) * | 1997-08-01 | 2001-11-06 | Creative Technology Ltd. | Method for performing wavelet-based image compaction losslessly and low bit precision requirements |
KR100335611B1 (ko) * | 1997-11-20 | 2002-10-09 | 삼성전자 주식회사 | 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치 |
KR100335609B1 (ko) * | 1997-11-20 | 2002-10-04 | 삼성전자 주식회사 | 비트율조절이가능한오디오부호화/복호화방법및장치 |
US6121904A (en) | 1998-03-12 | 2000-09-19 | Liquid Audio, Inc. | Lossless data compression with low complexity |
US6757659B1 (en) * | 1998-11-16 | 2004-06-29 | Victor Company Of Japan, Ltd. | Audio signal processing apparatus |
US6223162B1 (en) * | 1998-12-14 | 2001-04-24 | Microsoft Corporation | Multi-level run length coding for frequency-domain audio coding |
US6400289B1 (en) * | 2000-03-01 | 2002-06-04 | Hughes Electronics Corporation | System and method for performing lossless data compression and decompression |
FI109393B (fi) * | 2000-07-14 | 2002-07-15 | Nokia Corp | Menetelmä mediavirran enkoodaamiseksi skaalautuvasti, skaalautuva enkooderi ja päätelaite |
BR0107420A (pt) * | 2000-11-03 | 2002-10-08 | Koninkl Philips Electronics Nv | Processos de codificação de um sinal de entrada e de decodificação, sinal modificado modelado, meio de armazenagem, decodificador, reprodutor de áudio, e ,aparelho para codificação de sinais |
US6675148B2 (en) * | 2001-01-05 | 2004-01-06 | Digital Voice Systems, Inc. | Lossless audio coder |
US6735254B2 (en) * | 2001-06-29 | 2004-05-11 | Qualcomm, Inc. | DCT compression using Golomb-Rice coding |
US6650784B2 (en) * | 2001-07-02 | 2003-11-18 | Qualcomm, Incorporated | Lossless intraframe encoding using Golomb-Rice |
US6856701B2 (en) | 2001-09-14 | 2005-02-15 | Nokia Corporation | Method and system for context-based adaptive binary arithmetic coding |
US7193537B2 (en) | 2002-03-07 | 2007-03-20 | Aware, Inc. | Interlaced sign bit coding |
KR100908114B1 (ko) * | 2002-03-09 | 2009-07-16 | 삼성전자주식회사 | 스케일러블 무손실 오디오 부호화/복호화 장치 및 그 방법 |
US7110941B2 (en) * | 2002-03-28 | 2006-09-19 | Microsoft Corporation | System and method for embedded audio coding with implicit auditory masking |
US7328150B2 (en) * | 2002-09-04 | 2008-02-05 | Microsoft Corporation | Innovations in pure lossless audio compression |
US7424434B2 (en) * | 2002-09-04 | 2008-09-09 | Microsoft Corporation | Unified lossy and lossless audio compression |
US7536305B2 (en) * | 2002-09-04 | 2009-05-19 | Microsoft Corporation | Mixed lossless audio compression |
KR101015497B1 (ko) * | 2003-03-22 | 2011-02-16 | 삼성전자주식회사 | 디지털 데이터의 부호화/복호화 방법 및 장치 |
DE602004013031T2 (de) * | 2003-10-10 | 2009-05-14 | Agency For Science, Technology And Research | Verfahren zum codieren eines digitalen signals in einen skalierbaren bitstrom, verfahren zum decodieren eines skalierbaren bitstroms |
JP2005173201A (ja) * | 2003-12-11 | 2005-06-30 | Canon Inc | オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、及びオーディオ復号プログラムを記録したコンピュータ可読記録媒体 |
KR100576548B1 (ko) * | 2003-12-26 | 2006-05-03 | 한국전자통신연구원 | 문맥기반 적응 가변길이 복호화 장치 및 그 방법 |
KR20050087956A (ko) * | 2004-02-27 | 2005-09-01 | 삼성전자주식회사 | 무손실 오디오 부호화/복호화 방법 및 장치 |
-
2004
- 2004-06-30 KR KR1020040050479A patent/KR100561869B1/ko not_active IP Right Cessation
-
2005
- 2005-03-10 ES ES05251452T patent/ES2339257T3/es active Active
- 2005-03-10 DE DE602005019643T patent/DE602005019643D1/de active Active
- 2005-03-10 JP JP2005067265A patent/JP4744899B2/ja not_active Expired - Fee Related
- 2005-03-10 EP EP05251452A patent/EP1575032B1/en not_active Not-in-force
- 2005-03-10 CN CN2005100741885A patent/CN1681213B/zh not_active Expired - Fee Related
- 2005-03-10 US US11/076,284 patent/US7660720B2/en not_active Expired - Fee Related
-
2010
- 2010-10-13 JP JP2010230776A patent/JP5372886B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP4744899B2 (ja) | 2011-08-10 |
EP1575032A3 (en) | 2006-09-27 |
CN1681213B (zh) | 2010-05-26 |
US7660720B2 (en) | 2010-02-09 |
EP1575032A2 (en) | 2005-09-14 |
JP2005260969A (ja) | 2005-09-22 |
US20050203731A1 (en) | 2005-09-15 |
CN1681213A (zh) | 2005-10-12 |
DE602005019643D1 (de) | 2010-04-15 |
JP2011048388A (ja) | 2011-03-10 |
EP1575032B1 (en) | 2010-03-03 |
KR100561869B1 (ko) | 2006-03-17 |
JP5372886B2 (ja) | 2013-12-18 |
KR20050090941A (ko) | 2005-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2339257T3 (es) | Procedimiento y aparato para la codificacion/decodificacion de audio sin perdida. | |
JP5384780B2 (ja) | 無損失オーディオ符号化方法、無損失オーディオ符号化装置、無損失オーディオ復号化方法、無損失オーディオ復号化装置及び記録媒体 | |
ES2717606T3 (es) | Codificación y decodificación de audio escalable usando un banco de filtros jerárquico | |
CN101027717B (zh) | 无损多通道音频编解码器 | |
ES2321147T3 (es) | Codificacion de habla de tasa de transmision variable. | |
TWI515720B (zh) | 壓縮數位化音訊信號之方法、解碼已編碼壓縮數位化音訊信號之方法、及機器可讀儲存媒體 | |
KR100818268B1 (ko) | 오디오 데이터 부호화 및 복호화 장치와 방법 | |
WO2002103685A1 (fr) | Appareil et procede de codage, appareil et procede de decodage et programme | |
KR20060121655A (ko) | 넓은-뜻의 지각적 유사성을 이용하는 디지털 미디어스펙트럼 데이터의 효과적인 코딩 | |
JP2008519991A (ja) | 音声の符号化及び復号化 | |
ES2575693T3 (es) | Un método y un aparato para detectar tasa de muestreo de audio | |
US8239210B2 (en) | Lossless multi-channel audio codec | |
US7197454B2 (en) | Audio coding | |
ES2248549T3 (es) | Edicion de señales de audio. | |
Yang et al. | A lossless audio compression scheme with random access property | |
US20100161322A1 (en) | Encoding and decoding apparatuses for improving sound quality of g.711 codec | |
KR101387808B1 (ko) | 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치 | |
ES2338801T3 (es) | Procedimiento de cuantificacion de un codificador de palabra de flujo muy bajo. | |
Chang et al. | Dither-like data hiding in multistage vector quantization of MELP and G. 729 speech coding | |
US20120102035A1 (en) | Data Embedding Methods, Embedded Data Extraction Methods, Truncation Methods, Data Embedding Devices, Embedded Data Extraction Devices And Truncation Devices | |
KR100947065B1 (ko) | 무손실 오디오 부호화/복호화 방법 및 장치 | |
JP2006211243A (ja) | ディジタル信号符号化装置,ディジタル信号符号化方法 | |
Kandadai et al. | Scalable audio compression at low bitrates | |
ES2296489B1 (es) | Metodo escalable de compresion de audio e imagenes. |