ES2387869T3 - Reconstrucción de datos de audio multicanal - Google Patents

Reconstrucción de datos de audio multicanal Download PDF

Info

Publication number
ES2387869T3
ES2387869T3 ES09802568T ES09802568T ES2387869T3 ES 2387869 T3 ES2387869 T3 ES 2387869T3 ES 09802568 T ES09802568 T ES 09802568T ES 09802568 T ES09802568 T ES 09802568T ES 2387869 T3 ES2387869 T3 ES 2387869T3
Authority
ES
Spain
Prior art keywords
spatialization
data
value
model
predicted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES09802568T
Other languages
English (en)
Inventor
David Virette
Pierrick Philippe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Application granted granted Critical
Publication of ES2387869T3 publication Critical patent/ES2387869T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2420/00Details of connection covered by H04R, not provided for in its groups
    • H04R2420/03Connection circuits to selectively connect loudspeakers or headphones to amplifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

Procedimiento de procesamiento de datos sonoros, para la reconstrucción de datos de audio multicanal a partir deal menos datos en un número de canales restringido y de datos de espacialización, comprendiendo dichoprocedimiento una etapa de test (306) de validez de datos de espacialización de una trama recibida y, si dicho testmuestra que dichos datos de espacialización recibidos son válidos, etapas de:a/ mediante un modelo respectivo de una pluralidad de modelos de predicción, predicción de acuerdo con dichomodelo de un valor de espacialización (307), yb/ elección de un modelo de predicción, a partir de los valores de espacialización predichos de este modo y, a partirde los datos de espacialización recibidos, para poder, en caso de recepción posterior de datos de espacializacióndefectuosos, predecir de acuerdo con dicho modelo seleccionado un valor de espacialización y utilizar dicho valor deespacialización predicho para la reconstrucción de los datos de audio multicanal;y en el que, durante la etapa b/:mediante un modelo respectivo de la pluralidad de modelos, se calcula un valor de semejanza , a partir,por un lado, del valor de espacialización predicho según dicho modelo y, por otro lado, deun valor estimado (WL(b,n), WR(b,n)) a partir de los datos de espacialización recibidos, yse selecciona el modelo de predicción para el cual dicho valor de semejanza indica una mayor adecuación entre elvalor de espacialización predicho y dicho valor estimado.

Description

Reconstrucción de datos de audio multicanal
5 La invención se refiere a la ocultación de datos de espacialización defectuosos, para la reconstrucción de datos de audio multicanal. Los datos de audio multicanal son típicamente reconstruidos a partir de al menos datos de espacialización y de datos de audio en un número de canales restringido, por ejemplo datos monocanal.
Los datos de audio multicanal están destinados típicamente a varias pistas de audio respectivas. Pueden utilizarse varias fuentes sonoras respectivas para contribuir a proporcionar al oyente la ilusión de un sonido envolvente.
Los datos de audio multicanal pueden comprender por ejemplo datos en estéreo en dos canales, o bien incluso datos 5.1 en seis canales, en particular para aplicaciones de Home Cinema. La invención también puede aplicarse en el campo de las conferencias de audio espacializadas, en el que los datos que corresponden a un locutor
15 experimentan un tratamiento de espacialización para proporcionar al oyente la ilusión de que la voz de este locutor proviene de una posición particular del espacio.
Los datos de espacialización se utilizan para obtener datos multicanal a partir de los datos en un número inferior de canales, por ejemplo datos monocanal. Estos datos de espacialización pueden comprender por ejemplo diferentes diferencias de nivel inter-vías o ILD (del inglés “Interchannel Level Difference”), correlaciones inter-vías o ICC (del inglés “Interchannel Cross Correlation”), retardos entre vías o ITD (del inglés “Interchannel Time Difference”), diferencias de fase entre vías o IPD (del inglés “Interchannel Phase Difference”), u otras.
Puede ocurrir que los datos de audio recibidos, que comprenden al menos los datos monocanal y los datos de 25 espacialización, sean defectuosos, es decir que algunos datos falten o que sean erróneos.
La detección de esta transmisión defectuosa puede realizarse por medio de un código de tipo CRC (del inglés “Cyclic Redundancy Check”).
Se conoce el alivio de estos defectos sustituyendo valores defectuosos por valores predichos. Estos valores predichos pueden determinarse siguiendo un modelo de predicción conocido.
Se conocen varios modelos de predicción. Por ejemplo, se selecciona como valor predicho un valor arbitrario, un valor precedente, un valor determinado a partir de los datos de audio recibidos anteriormente siguiendo, por ejemplo,
35 procedimientos de predicción lineal, u otros.
Cuando se reciben de forma defectuosa datos monocanal, la sustitución de los valores defectuosos por valores predichos de datos monocanal se revela en general relativamente satisfactoria.
Sin embargo, cuando se reciben de forma defectuosa datos de espacialización, la sustitución de los valores defectuosos por valores predichos puede revelarse insatisfactoria.
Las variaciones fuertes de los datos de espacialización a lo largo del tiempo se traducen para el oyente en la sensación de desplazamientos bruscos de las fuentes sonoras.
45 Por ejemplo, si se sustituyen los valores defectuosos por un valor arbitrario correspondiente a una ausencia de espacialización, la sensación de un retorno a un sonido monocanal puede ser molesta para el oyente, en particular en el caso de señales binaurales. En efecto, las señales binaurales, es decir que permiten una restitución fiel del espacio 3D a nivel de las orejas, corresponden a menudo a fuentes sonoras virtuales relativamente fijas en el espacio.
Existe, por lo tanto, una necesidad de una mejor ocultación de los defectos de los datos de espacialización durante la reconstrucción de datos de audio multicanal. Por ejemplo, el documento US 2005/182996 (BRUHN STEFAN), 18 de agosto de 2005, describe la construcción de un modelo de predicción sobre la base de una combinación
55 apropiada de canales.
De acuerdo con un primer aspecto, la invención tiene por objeto un procedimiento de procesamiento de datos sonoros, para la reconstrucción de datos de audio multicanal a partir de, al menos, datos en un número de canales restringido y de datos de espacialización, comprendiendo este procedimiento, tal como se define en la reivindicación 1, una etapa de test de la validez de datos de espacialización de una trama recibida. Si este test muestra que estos datos de espacialización son válidos:
a/ mediante modelo respectivo de una pluralidad de modelos de predicción, se predice, según este modelo, un valor de espacialización,
65 b/ se selecciona un modelo de predicción, a partir de los valores de espacialización predichos de este modo y, a partir de los datos de espacialización recibidos efectivamente, para poder, en caso de recepción posterior de datos de espacialización defectuosos, predecir según este modelo seleccionado un valor de espacialización, y utilizar este valor de espacialización predicho para la reconstrucción de los datos de audio multicanal.
5 Durante la etapa b/, se confronta cada valor de espacialización predicho con un valor estimado a partir de los datos de espacialización recibidos. En particular, puede preverse calcular, por modelo, un valor de semejanza a partir, por un lado, del valor de espacialización predicho siguiendo este modelo y, por otro lado, de un valor estimado a partir de los datos de espacialización recibidos. Se selecciona entonces el modelo de predicción para el cual el valor de semejanza indica una mayor adecuación entre el valor predicho y el valor estimado.
De este modo, se utilizan datos de espacialización considerados como válidos para seleccionar entre una pluralidad de modelos de predicción un modelo de predicción a adoptar en caso de recepción de datos de espacialización considerados como defectuosos. Dicho procedimiento adaptativo según el contenido permite paliar los defectos de los datos de espacialización de forma más satisfactoria que en la técnica anterior en la que se utiliza un solo modelo
15 de predicción.
Por “un número de canales restringido”, se entiende un número de canales inferior al número de canales de los datos multicanal. Por ejemplo, los datos en un número de canales restringido pueden comprender datos monocanal.
Los datos de espacialización y, de forma más general, los datos de audio recibidos, pueden provenir de un canal de transmisión. Por ejemplo, estos datos pueden recibirse por Internet. Como alternativa, los datos de audio recibidos pueden leerse en un soporte de almacenamiento, por ejemplo un DVD (del inglés “Digital Versatile Disk”), u otro. La invención no está en absoluto limitada por la procedencia de los datos de audio recibidos.
25 Los datos de audio recibidos pueden comprender una señal codificada, una señal demultiplexada y/o decodificada, valores numéricos, u otros.
Las etapas a/ y b/ pueden realizarse sistemáticamente después de la recepción de una trama considerada como válida. De este modo, los procesamientos se distribuyen en el tiempo.
Puede preverse, en particular cuando las etapas a/ y b/ se realizan para cada trama válida, escribir en la memoria un identificador del modelo de predicción seleccionado y esto para poder, en caso de recepción posterior de datos de espacialización defectuosos, recuperar rápidamente el modelo de predicción a aplicar.
35 Como alternativa, la ejecución de las etapas a/ y/o b/ puede estar sometida a la realización de ciertas condiciones, lo que puede permitir evitar realizar cálculos inútiles.
Por ejemplo, cuando una trama se considera como válida, los datos de espacialización se almacenan en una memoria, al menos de forma temporal. Las etapas a/ y b/ se realizan (a partir de los datos almacenados de este modo), solamente en caso de recepción posterior de datos de espacialización considerados como defectuosos. De este modo, se evita realizar en particular las predicciones de la etapa a/ cuando esto no es necesario.
De acuerdo con otro ejemplo, puede preverse realizar las predicciones de la etapa a/ sistemáticamente después de la recepción de una trama considerada como válida, mientras que la etapa b/ solamente se realiza (a partir de los
45 datos de espacialización de la trama o las tramas precedentes, conservadas en la memoria) en caso de recepción de una trama defectuosa.
El valor estimado puede ser uno de los datos de espacialización, por ejemplo el valor estimado puede comprender un ILD. En este caso, puede preverse, durante la etapa b/ comparar los valores de espacialización predichos directamente con datos de espacialización recibidos.
Como alternativa, el valor estimado puede derivar solamente de los datos de espacialización. Por ejemplo el valor estimado puede comprender una ganancia procedente de los ILD para una trama y una banda de frecuencias dadas, un retardo u otro. En este caso, puede preverse, durante la etapa b/, comparar los valores de espacialización
55 predichos con valores obtenidos a partir de datos de espacialización recibidos.
Ventajosamente, para al menos un modelo, se confrontan además valores de espacialización predichos anteriormente con valores estimados correspondientes. De este modo, la elección del modelo de predicción más adecuado para el contenido puede realizarse de forma más precisa.
Por ejemplo, pueden utilizarse los datos de espacialización recibidos en varias tramas y confrontar, para varias tramas, los valores predichos y los valores estimados.
En particular, por trama de una secuencia de tramas recibidas, y para al menos un modelo, puede predecirse,
65 siguiendo este modelo, un valor de espacialización, de modo que se predice una secuencia de valores de espacialización. Para este modelo, el valor de semejanza puede calcularse a partir, por un lado, de esta secuencia de valores de espacialización predichos y, por otro lado, de una secuencia de valores estimados a partir de los datos de la secuencia de tramas.
Ventajosamente, no se utilizarán datos de espacialización defectuosos durante la etapa de elección del modelo de 5 predicción, para evitar falsear esta elección.
Como alternativa, puede bastar con los datos de espacialización corrientes recibidos, por ejemplo, en una misma trama, para la elección del modelo de predicción.
Los datos pueden ser defectuosos, debido a degradaciones introducidas durante la transmisión, o a degradaciones de un soporte de almacenamiento de los datos. La invención no está limitada a este origen de defectos. Por ejemplo, en el caso de una transmisión jerarquizada en capas (“scalable coding” en inglés) para la cual un emisor u otro elemento de una red de transmisión puede elegir no transmitir un conjunto de datos, pueden faltar datos entre los datos de espacialización recibidos.
15 El carácter defectuoso de los datos de espacialización puede detectarse según procedimientos conocidos, por ejemplo por medio de un código de tipo CRC.
La invención no está en absoluto limitada por la forma de la escritura en memoria del identificador del modelo de predicción elegido. Se puede, por ejemplo, copiar en una memoria programa todas las instrucciones de un programa correspondiente a este modelo, o bien simplemente memorizar un nombre de modelo en una memoria eventualmente volátil.
Durante la etapa a/, la predicción del valor de espacialización se realiza siguiendo un modelo de predicción, es decir
25 en particular que los datos utilizados para la predicción pueden variar siguiendo el modelo. Por ejemplo, para un modelo que consiste en asignar un valor arbitrario al valor de espacialización, no es necesario ningún dato para la predicción. Para un modelo que consiste en retomar un valor de espacialización precedente y/o en ponderar un valor de espacialización precedente, este valor de espacialización precedente se utiliza durante la predicción.
Ventajosamente, la etapa a/ se realiza para datos de espacialización correspondientes a una banda de frecuencias dada. De este modo, pueden realizarse varias predicciones en paralelo, en diferentes bandas de frecuencias. En efecto, en el caso de una señal en estéreo, la elección del modelo de predicción más preciso puede estar vinculada a la frecuencia: según la banda de frecuencias considerada, esto puede conducir a elegir modelos de predicción diferentes.
35 De acuerdo con otro aspecto (véase la reivindicación 9), la invención tiene por objeto un programa informático que comprende instrucciones para la implementación del procedimiento expuesto anteriormente, cuando estas instrucciones son ejecutadas por un procesador.
De acuerdo con otro aspecto más, la invención tiene como aspecto un dispositivo de ocultación de datos de espacialización defectuosos tal como se define en la reivindicación 10. Este dispositivo comprende una unidad de memoria, la cual puede comprender una o varias memorias, para almacenar una pluralidad de juegos de instrucciones, correspondiendo cada juego de instrucciones a un modelo de predicción. Este dispositivo comprende además medios de recepción para recibir datos de espacialización. Un módulo de test permite testar la validez de
45 los datos de espacialización recibidos por los medios de recepción. En caso de recepción de datos de espacialización detectados como válidos por el módulo de test, un módulo de estimación permite, mediante el juego de instrucciones almacenado en la unidad de memoria, ejecutar este juego de instrucciones para predecir un valor de espacialización. Un módulo de selección permite elegir un modelo de predicción, a partir de los valores de espacialización predichos por el módulo de estimación y a partir de los datos de espacialización recibidos por los medios de recepción. El dispositivo de ocultación comprende además un módulo de predicción dispuesto para, en caso de recepción de datos de espacialización considerados como defectuosos por el módulo de detección, predecir, de acuerdo con el modelo elegido por el módulo de selección, un valor de espacialización.
De acuerdo con otro aspecto más (véase la reivindicación 11), la invención tiene por objeto un aparato de
55 reconstrucción de datos de audio multicanal. Este aparato comprende medios de reconstrucción multicanal, para reconstruir datos de audio multicanal a partir de al menos datos en un número de canales restringido, por ejemplo datos monocanal. Este aparato comprende además el dispositivo de ocultación descrito anteriormente. El módulo de predicción se dispone para, en caso de recepción de datos de espacialización considerados como defectuosos por el módulo de detección, proporcionar el valor de espacialización predicho a los medios de reconstrucción multicanal para la reconstrucción de los datos de audio multicanal.
El aparato de reconstrucción de datos de audio multicanal puede estar integrado en un procesador, o bien incluso comprender un aparato de tipo ordenador, cadena Hi-Fi u otro.
65 Los diversos componentes del aparato de reconstrucción, por ejemplo los medios de reconstrucción, el dispositivo de ocultación, el módulo de detección u otro, pueden ser distintos o estar fusionados.
Otras particularidades y ventajas de la presente invención quedarán claras en la descripción detallada a continuación, realizada en referencia a los dibujos adjuntos, en los que:
5 la figura 1 muestra un ejemplo de dispositivo de codificación conversacional,
la figura 2 muestra un ejemplo de dispositivo de decodificación que comprende un ejemplo de aparato de reconstrucción de acuerdo con una realización de la invención,
la figura 3 es un ejemplo de algoritmo de un procedimiento de acuerdo con una realización de la invención,
la figura 4 es un gráfico que muestra un ejemplo de evolución posible de la ganancia, y
la figura 5 muestra un dispositivo adecuado para ejecutar un programa informático de acuerdo con un aspecto de la 15 invención.
Referencias idénticas designan objetos idénticos o similares de una figura a otra.
En los ejemplos ilustrados por las figuras, el número de canales de los datos de audio multicanal es de dos exactamente pero, por supuesto, pueden preverse más canales. Los datos de audio multicanal pueden comprender por ejemplo datos 5.1 en seis canales. La invención también puede aplicarse en el campo de las conferencias de audio espacializadas.
En particular, se puede hacer remisión a la norma MPEG Surround, es decir que se puede utilizar o simular una 25 estructura en árbol para generar más de de dos vías.
En los ejemplos representados, los datos de audio se agrupan por tramas o paquetes, con el índice n.
La figura 1 muestra un ejemplo de codificador, para el cual informaciones en estéreo son transmitidas por bandas de frecuencias y se aplican en el ámbito frecuencial.
Para ello, el codificador integra medios de transformación tiempo-frecuencia 10, por ejemplo un DSP (del inglés “Digital Signal Processor”) adecuados para realizar una transformada, por ejemplo una transformada de Fourier discreta o DFT (del inglés “Discrete Fourier Transform”), una transformada MDCT (del inglés “Modified Discrete
35 Cosine Transform”), una transformada MCLT (del inglés “Modulated Complex Lapped Transform”).
De este modo se obtiene, a partir de los valores SL(n), SR(n) correspondientes a las señales temporales izquierda y derecha, valores de señales frecuenciales SL(k) y derecha SR(k).
A continuación se aplica una matrización a las señales de la vía izquierda SL(k) y derecha SR(k), mediante medios de matrización 11.
Estos medios 11 permiten determinar a partir de la señal en estéreo SL(k), SL(k), una señal monocanal M(k) y una señal residual E(k). La señal monocanal M(k) es típicamente la media-suma de las señales izquierda SL(k) y derecha
45 SR(k). La señal residual E(k) puede ser igual a la mitad de la diferencia entre las señales izquierda SL(k) y derecha SR(k).
Puede preverse que la matrización sea adaptativa para que la señal monocanal M(k) transporte más información. Para ello el procedimiento implementado por los medios de matrización 11 puede evolucionar con el tiempo, para evitar la anulación de componentes que estarían en oposición de fase entre las vías izquierdas y derechas.
Medios de estimación de datos de espacialización 12 permiten estimar a partir de la señal monocanal M(k) y de la señal residual E(k) datos de espacialización, por ejemplo parámetros en estéreo. Estos parámetros en estéreo pueden ser conocidos por el especialista en la técnica y comprender, por ejemplo, diferencias de nivel inter-vías
55 (ILD), correlaciones inter-vías (ICC) y retardos o diferencias de fase entre vías (IPD / ITD).
Estos parámetros en estéreo ILD(b) puede determinarse mediante bandas de frecuencias, indexadas por la variable
b. Estas bandas pueden estar constituidas según una escala frecuencial próxima a la percepción humana. Por ejemplo, pueden utilizarse entre 8 y 20 bandas frecuenciales, según la precisión deseada y la riqueza del espectro considerado.
Medios de cuantificación, codificación y multiplexado 13 permiten cuantificar y codificar los parámetros en estéreo ILD(b) para permitir una transmisión a un caudal reducido.
65 La señal monocanal M(k) también es cuantificada y codificada por los medios 13, en el ámbito transformado como se presenta en la figura 1 o, como alternativa, en el ámbito temporal. Pueden utilizarse algoritmos normalizados para procesar esta señal monocanal M(k), por ejemplo un codificador de voz de tipo ITU G.729.1 o G.718. También podrá tratarse de un codificador de audio genérico de tipo MPEG-4 AAC o HE-AAC.
La señal residual E(k) es transmitida opcionalmente, recurriendo también a una codificación normalizada o una 5 técnica de transmisión apropiada para esta señal en el ámbito frecuencial o temporal.
La señal codificada Scod obtenida a la salida de los medios de cuantificación, codificación y multiplexado 13 es transmitida, por ejemplo por vía de radio.
10 Como alternativa, se podrá prever que el codificador conduzca a obtener datos en más de un canal monofónico, siempre que el número de canales de los datos obtenidos a la salida del codificador sea inferior al número de canales de los datos a la entrada del codificador.
La figura 2 muestra un ejemplo de decodificador susceptible de recibir una señal S'cod correspondiente a la señal Scod 15 transmitida.
Medios de decodificación y de demultiplexado 29 permiten extraer de la señal S'cod recibida datos monocanal M'(k), datos de espacialización ILD'(b), así como, eventualmente, datos residuales E'(k).
20 El decodificador comprende, además, un aparato de reconstrucción 26 para reconstruir datos de audio multicanal S'L(k), S'R(k), a partir de datos monocanal M'(k), datos de espacialización ILD'(b) y eventuales datos residuales E'(k).
La figura 3 muestra un algoritmo ejecutable por el aparato de reconstrucción 26 de la figura 2. Estas dos figuras serán, por lo tanto, comentadas simultáneamente.
25 El aparato de reconstrucción 26 comprende un dispositivo de ocultación 20 para proporcionar valores de sustitución en caso de datos de espacialización ILD'(b) defectuosos y medios de reconstrucción multicanal 27 para la reconstrucción propiamente dicha.
30 Los medios de reconstrucción multicanal 27 pueden realizar, por ejemplo, durante una etapa 300, combinaciones de tipo:
35 Donde:
k designa el índice frecuencial en cuestión,
b designa la banda asignada por los parámetros en estéreo transmitidos,
40 ML(k), una señal en el ámbito frecuencial, obtenida durante una etapa 301 a partir de los datos monocanal M'(k), aplicando de forma conocida por el especialista en la técnica un desfase o un retardo correspondiente a la vía izquierda, obteniéndose este desfase o este retardo de datos de espacialización no representados, y
45 MR(k), una señal en el ámbito frecuencial, obtenida de forma equivalente durante la etapa 301, para la vía derecha.
En particular, si no se aplica ningún desfase, entonces MR(k)=ML(k)=M’(k).
E'L es una señal específica para la vía izquierda, obtenida de forma conocida por el especialista en la técnica de los
50 datos residuales E'(k) opcionalmente transmitidos; y E'R, una señal específica para la vía derecha, obtenida de forma conocida por el especialista en la técnica de los datos residuales E'(k) opcionalmente transmitidos. La etapa de obtención de los datos E'L, E'R no se representa en la figura 3.
En caso de no transmisión de datos residuales: 55 E’(k),E’L=E’R=0.
WL y WR son las ganancias procedentes de datos de espacialización ILD'(b,n) para la banda b considerada y la trama n.
60 Las ganancias WL y WR pueden determinarse, por ejemplo, de la siguiente manera, por medio de valores W'L y W'R, durante una etapa 302: 5 donde ILD'(b,n) es el dato de espacialización ILD'(b) recibido para la trama n.
Entonces se realiza, durante una etapa 304, un alisado con una constante de tiempo α entre 0 y 1, por ejemplo α = 0,8, según:
10 WL(b,n)= α.W'L(b,n)+(1-α).WL(b,n-1), donde WL(b,n-1) designa el valor obtenido para la trama precedente.
Para la vía derecha, puede realizarse durante la etapa 304 el mismo alisado:
WR(b,n) = α.W' R(b,n) + (1-α).WR (b,n-1), donde WR(b,n-1) designa el valor obtenido para la trama precedente. 15 Como alternativa, puede utilizarse el valor obtenido para la vía izquierda, según por ejemplo:
WR(b,n)=2-WR(b,n)
20 El dispositivo de ocultación 20 permite evitar pérdidas eventuales de datos ILD'(b,n), de modo que los datos WR y WL puedan determinarse a pesar de todo.
El dispositivo de ocultación 20 comprende medios de recepción no representados para recibir, durante una etapa 305, los datos de espacialización ILD'(b,n), así como eventualmente los datos monocanal M'(k), y los datos 25 residuales E'(k).
Estos medios de recepción pueden comprender, por ejemplo, un puerto de entrada, clavijas de entrada u otro.
Un módulo de test 22 conectado a estos medios de recepción permite testar durante una etapa 306 la validez de los
30 datos de espacialización ILD'(b). Este módulo de test puede implementar una verificación de una codificación de tipo CRC, para verificar, por ejemplo, que la transmisión no ha conllevado ninguna degradación de los datos de espacialización.
El módulo de test 22 también puede leer algunos valores (no representados) extraídos de la señal S'cod recibida,
35 indicando estos valores eventuales supresiones de capas de datos transmitidos. En efecto, puede preverse que algunos elementos de la red de transmisión se abstienen de transmitir, en particular en caso de atasco de la red, o de reducción de la banda pasante del canal de transmisión, tal o cual conjunto de datos. Los conjuntos de datos no transmitidos pueden corresponder, por ejemplo, a detalles sonoros. Cuando el módulo de test 22 lee un valor que indica una supresión de algunos datos, se considera que estos datos faltan.
40 El dispositivo de ocultación 20 comprende una unidad de memoria 21 que almacena varios juegos de instrucciones, correspondiendo cada juego de instrucciones a un modelo de predicción.
Por ejemplo, según un primer modelo de predicción, cuando los datos de espacialización ILD'(b,n) son defectuosos 45 para una trama n y una banda de frecuencia b dada, se selecciona
Las instrucciones correspondientes consisten entonces en copiar los valores WR(b,n-1), WL(b,n-1) obtenidos para la trama precedente.
Por ejemplo, según un segundo modelo de predicción, se selecciona:
De este modo, en caso de una sucesión de tramas para las cuales los datos de espacialización son defectuosos,
tienden a 1 y, por consiguiente, los datos de audio multicanal S'L(k), S'R(k) se aproximan
a los datos monocanal M'(k). Dicho de otro modo, se suprimen poco a poco los efectos de espacialización para
volver a una señal monocanal.
De acuerdo con otro ejemplo de modelo de predicción, se selecciona
15 O bien también:
O bien también se utiliza un filtro mediano:
Eventualmente, para asegurar una mejor estabilidad, se utilizará en lugar de WL(b,n-i) y WR(b,n-i) respectivamente valores atenuados, por ejemplo 0,9.WL(b,n-i) y 0,9.WR(b,n-i). Puede preverse conservar en la unidad de memoria valores atenuados, para utilizarlos directamente aplicando uno de los modelos expuestos anteriormente.
30 Otros modelos también son posibles, por ejemplo es posible una predicción más general de la forma
, con un orden de predicción P. Los coeficientes ai pueden evolucionar en el tiempo, y reactualizarse utilizando un método de tipo Levinson-Durbin.
35 Estos ejemplos de modelos conducen a predecir valores de WL y WR. Como alternativa, los modelos pueden permitir predecir valores de las variables ILD'(b,n), de W'L y W'R, u otro.
Por ejemplo, según un modelo de predicción equivalente al primer modelo expuesto anteriormente, cuando faltan datos de espacialización ILD'(b,n) para una trama n y una banda de frecuencia b dada, se selecciona
40 ILD'(b,n)=ILD'(b,n-1). La instrucción correspondiente consiste entonces en copiar este valor ILD'(b,n-1) obtenido para la trama precedente.
Un módulo de estimación 23 permite ejecutar las instrucciones de los diferentes juegos de instrucciones. Este módulo 23 está activado, por ejemplo, para cada trama tal que los datos de espacialización ILD'(b,n)
45 correspondientes son considerados como válidos por el módulo de test 22, o bien también solamente para las tramas consideradas como válidas y que preceden a una trama considerada como defectuosa.
Cuando este módulo 23 está activado, todos los juegos de instrucciones almacenados son ejecutados, durante etapas 307 repetidas en un bucle que recorre los juegos de instrucciones, con las etapas clásicas de inicialización,
de test y de incremento, para obtener un conjunto de valores , indicando m el modelo utilizado. Un módulo de selección 24 permite seleccionar uno de estos modelos confrontando los valores de espacialización
predichos , con valores de espacialización estimados WL, WR a partir de los datos de espacialización efectivamente recibidos ILD'(b,n).
Por ejemplo, para cada modelo, pueden calcularse durante etapas 308 valores de semejanza , , a partir
de valores predichos ,
y a partir de valores estimados WL(b,n), WR(b,n). Los valores de semejanza pueden comprender, por ejemplo, la varianza de cada predicción:
representando E la expectativa matemática, según por ejemplo:
De este modo, se utiliza una secuencia de N tramas recibidas para determinar N valores
y compararlas
con N valores estimados WL(b,n). 20 Una fórmula equivalente se aplica para la vía derecha. Como alternativa, puede preverse calcular una varianza de forma recursiva, por ejemplo según, para cada vía:
donde α es, en este caso, una constante de tiempo, por ejemplo, igual a 0,975, y designa la estimación de la
varianza en la trama n. De acuerdo con una realización alternativa y no representada, en lugar de estimar la varianza, se estima una
30 probabilidad de los datos frente a los datos WL, WR obtenidos a partir de los valores efectivamente recibidos. Puede utilizarse, por ejemplo, un conjunto de estimadores:
Mediante comparación de los estimadores de tipo
o Pm, puede seleccionarse el modelo de predicción para el cual el valor de semejanza indica una mayor adecuación entre valores predichos y valores estimados. Por ejemplo,
se determina el índice m* del modelo que proporciona la mejor ocultación: éste será el índice que minimizará 40 maximizará Pm en otra realización.
En aras de la sencillez, puede preverse seleccionar el índice que minimizará
en una sola de las vías, por ejemplo la vía izquierda.
45 Este valor m* constituye un identificador del modelo de predicción seleccionado y se almacena en la unidad de memoria 21 durante una etapa 309.
Queda claro que las etapas 307 pueden ejecutarse antes que las etapas 302, 304, o bien también en paralelo. Cada etapa 308 emplea, en este caso, valores obtenidos durante la etapa 304, y es ejecutada, por lo tanto, posteriormente a esta etapa 304.
El dispositivo de ocultación 20 comprende, además, un módulo de predicción 25 para, en caso de recepción de datos de espacialización considerados como defectuosos, predecir durante una etapa 310 de acuerdo con el modelo
5 identificado por el valor m*, valores de espacialización
Este valor es suministrado a los medios de reconstrucción multicanal 27, los cuales están ahora en condiciones de reconstruir durante la etapa 300 los datos multicanal S'L(k), S'R(k) a pesar de los defectos de los datos de espacialización.
10 Medios de transformación frecuencia-tiempo 28, por ejemplo DSP, permiten recuperar datos de audio temporales S'L(n), S'R(n) a partir de los datos multicanal S'L(k), S'R(k) reconstruidos.
La figura 4 muestra un diagrama que representa un ejemplo de evolución del valor WL(b,n) para la segunda sub15 banda de frecuencias, es decir b=1. En abscisas figura el índice de trama n, y en ordenadas los valores WL(1,n).
Para la parte A que corresponde, de forma grosera, a las tramas entre la 500ª y la 810ª tramas, los valores de WL(1,n) son en su mayor parte iguales a 1, lo que corresponde a una señal sonora relativamente monofónica.
20 Para la parte B, los valores de WL(1,n) corresponden a una señal localizada a la izquierda, mientras que para la parte C, los valores de WL(1,n) corresponden a una señal localizada a la derecha.
Para la parte D, los valores de WL(1,n) corresponden a una pluralidad de fuentes sonoras localizadas en diversos emplazamientos. 25 El mejor modelo de predicción seleccionado puede variar de acuerdo con el tipo de las variaciones de la ganancia.
De este modo, para la parte A, el modelo que consiste en repetir el valor obtenido para la trama precedente conduciría a repetir de forma errónea los picos de valores de WL(1,n). Un modelo más juicioso consistiría en 30 seleccionar un valor arbitrario correspondiente a una señal monocanal, o bien en ponderar la ganancia obtenida para la trama precedente para aproximarse poco a poco a una ganancia de 1.
Por el contrario, para las partes B y C, el enfoque más juicioso puede consistir en repetir el valor de ganancia obtenido para la trama precedente.
35 Para la parte D, cuando la evolución de la ganancia es relativamente lenta y, por lo tanto, relativamente predecible, un enfoque juicioso consistiría en realizar una media ponderada de las ganancias obtenidas para P tramas precedentes. Cuando los parámetros en estéreo evolucionan más rápidamente, el enfoque más juicioso consistiría en volver a una señal monocanal para evitar cualquier artefacto.
40 De este modo, el modelo más juicioso puede cambiar de acuerdo con el tipo de variaciones de la ganancia de una trama a otra. El procedimiento de la figura 3 permite seleccionar, sin intervención humana, el modelo de predicción más adecuado.
45 Esta selección del modelo de predicción más adecuado permite obtener una ocultación de mejor calidad en caso de datos defectuosos.
La figura 5 muestra un ordenador que comprende una pantalla 502, un teclado y una unidad central. Esta unidad central comprende una memoria 500 para almacenar un programa informático que comprende instrucciones 50 correspondientes a las etapas del procedimiento descrito anteriormente. Esta unidad central comprende, además, un procesador 501 conectado a la memoria 500, para ejecutar estas instrucciones.

Claims (9)

  1. REIVINDICACIONES
    1. Procedimiento de procesamiento de datos sonoros, para la reconstrucción de datos de audio multicanal a partir de al menos datos en un número de canales restringido y de datos de espacialización, comprendiendo dicho
    5 procedimiento una etapa de test (306) de validez de datos de espacialización de una trama recibida y, si dicho test muestra que dichos datos de espacialización recibidos son válidos, etapas de:
    a/ mediante un modelo respectivo de una pluralidad de modelos de predicción, predicción de acuerdo con dicho modelo de un valor de espacialización (307), y
    b/ elección de un modelo de predicción, a partir de los valores de espacialización predichos de este modo y, a partir de los datos de espacialización recibidos, para poder, en caso de recepción posterior de datos de espacialización defectuosos, predecir de acuerdo con dicho modelo seleccionado un valor de espacialización y utilizar dicho valor de espacialización predicho para la reconstrucción de los datos de audio multicanal;
    15 y en el que, durante la etapa b/:
    mediante un modelo respectivo de la pluralidad de modelos, se calcula un valor de semejanza
    por un lado, del valor de espacialización predicho según dicho modelo
    un valor estimado (WL(b,n), WR(b,n)) a partir de los datos de espacialización recibidos, y
    se selecciona el modelo de predicción para el cual dicho valor de semejanza indica una mayor adecuación entre el valor de espacialización predicho y dicho valor estimado.
    25 2. Procedimiento de acuerdo con la reivindicación 1, que comprende además, si el test muestra que los datos de espacialización recibidos son válidos, y previamente a la etapa a/, una etapa de almacenamiento de dichos datos de espacialización válidos; y en el que la etapa b/ se realiza en caso de recepción posterior de datos de espacialización defectuosos, a partir de dichos datos de espacialización almacenados.
  2. 3.
    Procedimiento de acuerdo con la reivindicación 2, en el que la etapa a/ se realiza en caso de recepción posterior de datos de espacialización defectuosos, a partir de dichos datos de espacialización almacenados.
  3. 4.
    Procedimiento de acuerdo con la reivindicación 1, en el que las etapas a/ y b/ se realizan sistemáticamente
    después de la recepción de una trama válida, comprendiendo el procedimiento además, después de la etapa b/, una 35 etapa de escritura en memoria de un identificador del modelo de predicción seleccionado.
  4. 5. Procedimiento de acuerdo con la reivindicación 1, en el que el valor de espacialización predicho comprende una ganancia .
  5. 6.
    Procedimiento de acuerdo con la reivindicación 1, en el que el valor de espacialización predicho comprende un retardo.
  6. 7.
    Procedimiento de acuerdo con la reivindicación 1, en el que durante las etapas a/ y b/:
    45 por trama de una secuencia de tramas recibidas, y para al menos un modelo de la pluralidad de modelos, se predice
    de acuerdo con dicho modelo un valor de especialización
    para dicho modelo, el valor de semejanza
    se calcula a partir, por un lado, de la secuencia de valores de espacialización predichos según dicho modelo y, por otro lado, de una secuencia de valores estimados (WL(b,n), WR(b,n)) a partir de los datos de espacialización de la secuencia de tramas recibidas.
  7. 8. Procedimiento de acuerdo con la reivindicación 1, en el que, la etapa a/ se realiza para los datos de espacialización correspondientes a una banda de frecuencias (b) dada.
    55 9. Programa informático que comprende instrucciones para la implementación del procedimiento de acuerdo con la reivindicación 1, cuando dichas instrucciones son ejecutadas por un procesador.
  8. 10. Dispositivo de ocultación (20) de datos de espacialización defectuosos para la reconstrucción de datos de audio multicanal, comprendiendo el dispositivo:
    una unidad de memoria (21) para almacenar una pluralidad de juegos de instrucciones, correspondiendo cada juego de instrucciones a un modelo de predicción,
    medios de recepción para recibir datos de espacialización,
    un módulo de test (22) de la validez de los datos de espacialización recibidos por los medios de recepción,
    un módulo de estimación (23) adecuado para, en caso de recepción de datos de espacialización detectados como 5 válidos por el módulo de test (22), y por juego de instrucciones almacenado en la unidad de memoria, ejecutar dicho juego de instrucciones para predecir un valor de espacialización, y
    un módulo de selección (24) para seleccionar un modelo de predicción, a partir de los valores de espacialización predichos por el módulo de estimación, siendo este módulo de selección adecuado: 10
    • para calcular, mediante modelo respectivo de la pluralidad de modelos, un valor de semejanza
    partir, por un lado, del valor de espacialización predicho según dicho modelo lado, de un valor estimado (WL(b,n), WR(b,n)) a partir de los datos de espacialización recibidos por los medios de recepción, y
    • para seleccionar el modelo de predicción para el cual dicho valor de semejanza indica una mayor adecuación entre el valor de espacialización predicho y dicho valor estimado;
    comprendiendo el dispositivo de ocultación además un módulo de predicción (25) dispuesto para, en caso de 20 recepción posterior de datos de espacialización considerados como defectuosos por el módulo de test (22), predecir un valor de espacialización de acuerdo con dicho modelo seleccionado por el módulo de selección.
  9. 11. Aparato de reconstrucción (26) de datos de audio multicanal, comprendiendo dicho aparato:
    25 medios de reconstrucción multicanal (27), para reconstruir datos de audio multicanal a partir al menos de datos monocanal,
    el dispositivo de ocultación (20) de acuerdo con la reivindicación 10, en el que el módulo de predicción (25) está dispuesto para, en caso de recepción de datos de espacialización considerados como defectuosos por el módulo de 30 test (22), proporcionar el valor de espacialización predicho a los medios de reconstrucción multicanal para la reconstrucción de los datos de audio multicanal.
ES09802568T 2008-07-30 2009-07-03 Reconstrucción de datos de audio multicanal Active ES2387869T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0855249 2008-07-30
FR0855249 2008-07-30
PCT/FR2009/051304 WO2010012927A1 (fr) 2008-07-30 2009-07-03 Reconstruction de donnees audio multicanal

Publications (1)

Publication Number Publication Date
ES2387869T3 true ES2387869T3 (es) 2012-10-03

Family

ID=40276118

Family Applications (1)

Application Number Title Priority Date Filing Date
ES09802568T Active ES2387869T3 (es) 2008-07-30 2009-07-03 Reconstrucción de datos de audio multicanal

Country Status (8)

Country Link
US (1) US8867752B2 (es)
EP (1) EP2319037B1 (es)
JP (1) JP5421367B2 (es)
KR (1) KR101590919B1 (es)
CN (1) CN102138177B (es)
AT (1) ATE557387T1 (es)
ES (1) ES2387869T3 (es)
WO (1) WO2010012927A1 (es)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5333257B2 (ja) * 2010-01-20 2013-11-06 富士通株式会社 符号化装置、符号化システムおよび符号化方法
CN103098131B (zh) * 2010-08-24 2015-03-11 杜比国际公司 调频立体声无线电接收器的间歇单声道接收的隐藏
EP2862166B1 (en) * 2012-06-14 2018-03-07 Dolby International AB Error concealment strategy in a decoding system
US9552818B2 (en) 2012-06-14 2017-01-24 Dolby International Ab Smooth configuration switching for multichannel audio rendering based on a variable number of received channels
CN116665683A (zh) 2013-02-21 2023-08-29 杜比国际公司 用于参数化多声道编码的方法
CN104282309A (zh) * 2013-07-05 2015-01-14 杜比实验室特许公司 丢包掩蔽装置和方法以及音频处理系统
CN107886960B (zh) * 2016-09-30 2020-12-01 华为技术有限公司 一种音频信号重建方法及装置
US10043523B1 (en) 2017-06-16 2018-08-07 Cypress Semiconductor Corporation Advanced packet-based sample audio concealment
US20220199098A1 (en) * 2019-03-29 2022-06-23 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for low cost error recovery in predictive coding
EP4138396A4 (en) * 2020-05-21 2023-07-05 Huawei Technologies Co., Ltd. AUDIO DATA TRANSMISSION METHOD AND DEVICE ASSOCIATED

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4111131C2 (de) * 1991-04-06 2001-08-23 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen digitalisierter Tonsignale
US6006173A (en) * 1991-04-06 1999-12-21 Starguide Digital Networks, Inc. Method of transmitting and storing digitized audio signals over interference affected channels
DE19526366A1 (de) * 1995-07-20 1997-01-23 Bosch Gmbh Robert Verfahren zur Redundanzreduktion bei der Codierung von mehrkanaligen Signalen und Vorrichtung zur Dekodierung von redundanzreduzierten, mehrkanaligen Signalen
US6181800B1 (en) * 1997-03-10 2001-01-30 Advanced Micro Devices, Inc. System and method for interactive approximation of a head transfer function
US6154452A (en) * 1999-05-26 2000-11-28 Xm Satellite Radio Inc. Method and apparatus for continuous cross-channel interleaving
JP2004531925A (ja) * 2001-03-05 2004-10-14 インタービデオインコーポレイテッド 圧縮されたビデオビットストリームにおける冗長な動きベクトルを符号化し復号するシステム及び方法
SE527866C2 (sv) * 2003-12-19 2006-06-27 Ericsson Telefon Ab L M Kanalsignalmaskering i multikanalsaudiosystem
US7835916B2 (en) 2003-12-19 2010-11-16 Telefonaktiebolaget Lm Ericsson (Publ) Channel signal concealment in multi-channel audio systems
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
SE0402651D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
KR20080015878A (ko) * 2005-05-25 2008-02-20 코닌클리케 필립스 일렉트로닉스 엔.브이. 복수 채널 신호의 예측 엔코딩

Also Published As

Publication number Publication date
JP5421367B2 (ja) 2014-02-19
KR101590919B1 (ko) 2016-02-02
WO2010012927A1 (fr) 2010-02-04
US8867752B2 (en) 2014-10-21
CN102138177A (zh) 2011-07-27
JP2011529579A (ja) 2011-12-08
US20110129092A1 (en) 2011-06-02
EP2319037A1 (fr) 2011-05-11
CN102138177B (zh) 2014-05-28
KR20110065447A (ko) 2011-06-15
ATE557387T1 (de) 2012-05-15
EP2319037B1 (fr) 2012-05-09

Similar Documents

Publication Publication Date Title
ES2387869T3 (es) Reconstrucción de datos de audio multicanal
JP6735053B2 (ja) マルチチャネル符号化におけるステレオ充填装置及び方法
TWI415113B (zh) 用以把向下混合音訊信號向上混合之向上混合器、方法與電腦程式
ES2511390T3 (es) Aparato, procedimiento y programa de computación para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavización de valor de fase
JP2019080347A (ja) パラメトリック・マルチチャネル・エンコードのための方法
BR112013004362B1 (pt) aparelho para a geração de um sinal descorrelacionado utilizando informação de fase transmitida
BR112013018362B1 (pt) codificação e decodificação de posições de intervalo de eventos em um quadro de sinal de áudio
EP2879131A1 (en) Decoder, encoder and method for informed loudness estimation in object-based audio coding systems
ES2703327T3 (es) Codificador, decodificador y métodos para codificación espacial de objetos de audio de multirresolución retrocompatible
BRPI0605641B1 (pt) equipamento e método para a geração de sinal de controle sintetizador multicanais e equipamento e método para sintetizar multicanais
BR112012007138B1 (pt) Decodificador de sinal de áudio, codificador de sinal de áudio, método para prover uma representação de mescla ascendente de sinal, método para prover uma representação de mescla descendente de sinal e fluxo de bits usando um valor de parâmetro comum de correlação intra- objetos
BRPI1005299B1 (pt) aparelho e método para realizar o upmmix em um sinal de áudio downmix
BR112015000247B1 (pt) Decodificador, método de decodificação, codificador, método de codificação, e sistema de codificação e decodificação.
JP7471326B2 (ja) パラメータの符号化および復号
CA3017405C (en) Encoding apparatus for processing an input signal and decoding apparatus for processing an encoded signal
ES2691546T3 (es) Aparato y procedimiento para la codificación de objetos de audio espacial que emplea objetos ocultos para la manipulación de mezclas de señales
KR102469964B1 (ko) 서브대역 그룹들에 대한 서브대역 구성 데이터를 코딩하거나 디코딩하는 방법 및 장치
ES2624668T3 (es) Codificación y descodificación de objetos de audio
TWI843389B (zh) 音訊編碼器、降混訊號產生方法及非暫時性儲存單元
CN113614827B (zh) 用于预测性译码中的低成本错误恢复的方法和设备
ES2737889T3 (es) Codificador, decodificador, procedimiento de codificación, procedimiento de decodificación y programa
Melkote et al. A modified distortion metric for audio coding
KR20230035089A (ko) 패킷 손실 은닉
BR112017006278B1 (pt) Método para aprimorar o diálogo num decodificador em um sistema de áudio e decodificador
de Vries et al. Applying cochlear modeling and psychoacoustics in room acoustics