ES2553398T3 - Codificador paramétrico para codificar una señal de audio multicanal - Google Patents

Codificador paramétrico para codificar una señal de audio multicanal Download PDF

Info

Publication number
ES2553398T3
ES2553398T3 ES10859153.8T ES10859153T ES2553398T3 ES 2553398 T3 ES2553398 T3 ES 2553398T3 ES 10859153 T ES10859153 T ES 10859153T ES 2553398 T3 ES2553398 T3 ES 2553398T3
Authority
ES
Spain
Prior art keywords
audio signal
parameter
transformed
signal
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES10859153.8T
Other languages
English (en)
Inventor
Christof Faller
Lei Miao
Yue Lang
Jianfeng Xu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Application granted granted Critical
Publication of ES2553398T3 publication Critical patent/ES2553398T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Abstract

Un codificador paramétrico para codificar una señal de audio multicanal que está compuesta por una primera señal de audio y una segunda señal de audio, teniendo el codificador paramétrico: un transformador (101) para transformar la primera señal de audio en el dominio de la frecuencia con el fin de obtener una primera señal de audio transformada, y para transformar la segunda señal de audio en el dominio de la frecuencia con el fin de obtener una segunda señal de audio transformada; un generador (107) de parámetros para generar un primer parámetro de codificación, X(i), a partir de la primera señal de audio transformada y a partir de la segunda señal de audio transformada en una primera banda i de frecuencia, y para generar un segundo parámetro de codificación, X(j), a partir de la primera señal de audio transformada y de la segunda señal de audio transformada en una segunda banda j de frecuencia; y un combinador (109) de parámetros para combinar el primer parámetro de codificación y el segundo parámetro de codificación con el fin de obtener un parámetro de codificación combinado, X, de acuerdo con la fórmula**Fórmula** en donde el parámetro I denota un conjunto de índices de bandas de frecuencia, el parámetro gi es un coeficiente de ponderación asignado a una banda i de frecuencia, el parámetro P1(i) denota una potencia de señal de la primera señal de audio en la banda i-ésima de frecuencia, el parámetro P2(i) denota una potencia de señal de la segunda señal de audio en la banda i-ésima de frecuencia, y en donde el primer parámetro de codificación, X(i), y el segundo parámetro de codificación, X(j), son una diferencia de fase entre canales o una coherencia entre canales o una diferencia de intensidad entre canales o una diferencia de nivel entre canales.

Description

5
10
15
20
25
30
35
40
45
50
55
DESCRIPCION
Codificador parametrico para codificar una senal de audio multicanal Campo de la invencion
La presente invencion esta relacionada con la codificacion de audio.
Antecedentes de la invencion
La codificacion de audio multicanal o estereo parametrico, tal como se describe por ejemplo en C. Faller y F. Baumgarte, "Efficient representation of spatial audio using perceptual parametrization (Representacion eficiente de audio espacial mediante parametrizacion perceptual)", en Proc. lEEE Workshop on Appl. of Sig. Proc. to Audio and Acoust. (Actas de las Jornadas de Trabajo del IEEE sobre Aplicaciones del Procesamiento de Senales de Audio y Acustica), Octubre de 2001, paginas 199-202, utiliza cues (referencias) espaciales para sintetizar senales de audio downmix (mezcladas para reducir los canales) - normalmente mono o estereo - en senales con mas canales. Generalmente, las senales de audio downmix son el resultado de una superposicion de una pluralidad de senales de canales de audio de una senal de audio multicanal, por ejemplo, de una senal de audio estereo. Este menor numero de canales estan codificados en forma de onda y a los canales de audio codificados se les anade, como parametros de codificacion, informacion complementaria, esto es, las cue espaciales relativas a las relaciones de los canales de las senales originales. El descodificador utiliza esta informacion complementaria para regenerar el numero original de canales de audio a partir de los canales de audio codificados en forma de onda descodificados.
Un codificador estereo parametrico basico puede utilizar las diferencias de nivel entre canales (ILD) como una cue necesaria para generar la senal estereo a partir de la senal downmix de audio mono. Los codificadores mas sofisticados tambien pueden utilizar la coherencia entre canales (ICC), que puede representar un grado de similitud entre las senales de los canales de audio, esto es, los canales de audio. Adicionalmente, cuando se codifican senales estereo biaural, por ejemplo, para reproduccion de audio 3D o sonido envolvente a traves de auriculares, para reproducir las diferencias de fase/retardo entre los canales tambien puede desempenar la funcion de una diferencia de fase entre canales (IPD).
La smtesis de las cue de ICC puede ser relevante para la mayona de los contenidos de audio y musicales para regenerar el ambiente, la reverberacion estereo, la amplitud de la fuente y otras percepciones relacionadas con la impresion espacial, tal como se describe en J. Blauert, Spatial Hearing: The Psychophysics of Human Sound Localization (Audicion Espacial: La Psicoffsica de la Localizacion de Sonidos por Humanos), The MIT Press, Cambridge, Massachusetts, EE.UU., 1997. La smtesis de coherencia se puede implementar mediante la utilizacion de descorreladores en el dominio de la frecuencia, tal como se describe en E. Schuijers, W. Oomen, B. den Brinker, y J. Breebaart, "Advances in parametric coding for high-quality audio (Avances en codificacion parametrica para audio de alta calidad)", en Preprint 114th Conv. Aud. Eng. Soc. (Publicacion preliminar de la 114a Convencion de la Sociedad de Ingeniena de Audio), marzo de 2003. Sin embargo, los enfoques de smtesis conocidos para sintetizar las senales de audio multicanal pueden tener una mayor complejidad. Ademas, la utilizacion de los parametros de ICC, por ejemplo ademas de otros parametros, tales como los de diferencia de nivel entre canales (ICLD) y los de diferencia de fase entre canales (ICPD), puede incrementar excesivamente la tasa de bits.
El documento US 2005/180579 A1 divulga un esquema para la smtesis estereo y multicanal de cues de correlacion entre canales (ICC) (correlacion cruzada normalizada) para la codificacion de estereo parametrico y multicanal. El esquema sintetiza las cue de ICC de tal modo que se aproxima a la del original. A tal efecto se generan canales de audio difuso y se mezclan con la(s) senal(es) combinada(s) (por ejemplo, mediante suma) transmitida(s). Los canales de audio difuso se generan preferiblemente utilizando filtros relativamente largos con respuestas de pulsos Gaussianos que decrecen exponencialmente. Estas respuestas de pulsos generan un sonido difuso parecido a la reverberacion posterior. Para reducir la complejidad del calculo se propone una implementacion alternativa en la que la diferencia de nivel entre canales (ICLD), la diferencia de tiempo entre canales (ICTD) y la smtesis de la ICC se realizan todas en el dominio de una unica transformada de Fourier de tiempo corto (STFT), incluyendo el filtrado para la generacion del sonido difuso.
El documento WO 2003/219130 A1 divulga un dispositivo de combinacion que incluye: una unidad de deteccion que detecta flujos de bits codificados activos que son flujos de bits codificados efectivos a partir de una pluralidad de flujos de bits codificados a lo largo de un penodo de tiempo predeterminado; una primera unidad de combinacion que combina, a partir de una pluralidad de flujos de bits downmix incluidos en los flujos de bits codificados, unicamente los flujos de bits downmix incluidos en los flujos de bits codificados activos, con el fin de generar un flujo de bits downmix combinado; y una segunda unidad de combinacion que combina, a partir de una pluralidad de flujos de bits de parametros incluidos en los flujos de bits codificados, unicamente los flujos de bits de parametros incluidos en los flujos de bits codificados activos, con el fin de generar un flujo de bits de parametros combinado.
El documento US 2003/219130 A1 divulga una escena auditiva sintetizada a partir de una senal de audio mono modificando, para cada una de las bandas cnticas, un parametro de la escena auditiva (por ejemplo, una diferencia
5
10
15
20
25
30
35
40
45
50
de nivel interaural (ILD) y/o una diferencia de tiempo interaural (ITD)) para cada una de las subbandas dentro de la banda cntica, en donde la modificacion se basa en el promedio de la coherencia calculada para la banda cntica. La modificacion basada en la coherencia da lugar a escenas auditivas que tienen objetos cuya amplitud coincide de forma mas precisa con la amplitud de los objetos en la escena auditiva original de entrada.
Resumen de la invencion
Uno de los objetivos que se debe conseguir mediante la presente invencion es reducir la complejidad de un esquema de codificacion parametrica. Este objetivo se logra mediante las caractensticas de las reivindicaciones independientes. A partir de la descripcion, los dibujos y las reivindicaciones dependientes resultan evidentes otros modos de realizacion adicionales.
La invencion se basa en el descubrimiento de que la combinacion de parametros de codificacion parametrica, como por ejemplo los parametros de ICC, puede reducir la tasa de bits necesaria para representar los parametros y de este modo se puede reducir la complejidad del esquema de codificacion parametrica resultante. Los parametros de codificacion combinados se pueden aplicar, por ejemplo, solo a una region de frecuencia determinada con el fin de mejorar la calidad de audio para, por ejemplo, la senal de voz, mediante lo cual se pueden reducir aun mas la complejidad y los requisitos de memoria.
La invencion se describe en las reivindicaciones independientes 1 y 6. Los modos de realizacion adicionales se definen en las reivindicaciones dependientes 2-5.
De acuerdo con una primera forma de implementacion, el primer y el segundo parametros de codificacion pueden ser una diferencia de fase entre canales.
De acuerdo con una segunda forma de implementacion, el primer y el segundo parametros de codificacion pueden ser una coherencia entre canales.
De acuerdo con una tercera forma de implementacion, el primer y el segundo parametros de codificacion pueden ser una diferencia de intensidad entre canales.
De acuerdo con una cuarta forma de implementacion, el primer y el segundo parametros de codificacion pueden ser una diferencia de nivel entre canales.
De acuerdo con una quinta forma de implementacion, el generador de parametros esta configurado para generar el primer parametro de codificacion y el segundo parametro de codificacion a partir de la multiplicacion de los valores de la primera senal de audio transformada y de la segunda senal de audio transformada.
De acuerdo con una sexta forma de implementacion, el combinador de parametros esta configurado para determinar una media ponderada del primer parametro de codificacion y el segundo parametro de codificacion mediante la utilizacion de potencias de una primera senal de audio transformada y la segunda senal de audio transformada en la frecuencia determinada como coeficientes de ponderacion con el fin de obtener los parametros de codificacion combinados.
De acuerdo con una septima forma de implementacion, el combinador de parametros esta configurado para determinar una media ponderada del primer parametro de codificacion y el segundo parametro de codificacion mediante la utilizacion de un coeficiente de ponderacion dependiente de la frecuencia con el fin de obtener los parametros de codificacion combinados.
De acuerdo con una octava forma de implementacion, el generador de parametros esta configurado para generar una pluralidad de parametros de codificacion a partir de la primera senal de audio transformada y a partir de la segunda senal de audio transformada en una pluralidad de frecuencias, y en donde el combinador de parametros esta configurado para combinar la pluralidad de parametros de codificacion con el fin de obtener el parametro de codificacion combinado.
De acuerdo con una novena forma de implementacion, el codificador parametrico comprende, ademas, un combinador de senales para combinar la primera senal de audio transformada y la segunda senal de audio transformada para obtener una senal downmix.
De acuerdo con una decima forma de implementacion, el codificador parametrico comprende, ademas, un transformador inverso para la transformacion inversa de una combinacion de la primera senal de audio transformada y la segunda senal de audio transformada para obtener una senal downmix de audio.
De acuerdo con un segundo aspecto, la invencion esta relacionada con un metodo para codificar de forma parametrica una senal de audio multicanal que esta compuesta por una primera senal de audio y una segunda senal de audio, consistiendo el metodo en transformar la primera senal de audio en el dominio de la frecuencia para obtener una primera senal de audio transformada, y transformar la segunda senal de audio en el dominio de la
5
10
15
20
25
30
35
40
45
50
frecuencia para obtener una segunda senal de audio transformada, generar un primer parametro de codificacion a partir de la primera senal de audio transformada y a partir de la segunda senal de audio transformada en una primera frecuencia, y generar un segundo parametro de codificacion a partir de la primera senal de audio transformada y a partir de la segunda senal de audio transformada en una segunda frecuencia, y combinar el primer parametro de codificacion y el segundo parametro de codificacion para obtener un parametro de codificacion combinado.
A partir de la funcionalidad del codificador parametrico de acuerdo con el primer aspecto se pueden deducir directamente pasos adicionales del metodo de las formas de implementacion de acuerdo con el segundo aspecto
Breve descripcion de los dibujos
A continuacion se describiran modos de realizacion de la invencion haciendo referencia a los siguientes dibujos, en los que:
la Fig. 1 muestra un diagrama de bloques de un codificador parametrico de acuerdo con una forma de implementacion;
la Fig. 2 muestra un diagrama de bloques de un descodificador parametrico de acuerdo con una forma de implementacion;
la Fig. 3 muestra un diagrama de un metodo para codificacion parametrica de acuerdo con una forma de implementacion; y
la Fig. 4 muestra un diagrama de un metodo para descodificacion parametrica de acuerdo con una forma de implementacion.
Descripcion detallada de los modos de realizacion
La Fig. 1 muestra un diagrama de un codificador parametrico para codificar una senal de audio multicanal que esta compuesta por una primera senal de audio, x1, y una segunda senal de audio, x2, de acuerdo con una forma de implementacion. El codificador parametrico comprende un transformador 101 para transformar la primera senal de audio en el dominio de la frecuencia con el fin de obtener una primera senal de audio transformada, y para transformar la segunda senal de audio en el dominio de la frecuencia con el fin de obtener una segunda senal de audio transformada. El transformador 101 puede comprender un primer transformador 103 para transformar la primera senal de audio, y un segundo transformador 105 para transformar la segunda senal de audio. A modo de ejemplo, el transformador 101 y/o los transformadores 103, 105 pueden ser transformadores de Fourier. La primera y la segunda senales de audio transformadas se le suministran a un generador 107 de parametros para generar un primer parametro de codificacion a partir de la primera senal transformada y a partir de la segunda senal de audio transformada en una primera frecuencia, por ejemplo, en la frecuencia i-esima o en la banda i-esima. La banda i- esima o "banda i" (vease tambien en la Fig. 1) se refiere a una banda de frecuencia i donde o en la que el generador 107 de parametros genera el parametro de codificacion respectivo a partir de la primera y la segunda senales transformadas, y tambien se conoce como banda i de parametros. El generador 107 de parametros esta configurado, ademas, para generar un segundo parametro de codificacion a partir de la primera y la segunda senales de audio transformadas en una segunda frecuencia o en una segunda banda. El primer y el segundo parametros de codificacion se le suministran al combinador 109 de parametros, el cual combina el primer parametro de codificacion y el segundo parametro de codificacion con el fin de obtener un parametro de codificacion combinado de acuerdo con un principio descrito en la presente solicitud. No obstante, el combinador 109 de parametros puede obtener por separado los parametros de codificacion para diferentes bandas de parametros.
Haciendo referencia a la Fig. 1 y a los parametros de ICC que forman un modo de realizacion de los parametros de codificacion, los canales de audio estereo de entrada x1 y x2, por ejemplo, se convierten en una pluralidad de subbandas o bandas de parametros. Los parametros de ICC correspondientes se pueden calcular en todas o en un subconjunto de las bandas de parametros. Para calcular los parametros de ICC combinados, a los parametros de ICC de todas o algunos subconjuntos de bandas de parametros se les pueden aplicar uno o mas de los procesos que combinan parametros de ICC, por ejemplo, uno de los procesos de acuerdo con las ecuaciones (1)-(4). Al menos un parametro de ICC combinado se puede insertar en un flujo de bits 111 o se puede transmitir a un descodificador de audio que no se ilustra en la Fig. 1.
En relacion con los ICC que conforman un modo de realizacion de un parametro de codificacion, a continuacion se describen a modo de ejemplo los siguientes modos de realizacion.
Se debe entender, sin embargo, que el parametro de codificacion puede ser cualquier parametro de codificacion o pertenecer a cualquier tipo de parametro de codificacion utilizado para la codificacion parametrica, por ejemplo, la diferencia de fase entre canales o la diferencia de intensidad entre canales o una diferencia de nivel entre canales o similares, y que el codificador puede estar adaptado para producir parametros de codificacion combinados en
5
10
15
20
25
30
35
funcion de uno, algunos o todos los tipos de parametros de codificacion antes mencionados y para incluir como informacion complementaria en el flujo de bits 111 parametros de codificacion combinados de diferentes tipos.
El codificador parametrico de la Fig. 1 puede formar un codificador estereo parametrico que calcula parametros cue espaciales de percepcion, como el ICLD, el ICPD, y/o el ICC, en bandas de parametros. Si el mdice de la banda de parametros es i, entonces los parametros calculados en esa banda se designan mediante ICLD(i), ICPD(i) e ICC(i). Las potencias de la senal izquierda y derecha en una banda de parametros se denotan mediante P-i(i) y P2O), respectivamente.
A este respecto se pueden calcular uno o mas parametros de ICC combinados, por ejemplo, como un promedio
ICC = — £ ICC(t) (1)
NI ieI
en donde I es el conjunto de indices de las bandas de parametros de las cuales se utilizan los ICC para calcular el parametro de ICC combinado, y Ni es el numero de indices en el conjunto I.
Otra forma de calcular un parametro de ICC combinado consiste en utilizar un promedio ponderado, esto es,
ICC =
£ (p(t) + P2(0)ICC(0
ieI_________________
£ (poi) + P2(i))
ie I
(2)
en donde P1(i) denota una potencia de senal de la primera senal de canal de audio en la banda i-esima, y en donde P2(i) denota una potencia de senal de la segunda senal del canal de audio en la banda i-esima.
Ademas, al calcular el ICC combinado las diferentes bandas de parametros (frecuencias) se pueden ponderar de forma diferente:
ICC =
£ gt (p(t) + p(/))ICC(0
ieI___________________
£ gt (p(t) + p(t))
ie I
(3)
en donde gi es un coeficiente de ponderacion para la frecuencia (banda de parametros) i.
Otro ejemplo emplea un promedio en funcion no de la potencia sino de la ponderacion de la frecuencia. Ademas, al calcular el ICC combinado las diferentes bandas de parametros (frecuencias) se pueden ponderar de forma diferente:
£ gtICC(i)
ICC = ------- (4)
£ gi
Un unico ICC para toda la banda se comporta sorprendentemente bien. En este caso, el ICC combinado se calcula utilizando todas las bandas de parametros, esto es, I contiene los indices de todas las bandas de parametros.
De acuerdo con algunas formas de implementacion se puede mejorar la calidad de la voz utilizando unicamente los ICC en un rango de frecuencia limitado. Cuando para generar los parametros de ICC se utilizan unicamente bandas de parametros entre 500 Hz y 1,5 kHz, se producen menos artefactos. En este caso, el ICC combinado se calcula utilizando unicamente las bandas de parametros entre 500 Hz y 1,5 kHz, esto es, I solo contiene esos indices.
De acuerdo con algunas formas de implementacion, el codificador parametrico que se muestra en la Fig. 1 puede calcular uno o mas parametros de ICC combinados:
(a) combinando los parametros de ICC de una pluralidad de bandas de parametros en un parametro de ICC combinado,
(b) insertando los parametros de ICC combinados en un flujo de bits, y
(c) emitiendo como salida la corriente de bits.
5
10
15
20
25
30
35
40
45
50
55
La Fig. 2 muestra un diagrama de bloques de un codificador parametrico para descodificar una senal de audio downmix de acuerdo con una forma de aplicacion. La senal downmix puede ser proporcionada por el codificador parametrico, tal como se muestra, por ejemplo, en la Fig. 1. El descodificador parametrico comprende un transformador 201 para transformar la senal downmix de audio con el fin de obtener una senal downmix de audio transformada que tiene una frecuencia determinada, por ejemplo, una frecuencia i-esima de una pluralidad de frecuencias, o, en correspondencia, una banda determinada, por ejemplo, una banda i-esima de una pluralidad de bandas. El descodificador parametrico comprende, ademas, un proveedor 203 para proporcionar un parametro de codificacion de frecuencia espedfica asociado a la frecuencia determinada. El parametro de codificacion de frecuencia espedfica se puede obtener a partir del parametro de codificacion combinado. No obstante, el parametro de codificacion de frecuencia espedfica puede corresponder al parametro de codificacion combinado. El descodificador parametrico comprende, ademas, un sintetizador 205 de audio, por ejemplo, un sintetizador estereo, para sintetizar una primera senal de audio y una segunda senal de audio en la frecuencia determinada o en la banda determinada a partir de la senal downmix de audio transformada proporcionada por el transformador 201 utilizando el parametro de codificacion de frecuencia espedfica tal como lo proporciona el proveedor 203.
De acuerdo con algunas formas de implementacion, el transformador 201 puede ser un transformador de Fourier, en donde el sintetizador de audio puede sintetizar la primera y la segunda senales de audio en el dominio de la frecuencia. Asf pues, la senal de salida proporcionada por el sintetizador 205 puede corresponder a la primera y a la segunda senales del canal de audio. Sin embargo, de acuerdo con algunas formas de implementacion, el codificador parametrico puede comprender, ademas, un transformador inverso 207 para la transformacion inversa de la primera y la segunda senales del canal de audio en el dominio del tiempo con el fin de obtener una primera y una segunda senales del canal de audio, x1 y x2, en el dominio del tiempo.
El descodificador parametrico que se muestra en la Fig. 1 utiliza el parametro de ICC combinado o una version modificada del mismo para todas las bandas de parametros, o un subconjunto J de las mismas. Se puede utilizar en el descodificador el mismo subconjunto de bandas de parametros que en el codificador, esto es, J=I, o un subconjunto diferente.
Con respecto a la Fig. 2, el descodificador parametrico puede recibir la senal downmix s y los parametros de estereo, esto es, los parametros de codificacion, entre los cuales se puede recibir al menos un parametro de ICC combinado. Para al menos una banda parametros se utiliza un parametro de ICC obtenido a partir de parametros de ICC combinados. A algunas bandas no se les puede aplicar la smtesis de ICC.
De acuerdo con una forma de implementacion, cuando se utiliza un ICC combinado para la "Combined ICC to Band ICC Conversion (Conversion de ICC Combinado a ICC de Banda)", el ICC combinado se aplica a todas las bandas de parametros. O, si el ICC combinado se ha calculado unicamente para un subconjunto de bandas, J, entonces el descodificador puede aplicar el ICC combinado a todas las bandas, al mismo subconjunto, o a otro subconjunto, por ejemplo, un subconjunto del mismo subconjunto.
Si se utilizan dos ICC combinados, representan dos regiones de frecuencia distintas de la senal de audio. El descodificador puede aplicar los ICC combinados a las bandas de parametros correspondientes a las regiones de frecuencia a partir de las cuales se calcularon los ICC combinados.
La Fig. 3 muestra un diagrama de un metodo para codificar de forma parametrica una senal de audio multicanal compuesta por la primera y la segunda senales de audio tal como se ha mencionado mas arriba. El metodo comprende transformar 301 la primera y la segunda senales de audio en el dominio de la frecuencia para obtener una primera y una segunda senales de audio transformadas, generar 303 un primer parametro de codificacion a partir de la primera y la segunda senales de audio transformadas en una primera frecuencia, y un segundo parametro de codificacion a partir de la primera y la segunda senales de audio transformadas en una segunda frecuencia, y combinar 305 el primer y el segundo parametros de codificacion para obtener un parametro de codificacion combinado. A modo de ejemplo, el metodo que se ilustra en la Fig. 3 puede ser utilizado por el codificador parametrico que se muestra en la Fig. 1.
La Fig. 4 muestra un diagrama de bloques de un metodo para descodificar de forma parametrica una senal downmix de audio a partir de un parametro de codificacion combinado. La senal downmix de audio puede representar una combinacion, por ejemplo una superposicion, de una primera y una segunda senales de audio. El parametro de codificacion combinado puede tener unas caractensticas tal como se han descrito mas arriba.
El metodo comprende transformar 401 la senal downmix de audio para obtener una senal downmix de audio transformada que tiene una cierta frecuencia, proporcionar 403 un parametro de codificacion de frecuencia espedfica asociado a la frecuencia determinada a partir del parametro de codificacion combinado, de acuerdo con el principio descrito en la presente solicitud, y sintetizar 405 la primera y la segunda senales de audio en la frecuencia determinada a partir de la senal downmix de audio transformada y a partir del parametro de codificacion de frecuencia espedfica.
De acuerdo con algunas formas de implementacion, el metodo que se ilustra en la Fig. 4 puede ser utilizado por el descodificador parametrico como se muestra en la Fig. 2.
De acuerdo con algunas formas de implementacion, el descodificador parametrico que se muestra en la Fig. 2 puede ser un descodificador parametrico estereo adaptado para
5 (a) recibir uno o mas parametros de ICC combinados, y
(b) utilizar, para al menos una banda de parametros, un parametro de ICC relacionado con los parametros de ICC combinado recibidos.

Claims (6)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    REIVINDICACIONES
    1. Un codificador parametrico para codificar una senal de audio multicanal que esta compuesta por una primera senal de audio y una segunda senal de audio, teniendo el codificador parametrico:
    un transformador (101) para transformar la primera senal de audio en el dominio de la frecuencia con el fin de obtener una primera senal de audio transformada, y para transformar la segunda senal de audio en el dominio de la frecuencia con el fin de obtener una segunda senal de audio transformada;
    un generador (107) de parametros para generar un primer parametro de codificacion, X(i), a partir de la primera senal de audio transformada y a partir de la segunda senal de audio transformada en una primera banda i de frecuencia, y para generar un segundo parametro de codificacion, X(j), a partir de la primera senal de audio transformada y de la segunda senal de audio transformada en una segunda banda j de frecuencia; y
    un combinador (109) de parametros para combinar el primer parametro de codificacion y el segundo parametro de codificacion con el fin de obtener un parametro de codificacion combinado, X, de acuerdo con la formula
    (P0) + P0))x (i)
    LeISi (PiV + P2(0)
    en donde el parametro I denota un conjunto de indices de bandas de frecuencia, el parametro gi es un coeficiente de ponderacion asignado a una banda i de frecuencia, el parametro P-i(i) denota una potencia de senal de la primera senal de audio en la banda i-esima de frecuencia, el parametro P2(i) denota una potencia de senal de la segunda senal de audio en la banda i-esima de frecuencia,
    y en donde el primer parametro de codificacion, X(i), y el segundo parametro de codificacion, X(j), son una diferencia de fase entre canales o una coherencia entre canales o una diferencia de intensidad entre canales o una diferencia de nivel entre canales.
  2. 2. El codificador parametrico de la reivindicacion 1, en el que el generador (107) de parametros esta configurado para generar el primer parametro de codificacion y el segundo parametro de codificacion mediante la multiplicacion de los valores de la primera senal de audio transformada y de la segunda senal de audio transformada.
  3. 3. El codificador parametrico de una cualquiera de las reivindicaciones 1 a 2, en el que el generador (107) de parametros esta configurado para generar una pluralidad de parametros de codificacion a partir de la primera senal de audio transformada y a partir de la segunda senal de audio transformada en una pluralidad de bandas de frecuencia
    y en el que
    el combinador de parametros esta configurado para combinar la pluralidad de los parametros de codificacion con el fin de obtener el parametro de codificacion combinado.
  4. 4. El codificador parametrico de una cualquiera de las reivindicaciones 1 a 3, que esta configurado, ademas, para combinar la primera senal de audio transformada y la segunda senal de audio transformada con el fin de obtener una senal downmix (mezcladas para reducir los canales).
  5. 5. El codificador parametrico de una cualquiera de las reivindicaciones 1 a 4, que comprende, ademas, un transformador inverso para la transformacion inversa de una combinacion de la primera senal de audio transformada y la segunda senal de audio transformada con el fin de obtener una senal downmix de audio.
  6. 6. Un metodo para codificar de forma parametrica una senal de audio multicanal que esta compuesta por una primera senal de audio y una segunda senal de audio, en donde el metodo esta configurado para utilizar un codificador parametrico de acuerdo con las reivindicaciones precedentes.
ES10859153.8T 2010-11-03 2010-11-03 Codificador paramétrico para codificar una señal de audio multicanal Active ES2553398T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2010/078358 WO2012058805A1 (en) 2010-11-03 2010-11-03 Parametric encoder for encoding a multi-channel audio signal

Publications (1)

Publication Number Publication Date
ES2553398T3 true ES2553398T3 (es) 2015-12-09

Family

ID=46023928

Family Applications (1)

Application Number Title Priority Date Filing Date
ES10859153.8T Active ES2553398T3 (es) 2010-11-03 2010-11-03 Codificador paramétrico para codificar una señal de audio multicanal

Country Status (4)

Country Link
EP (1) EP2633520B1 (es)
CN (1) CN102844808B (es)
ES (1) ES2553398T3 (es)
WO (1) WO2012058805A1 (es)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102739320B (zh) * 2012-06-16 2014-11-05 天地融科技股份有限公司 音频数据传输方法、系统、传输装置及电子签名工具
PL2883225T3 (pl) 2012-08-10 2017-10-31 Fraunhofer Ges Forschung Koder, dekoder, układ i sposób, wykorzystujące koncepcje resztki dla parametrycznego kodowania obiektów audio
CN109509478B (zh) 2013-04-05 2023-09-05 杜比国际公司 音频处理装置
US9838819B2 (en) * 2014-07-02 2017-12-05 Qualcomm Incorporated Reducing correlation between higher order ambisonic (HOA) background channels
MY188370A (en) * 2015-09-25 2021-12-06 Voiceage Corp Method and system for decoding left and right channels of a stereo sound signal
CN107452387B (zh) 2016-05-31 2019-11-12 华为技术有限公司 一种声道间相位差参数的提取方法及装置
CN117292695A (zh) 2017-08-10 2023-12-26 华为技术有限公司 时域立体声参数的编码方法和相关产品
GB2576769A (en) 2018-08-31 2020-03-04 Nokia Technologies Oy Spatial parameter signalling
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding
CN110740404B (zh) * 2019-09-27 2020-12-25 广州励丰文化科技股份有限公司 一种音频相关性的处理方法及音频处理装置
CN112731289A (zh) * 2020-12-10 2021-04-30 深港产学研基地(北京大学香港科技大学深圳研修院) 一种基于加权模板匹配的双耳声源定位方法和装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
KR20060090984A (ko) * 2003-09-29 2006-08-17 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 신호들을 엔코딩하는 방법 및 장치
US20100121632A1 (en) * 2007-04-25 2010-05-13 Panasonic Corporation Stereo audio encoding device, stereo audio decoding device, and their method
CN100571043C (zh) * 2007-11-06 2009-12-16 武汉大学 一种空间参数立体声编解码方法及其装置
US8060042B2 (en) * 2008-05-23 2011-11-15 Lg Electronics Inc. Method and an apparatus for processing an audio signal
BRPI0905069A2 (pt) * 2008-07-29 2015-06-30 Panasonic Corp Aparelho de codificação de áudio, aparelho de decodificação de áudio, aparelho de codificação e de descodificação de áudio e sistema de teleconferência
WO2010090019A1 (ja) * 2009-02-04 2010-08-12 パナソニック株式会社 結合装置、遠隔通信システム及び結合方法

Also Published As

Publication number Publication date
CN102844808B (zh) 2016-01-13
EP2633520A1 (en) 2013-09-04
WO2012058805A1 (en) 2012-05-10
CN102844808A (zh) 2012-12-26
EP2633520B1 (en) 2015-09-02
EP2633520A4 (en) 2013-09-04

Similar Documents

Publication Publication Date Title
ES2553398T3 (es) Codificador paramétrico para codificar una señal de audio multicanal
US11647333B2 (en) Audio decoder for audio channel reconstruction
ES2313646T3 (es) Codificacion y descodificacion de audio.
ES2682073T3 (es) Codificación conjunta paramétrica de fuentes de audio
ES2636808T3 (es) Codificación de escenas de audio
EP2088580A2 (en) Audio encoding and decoding
US8626503B2 (en) Audio encoding and decoding
TWI352511B (en) Method and apparatus for decoding a signal