ES2555136T3 - Codificador paramétrico para codificar una señal de audio multicanal - Google Patents

Codificador paramétrico para codificar una señal de audio multicanal Download PDF

Info

Publication number
ES2555136T3
ES2555136T3 ES12707055.5T ES12707055T ES2555136T3 ES 2555136 T3 ES2555136 T3 ES 2555136T3 ES 12707055 T ES12707055 T ES 12707055T ES 2555136 T3 ES2555136 T3 ES 2555136T3
Authority
ES
Spain
Prior art keywords
audio
signal
audio channel
channel signal
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES12707055.5T
Other languages
English (en)
Inventor
Yue Lang
David Virette
Jianfeng Xu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Application granted granted Critical
Publication of ES2555136T3 publication Critical patent/ES2555136T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un codificador de audio paramétrico (100) para generar un parámetro de codificación (ICC) para una señal de canal de audio (X1[b]) de una pluralidad de señales de canales de audio (X1[b], X2[b]) de una señal de audio multicanal, teniendo cada señal de canal de audio (X 1[b], X2[b]) valores de señal de canal de audio (X1[k], X2[k]), siendo el parámetro de codificación un parámetro de coherencia intercanales (ICC), comprendiendo el codificador de audio paramétrico (100) un generador de parámetros (105), estando el generador de parámetros (105) para - para determinar para la señal de canal de audio (X1[b]) de la pluralidad de señales de canales de audio un primer conjunto de parámetros de codificación (IPD[b]) a partir de los valores de señal de canal de audio (X1[k]) de la señal de canal de audio (X1[b]) y valores de señal de audio de referencia (X2[k]) de una señal de audio de referencia (X2[b]), en donde la señal de audio de referencia es otra señal de canal de audio (X2[b]) de la pluralidad de señales de canales de audio o una señal de audio mezclada reducida derivada de al menos dos señales de canales de audio de la pluralidad de señales de audio multicanales, en donde el primer conjunto de parámetros de codificación (IPD[b]) son parámetros de diferencia de fase intercanales o parámetros de diferencia de fase intercanales de sub-banda, - para determinar para la señal de canal de audio (X1[b]) un primer valor medio de parámetros de codificación (IPDmean[i]) sobre la base del primer conjunto de parámetros de codificación (IPD[b]) del primer canal de señal de audio (X1[b]), refiriéndose el primer valor medio de parámetros de codificación a una trama corriente de la señal de canal de audio, en donde el generador de parámetros (105) está configurado para determinar el primer valor medio de parámetros de codificación (IPDmean[i]) de la señal de canal de audio (X1[b]) como una media del primer conjunto de parámetros de codificación (IPD[b]) de la señal de canal de audio (X1[b]) a través de bandas de frecuencias [k] o de sub-bandas de frecuencia [b], - para determinar para la señal de canal de audio (X1[b]) una segunda media de parámetros de codificación (IPDmean_long_term) en función de la primera media de parámetros de codificación (IPDmean[i]) de la señal de canal de audio (X1[b]) y al menos una otra primera media de parámetros de codificación ( IPDmean[i-1]) de la señal de canal de audio (X1[b]), refiriéndose a la al menos una otra primera media de parámetros de codificación a una trama anterior de la señal de canal de audio, y - para determinar el parámetro de codificación (ICC) sobre la base de la primera media de parámetros de codificación (IPDmean[i]) de la señal de canal de audio (X1[b]) y la segunda media de parámetros de codificación (IPDmean_long_term) de la señal de canal de audio (X1[b]); en donde el generador de parámetros (105) está configurado, además - para determinar un valor absoluto (IPDdist) de una diferencia entre la segunda media de parámetros de codificación (IPDmean_long_term) y la primera media de parámetros de codificación (IPDmean[i]), y - para determinar el parámetro de codificación (ICC) como una función de valor absoluto determinado (IPDdist).

Description

5
10
15
20
25
30
35
40
45
50
55
60
65
DESCRIPCION
Codificador parametrico para codificar una senal de audio multicanal CAMPO DE LA INVENCION
La presente invencion se refiere a la codificacion de audio.
ANTECEDENTES DE LA INVENCION
La codificacion de audio parametrica en estereo o multicanal segun se describe, p.e., en C. Faller y F. Baumgarte, “Representacion eficiente de la senal de audio espacial utilizando una parametrizacion perceptual”, en Proc. IEEE Workshop on Appl. of Sig. Proc. para audio y acustica, octubre 2001, paginas 199-202, utiliza pistas espaciales para sintetizar senales de audio multicanal a partir de senales de audio mezcladas reducidas - normalmente mono o estereo - teniendo las senales de audio multicanal mas canales que las senales de audio mezcladas reducidas. En condiciones normales, las senales de audio mezcladas reducidas resultan de una superposicion de una pluralidad de senales de canales de audio de una senal de audio multicanal, p.e., de una senal de audio estereo. Estos canales estan codificados en forma de onda e informacion secundaria, esto es, las pistas espaciales, referidas a las relaciones de senales de canales originales se anaden como parametros de codificacion a los canales de audio codificados. El decodificador utiliza esta informacion secundaria para regenerar el numero original de canales de audio sobre la base de los canales codificados en forma de onda decodificados.
Un codificador estereo parametrico basico puede utilizar las diferencias de niveles intercanales (ILD) como una pista necesaria para generar la senal de estereo a partir de la senal de audio mezclada reducida monoaural. Codificadores mas sofisticados pueden utilizar tambien la coherencia intercanal (ICC), que puede representar un grado de similitud entre las senales de canales de audio, esto es, canales de audio. Ademas, cuando se codifican senales estereo binaurales, p.e., para senales de audio en 3D o la prestacion circundante basada en auriculares, tambien una diferencia de fase intercanal (IPD) puede desempenar una funcion importante para reproducir diferencias de fase/retardo entre los canales.
La smtesis de pistas de ICC puede ser de importancia para la mayona de los contenidos de audio y musicales para regenerar el entorno ambiental, reverberacion de estereo, anchura de fuente y otras percepciones relacionadas con la impresion especial segun se describe en el documento de J. Blauert, Audiencia espacial: La psicoffsica de la localizacion del sonido humano, The MIT Press, Cambridge, Massachusetts, Estados Unidos, 1997.
La smtesis de coherencia puede realizarse utilizando los denominados de-correladores en el dominio de la frecuencia segun se describe en el documento de E. Schuijers, W. Oomen, B. den Brinker y J. Breebaart, “Avances en la codificacion parametrica para audio de alta calidad”, en Preprint 114th Conv. Aud. Eng. Soc., marzo 2003. Sin embargo, los metodos de smtesis conocidos para la estimacion de las pistas espaciales y la sintetizacion de senales de audio multicanal pueden sufrir una complejidad incrementada, vease documento EP 1565036. Ademas, el uso de parametros de ICC, p.e., ademas de otros parametros, tales como diferencias de nivel entre canales (ICLDs) y las diferencias de fase entre canales (ICPDs) pueden aumentar una sobrecarga de tasa binaria.
SUMARIO DE LA INVENCION
Es el objetivo de la invencion dar a conocer un concepto para la estimacion de parametros de codificacion que representen relaciones intercanal entre canales de una senal de audio multicanal para una codificacion eficiente de las senales de audio.
Este objetivo se consigue mediante las caractensticas establecidas en las reivindicaciones independientes. Otras formas de realizacion son evidentes a partir de las reivindicaciones subordinadas, la descripcion y las figuras.
Con el fin de poder describir la invencion en detalle, se utilizaran los terminos, abreviaturas y notaciones siguientes:
BCC: Codificacion de pistas binaurales, codificacion de senales estereo o de multicanal utilizando una mezcla
reducida y pistas binaurales (o parametros espaciales) para describir las relaciones entre canales.
Pistas
binaurales: Pistas intercanales entre las senales de entrada en el ofdo izquierdo y en el odio derecho (vease tambien ITD, ILD, e IC).
CLD: Diferencia de nivel de canal, lo mismo que ICLD.
FFT: Realizacion rapida de la DFT, indicada como Transformada de Fourier Rapida.
STFT: Transformada de Fourier de corta duracion.
5
10
15
20
25
30
35
40
45
50
55
60
65
HRTF: Funcion de transferencia relacionada con auriculares, transduccion de modelizacion de sonido desde
una fuente a las entradas del ofdo izquierdo y del ofdo derecho en un campo libre.
IC: Coherencia interaural, esto es, grado de similitud entre las senales de entrada desde el ofdo izquierdo y
el ofdo derecho. Este termino se refiere tambien, a veces, como IAC o correlacion cruzada interaural (IACC).
ICC: Coherencia intercanal, correlacion intercanal.
ICPD: Diferencia de fase intercanal. Diferencia de fase media entre un par de senales.
ICLD: Diferencia de nivel de intercanal.
ICTD: Diferencia temporal intercanal.
ILD: Diferencia de nivel interaural, esto es, diferencia de nivel entre las senales de entrada del ofdo izquierdo
y del ofdo derecho. Se refiere tambien a veces como diferencia de intensidad interaural (IID)
IPD: Diferencia de fase interaural, esto es, diferencia de fase entre las senales de entrada del ofdo izquierdo
y del ofdo derecho.
ITD: Diferencia temporal interaural, esto es, diferencia temporal entre las senales de entrada del ofdo
izquierdo y del ofdo derecho. Se refiere tambien, a veces, como un retardo interaural.
Mezcla: Dado un numero de senales origen (p.e., instrumentos registrados por separado, registro multipista), el
proceso de generar senales esterero o de audio multicanal previstas para la reproduccion de audio espacial que se indica por mezcla.
Audio
espacial: Senales de audio que, cuando se reproducen a traves de un sistema de reproduccion adecuado,
recuperan operativamente una imagen espacial del auditorio.
Pistas
espaciales: Pistas importantes para la percepcion espacial. Este termino se utiliza para pistas entre pares de canales de una senal de audio multicanal o estereo (vease tambien ICTD, ICLD e ICC), tambien indicadas como parametros espaciales o pistas binaurales.
En conformidad con el primer aspecto de la idea inventiva, la invencion se refiere a un codificador de audio parametrico para generar un parametro de codificacion para una senal de canal de audio para una pluralidad de senales de canales de audio de una senal de audio multicanal, teniendo cada senal de canal de audio valores de senales de canales, siendo el parametro de codificacion un parametro de coherencia intercanal, comprendiendo el codificador de audio parametrico un generador de parametros, estando configurado el generador de parametros para
- determinar para la senal de canal de audio de la pluralidad de senales de canales de audio un primer conjunto de parametros de codificacion a partir de los valores de senales de canales de audio de los valores de la senal de audio de referencia y de senal de canal de audio de una senal de audio de referencia, en donde la senal de audio de referencia es otra senal de canal de audio de la pluralidad de senales de canales de audio, en donde el primer conjunto de parametros de codificacion son parametros de diferencia de fase intercanal o parametros de diferencia de fase intercanal de sub-banda,
- para determinar para la senal de canal de audio una primera media de parametros de codificacion sobre la base del primer conjunto de parametros de codificacion de la senal de canal de audio, refiriendose la primera media de parametros de codificacion a una trama actual de la senal de canal de audio, en donde el generador de parametros esta configurado para determinar la primera media de parametros de codificacion de la senal de canal de audio como una media del primer conjunto de parametros de codificacion de la senal de canal de audio a traves de las bandas de frecuencia o de las sub-bandas de frecuencia,
- para determinar para la senal de canal de audio, una segunda media de parametros de codificacion sobre la base de la primera media de parametros de codificacion de la senal de canal de audio y al menos una otra primera media de parametros de codificacion de la senal de canal de audio, refiriendose a la al menos una otra primera de parametros de codificacion a una trama anterior de la senal de canal de audio, y
- para determinar el parametro de codificacion sobre la base de la primera media de parametros de codificacion de la senal de canal de audio y la segunda media de parametros de codificacion de la senal de canal de audio;
5
10
15
20
25
30
35
40
45
50
55
60
65
en donde el generador de parametros esta configurado, ademas,
- para determinar un valor absoluto de una diferencia entre la segunda media de parametros de codificacion y la primera media de parametros de codificacion, y
- para determinar el parametro de codificacion como una funcion del valor absoluto determinado.
Utilizando las tramas actuales y anteriores de la senal de canal de audio se puede realizar eficientemente la operacion de promedio a largo plazo.
La senal de audio de referencia puede ser una de las senales de canales de audio de la senal de audio multicanal. En particular, la senal de audio de referencia puede ser una senal de canal de audio del ofdo izquierdo o del ofdo derecho de una senal estereo que constituye una forma de realizacion de la senal multicanal de dos canales. Sin embargo, la senal de audio de referencia puede ser cualquier senal que constituya una referencia para determinar los parametros de codificacion. Dicha senal de referencia puede estar constituida por una senal de audio mezclada reducida monoaural despues de la mezcla reducida de los canales de la senal de audio multicanal o uno de entre el canal de una senal de audio mezclada reducida despues de la mezcla reducida de los canales de la senal de audio multicanal.
Dichos parametros como diferencia de fase intercanal o diferencia de fase intercanal de sub-banda representan un grado de similitud entre las senales de audio y por ello, se pueden utilizar por el codificador para reducir la informacion a transmitirse y de este modo, reducir la complejidad del calculo.
Mediante esa promediacion del primer conjunto de parametros de codificacion de la senal de canal de audio a traves de las bandas de frecuencias o de las sub-bandas de frecuencia, el codificador de audio parametrico proporciona una media de corta duracion de la senal de audio en donde se consideran todas las componentes de la frecuencia.
Mediante esa diferencia entre la segunda media de parametros de codificacion y la primera media de parametros de codificacion, el codificador de audio parametrico proporciona una medida para la diferencia entre la media a largo plazo y la media de corta duracion y por lo tanto, es capaz de predecir el comportamiento de la voz o de la musica.
Cuando el parametro de codificacion se proporciona como una funcion del valor absoluto determinado, existe una relacion entre el parametro de codificacion y el valor absoluto determinado, que se puede utilizar para calcular eficientemente el parametro de codificacion. La complejidad de calculo se reduce de este modo.
El codificador de audio parametrico puede tener una baja complejidad puesto que no requiere una coherencia o calculo de correlacion. Incluso proporciona una estimacion exacta de la relacion entre los canales de audio cuando el valor de ICC se cuantifica con un cuantificador aproximado que requiere solamente unas pocas etapas. En particular, para las senales musicales, pero tambien para las senales de voz, la utilizacion del parametro de codificacion para la codificacion de las senales de audio es importante porque la musica de salida suena mas natural con la anchura de escena acustica correcta y no “en seco”. Para un sistema de codificacion de audio estereo parametrico de baja tasa binaria, el presupuesto de bits esta limitado y solamente se transmite una ICC de banda completa, siendo el parametro de codificacion capaz de representar la correlacion global entre los canales.
En una primera posible forma de puesta en practica del codificador de audio parametrico en conformidad con el primer aspecto de la idea inventiva, el generador de parametros esta configurado para determinar las diferencias de fase de los valores de senales de canales de audio siguientes para obtener el primer conjunto de parametros de codificacion.
Las diferencias de fase de las senales de canales de audio siguientes se requieren para reproducir las diferencias de fase y/o retardo entre los canales. Cuando se reproducen las diferencias de fase, la voz y la musica suenan de forma mas natural.
En una segunda posible forma de puesta en practica del codificador de audio parametrico en conformidad con el primer aspecto de la idea inventiva o en conformidad con la forma de puesta en practica precedente del primer aspecto de la idea inventiva, la senal de canal de audio y la senal de audio de referencia son senales de dominio de la frecuencia y los valores de las senales de canales de audio y los valores de la senal de audio de referencia estan asociados con la bandas de frecuencia o las sub-bandas de frecuencia.
La resolucion de frecuencia utilizada esta ampliamente motivada por la resolucion de frecuencia del sistema del auditorio. La psicoacustica sugiere que la percepcion espacial esta muy probablemente basada en una representacion de banda cntica de la senal de entrada acustica. Esta resolucion de frecuencia se considera utilizando un banco de filtros invertible con sub-bandas con anchos de banda iguales o proporcionales al ancho de banda cntico del sistema del auditorio. De este modo, el codificador de audio parametrico puede estar bien adaptado a la percepcion humana.
5
10
15
20
25
30
35
40
45
50
55
60
65
En una tercera posible forma de puesta en practica del codificador de audio parametrico en conformidad con el primer aspecto de la idea inventiva o en conformidad con cualquiera de las formas de puesta en practica precedentes del primer aspecto, el codificador de audio parametrico comprende, ademas, un transformador para transformar una pluralidad de senales de canales de audio en el dominio temporal en el dominio de la frecuencia para obtener la pluralidad de senales de canales de audio.
La ecualizacion de la respuesta a impulsos de canales puede realizarse eficientemente en el dominio de la frecuencia puesto que la convolucion en el dominio temporal es una multiplicacion en el dominio de la frecuencia. De este modo, la realizacion de los calculos del codificador de audio parametrico en el dominio de la frecuencia puede dar lugar a una mas alta eficiencia con respecto a la complejidad de calculo o en una mayor exactitud.
En una cuarta posible forma de realizacion del codificador de audio parametrico, en conformidad con el primer aspecto de la idea inventiva o en conformidad con cualquiera de las formas de realizacion precedentes del primer aspecto, el generador de parametros esta configurado para determinar el primer conjunto de parametros de codificacion para cada contenedor de frecuencia o para cada sub-banda de frecuencia de las senales de canales de audio.
El codificador de audio parametrico puede limitar la determinacion del primer conjunto de parametros de codificacion para bandas de frecuencia o sub-bandas de frecuencias que sean percibibles por el ofdo humano y de este modo, se reduce la complejidad.
En una quinta posible forma de realizacion del codificador de audio parametrico en conformidad con el primer aspecto de la idea inventiva o en conformidad con cualquiera de las formas de realizacion precedentes del primer aspecto, el generador de parametros esta configurado para determinar la segunda media de parametros de codificacion de la senal de canal de audio como una media de una pluralidad de las primeras medias de parametros de codificacion a traves de una pluralidad de tramas de la senal de canal de audio, en donde cada primera media de parametros de codificacion esta asociada a una trama y de la senal de audio multicanal.
Mediante esa promediacion, el codificador de audio parametrico proporciona una media a largo plazo de la senal de audio en donde se consideran las propiedades caractensticas de la senal de voz o de la senal musical.
En una sexta posible forma de realizacion del codificador de audio parametrico en conformidad con el primer aspecto de la idea inventiva o en conformidad con cualquiera de las formas de realizacion precedentes del primer aspecto, el generador de parametros esta configurado para determinar el parametro de codificacion a partir de una diferencia entre un primer valor parametrico y el valor absoluto determinado multiplicado por un segundo valor parametrico.
Cuando el parametro de codificacion se proporciona como una diferencia entre el primer valor parametrico y el valor absoluto determinado, existe una relacion entre el parametro de codificacion y el valor absoluto determinado, que puede utilizarse para calcular eficientemente el parametro de codificacion. De este modo, se reduce la complejidad del calculo.
En una septima posible forma de realizacion del codificador de audio parametrico en conformidad con el primer aspecto de la idea inventiva o en conformidad con cualquiera de las formas de realizacion precedentes del primer aspecto, el generador de parametros esta configurado para establecer el primer valor parametrico a uno y para establecer el segundo valor parametrico a uno.
Mediante esa relacion, el codificador de audio parametrico es capaz de calcular eficientemente el parametro de codificacion. De este modo, se reduce la complejidad del calculo.
En una octava forma de realizacion posible del codificador de audio parametrico en conformidad con el primer aspecto de la idea inventiva o en conformidad con cualquiera de las formas de realizacion precedentes del primer aspecto, el codificador de audio parametrico comprende, ademas, un generador de senales mezcladas reducidas para la superposicion de al menos dos de las senales de canales de audio de la senal de audio multicanal para obtener una senal mezclada reducida, un codificador de audio, en particular, un codificador monoaural, para codificar la senal mezclada reducida para obtener una senal de audio codificada y un combinador para combinar la senal de audio codificada con un parametro de codificacion correspondiente.
La senal mezclada reducida y la senal de audio codificada pueden utilizarse como una senal de referencia para el generador de parametros. Ambas senales incluyen la pluralidad de senales de canales de audio y de este modo, proporciona una mayor exactitud que una senal de canal unica tomada como senal de referencia.
En una novena forma de realizacion posible del codificador de audio parametrico en conformidad con el primer aspecto de la idea inventiva, la trama actual de la senal de canal de audio es contigua a la trama anterior o la senal de canal de audio.
5
10
15
20
25
30
35
40
45
50
55
60
65
Cuando ambas tramas son contiguas, se detectan los denominados picos de tension en las senales de canales de audio en la media y pueden considerarse en el codificador de audio parametrico. De este modo, la codificacion es mas precisa que una codificacion en donde no pueden detectarse dichos picos de tension.
En conformidad con un segundo aspecto de la idea inventiva, la invencion se refiere a un codificador de audio
parametrico para generar un parametro de codificacion para una senal de canal de audio de una pluralidad de senales de canales de audio de una senal de audio multicanal, teniendo cada senal de canal de audio valores de senales de canales de audio, siendo el parametro de codificacion un parametro de coherencia intercanal, comprendiendo el codificador de audio parametrico un generador de parametros, estando el generador de parametros configurado
- para determinar para la senal de canal de audio de la pluralidad de senales de canales de audio un primer
conjunto de parametros de codificacion a partir de los valores de senales de canales de audio de la senal de
canal de audio y los valores de la senal de audio de referencia de una senal de audio de referencia, en donde la
senal de audio de referencia es una senal de audio mezclada reducida derivada de al menos dos senales de canales de audio de entre la pluralidad de senales de audio multicanal, en donde el primer conjunto de parametros de codificacion son parametros de diferencia de fase intercanal o parametros de diferencia de fase entre canales de sub-banda,
- para determinar para la senal de canal de audio una primera media de parametros de codificacion basada en el primer conjunto de parametros de codificacion de la senal de canal de audio, refiriendose la primera media de parametros de codificacion a una trama actual de la senal de canal de audio, en donde el generador de parametros esta configurado para determinar la primera media de parametros de codificacion de la senal de canal de audio como una media del primer conjunto de parametros de codificacion de la senal de canal de audio a traves de las bandas de frecuencia o de las sub-bandas de frecuencia,
- para determinar para la senal de canal de audio una segunda media de parametros de codificacion basada en la primera media de parametros de codificacion de la senal de canal de audio y al menos una otra primera media de parametros de codificacion de la senal de canal de audio, refiriendose la a menos otra primera media de parametros de codificacion a una trama anterior de la senal de canal de audio y
- para determinar el parametro de codificacion sobre la base de la primera media de parametros de codificacion de la senal de canal de audio y la segunda media de parametros de codificacion de la senal de canal de audio;
en donde el generador de parametros esta configurado ademas
- para determinar un valor absoluto de una diferencia entre la segunda media de parametros de codificacion y la primera media de parametros de codificacion, y
- para determinar el parametro de codificacion como una funcion del valor absoluto determinado.
Utilizando las tramas actuales y anteriores de la senal de canal de audio, se puede realizar eficientemente la operacion de promediacion a largo plazo.
La senal de audio de referencia puede ser una de las senales de canales de audio de la senal de audio multicanal. En particular, la senal de audio de referencia puede ser una senal de canal del ofdo izquierdo o del ofdo derecho de una senal estereo que constituye una forma de realizacion de una senal multicanal de dos canales. Sin embargo, la senal de audio de referencia puede ser cualquier senal que constituya una referencia para determinar los parametros de codificacion. Dicha senal de referencia puede formarse mediante una senal de audio mezclada reducida despues de la mezcla reducida de los canales de la senal de audio multicanal o una salida de un codificador monoaural.
Parametros tales como la diferencia de fase intercanal o la diferencia de fase entre canales de sub-banda representan un grado de similitud entre las senales de audio y por ello, se pueden utilizar por el codificador para reducir la informacion a transmitirse y de este modo, reducir la complejidad del calculo.
Mediante esa promediacion del primer conjunto de parametros de codificacion de la senal de canal de audio a traves de bandas de frecuencia o de sub-bandas de frecuencia, el codificador de audio parametrico proporciona una media a corto plazo de la senal de audio en donde se consideran todas las componentes de la frecuencia.
Mediante esa diferencia entre la segunda media de parametros de codificacion y la primera media de parametros de codificacion, el identificador de audio parametrico proporciona una medida de la diferencia entre la media a largo plazo y la media a corto plazo y por lo tanto, es capaz de predecir el comportamiento de la voz o de la musica.
Cuando el parametro de codificacion se proporciona como una funcion del valor absoluto determinado, existe una
5
10
15
20
25
30
35
40
45
50
55
60
65
relacion entre el parametro de codificacion y el valor absoluto determinado, que se puede utilizar para calcular eficientemente el parametro de codificacion. De este modo, se reduce la complejidad del calculo.
El codificador de audio parametrico puede tener una baja complejidad puesto que no requiere un calculo de correlacion o coherencia. Incluso proporciona una estimacion exacta de la relacion entre los canales de audio cuando se cuantifica el valor de ICC con un cuantificador aproximado que requiere solamente unas pocas etapas. En particular, para las senales musicales, pero tambien para las senales de voz, la utilizacion del parametro de codificacion para la codificacion de las senales de audio es importante porque la musica de salida suena mas natural con la anchura de escena acustica correcta y no “en seco”. Para un sistema de codificacion de audio estereo parametrico de muy baja tasa binaria, el presupuesto de bits esta limitado y solamente se transmite una ICC de banda completa, siendo el parametro de codificacion capaz de representar la correlacion global entre los canales.
En una primera posible forma de realizacion del codificador de audio parametrico en conformidad con el segundo aspecto de la idea inventiva, el generador de parametros esta configurado para determinar diferencias de fase de valores de senales de canales de audio siguientes con el fin de obtener el primer conjunto de parametros de codificacion. Las diferencias de fase de las senales de canales de audio siguientes se requieren para reproducir las diferencias de fase y/o retardo entre los canales. Cuando se reproducen las diferencias de fase, la voz y la musica tienen un sonido mas natural.
En una segunda posible forma de realizacion del codificador de audio parametrico en conformidad con el segundo aspecto de la idea inventiva o en conformidad con la forma de realizacion precedente del segundo aspecto, la senal de canal de audio y la senal de audio de referencia son senales de dominio de la frecuencia y los valores de las senales de canales de audio y los valores de las senales de audio de referencia estan asociados con las bandas de frecuencia o las sub-bandas de frecuencia.
La resolucion de frecuencia utilizada esta ampliamente motivada por la resolucion de frecuencia del sistema del auditorio. La psicoacustica sugiere que la percepcion espacial esta muy probablemente basada en una representacion de banda cntica de la senal de entrada acustica. Esta resolucion de frecuencia se considera utilizando un banco de filtros invertible con sub-bandas y anchos de banda iguales o proporcionales al ancho de banda cntico del sistema del auditorio. De este modo, el codificador de audio parametrico puede adaptarse adecuadamente para la percepcion humana.
En una tercera posible forma de realizacion del codificador de audio parametrico en conformidad con el segundo aspecto de la idea inventiva o en conformidad con cualquiera de las formas de realizacion precedentes del segundo aspecto, el codificador de audio parametrico comprende, ademas, un transformador para transformar una pluralidad de senales de canales de audio del dominio temporal en el dominio de la frecuencia con el fin de obtener la pluralidad de senales de canales de audio.
La ecualizacion de la respuesta de impulso de canal puede realizarse eficientemente en el dominio de la frecuencia puesto que la convolucion en el dominio temporal es una multiplicacion en el dominio de la frecuencia. De este modo, la realizacion de los calculos del codificador de audio parametrico en el dominio de la frecuencia puede dar lugar a una mas alta eficiencia con respecto a la complejidad del calculo o en una mayor exactitud.
En una cuarta posible forma de realizacion del codificador de audio parametrico en conformidad con el segundo aspecto de la idea inventiva o en conformidad con cualquiera de las formas de realizacion precedentes del segundo aspecto, el generador de parametros esta configurado para determinar el primer conjunto de parametros de codificacion para cada contenedor de frecuencia o para cada sub-bandas de frecuencia de las senales de canales de audio.
El codificador de audio parametrico puede limitar la deteccion del primer conjunto de parametros de codificacion a bandas de frecuencia o sub-bandas de frecuencia que sean percibibles por el ofdo humano y de este modo, se reduce la complejidad.
En una quinta posible forma de realizacion del codificador de audio parametrico en conformidad con el segundo aspecto de la idea inventiva o en conformidad con cualquiera de las formas de realizacion precedentes del segundo aspecto, el generador de parametros esta configurado para determinar la segunda media de parametros de codificacion de la senal de canal de audio como una media de una pluralidad de primeras medias de parametros de codificacion durante una pluralidad de tramas de la senal de canal de audio, en donde cada primera media de parametros de codificacion esta asociada con una trama de la senal de audio multicanal.
Mediante esa promediacion, el codificador de audio parametrico proporciona una media a largo plazo de la senal de audio en donde se consideran las propiedades caractensticas de la senal de voz o de la senal de musica.
En una sexta posible forma de realizacion del codificador de audio parametrico en conformidad con el segundo aspecto de la idea inventiva o en conformidad con cualquiera de las formas de realizacion precedentes del segundo aspecto, el generador de parametros esta configurado para determinar el parametro de codificacion a partir de una
5
10
15
20
25
30
35
40
45
50
55
60
65
diferencia entre un primer valor parametrico y el valor absoluto determinado multiplicado por un segundo valor parametrico.
Cuando el parametro de codificacion se proporciona como una diferencia entre el primer valor parametrico y el valor absoluto determinado, existe una relacion entre el parametro de codificacion y el valor absoluto determinado, que puede utilizarse para calcular eficientemente el parametro de codificacion. De este modo, se reduce la complejidad del calculo.
En una septima posible forma de realizacion del codificador de audio parametrico en conformidad con el segundo aspecto de la idea inventiva o en conformidad con cualquiera de las formas de realizacion precedentes del segundo aspecto, el generador de parametros esta configurado para establecer el primer valor parametrico a uno y para establecer el segundo valor parametrico a uno.
Mediante esa relacion, el codificador de audio parametrico es capaz de calcular eficientemente el parametro de codificacion. De este modo, se reduce la complejidad del calculo.
En una octava posible forma de realizacion del codificador de audio parametrico en conformidad con el segundo aspecto de la idea inventiva o en conformidad con cualquiera de las formas de realizacion precedentes del segundo aspecto, el codificador de audio parametrico comprende, ademas, un generador de senales mezcladas reducidas para la superposicion de al menos dos de las senales de canales de audio de la senal de audio multicanal para obtener una senal mezclada reducida, un codificador de audio, en particular un codificador monoaural, para codificar la senal mezclada reducida con el fin de obtener una senal de audio codificada y un combinador para combinar la senal de audio codificada con un parametro de codificacion correspondiente.
La senal mezclada reducida y la senal de audio codificada pueden utilizarse como una senal de referencia para el generador de parametros. Ambas senales incluyen la pluralidad de senales de canales de audio y de este modo, proporcionan una exactitud mayor que una senal de canal unico tomada como una senal de referencia.
En una novena forma de realizacion del codificador de audio parametrico en conformidad con el segundo aspecto de la idea inventiva, la trama actual de la senal de canal de audio es contigua a la trama anterior de la senal de canal de audio.
Cuando ambas tramas son contiguas, se detectan picos de tension en las senales de canales de audio en la promediacion y pueden considerarse en el codificador de audio parametrico. De este modo, la codificacion es mas precisa que una codificacion en donde no puedan detectarse picos de tension.
En conformidad con un tercer aspecto de la idea inventiva, la invencion se refiere a un metodo para generar un parametro de codificacion para una senal de canal de audio de una pluralidad de senales de canales de audio de una senal de audio multicanal, teniendo cada senal de canal de audio valores de senales de canales de audio, siendo el parametro de codificacion un parametro de coherencia intercanal, comprendiendo el metodo:
- determinar para la senal de canal de audio de la pluralidad de senales de canales de audio un primer conjunto de parametros de codificacion a partir de los valores de senales de canales de audio de la senal de canal de audio y de los valores de senales de audio de referencia de una senal de audio de referencia, en donde la senal de audio de referencia es otra senal de canal de audio de la pluralidad de senales de canales de audio, en donde el primer conjunto de parametros de codificacion son parametros de diferencia de fase intercanal o parametros de diferencia de fase intercanal de sub-banda,
- determinar para la senal de canal de audio una primera media de parametros de codificacion sobre la base del primer conjunto de parametros de codificacion de la senal de canal de audio, refiriendose la primera media de parametros de codificacion a una trama actual de la senal de canal de audio, en donde la primera media de parametros de codificacion se determina como una media del primer conjunto de parametros de codificacion de la senal de canal de audio a traves de bandas de frecuencia o de sub-bandas de frecuencia,
- determinar para la senal de canal de audio una segunda media de parametros de codificacion sobre la base de la primera media de parametros de codificacion de la senal de canal de audio y al menos otra primera media de parametros de codificacion de la senal de canal de audio, refiriendose al menos a otra primera media de parametros de codificacion a una trama anterior de la senal de canal de audio, y
- determinar el parametro de codificacion sobre la base de la primera media de parametros de codificacion de la senal de canal de audio y la segunda media de parametros de codificacion de la senal de canal de audio;
en donde la determinacion del parametro de codificacion sobre la base de la primera media de parametros de codificacion de la senal de canal de audio y la segunda media de parametros de codificacion de la senal de canal de audio comprende:
5
10
15
20
25
30
35
40
45
50
55
60
65
- determinar un valor absoluto de una diferencia entre la segunda media de parametros de codificacion y la primera media de parametros de codificacion, y
- determinar el parametro de codificacion como una funcion del valor absoluto determinado.
El metodo puede realizarse eficientemente en un procesador.
La senal de audio de referencia puede ser una de las senales de canales de audio de la senal de audio multicanal. En particular, la senal de audio de referencia puede ser una senal de canal de audio izquierdo o derecho de una senal estereo que constituye una forma de realizacion de una senal multicanal de dos canales. Sin embargo, la senal de audio de radiofrecuencia puede ser cualquier senal que constituya una referencia para determinar los parametros de codificacion. Dicha senal de referencia puede estar constituida por una senal de audio mezclada reducida monoaural despues de la mezcla reducida de los canales de la senal de audio multicanal o uno del canal de una senal de audio mezclada reducida despues de la mezclada reducida de los canales de la senal de audio multicanal.
En conformidad con un cuarto aspecto de la idea inventiva, la invencion se refiere a un metodo para generar un
parametro de codificacion para una senal de canal de audio de una pluralidad de senales de canales de audio de
una senal de audio multicanal, teniendo cada senal de canal de audio valores de senales de canales de audio, siendo el parametro de codificacion un parametro de coherencia intercanal, comprendiendo el metodo:
- determinar para la senal de canal de audio de la pluralidad de senales de canales de audio un primer conjunto de parametros de codificacion a partir de los valores de senales de canales de audio de la senal de canal de audio y de los valores de senal de audio de referencia de una senal de audio de referencia, en donde la senal de audio de referencia es una senal de audio mezclada reducida derivada de al menos dos senales de canales de audio de entre la pluralidad de senales de audio multicanal, en donde el primer conjunto de parametros de codificacion son parametros de diferencia de fase intercanal o parametros de diferencia de fase intercanal de sub-banda,
- determinar para la senal de canal de audio una primera media de parametros de codificacion sobre la base del
primer conjunto de parametros de codificacion de la senal de canal de audio, refiriendose la primera media de parametros de codificacion a una trama actual de la senal de canal de audio, en donde la primera media de
parametros de codificacion se determina como media del primer conjunto de parametros de codificacion de la
senal de canal de audio a traves de bandas de frecuencia o de sub-bandas de frecuencia,
- determinar para la senal de canal de audio una segunda media de parametros de codificacion sobre la base de la primera media de parametros de codificacion de la senal de canal de audio y al menos una otra primera media de parametro de codificacion de la senal de canal de audio, refiriendose la a menos una otra primera media de parametros de codificacion a una trama anterior de la senal de canal de audio y
- determinar el parametro de codificacion sobre la base de la primera media de parametros de codificacion de la senal de canal de audio y la segunda media de parametros de codificacion de la senal de canal de audio;
en donde la determinacion del parametro de codificacion sobre la base de la primera media de parametros de codificacion de la senal de canal de audio y la segunda media de parametros de codificacion de la senal de canal de audio comprende:
- determinar un valor absoluto de una diferencia entre la segunda media de parametros de codificacion y la primera media de parametros de codificacion, y
- determinar el parametro de codificacion como una funcion del valor absoluto determinado.
El metodo puede realizarse de forma eficiente en un procesador.
La senal de audio de referencia puede ser una de entre las senales de canales de audio de la senal de audio multicanal. En particular, la senal de audio de referencia puede ser una senal de canal de audio izquierdo o derecho de una senal estereo que constituye una forma de realizacion de una senal multicanal de dos canales. Sin embargo, la senal de audio de referencia puede ser cualquier senal que constituya una referencia para determinar los parametros de codificacion. Dicha senal de referencia puede estar constituida por una senal de audio mezclada reducida monoaural despues de la mezclada reducida de los canales de la senal de audio multicanal o uno de los canales de una senal de audio mezclada reducida despues de la mezcla reducida de los canales de la senal de audio multicanal.
En conformidad con un quinto aspecto de la idea inventiva, la invencion se refiere a un programa informatico que esta configurado para poner en practica el metodo en conformidad con uno del tercero y cuarto aspectos de la idea inventiva cuando se ejecuta en un ordenador.
5
10
15
20
25
30
35
40
45
50
55
60
65
El programa informatico tiene una complejidad reducida y de este modo, se puede poner en practica eficientemente en un terminal movil en donde debe economizarse la vida de la batena. La duracion de la vida util de la batena se aumenta cuando el programa informatico se ejecuta en un terminal movil.
Los metodos aqu descritos pueden ponerse en practica como software en un Procesador de Senal Digital (DSP), en un microcontrolador o en cualquier otro procesador secundario o como circuito de hardware dentro de un circuito integrado espedfico de la aplicacion (ASIC).
La invencion puede ponerse en practica en circuitos electronicos digitales o en hardware, firmware, software o una de sus combinaciones en ordenador.
BREVE DESCRIPCION DE LOS DIBUJOS
Formas de realizacion adicionales de la invencion se describiran, a continuacion, con respecto a las Figuras siguientes, en las que:
La Figura 1 ilustra un diagrama de bloques de un codificador de audio parametrico en conformidad con una forma de realizacion;
La Figura 2 ilustra un diagrama de bloques de un decodificador de audio parametrico en conformidad con una forma de realizacion;
La Figura 3 ilustra un diagrama de bloques de un codificador de audio estereo parametrico y un decodificador en conformidad con una forma de realizacion; y
La Figura 4 ilustra un diagrama esquematico de un metodo para generar un parametro de codificacion para una senal de canal de audio en conformidad con una forma de realizacion.
DESCRIPCION DETALLADA DE LAS FORMAS DE REALIZACION DE LA INVENCION
La Figura 1 ilustra un diagrama de bloques de un codificador de audio parametrico 100 en conformidad con una forma de realizacion. El codificador de audio parametrico 100 recibe una senal de audio multicanal 101 como senal de entrada y proporciona un flujo de bits como senal de salida 103. El identificador de audio parametrico 100 comprende un generador de parametros 105 acoplado a la senal de audio multicanal 101 para generar un parametro de codificacion 115, un generador de senales mezcladas reducidas 107 acoplado a la senal de audio multicanal 101 para generar una senal mezclada reducida 111 o una senal suma, un codificador de audio 109 acoplado la generador de senales mezcladas reducidas 107 para codificar la senal mezclada reducida 111 para proporcionar una senal de audio codificada 113 y un combinador 117, p.e., un dispositivo formador de flujos de bits acoplado al generador de parametros 105 y al codificador de audio 109 para formar un flujo de bits 103 a partir del parametro de codificacion 115 y la senal codificada 113.
El codificador de audio parametrico 100 pone en practica un sistema de codificacion de audio para senales de audio multicanal y estereo, que solamente transmite un canal de audio unico, p.e., el canal de audio de mezcla reducida junto con parametros adicionales que describen “diferencias perceptualmente pertinentes” entre los canales de audio X-i[b], X2[b], ..., XM[b]. El sistema de codificacion esta en conformidad con la codificacion de pistas binaurales (BCC) porque las pistas binaurales desempenan una funcion importante a este respecto. Segun se indica en la Figura, la pluralidad M de canales de audio de entrada X-i[b], X2[b], ..., XM[b] de la senal de audio multicanal 101 son objeto de mezcla reducida a un canal de audio unico 111, tambien indicado como la senal suma. Para una senal de audio estereo M igual a 2, habida cuenta de las “diferencias perceptualmente pertinentes” entre los canales de audio X-i[b], X2[b], ..., XM[b], el parametro de codificacion 115, p.e., una diferencia de tiempo intercanal (ICTD), una diferencia de nivel intercanal (ICLD) y/o una coherencia intercanal (ICC) se estima como una funcion de la frecuencia y del tiempo y se transmite como informacion secundaria al decodificador 200 descrito en la Figura 2.
El generador de parametros 105 que pone en practica BCC procesa la senal de audio multicanal 101 con un determinado periodo de tiempo y resolucion de frecuencia. La resolucion de frecuencia utiliza es ampliamente motivada por la resolucion de frecuencia del sistema del auditorio. La psicoacustica sugiere que la percepcion espacial esta muy probablemente basada en una representacion de banda cntica de la senal de entrada acustica. Esta resolucion de frecuencia se considera utilizando un banco de filtros invertible con sub-bandas con anchos de banda iguales o proporcionales al ancho de banda cntico del sistema del auditorio. Es importante que la suma transmitida 111 contenga todas las componentes de senales de la senal de audio multicanal 101. El objetivo es que cada componente de senal se mantenga completamente. La suma simple de los canales de entrada de audio X-i[b], X2[b], ., XM[b] de la senal de audio multicanal 101 suele dar lugar a la amplificacion o atenuacion de componentes de senales. Dicho de otro modo, la potencia de las componentes de senales en la suma “simple” suele ser mayor o menor que la suma de la potencia de las componentes de senal correspondientes de cada canal X-i[b], X2[b], ..., XM[b]. Por lo tanto, una tecnica de mezcla reducida se utiliza aplicando el dispositivo de mezclada reducida 107 que ecualiza la senal suma 111 de modo que la potencia de las componentes de senales en la senal suma 111 sea
5
10
15
20
25
30
35
40
45
50
55
60
65
aproximadamente la misma que la potencia correspondiente en todos los canales de audio de entrada Xi[b], X2[b], ..., XM[b] de la senal de audio multicanal 101. Los canales de audio de entrada Xi[b], X2[b], ..., XM[b] representan las senales de canales para la sub-banda b. El canal de audio de entrada del dominio de la frecuencia se indica por Xi[k], X2[k],... XM[k], en donde k representa el mdice de frecuencia (contenedor de frecuencia), una sub-banda b estando normalmente constituida por varias bandas de frecuencia k.
Dada la senal suma 111, el generador de parametros 105 sintetiza una senal de audio multicanal o estereo 115 de modo que ICTD, ICLD y/o ICC se aproximen a las pistas correspondientes de la senal de audio multicanal original 101.
Cuando se consideran respuestas de impulsos espaciales binaurales (BRIRs) de un solo origen, existe una relacion entre la anchura del evento operativo del auditorio y la envolvente de escuchas y el valor de IC estimado para las partes iniciales y finales de las respuesta BRIRs. Sin embargo, la relacion entre IC (o ICC) y estas propiedades para senales generales (y no solamente las BRIRs) no es simple. Las senales de audio multicanal y de estereo suelen contener una mezcla compleja de senales origen simultaneamente activas superpuestas por componentes de senales reflejadas que se derivan del registro en espacios cerrados o que se anaden por el tecnico de registro para crear artificialmente una impresion espacial. Senales origen diferentes y sus reflexiones ocupan diferentes zonas en el plano de tiempo-frecuencia. Lo que antecede se refleja por ICTD, ICLD e ICC que vanan como una funcion del tiempo y de la frecuencia. En este caso, la relacion entre los valores instantaneos de ICTD, ICLD e ICC y las direcciones de eventos del auditorio y la impresion espacial no es obvia. La estrategia del generador de parametros 105 es sintetizar, a ciegas, estas pistas de modo que se aproximan a las pistas correspondientes de la senal de audio original.
En una forma de realizacion, el codificador de audio parametrico 100 utiliza bancos de filtros con sub-bandas de anchos de banda iguales a dos veces el ancho de banda rectangular equivalente. Una escucha informal revelo que la calidad de audio de BCC no mejoro notablemente cuando se eligio una mas alta resolucion de frecuencia. Una mas baja resolucion de frecuencia es favorable puesto que da lugar a menos valores de ICTD, ICLD e ICC que necesitan transmitirse al decodificador y de este modo, en una tasa binaria mas baja. Con respecto a la resolucion temporal, ICTD, ICLD e ICC se consideran a intervalos de tiempo periodicos. En una forma de realizacion ICTD, ICLD e ICC se consideran aproximadamente cada 4 - 16 ms. Conviene senalar que a no ser que las pistas se consideren a intervalos muy cortos, el efecto de prioridad no esta directamente considerado.
La frecuentemente diferencia perceptualmente pequena conseguida entre la senal de referencia y la senal sintetizada implica que las pistas relacionadas con una amplia gama de atributos de imagenes espaciales del auditorio se consideran implfcitamente sintetizando ICTD, ICLd e ICC a intervalos de tiempo periodicos. La tasa binaria requerida para la transmision de estas pistas espaciales es solamente de unos pocos kb/s y de este modo, el codificador de audio parametrico 100 es capaz de transmitir senales de audio multicanal y estereo a tasas binarias proximas a las que se requieren para un canal de audio unico. La Figura 4 ilustra un metodo en el que se estima ICC como el parametro de codificacion 115.
El codificador de audio parametrico 100 comprende un generador de senal mezclada reducida 107 para la superposicion de al menos dos de entre las senales de canales de audio de la senal de audio multicanal 101 para obtener la senal mezclada reducida 111, el codificador de audio 109, en particular un codificador monoaural, para codificar la senal mezclada reducida 111 con el fin de obtener la senal de audio codificada 113 y el combinador 117 para combinar la senal de audio codificada 113 con un parametro de codificacion correspondiente 115.
El codificador de audio parametrico 100 genera el parametro de codificacion 115 para una senal de canal de audio de entre la pluralidad de senales de canales de audio indicadas como X1[b], X2[b], ..., XM[b] de la senal de audio multicanal 101. Cada una de las senales de canales de audio X1[b], X2[b], ..., XM[b] puede ser una senal digital que comprende valores de senales de canales de audio digitales en el dominio de la frecuencia que se indica como X1[k], X2[k], ..., XM[k].
Una senal de canal de audio, a modo de ejemplo, para la que el codificador de audio parametrico 100 genera el parametro de codificacion 115 es la primera senal de canal de audio X1[b] con valores de senales X1[k]. El generador de parametros 105 determina para la senal de canal de audio X1[b] un primer conjunto de parametros de codificacion indicado como IPD[b] a partir de los valores de senales de canales de audio X1[k] de la senal de canal de audio X1[b] y a partir de los valores de senales de audio de referencia de una senal de audio de referencia.
Una senal de canal de audio que se utiliza como una senal de audio de referencia es la segunda senal de canal de audio X2[b], a modo de ejemplo. De forma similar, cualquier otra de entre las senales de canales de audio X1[b], X2[b], ..., XM[b] puede servir como una senal de audio de referencia. En conformidad con un primer aspecto de la idea inventiva, la senal de audio de referencia es otra senal de canal de audio de las senales de canales de audio que no es igual a la senal de canal de audio X1[b] para la que se genera el parametro de codificacion 115.
En conformidad con un segundo aspecto de la idea inventiva, la senal de audio de referencia es una senal de audio mezclada reducida derivada a partir de al menos dos senales de canales de audio de entre la pluralidad de senales
5
10
15
20
25
30
35
40
45
50
55
60
65
de audio multicanal 101, p.e., derivada de la primera senal de canal de audio Xi[b] y de la segunda senal de canal de audio X2[b]. En una forma de realizacion, la senal de audio de referencia es la senal mezclada reducida 111, tambien denominada senal suma generada por el dispositivo de mezcla reducida 107. En otra forma de realizacion, la senal de audio de referencia es la senal codificada 113 proporcionada por el codificador 109.
Una senal de audio de referencia, a modo de ejemplo, utilizada por el generador de parametros 105 es la segunda senal de canal de audio X2[b] con valores de senales X2[k].
El generador de parametros 105 determina para la senal de canal de audio X1[b] una primera media de parametros de codificacion, indicada como IPDmean[i] sobre la base del primer conjunto de parametros de codificacion IPD[b] de la senal de canal de audio X1[b].
El generador de parametros 105 determina para la senal de canal de audio X1[b] una segunda media de parametros de codificacion, indicada por IPDmean_long_term, sobre la base de la primera media de parametros de codificacion IPDmean[i] de la senal de canal de audio X1[b] y al menos una otra primera media de parametros de codificacion indicada como IPDmean[i-1] de la senal de canal de audio X1[b]. En una forma de realizacion, la primera media de parametros de codificacion IPDmean[i] se refiere a una trama actual i de la senal de canal de audio X1[b] y la otra primera media de parametros de codificacion IPDmean[i-1] se refiere a una trama anterior i-1 de la senal de canal de audio X1[b]. En una forma de realizacion, la trama anterior i-1 de la senal de canal de audio X1[b] es la trama i-1 recibida antes de la trama actual i sin ninguna otra trama intermedia. En una forma de realizacion, la trama anterior iN de la senal de canal de audio X1[b] es una trama i-N recibida antes de la trama actual i pero multiples tramas llegaron en el periodo intermedio.
El generador de parametros 105 determinar el parametro de codificacion 115, indicado como ICC, sobre la base de la primera media de parametros de codificacion IPDmean[i] de la senal de canal de audio X1[b] y sobre la base de la segunda media de parametros de codificacion IPDmean_long_term de la senal de canal de audio X1[b].
El primer conjunto de parametros de codificacion IPD[b] son diferencias de fase entre canales, diferencias de nivel entre canales, coherencias entre canales, diferencias de intensidad entre canales, diferencias de niveles entre canales de sub-banda, diferencias de fase entre canales de sub-banda, coherencias entrecanales de sub-banda, diferencias de intensidad entre canales de sub-banda o una de sus combinaciones. Una diferencia de fase entre canales (ICPD) es una diferencia de fase media entre un par de senales. Una diferencia de nivel intercanal (ICLD) es la misma que una diferencia de nivel interaural (ILD), esto es, una diferencia de nivel entre senales de entrada del ofdo izquierdo y del ofdo derecho, pero definidas mas en general entre cualquier par de senales, p.e., un par de senales de altavoces, un par de senales de entrada al ofdo, etc. Una coherencia intercanal o una correlacion intercanal es la misma que una coherencia interaural (IC), esto es, el grado de similitud entre las senales de entrada el ofdo izquierdo y del ofdo derecho, pero definidas mas en general entre cualquier par de senales, p.e., par de senales de altavoces, par de senales de entrada a los ofdos, etc. Una diferencia temporal intercanal (ICTD) es la misma que una diferencia temporal interaural (ITD), a veces tambien referida como un retardo interaural, esto es, una diferencia temporal entre las senales de entrada de los ofdos izquierdo y derecho pero definida mas en general entre cualquier par de senales, p.e., pares de senales de altavoces, par de senales de entrada a los ofdos, etc. Las diferencias de niveles entre canales de sub-banda, las diferencias de fase entre canales de sub-bandas, las coherencias entre canales de sub-banda y las diferencias de intensidad entre canales de sub-banda estan relacionadas con los parametros anteriormente especificados con respecto al ancho de banda de sub-banda.
El generador de parametros 101 determina las diferencias de fase de valores de senal de canal de audio X1[k] siguientes para obtener el primer conjunto de parametros de codificacion IPD[b]. En una forma de realizacion, la senal de canal de audio X1[b] y la senal de audio de referencia X2[b] son senales de dominio de la frecuencia y los valores de senales de canales de audio X1[k] y los valores de senales de audio de referencia X2[k] estan asociados con bandas de frecuencia indicadas como [k] o sub-bandas de frecuencia, indicadas como [b]. En una forma de realizacion, el codificador de audio parametrico 100 comprende un transformador, p.e., un dispositivo de FFT para transformar una pluralidad de senales de canales de audio del dominio temporal X1[n], X2[n] en el dominio de la frecuencia con el fin de obtener la pluralidad de senales de canales de audio X1[b], X2[b]. En una forma de realizacion, el generador de parametros 101 determinar el primer conjunto de parametros de codificacion IPD[b] para cada contenedor de frecuencia [k] o para cada sub-banda de frecuencia [b] de las senales de canales de audio X1[b], X2[b].
En una primera etapa, el generador de parametros 105 aplica una transformada de tiempo-frecuencia en el canal de entrada del dominio temporal, p.e., el primer canal de entrada X1[n] y el canal de referencia del dominio temporal, p.e., el segundo canal de entrada X2[n]. En el caso de reproduccion estereo, estos son los canales izquierdo y derecho. En una forma de realizacion preferida, la transformada de tiempo-frecuencia es una Transformada de Fourier Rapida (FFT). En una forma de realizacion alternativa, la transformada de frecuencia-tiempo es un banco de filtros de modulacion cosenoidal o un banco de filtros completo.
En una segunda etapa, el generador de parametros 105 calcula un espectro cruzado para cada contenedor de frecuencia [b] de la fFt como:
5
10
15
20
25
30
35
40
45
50
55
imagen1
en donde c[b] es el espectro cruzado del contenedor de frecuencia [b] y Xi[b] y X2[b] son los coeficientes de FFT de los dos canales. El asterisco * indica una conjugacion completa. Para este caso, una sub-banda [b] corresponde directamente a un contenedor de frecuencia [k], mientras que el contenedor de frecuencia [b] y [k] representa exactamente el mismo contenedor de frecuencia.
como alternativa, el generador de parametros 105 calcula el espectro cruzado por sub-banda [b] como:
c[b] = E^Vt_1XiMX1[k], .
en donde c[b] es el espectro cruzado de la sub-banda [b] y Xi[k] y X2[k] son los coeficientes de FFT de los dos canales. El asterisco * indica una conjugacion completa. kb es la banda o sub-banda inicial b y kb+i es la banda inicial de la sub-banda adyacente b+1. Por lo tanto, las bandas de frecuencia [k] de FFT entre kb y kb+i-1 representan las sub-bandas [b].
Para diferencias de fase entre canales (IPDs) se calculan por sub-banda sobre la base del espectro cruzado como:
imagen2
en donde la operacion es el operador de argumento para calcular el angulo de c[b].
En una forma de realizacion, el generador de parametros 101 determina la primera media de parametros de codificacion IPDmean[i] de la senal de canal de audio X1[b] como una media del primer conjunto de parametros de codificacion IPD[b] de la senal de canal de audio X1[b] por intermedio de los contenedores de frecuencia [b] o sub- bandas de frecuencia [b].
La IPD promediada (IPDmean) a traves de las bandas de frecuencia [b] o las sub-bandas de frecuencia [b] se calcula segun se define en la ecuacion siguiente:
imagen3
en donde K es el numero de las bandas de frecuencia o de las sub-bandas de frecuencia que se tienen en cuenta para el calculo de la media.
En una forma de realizacion, el generador de parametros 101 determina la segunda media de parametros de codificacion IPDmean_long_term de la senal de canal de audio X1[b] como una media de una pluralidad de primera media de parametros de codificacion IPDmean[i] a traves de una pluralidad de tramas de la senal de canal de audio X1[b], en donde cada primera media de parametros de codificacion IPDmean[i] esta asociada a una trama [i] de la senal de audio multicanal.
Sobre la base de la media IPDmean anteriormente calculada, el generador de parametros 105 calcula una media a largo plazo de IPD. La media IPDmean_long_term se calcula como la media a traves de las N ultimas tramas (a modo de ejemplo N puede establecerse en 10).
imagen4
En una forma de realizacion, el generador de parametros 101 determina un valor absoluto IPDdistde una diferencia entre la segunda media de parametros de codificacion IPDmean_long_term y la primera media de parametros de codificacion IPDmean[i].
Con el fin de evaluar la estabilidad del parametro de IPD, la distancia entre IPDmean e IPDmean_long_term (IPDdist) se calcula a este respecto, lo que indica la evolucion de IPD durante las N ultimas tramas. En una forma de realizacion preferida, la distancia entre los valores de IPD local y a largo plazo se calcula como el valor absoluto de la diferencia entre la media local y a largo plazo.
5
10
15
20
25
30
35
40
45
50
55
60
65
— abs(IPDraean IPDmean_long_term)
Puede deducirse que si el parametro de IPDmean es estable a traves de las tramas anteriores, la distancia IPDdistse hace proxima a 0. La distancia es entonces igual a cero cuando la diferencia de fase es estable en el transcurso del tiempo. Esta distancia proporciona una buena estimacion de la similitud de los canales.
En una forma de realizacion, el generador de parametros 101 determina el parametro de codificacion ICC como una funcion del valor absoluto determinado IPDdist. En una forma de realizacion, el generador de parametros 101 determina el parametro de codificacion ICC a partir de una diferencia entre un primer valor parametrico d y el valor absoluto determinado IPDdist multiplicado por un segundo valor parametrico e. En una forma de realizacion, el generador de parametros 101 establece el primer valor parametrico d a uno y establece el segundo valor parametrico e a uno.
La coherencia o parametro ICC se calcula como ICC = 1 -IPDdist, puesto que ICC e IPDdisttienen una relacion inversa indirecta. El valor de ICC es proximo a 1 cuando los canales son similares e IPDdistse hace igual a cero en ese caso.
Como alternativa, la ecuacion para definir la relacion entre ICC e IPDdistse define como ICC = d - e. IPDdist con los valores de d y e eligiendose para representar mejor la relacion inversa entre los dos parametros. En otra forma de realizacion, la relacion entre ICC e IPDdistse obtiene a traves de una base de datos amplia y se generaliza luego como ICC = f(IPDdist).
Durante el segmento correlacionado de la senal de audio (a modo de ejemplo, para la senal de voz), el valor de IPDdist es pequeno y durante las partes difusas de la entrada de audio (a modo de ejemplo, para senal de musica), este parametro de IPDdist se hace mucho mayor y tendra un valor proximo a 1 si los canales de entrada no estan en correlacion. De este modo, ICC e IPDdist tienen una relacion inversa indirecta.
La Figura 2 ilustra un diagrama de bloques de un decodificador de audio parametrico 200 en conformidad con una forma de realizacion. El decodificador de audio parametrico 200 recibe un flujo de bit 203 transmitido a traves de un canal de comunicaciones como senal de entrada y proporciona una senal de audio multicanal decodificada 201 como senal de salida. El decodificador de audio parametrico 200 comprende un decodificador de flujos de bit 217 acoplado al flujo de bit 203 para decodificar el flujo de bit 203 en una parametro de codificacion 215 y una senal codificada 213, un decodificador 209 acoplado al decodificador de flujo de bit 217 para generar una senal suma 211 a partir de la senal codificada 213, un decodificador parametrico 205 acoplado al decodificador de flujo de bit 217 para decodificar un parametro 221 a partir del parametro de codificacion 215 y un sintetizador 205 acoplado al decodificador parametrico 205 y el decodificador 209 para sintetizar la senal de audio multicanal decodificada 201 a partir del parametro 221 y de la senal suma 211.
El decodificador de audio parametrico 200 genera los canales de salida de su senal de audio multicanal 201 tal como ICTD, ICLD y/o ICC entre los canales en proximidad a los de la senal de audio multicanal original. El sistema descrito es capaz de representar senales de audio multicanal a una tasa binaria solamente ligeramente mas alta que la que se requiere para representar una senal de audio monoaural. Esto es asf porque los valores de ICTD, ICLD e ICC estimados entre un par de canales contienen aproximadamente dos ordenes de magnitud de menos informacion que una forma de onda de audio. No solamente la baja tasa binaria sino tambien el aspecto de la compatibilidad retroactiva es de interes. La senal suma transmitida corresponde a una mezcla reducida monoaural de la senal multicanal o estereo.
La Figura 3 ilustra un diagrama de bloques de un codificador de audio estereo parametrico 301 y un decodificador 303 en conformidad con una forma de realizacion. El decodificador de audio esterero parametrico 301 corresponde al decodificador de audio parametrico 100 segun se describe con respecto a la Figura 1 pero la senal de audio multicanal 101 es una senal de audio estereo con canales de audio izquierdo 305 y derecho 307.
El codificador de audio estereo parametrico 301 recibe la senal de audio estereo 305, 307 que comprende una senal de audio de canal izquierdo 305 y una senal de audio de canal de audio 307, como senal de entrada y proporciona un flujo de bit como senal de salida 309. El codificador de audio estereo parametrico 301 comprende un generador de parametros 311 acoplado a la senal de audio estereo 305, 307 para generar parametros espaciales 313, un generador de senales mezclada reducida 315 acoplado a la senal de audio estereo 305, 307 para generar una senal mezclada reducida 317 o senal suma, un codificador monoaural 319 acoplado al generador de senales mezcladas reducidas 315 para codificar la senal mezclada reducida 317 para proporcionar una senal de audio codificada 321 y un combinador de flujo de bits 323 acoplado al generador de parametros 311 y al codificador monoaural 319 para combinar e parametro de codificacion 313 y la senal de audio codificada 321 para un flujo de bits con el fin de proporcionar la senal de salida 309. En el generador de parametros 311, los parametros espaciales 313 se extraen y cuantifican antes de que sean objeto de multiplexacion en el flujo de bits.
El decodificador de audio estereo parametrico 303 recibe el flujo de bits, esto es, la senal de salida 309 del codificador de audio estereo parametrico 301 transmitida a traves de un canal de comunicaciones, como una senal
5
10
15
20
25
30
35
40
45
50
de entrada y proporciona una senal de audio estereo decodificada con canal izquierdo 325 y canal derecho 327 como senal de salida. El decodificador de audio estereo parametrico 303 comprende un decodificador de flujos de bits 329 acoplado al flujo de bit recibido 309 para decodificar el flujo de bits 309 en parametros de codificacion 331 y una senal codificada 333, un decodificador monoaural 335 acoplado al decodificador de flujo de bits 329 para generar una senal suma 337 a partir de la senal codificada 333, un decodificador parametrico espacial 339 acoplado al decodificador de flujos de bit 329 para decodificar parametros espaciales 341 a partir de los parametros de codificacion 331 y un sintetizador 343 acoplado al decodificador parametrico espacial o sistema de resolucion 339 y el decodificador monoaural 335 para sintetizar la senal de audio estereo decodificada 325, 327 a partir de los parametros espaciales 341 y de la senal suma 337.
El procesamiento en el codificador de audio estereo parametrico 301 es capaz de extraer retardos y calcular el nivel de las senales de audio de forma adaptativa en el tiempo y frecuencia para generar los parametros espaciales 313, p.e., diferencias temporales entre canales (ICTDs) y diferencias de niveles entre canales (ICLDs). Ademas, el codificador de audio estereo parametrico 301 realiza un filtrado adaptativo temporal eficientemente para la smtesis de coherencia entre canales (ICC). En una forma de realizacion, el codificador estereo parametrico utiliza una Transformada de Fourier de Tiempo Corto (STFT) que sirve como base para un banco de filtros para la puesta en practica eficiente de los sistemas de codificacion de pistas binaurales (BCC) con baja complejidad de calculo. El procesamiento en el codificador de audio estereo parametrico 301 tiene baja complejidad de calculo y bajo retardo. Haciendo la codificacion de audio estereo parametrica adecuada para una puesta en practica asequible en microprocesadores o procesadores de senales digitales para aplicaciones en tiempo real.
El generador de parametros 311 ilustrado en la Figura 3 es funcionalmente el mismo que el generador de parametros correspondiente 105 descrito con respecto a la Figura 1, con la excepcion de que la cuantizacion y la codificacion de las pistas espaciales se ha anadido para fines ilustrativos. La senal suma 317 esta codificada con un codificador de audio monoaural convencional 319. En una forma de realizacion, el codificador de audio estereo parametrico 301 utiliza una transformacion de tiempo-frecuencia basada en la transformada STFT para transformar la senal de canal de audio estereo 305, 307 en el dominio de la frecuencia. La STFT aplica una Transformada de Fourier discreta (DFT) para las partes de ventanas temporales de una senal de entrada x(n). Una trama de senal de N muestras se multiplica con una ventana de longitud W antes de que se aplique una DFT de N puntos. Las ventanas adyacentes son objeto de solapamiento y se desplazan en W/2 muestras. La ventana se elige de modo que las ventanas en solapamiento se anadan hasta un valor constante de 1. Por lo tanto, para la transformacion inversa, no existe necesidad de establecer ventanas adicionales. Una DFT inversa sencilla de tamano N con avance temporal de tramas sucesivas de W/2 muestras se utiliza en el decodificador 303. Si no se modifica el espectro, la reconstruccion perfecta se consigue mediante solapamiento/adicion.
Puesto que la resolucion espectral uniforme de la STFT no esta bien adaptada a la percepcion humana, los coeficientes espectrales uniformemente espaciados, objeto de salida de la STFT, se agrupan en B particiones no solapantes con anchos de banda mejor adaptados para la percepcion. Una particion corresponde conceptualmente a una “sub-banda” en conformidad con la descripcion con respecto a la Figura 1. En una forma de realizacion alternativa, el codificador de audio estereo parametrico 301 utiliza un banco de filtro no uniforme para transformar la senal de canal de audio estereo 305, 307 en el dominio de la frecuencia.
En una forma de realizacion, el mezclador-reductor 315 determina los coeficientes espectrales de una particion b o de una sub-banda b de la senal suma ecualizada Sm(k) 317 mediante

.. ■ t. C • " .

■ ■ Sm{k) — efr(fc) Xr„,m(k) , ■-

■ ' ■ c=3, .
en donde Xc,m(k) son los espectros de los canales de audio de entrada 305, 307 y eb(k) es un factor de ganancia calculado como
imagen5
con estimaciones de la potencia de particion,
5
10
15
20
25
30
35
40
45
imagen6
Para impedir la presencia de elementos de ayuda resultantes de factores de ganancia de gran magnitud cuando la atenuacion de la suma de las senales de sub-banda es importante, los factores de ganancia eb(k) pueden limitarse a 6 dB, esto es, eb(k) < 2.
En una forma de realizacion, el generador de parametros 311 aplica una transformacion de tiempo-frecuencia, p.e., la STFT segun se describio anteriormente o una FFT sobre los canales de entrada, esto es, en el canal izquierdo 305 y en el canal derecho 307. En una forma de realizacion, la transformacion de tiempo-frecuencia es una Transformada de Fourier Rapida (FFT). En una forma de realizacion alternativa, la transformacion de tiempo- frecuencia se realiza en una banco de filtros de modulacion cosenoidal o en un banco de filtros complejo.
El generador de parametros 311 calcula un espectro cruzado para cada contenedor de frecuencia [b] de la FFT o de la STFT como
imagen7
Para este caso, una sub-banda [b] corresponde directamente a un solo contenedor de frecuencia [k], representando un contenedor de frecuencia [b] y [k] exactamente el mismo contenedor de frecuencia.
Como alternativa, el generador de parametros 311 calcula el espectro cruzado para la sub-banda [k] como
imagen8
en donde c[b] es el espectro cruzado de la banda b o la sub-banda k. X-i[k] y X2[k] son los coeficientes de FFT del canal izquierdo 305 y del canal derecho 307. El operador de asterisco * indica una conjugacion compleja. kb es la banda inicial de la sub-banda k y kb+1 es la banda inicial de la sub-banda b+1 adyacente. En consecuencia, las bandas de frecuencia [k] de una FFT o STFT entre kb y kb+1-1 representan las sub-bandas [b].
Las diferencias de fase entrecanales (IPDs) se calculan por sub-banda sobre la base del espectro cruzado como:
imagen9
en donde la operacion L es el operador de argumento para el calculo del angulo de c[b].
A continuacion, el generador de parametros 311 calcula el valor promediado de IPD (IPDmean) a traves de las bandas de frecuencia o de las sub-bandas de frecuencia segun se define en la ecuacion siguiente.
imagen10
en donde K es el numero de las bandas de frecuencia o de las sub-bandas de frecuencia que se tienen en cuenta para el calculo de la media.
A continuacion, sobre la base del valor de IPDmean anteriormente calculado, el generador de parametros 311 calcula una media a largo plazo de IPD. El IPDmean_long_term se calcula como la media a traves de las N ultimas tramas, en una forma de realizacion, siendo N establecido a un valor de 10.
5
10
15
20
25
30
35
40
45
50
55
60
imagen11
Con el fin de evaluar la estabilidad del parametro de IPD, el generador de parametros 311 calcula la distancia IPDdist entre IPDmean y IPDmean_long_term que ilustra la evolucion del IPD durante las N ultimas tramas. En una forma de realizacion, la distancia entre el iPd local y a largo plazo se calcula como el valor absoluto de la diferencia entre la media local y la media a largo plazo:
~ abs(IPDmean — lPDmean_)ong_tenri)
Puede deducirse que si el parametro de IPDmean es estable a traves de las tramas anteriores, el valor de la distancia IPDdist se hace proximo a 0. La distancia es entonces igual a cero cuando la diferencia de fase es estable en el transcurso del tiempo. Esta distancia proporciona una buena estimacion de la similitud de los canales.
En una forma de realizacion, el generador de parametros 311 calcula la coherencia o parametro ICC como ICC = 1- IPDdist puesto que ICC e IPDdist tienen una relacion inversa indirecta. El valor de ICC esta proximo a 1 cuando los canales son similares y el valor de IPDdist se hace igual a 0 en ese caso.
Como alternativa, el generador de parametros 311 utiliza la relacion entre ICC e IPDdist definida como ICC = d-e. IPDdist con d y e siendo parametros elegidos para representar mejor la relacion inversa entre los dos parametros ICC e IPDdist. En una forma de realizacion alternativa, el generador de parametros 311 obtiene la relacion entre ICC e IPDdist a traves de una amplia base de datos que se generaliza como ICC = f(IPDdist).
Durante un segmento en correlacion de una senal de audio, a modo de ejemplo, para la senal de voz, el valor de IPDdist es pequeno y durante partes difusas de la salida de audio, a modo de ejemplo, para senal de musica, este parametro de IPDdist se hace mucho mayor y sera proximo a 1 si los canales de entrada no estan en correlacion. De este modo, ICC e IPDdist tienen una relacion inversa indirecta.
El generador de parametros 311 utiliza IPDdist para una estimacion aproximada del valor de ICC. El espectro cruzado requiere una mas baja complejidad que el calculo de la correlacion. Ademas, en caso de calculo del IPD en el codificador de audio espacial parametrico, este espectro cruzado esta ya calculado y se deduce, en consecuencia, la complejidad total.
La Figura 4 ilustra un diagrama esquematico de un metodo 400 para generar un parametro de codificacion en conformidad con una forma de realizacion. El metodo 400 para generar el parametro de codificacion ICC para una senal de canal de audio x-i[n] de entre una pluralidad de senales de canales de audio x-i[n], x2[n] de una senal de audio multicanal. Cada senal de canal de audio x-i[n], x2[n] tiene valores de senales de canales de audio. La Figura 4 ilustra el caso de estereo en donde la pluralidad de senales de canales de audio comprende un canal de audio izquierdo x-i[n] y un canal de audio derecho x2[n]. El metodo 400 comprende:
aplicar una transformacion de FFT 401 a la senal de canal de audio izquierdo x-i[n] y aplicar una transformacion de FFT 403 a la senal de canal de audio derecho x2[n] para obtener senales de canales de audio en el dominio de la frecuencia X-i[b] y X2[b], en donde X-i[b] es la senal de canal de audio izquierdo y X2[b] es la senal de canal de audio derecho con respecto al contenedor de frecuencia [b] en el dominio de la frecuencia. como alternativa, se aplica una transformacion de banco de filtros a la senal de canal de audio izquierdo x-i[n] y a la senal de canal de audio derecho x2[n] para obtener senales de canales de audio X-i[b], X2[b] en sub-bandas de la frecuencia, en donde [b] indica la sub-banda de frecuencia;
determinar 405 una correlacion cruzada c[b] de cada contenedor de frecuencia [b] de la senal de canal de audio izquierdo X-i[b] y la senal de canal de audio derecho X2[b] o de forma alternativa, determinar 405 una correlacion cruzada c[b] de cada sub-banda de frecuencia [b] de la senal de canal de audio izquierdo X-i[b] y de la senal de canal de audio derecho X2[b];
determinar 407 para la senal de canal de audio X-i[b] de la pluralidad de senales de canales de audio un primer conjunto de parametros de codificacion IPD[b] de los valores de senales de canales de audio de la senal de canal de audio X-i[b] y los valores de senales de audio de referencia de una senal de audio de referencia X2[b], en donde la senal de audio de referencia es otra senal de canal de audio X2[b] de la pluralidad de senales de canales de audio o una senal de audio mezclada reducida derivada de al menos dos senales de canales de audio de la pluralidad de senales de audio multicanal. La Figura 4 ilustra el caso de estereo, en donde la operacion de determinacion 407 determina para la senal de canal de audio izquierdo X-i[b] el primer conjunto de parametros de codificacion IPD[b] y en donde la senal de audio de referencia es la senal de canal de audio derecho X2[b];
determinar 409 para la senal de canal de audio X-i[b] una primera media de parametros de codificacion IPDmean[i]
5
10
15
20
25
30
35
40
45
50
55
sobre la base del primer conjunto de parametros de codificacion IPD[b] de la senal de canal de audio Xi[b];
determinar 411 para la senal de canal de audio X1[b] una segunda media de parametros de codificacion IPDmean_long_term sobre la base de la primera media de parametros de codificacion IPDmean[i] de la senal de canal de audio Xi[b] y al menos una otra media de parametros de codificacion IPDmean[i-1] de la senal de canal de audio Xi[b]. La otra primera media de parametros de codificacion IPDmean[i-1] se calcula a partir de las N-1 tramas anteriores de la senal de canal de audio X1[b]; y
determinar 413 o calcular el parametro de codificacion ICC sobre la base de la primera media de parametros de codificacion IPDmean[i] de la senal de canal de audio X1[b] y la segunda media de parametros de codificacion IPDmean_long_term de la senal de canal de audio X1[b].
En una forma de realizacion, el primer conjunto de parametros de codificacion IPD[b] de la senal de canal de audio X1[b] esta ya disponible y el metodo 400 se inicia con las etapas 409, 411 y 413 segun se describio con anterioridad.
Aunque no se ilustra en la Figura 4, el metodo 400 es aplicable al caso general de senales de audio multicanal, siendo entonces la senal de referencia otra senal de canal de audio o una senal de audio mezclada reducida segun se describio anteriormente con respecto a la Figura 1.
En una forma de realizacion, el metodo 400 se procesa como sigue:
en una primera etapa 401,403, se aplica una transformacion de tiempo-frecuencia en los canales de entrada (canal izquierdo y canal derecho en caso de estereo). En una forma de realizacion preferida, la transformacion de tiempo- frecuencia se realiza con una Transformada de Fourier rapida (FFT). En una forma de realizacion alternativa, la transformacion de tiempo-frecuencia puede realizarse con un banco de filtros de modulacion cosenoidal o un banco de filtros complejo.
En una segunda etapa 405, un espectro cruzado para cada contenedor de frecuencia de la FFT se calcula mediante
imagen12
en donde una sub-banda [b] corresponde directamente a un solo contenedor de frecuencia [k], con el contenedor de frecuencia [b] y [k] representando exactamente el mismo contenedor de frecuencia.
Como alternativa, el espectro cruzado puede calcularse por sub-banda como
imagen13
en donde c[b] es el espectro cruzado de la banda b o de la sub-banda b. X1[k] y X2[k] son los coeficientes de FFT de los dos canales (a modo de ejemplo canales izquierdo y derecho en caso de estereo). El asterisco * indica una conjugacion completa. kb es la banda inicial de sub-banda b y kb+1 es la banda inicial de la sub-banda adyacente b+1. Por lo tanto, las bandas de frecuencia [k] de la FFT entre kb y kb+1-1 representan las sub-bandas [b].
En una tercera etapa 407, las diferencias de fase entre canales (IPDs) se calculan por sub-banda, sobre la base del espectro cruzado como
imagen14
en donde la operacion Z. es el operador de argumento para calcular el angulo de c[b],
En una cuarta etapa 409, el IPD promediado (IPDmean) a traves de las bandas de frecuencia (o sub-bandas de frecuencia) se calcula tambien segun se define en la ecuacion siguiente:
en donde K es el numero de las bandas de frecuencia o de las sub-bandas de frecuencia que se tienen en cuenta para el calculo de la media.
imagen15
5
10
15
20
25
30
35
40
45
50
55
60
En una quinta etapa 411, basada en el valor de IPDmean anteriormente calculado se determina una media a largo plazo de IPD. El IPDmeanjong_term se calcula como la media a traves de las N ultimas tramas (a modo de ejemplo, N puede establecerse a 10).
imagen16
Con el fin de evaluar la estabilidad del parametro de IPD, la distancia entre IPDmean e IPDmean_long_term (IPDdist) es objeto de calculo, lo que muestra la evolucion de IPD durante las N ultimas tramas. En una forma de realizacion preferida, la distancia entre el IPD local y a largo plazo se calcula como el valor absoluto de la diferencia entre la media local y la media a largo plazo:
IPDdist = abs(IPDmean IPDmean_long_term)
Puede deducirse que si el parametro de IPDmean es estable a traves de las tramas anteriores, la distancia IPDdist se hace proxima a 0. La distancia es entonces igual a cero cuando la diferencia de fase es estable en el transcurso del tiempo. Esta distancia proporciona una buena estimacion de la similitud de los canales.
En una sexta etapa 413, el parametro de ICC o la coherencia se calcula por ICC = 1-IPDdist, puesto que ICC e IPDdist tienen una relacion inversa indirecta. El valor de ICC es proximo a 1 cuando los canales son similares e IPDdist se hace igual a cero en ese caso.
En una forma de realizacion alternativa de la sexta etapa 413, la ecuacion para definir la relacion entre ICC e IPDdist se define como ICC = d-e. IPDdist con los parametros d y e eligiendose para representar mejor la relacion inversa entre los dos parametros ICC e IPDdist. En otra forma de realizacion de la sexta etapa 413, la relacion entre ICC e IPDdist se obtiene mediante una base de datos amplia y puede generarse entonces como ICC = f(IPDdist).
Durante un segmento en correlacion de una senal de audio (a modo de ejemplo, para senal de voz), el valor de IPDdist es pequeno y durante partes difusas de la entrada de audio (a modo de ejemplo, para senal de musica), este parametro de IPDdist se hace mucho mayor y su valor sera proximo a 1 si los canales de entrada no estan en correlacion. De este modo, ICC e IPDdist tienen una relacion inversa indirecta.
De lo que antecede un experto en esta tecnica deducira que se dan a conocer una diversidad de metodos, sistemas, programas informaticos en soportes de registro y similares.
La presente invencion soporta tambien un producto de programa informatico que incluye un codigo ejecutable por ordenador o instrucciones ejecutables por ordenador que, cuando se ejecutan, hacen que al menos un ordenador ejecute las etapas de realizacion y calculo aqrn descritas.
La presente invencion soporta tambien un sistema configurado para ejecutar las etapas de realizacion y calculo aqrn descritas.
Numerosas alternativas, modificaciones y variantes seran evidentes para los expertos en esta tecnica teniendo en cuenta las ensenanzas anteriores. Por supuesto, los expertos en esta tecnica reconocen facilmente que existen numerosas aplicaciones de la invencion mas alla de las aqrn descritas. Aunque la presente invencion ha sido descrita con referencia a una o mas formas de realizacion particulares, los expertos en esta tecnica reconocen que pueden efectuarse numerosos cambios sin desviarse por ello del alcance de proteccion de la presente invencion. Por lo tanto, ha de entenderse que dentro del alcance de las reivindicaciones adjuntas y de sus equivalentes, puede realizarse la invencion de forma distinta a la aqrn concretamente descrita.
Una forma de realizacion correspondiente de la presente invencion puede aplicarse en el codificador de la extension estereo de las normas ITU-T G.722, G.722 Anexo B, G.711.1 y/o G.711.1 Anexo D. Ademas, el metodo descrito puede aplicarse tambien para un codificador de voz y de audio para aplicacion movil segun se define en 3GPP EVS (servicio de voz mejorado) codec.

Claims (11)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    REIVINDICACIONES
    1. Un codificador de audio parametrico (100) para generar un parametro de codificacion (ICC) para una senal de canal de audio (X1[b]) de una pluralidad de senales de canales de audio (X-i[b], X2[b]) de una senal de audio multicanal, teniendo cada senal de canal de audio (Xi[b], X2[b]) valores de senal de canal de audio (Xi[k], X2[k]), siendo el parametro de codificacion un parametro de coherencia intercanales (ICC), comprendiendo el codificador de audio parametrico (100) un generador de parametros (105), estando el generador de parametros (105) para
    - para determinar para la senal de canal de audio (X1[b]) de la pluralidad de senales de canales de audio un primer conjunto de parametros de codificacion (IPD[b]) a partir de los valores de senal de canal de audio (X1[k]) de la senal de canal de audio (X1[b]) y valores de senal de audio de referencia (X2[k]) de una senal de audio de referencia (X2[b]), en donde la senal de audio de referencia es otra senal de canal de audio (X2[b]) de la pluralidad de senales de canales de audio o una senal de audio mezclada reducida derivada de al menos dos senales de canales de audio de la pluralidad de senales de audio multicanales, en donde el primer conjunto de parametros de codificacion (IPD[b]) son parametros de diferencia de fase intercanales o parametros de diferencia de fase intercanales de sub-banda,
    - para determinar para la senal de canal de audio (X1[b]) un primer valor medio de parametros de codificacion (IPDmean[i]) sobre la base del primer conjunto de parametros de codificacion (IPD[b]) del primer canal de senal de audio (X1[b]), refiriendose el primer valor medio de parametros de codificacion a una trama corriente de la senal de canal de audio, en donde el generador de parametros (105) esta configurado para determinar el primer valor medio de parametros de codificacion (IPDmean[i]) de la senal de canal de audio (X1[b]) como una media del primer conjunto de parametros de codificacion (IPD[b]) de la senal de canal de audio (X1[b]) a traves de bandas de frecuencias [k] o de sub-bandas de frecuencia [b],
    - para determinar para la senal de canal de audio (X1[b]) una segunda media de parametros de codificacion (IPDmean_long_term) en funcion de la primera media de parametros de codificacion (IPDmean[i]) de la senal de canal de audio (X1[b]) y al menos una otra primera media de parametros de codificacion ( IPDmean[i-1]) de la senal de canal de audio (X1[b]), refiriendose a la al menos una otra primera media de parametros de codificacion a una trama anterior de la senal de canal de audio, y
    - para determinar el parametro de codificacion (ICC) sobre la base de la primera media de parametros de codificacion (IPDmean[i]) de la senal de canal de audio (X1[b]) y la segunda media de parametros de codificacion (IPDmean_long_term) de la senal de canal de audio (X1[b]);
    en donde el generador de parametros (105) esta configurado, ademas
    - para determinar un valor absoluto (IPDdist) de una diferencia entre la segunda media de parametros de codificacion (IPDmean_long_term) y la primera media de parametros de codificacion (IPDmean[i]), y
    - para determinar el parametro de codificacion (ICC) como una funcion de valor absoluto determinado (IPDdist).
  2. 2. El codificador de audio parametrico (100) segun la reivindicacion 1, en donde el generador de parametros (105) esta configurado para determinar diferentes de fase de valores de senal de canal de audio siguientes (X1[k]) con el fin de obtener el primer conjunto de parametros de codificacion (IPD[b]).
  3. 3. El codificador de audio parametrico (100) segun una de las reivindicaciones precedentes, en donde la senal de canal de audio (X1[b]) y la senal de audio de referencia (X2[b]) son senales del dominio de frecuencia y en donde los valores de la senal de canal de audio (X1[k]) y los valores de la senal de audio de referencia (X2[k]) estan asociados con las bandas de frecuencia (k) o las sub-bandas de frecuencia (b).
  4. 4. El codificador de audio parametrico (100) segun una de las reivindicaciones precedentes, que comprende, ademas, un transformador (FFT) para transformar una pluralidad de senales de canales de audio en el dominio temporal (x1[n], X2[n]) en el dominio de la frecuencia para obtener la pluralidad de senales de canales de audio (X1[b], X2[b]).
  5. 5. El codificador de audio parametrico (100) segun una de las reivindicaciones precedentes, en donde el generador de parametros (105) esta configurado para determinar el primer conjunto de parametros de codificacion (IPD[b]) para cada contenedor de frecuencia ([k]) o para cada sub-banda de frecuencia ([b]) de las senales de canales de audio (X1[b], X2[b]).
  6. 6. El codificador de audio parametrico (100) segun una de las reivindicaciones precedentes, en donde el generador de parametros (105) esta configurado para determinar la segunda media de parametros de codificacion (IPDmean_long_term) de la senal de canal de audio (X1[b]) como una media de una pluralidad de primeras medias de parametros de codificacion (IPDmean[i]) en una pluralidad de tramas de la senal de canal de audio (X1[b]), en donde cada primera media de parametros de codificacion (IPDmean[i]) esta asociada a una primera trama (i) de la senal de
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    audio multicanal.
  7. 7. El codificador parametrico (100) segun una de las reivindicaciones precedentes, en donde el generador de parametros (105) esta configurado para determinar el parametro de codificacion (ICC) a partir de una diferencia entre un primer valor parametrico (d) y el valor absoluto determinado (IPDdist) multiplicado por un segundo valor parametrico (e).
  8. 8. El codificador de audio de parametrico (100) segun la reivindicacion 7, en donde el generador de parametros (105) esta configurado para establecer el primer valor parametrico (d) a uno y para establecer el segundo valor parametrico (e) a uno.
  9. 9. El codificador de audio parametrico (100) segun una de las reivindicaciones precedentes, que comprende, ademas, un generador de senales mezcladas reducidas para superponer al menos dos de las senales de canales de audio de la senal de audio multicanal con el fin de obtener una senal mezclada reducida, un codificador de audio, en particular, un codificador mono, para codificar la senal mezclada reducida para obtener una senal de audio codificada y un combinador para combinar la senal de audio codificada con un parametro de codificacion correspondiente.
  10. 10. Un metodo (400) para generar un parametro de codificacion (ICC) para una senal de canal de audio (X-i[b]) de una pluralidad de senales de canales de audio (X-i[b], X2[b]) de una senal de audio multicanal, teniendo cada senal de canal de audio (X-i[b], X2[b]) valores de senales de canales de audio (X-i[k], X2[k]), siendo el parametro de codificacion un parametro de coherencia intercanales (ICC), comprendiendo el metodo (400):
    - la determinacion (407) para la senal de canal de audio (X-i[b]) de la pluralidad de senales de canales de audio un primer conjunto de parametros de codificacion (IPD[b]) a partir de los valores de senales de canales de audio (X-i[k]) de la senal de canal de audio (X-i[b]) y los valores de la senal de audio de referencia (X2[k]) de una senal de audio de referencia (X2[b]), en donde la senal de audio de referencia es otra senal de canal de audio (X2[b]) de la pluralidad de senales de canales de audio o una senal de audio mezclada reducida derivada de al menos dos senales de canales de audio de la pluralidad de senales de audio multicanales, en donde el primer conjunto de parametros de codificacion (IPD[b]) son parametros de diferencia de fase intercanal o parametros de diferencia de fase intercanal de sub-banda,
    - la determinacion (409) para la senal de canal de audio (X-i[b]) de una primera media de parametros de codificacion (IPDmean[i]) sobre la base del primer conjunto de parametros de codificacion (IPD[b]) de la senal de canal de audio (X1 [b]), refiriendose la primera media de parametros de codificacion a una trama corriente de la senal de canal de audio, en donde la primera media de parametros de codificacion (IPDmean[i]) se determina como una media del primer conjunto de parametros de codificacion (IPD[b]) de la senal de canal de audio (X-i[b]) a traves de bandas de frecuencia [k] o sub-bandas de frecuencia [b],
    - la determinacion (411) para la senal de canal de audio (X-i[b]) de una segunda media de parametros de codificacion (IPDmean_long_term) sobre la base de la primera media de parametros de codificacion (IPDmean[i]) de la senal de canal de audio (X-i[b]) y al menos una otra primera media de parametros de codificacion ( IPDmean[i-1]) de la senal de canal de audio (X-i[b]), refiriendose a por lo menos otra primera media de parametros de codificacion a una trama anterior de la senal de canal de audio, y
    - la determinacion (413) del parametro de codificacion (ICC) sobre la base de la primera media de parametros de codificacion (IPDmean[i]) de la senal de canal de audio (X-i[b]) y la segunda media de parametros de codificacion (IPDmean_long_term) de la senal de canal de audio (X-i[b]);
    en donde la determinacion (413) del parametro de codificacion (ICC) sobre la base de la primera media de parametros de codificacion (IPDmean[i]) de la senal de canal de audio (X-i[b]) y la segunda media de parametros de codificacion (IPDmean_long_term) de la senal de canal de audio comprende:
    - la determinacion de un valor absoluto (IPDdist) de una diferencia entre la segunda media de parametros de codificacion (IPDmean_long_term) y la primera media de parametros de codificacion (IPDmean[i]), y
    - la determinacion del parametro de codificacion (ICC) como una funcion del valor absoluto determinado (IPDdist).
  11. 11. Un programa informatico que esta configurado para poner en practica el metodo segun la reivindicacion 10 cuando se ejecuta en un ordenador.
ES12707055.5T 2012-02-17 2012-02-17 Codificador paramétrico para codificar una señal de audio multicanal Active ES2555136T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2012/052734 WO2013120531A1 (en) 2012-02-17 2012-02-17 Parametric encoder for encoding a multi-channel audio signal

Publications (1)

Publication Number Publication Date
ES2555136T3 true ES2555136T3 (es) 2015-12-29

Family

ID=45808779

Family Applications (1)

Application Number Title Priority Date Filing Date
ES12707055.5T Active ES2555136T3 (es) 2012-02-17 2012-02-17 Codificador paramétrico para codificar una señal de audio multicanal

Country Status (7)

Country Link
US (1) US9401151B2 (es)
EP (1) EP2702776B1 (es)
JP (1) JP5724044B2 (es)
KR (1) KR101580240B1 (es)
CN (1) CN104246873B (es)
ES (1) ES2555136T3 (es)
WO (1) WO2013120531A1 (es)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2702776B1 (en) * 2012-02-17 2015-09-23 Huawei Technologies Co., Ltd. Parametric encoder for encoding a multi-channel audio signal
CN104681029B (zh) * 2013-11-29 2018-06-05 华为技术有限公司 立体声相位参数的编码方法及装置
CN106033671B (zh) * 2015-03-09 2020-11-06 华为技术有限公司 确定声道间时间差参数的方法和装置
US10152977B2 (en) * 2015-11-20 2018-12-11 Qualcomm Incorporated Encoding of multiple audio signals
US9978381B2 (en) * 2016-02-12 2018-05-22 Qualcomm Incorporated Encoding of multiple audio signals
CN107358961B (zh) * 2016-05-10 2021-09-17 华为技术有限公司 多声道信号的编码方法和编码器
CN107358960B (zh) * 2016-05-10 2021-10-26 华为技术有限公司 多声道信号的编码方法和编码器
CN107742521B (zh) * 2016-08-10 2021-08-13 华为技术有限公司 多声道信号的编码方法和编码器
CN107731238B (zh) * 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
US10366695B2 (en) * 2017-01-19 2019-07-30 Qualcomm Incorporated Inter-channel phase difference parameter modification
JP7149936B2 (ja) * 2017-06-01 2022-10-07 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置及び符号化方法
CN109215668B (zh) * 2017-06-30 2021-01-05 华为技术有限公司 一种声道间相位差参数的编码方法及装置
CN109859766B (zh) * 2017-11-30 2021-08-20 华为技术有限公司 音频编解码方法和相关产品
EP3588495A1 (en) 2018-06-22 2020-01-01 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Multichannel audio coding
JP2021145311A (ja) * 2020-03-13 2021-09-24 ヤマハ株式会社 音響処理装置および音響処理方法
EP4383254A1 (en) * 2022-12-07 2024-06-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder comprising an inter-channel phase difference calculator device and method for operating such encoder

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ES2295837T3 (es) 2004-03-12 2008-04-16 Nokia Corporation Sistesis de una señal de audio monofonica sobre la base de una señal de audio multicanal codificada.
JP4950040B2 (ja) * 2004-06-21 2012-06-13 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャンネルオーディオ信号を符号化及び復号する方法及び装置
WO2007010785A1 (ja) * 2005-07-15 2007-01-25 Matsushita Electric Industrial Co., Ltd. オーディオデコーダ
WO2007040364A1 (en) 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
EP1984913A4 (en) 2006-02-07 2011-01-12 Lg Electronics Inc DEVICE AND METHOD FOR CODING / DECODING A SIGNAL
US8027479B2 (en) 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
WO2008084427A2 (en) 2007-01-10 2008-07-17 Koninklijke Philips Electronics N.V. Audio decoder
WO2010003521A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and discriminator for classifying different segments of a signal
PT2489037T (pt) * 2009-10-16 2022-01-07 Fraunhofer Ges Forschung Aparelho, método e programa de computador para fornecer parâmetros ajustados
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
WO2011072729A1 (en) * 2009-12-16 2011-06-23 Nokia Corporation Multi-channel audio processing
CN103026406B (zh) * 2010-09-28 2014-10-08 华为技术有限公司 用于对已解码多通道音频信号或已解码立体声信号进行后处理的装置和方法
FR2966634A1 (fr) * 2010-10-22 2012-04-27 France Telecom Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
EP2702776B1 (en) * 2012-02-17 2015-09-23 Huawei Technologies Co., Ltd. Parametric encoder for encoding a multi-channel audio signal

Also Published As

Publication number Publication date
US20140098963A1 (en) 2014-04-10
KR101580240B1 (ko) 2016-01-04
EP2702776B1 (en) 2015-09-23
US9401151B2 (en) 2016-07-26
JP2014529101A (ja) 2014-10-30
CN104246873A (zh) 2014-12-24
KR20140128423A (ko) 2014-11-05
EP2702776A1 (en) 2014-03-05
WO2013120531A1 (en) 2013-08-22
CN104246873B (zh) 2017-02-01
JP5724044B2 (ja) 2015-05-27

Similar Documents

Publication Publication Date Title
ES2555136T3 (es) Codificador paramétrico para codificar una señal de audio multicanal
ES2555579T3 (es) Codificador de audio multicanal y método para codificar una señal de audio multicanal
ES2773794T3 (es) Aparato y procedimiento para estimar una diferencia de tiempos entre canales
US9449604B2 (en) Method for determining an encoding parameter for a multi-channel audio signal and multi-channel audio encoder
KR101445293B1 (ko) 전송된 위상 정보를 사용하여 역상관된 신호를 발생시키기 위한 장치
RU2345506C2 (ru) Многоканальный синтезатор и способ для формирования многоканального выходного сигнала
RU2393646C1 (ru) Усовершенствованный способ для формирования сигнала при восстановлении многоканального аудио
KR101798117B1 (ko) 후방 호환성 다중 해상도 공간적 오디오 오브젝트 코딩을 위한 인코더, 디코더 및 방법
KR101662682B1 (ko) 채널간 차이 추정 방법 및 공간적 오디오 코딩 장치
JP2017058696A (ja) インターチャネル差分推定方法及び空間オーディオ符号化装置
Jansson Stereo coding for the ITU-T G. 719 codec
RU2575393C2 (ru) Кодирование и декодирование позиций слотов с событиями в кадре аудиосигнала