ES2609449T3 - Decodificación de audio - Google Patents

Decodificación de audio Download PDF

Info

Publication number
ES2609449T3
ES2609449T3 ES07735236.7T ES07735236T ES2609449T3 ES 2609449 T3 ES2609449 T3 ES 2609449T3 ES 07735236 T ES07735236 T ES 07735236T ES 2609449 T3 ES2609449 T3 ES 2609449T3
Authority
ES
Spain
Prior art keywords
signal
channel
matrices
matrix
frequency subbands
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES07735236.7T
Other languages
English (en)
Inventor
Lars F. Villemoes
Erik G. P. Schuijers
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Dolby International AB
Original Assignee
Koninklijke Philips NV
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Dolby International AB filed Critical Koninklijke Philips NV
Application granted granted Critical
Publication of ES2609449T3 publication Critical patent/ES2609449T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Abstract

Un decodificador de audio (715) que comprende: - medios (801) para recibir datos de entrada que comprenden una señal de N canales que corresponde a una señal de mezclado descendente de una señal de audio de M canales, M>N, que tiene matrices de codificación de subbanda de valor complejo aplicadas en subbandas de frecuencia y datos paramétricos de múltiples canales asociados con la señal de mezclado descendente; y caracterizado por comprender adicionalmente: - medios (805) para generar subbandas de frecuencia para la señal de N canales, siendo al menos algunas de las subbandas de frecuencia subbandas de frecuencia de valor real; - medios de determinación (809) para determinar matrices de decodificación de subbanda de valor real para compensar la aplicación de las matrices de codificación en respuesta a los datos paramétricos de múltiples canales; y - medios (807) para generar datos de mezclado descendente que corresponden a la señal de mezclado descendente mediante una multiplicación de matriz de las matrices de decodificación de subbanda de valor real y datos de la señal de N canales al menos en algunas subbandas de frecuencia de valor real.

Description

5
10
15
20
25
30
35
40
45
50
55
60
Decodificacion de audio DESCRIPCION
La invencion se refiere a la decodificacion de audio y en particular, aunque no de manera exclusiva, a la decodificacion de senales envolventes MPEG.
La codificacion digital de diversas senales de origen se ha vuelto cada vez mas importante a traves de las ultimas decadas puesto que la representacion y comunicacion de senal digital ha reemplazado cada vez mas la representacion y comunicacion analogica. Por ejemplo, la distribucion de contenido de medios, tal como v^deo y musica esta basada cada vez mas en la codificacion del contenido digital.
Ademas, en la ultima decada ha existido la tendencia hacia el audio de multiples canales y de manera espedfica, hacia el audio espacial que se extiende mas alla de las senales convencionales de estereo. Por ejemplo, las grabaciones tradicionales de estereo solo comprenden dos canales, mientras que los sistemas modernos y avanzados de audio normalmente utilizan cinco o seis canales, como en los sistemas conocidos de sonido envolvente de 5.1 canales. Esto proporciona una experiencia de escucha mas involucrada, donde el usuario puede ser rodeado por fuentes de sonido.
Diversas tecnicas y normas se han desarrollado para la comunicacion de estas senales de multiples canales. Por ejemplo, seis canales discretos que representan un sistema envolvente 5.1 pueden transmitirse de acuerdo con las normas, tales como las normas de Codificacion Avanzada de Audio (AAC) o Dolby Digital.
No obstante, para proporcionar una compatibilidad hacia atras, se conoce el mezclado descendente del numero mas alto a un numero mas bajo de canales, y de manera espedfica, se utiliza frecuentemente para el mezclado descendente de una senal de sonido envolvente 5.1 a una senal de estereo que permita que se reproduzca la senal de estereo mediante decodificadores (estereo) heredados y una senal 5.1 mediante decodificadores de sonido envolvente.
Un ejemplo es el metodo de codificacion compatible hacia atras MPEG2. Una senal de multiples canales se mezcla de manera descendente en una senal de estereo. Las senales adicionales se codifican como datos de multiples canales en la porcion de datos auxiliares que permite que un decodificador de multiples canales MPEG2 genere una representacion de la senal de multiples canales. Un decodificador MPEG1 desechara los datos auxiliares y de esta manera, solo decodificara el mezclado descendente estereo. La desventaja principal del metodo de codificacion aplicado en MPEG2 es que la tasa adicional de datos que se requiere para las senales adicionales es del mismo orden de magnitud que la tasa de datos que se requiere para codificar la senal estereo. La tasa de bits adicional para ampliar estereo a audio de multiples canales es por lo tanto significativa.
Otros metodos existentes para transmision de multiples canales compatibles hacia atras sin informacion de multiples canales adicional pueden estar caracterizados tfpicamente como metodos envolventes de matrices. Ejemplos de codificacion envolvente de matriz incluyen metodos tales como Dolby Prologic II y Logic-7. El principio comun de estos metodos es que su matriz multiplica los multiples canales de la senal de entrada por una matriz adecuada generando de esta manera una senal de salida con un numero inferior de canales. Espedficamente, un codificador de matriz aplica tfpicamente desplazamientos de fase a los canales envolventes antes de mezclarlos con los canales frontal y central.
Otra razon para una conversion de canal es la eficacia de codificacion. Se ha encontrado que, por ejemplo, las senales de audio de sonido envolvente pueden codificarse como senales de audio de canal estereo combinadas con un flujo de bits de parametros que describe las propiedades espaciales de la senal de audio. El decodificador puede reproducir las senales de audio estereo con un grado muy satisfactorio de precision. De esta manera, pueden obtenerse ahorros de tasa de bits sustanciales.
Existen varios parametros que pueden utilizarse para describir las propiedades espaciales de las senales de audio. Un parametro de este tipo es la correlacion cruzada entre canales, tal como la correlacion cruzada entre el canal izquierdo y el canal derecho para las senales de estereo. Otro parametro es la relacion de potencia de los canales. En los denominados codificadores de audio espacial (parametricos), tal como el codificador de Envolvente MPEG, estos y otros parametros se extraen de la senal de audio original para producir una senal de audio que tiene un numero reducido de canales, por ejemplo, solo un canal unico, mas un conjunto de parametros que describen las propiedades espaciales de la senal de audio original. En los denominados decodificadores de audio espacial (parametricos), las propiedades espaciales que se describen por los parametros espaciales transmitidos se vuelven a instanciar.
Preferentemente, tal codificacion de audio espacial emplea una estructura jerarquica en cascada o basada en arbol
5
10
15
20
25
30
35
40
45
50
55
60
que comprende unidades convencionales en el codificador y el decodificador. En el codificador, estas unidades convencionales pueden ser mezcladores descendentes que combinan canales en un numero mas bajo de canales, tales como los mezcladores descendentes de 2 a 1, 3 a 1, 3 a 2, etc., mientras que en el decodificador correspondiente las unidades convencionales pueden ser mezcladores ascendentes que dividen los canales en un numero mas alto de canales, tales como los mezcladores ascendentes de 1 a 2, 2 a 3.
La Figura 1 ilustra un ejemplo de un codificador para la codificacion de senales de audio de multiples canales de acuerdo con el enfoque que actualmente esta normalizandose por MPEG bajo el nombre de Envolvente MPEG. El sistema de Envolvente MPEG codifica una senal de multiples canales como un mezclado descendente mono o estereo acompanado por un conjunto de parametros. La senal de mezclado descendente puede codificarse por un codificador de audio heredado, tal como un codificador MP3 o AAC. Los parametros representan la imagen espacial de la senal de audio de multiples canales y pueden codificarse y embeberse en un modo compatible hacia atras en el flujo de audio heredado.
En el lado del decodificador, el flujo central de bits primero se decodifica dando como resultado que se genere la senal de mezclado descendente mono o estereo. Los decodificadores heredados, es decir, los decodificadores que no hacen uso de la decodificacion de Envolvente MPEG todavfa pueden decodificar esta senal de mezclado descendente. Sin embargo, si estuviera disponible un decodificador de Envolvente MPEG, los parametros espaciales se vuelven a instanciar dando como resultado una representacion de multiples canales que es perceptualmente cercana a la senal original de entrada de multiples canales. Un ejemplo de un decodificador de Envolvente MPEG se ilustra en la Figura 2.
Ademas de la codificacion/decodificacion basica espacial que se ilustra en la Figura 1 y en la Figura 2, el sistema de Envolvente MPEG ofrece un conjunto rico de caractensticas que permiten un gran dominio de aplicacion. Una de las caractensticas mas importantes se denomina como la Compatibilidad de Matriz o Compatibilidad Envolvente de Matriz.
Una vista general de la Envolvente MPEG se proporciona en J. Breebart et al., “MPEG Spatial Audio Coding/ MPEG Surround: Overview and Current Status”, artfculo Audio Engineering Society Convention, presentado en 119th Convention, Nueva York, Estados Unidos, octubre de 2005, pags. 1-17.
Los ejemplos de los sistemas tradicionales envolventes de matriz son Dolby Pro Logic I y II y Circle Surround. Estos sistemas operan como se ilustra en la Figura 3. La senal de entrada PCM de multiples canales se transforma en una denominada senal de mezclado descendente de matriz que utiliza normalmente una matriz de 5(.1) a 2. La idea detras de los sistemas envolventes de matriz es que se mezclen los canales frontal y envolvente (posterior) dentro de fase y fuera de fase, de manera respectiva, en la senal de mezclado descendente estereo. Hasta cierto punto esto permite la inversion en el lado del decodificador dando como resultado una reconstruccion de multiples canales.
En los sistemas envolventes de matriz, la senal estereo puede transmitirse utilizando canales tradicionales que se pretenden para la transmision de estereo. Por lo tanto, de forma similar al sistema de Envolvente MPEG, los sistemas envolventes de matriz tambien ofrecen una forma de compatibilidad hacia atras. Sin embargo, debido a las propiedades espedficas de fase de la senal de mezclado descendente estereo que resultan de la codificacion envolvente de matriz, con frecuencia estas senales no tienen una alta calidad de sonido cuando se escuchan como una senal estereo por ejemplo, a partir de altavoces o auriculares.
En un decodificador envolvente de matriz, se aplica una matriz de M a N (donde por ejemplo, M=2 y N=5(.1)) para generar la senal de salida PCM de multiples canales. No obstante, en general un sistema de matriz de N a M, con (N>M) no puede invertirse, y por lo tanto, los sistemas envolventes de matriz generalmente no son capaces de reconstruir con exactitud las senales originales de salida PCM de multiples canales que tienden a tener artefactos altamente perceptibles.
En contraste con estos sistemas tradicionales envolventes de matriz, la Compatibilidad Envolvente de Matriz en el sistema de Envolvente MPEG se consigue aplicando una matriz de 2x2 en valores complejos de muestra en las subbandas de frecuencia del codificador de Envolvente MPEG seguido por la codificacion de Envolvente MPEG. Un ejemplo de un codificador de este tipo se ilustra en la Figura 4. La matriz de 2x2 generalmente es una matriz de valor complejo con coeficientes dependientes de los parametros espaciales. En un sistema de este tipo, los parametros espaciales son variables en el tiempo y frecuencia y en consecuencia, la matriz de 2x2 tambien es variable en el tiempo y frecuencia. En consecuencia, la operacion de matriz compleja se aplica normalmente en mosaicos de tiempo-frecuencia.
La aplicacion de la funcionalidad de Compatibilidad Envolvente de Matriz en un codificador de Envolvente MPEG permite que la senal resultante de estereo sea compatible con la senal que se esta generando a traves de los codificadores convencionales envolventes de matriz, tales como Dolby Pro-Logic™. Esto permitira que los decodificadores heredados decodifiquen la senal envolvente. Ademas, la operacion de la Compatibilidad Envolvente
5
10
15
20
25
30
35
40
45
50
55
de Matriz puede invertirse en un decodificador compatible de Envolvente MPEG, permitiendo de esta manera que se genere una senal de multiples canales de alta calidad.
La matriz de codificacion de compatibilidad de matriz puede describirse como sigue:
A. Til K MW’
donde L, R es el mezclado descendente convencional de estereo MPEG, Lmtx, Rmtx es el mezclado descendente codificado envolvente de matriz y donde hxy son los coeficientes complejos determinados en respuesta a los parametros de multiples canales.
Una ventaja principal de proporcionar senales de estereo compatibles de matriz por medio de una matriz de 2x2 es el hecho que estas matrices pueden invertirse. Como resultado, el decodificador de Envolvente MPEG todavfa puede suministrar la misma calidad de audio de salida sin considerar si se emplea o no el mezclado descendente de estereo compatible de matriz en el codificador. Un ejemplo de un decodificador compatible de Envolvente MPEG se ilustra en la Figura 5.
imagen1
El procesamiento inverso en el lado del decodificador en un decodificador normal de Envolvente MPEG puede determinarse de esta manera por:
imagen2
L^tx
p
_MTX
,D h\2 [)
^21,0 ^21,D
d ’ L MJ3T _
De esta manera, puesto que H puede invertirse, la operacion del codificador de compatibilidad de matriz puede invertirse.
En el sistema de Envolvente MPEG, el procesamiento, incluyendo las operaciones de compatibilidad de matriz, se realiza en el dominio de frecuencia. De manera mas espedfica, los denominados bancos de Filtro de Espejo en Cuadratura (QM) modulados de exponencial complejo se emplean para dividir el eje de frecuencia en un numero de bandas.
En muchas formas este tipo de bancos de QMF pueden igualarse con el banco de Transformada Discreta de Fourier de Superposicion-Adicion (DFT), o su parte contraria eficiente como la Transformada Rapida de Fourier (FFT). El banco QMF, asf como tambien el banco DFT comparten las siguientes propiedades deseadas para la manipulacion de senal:
- La representacion del dominio de frecuencia esta sobremuestreada. Debido a esta propiedad es posible la aplicacion de manipulaciones, tal como por ejemplo, la ecualizacion (la escala de las bandas individuales) sin introducir una distorsion de solapamiento. Las representaciones de muestra critica, tales como por ejemplo, la Transformada Discreta del Coseno Modificado (MDCT) bien conocida, que se emplea por ejemplo en ACC, no obedece a esta propiedad. Por lo tanto, la modificacion variable en tiempo y frecuencia de los coeficientes MDCT antes de la smtesis da como resultado el solapamiento, lo cual a su vez provoca artefactos audibles en la senal de salida.
- La representacion del dominio de frecuencia es de valor complejo. En contraste con las representaciones de valor real, las representaciones de valor complejo permiten una modificacion simple de la fase de las senales.
Aunque existe un numero de ventajas con respecto a una representacion de valor real de muestra crftica en terminos de manipulacion de senal, una desventaja significativa comparada con esta representacion es la complejidad computacional. Una parte principal de la complejidad del decodificador de Envolvente MPEG es debida a los bancos de filtros de analisis y smtesis QMF y al procesamiento correspondiente sobre las senales de valor complejo.
Por consiguiente, se ha propuesto realizar parte del procesamiento en el dominio de valor real por el denominado decodificador de Baja Potencia (LP, por sus siglas en ingles). Para este fin, el banco de filtros modulado complejo se ha sustituido por un banco de filtros modulado del coseno de valor real seguido por una extension parcial al dominio de valor complejo para las bandas de frecuencia mas baja. Este banco de filtros se ilustra en la Figura 6.
En el modo regular de operacion, el decodificador de Envolvente MPEG aplica un procesamiento de valor real a las muestras de dominio de subbanda de valor complejo, o en el caso de LP, aplica estas a las muestras de dominio de subbanda de valor real. Sin embargo, la caractenstica de compatibilidad de matriz en el decodificador implica las
5
10
15
20
25
30
35
40
45
50
55
60
rotaciones de fase para restaurar el mezclado descendente original de estereo en el dominio de frecuencia. Estas rotaciones de fase se consiguen por medio del procesamiento de valor complejo. En otras palabras, la matriz de decodificacion de compatibilidad de matriz H-1 es de valor intnnsecamente complejo para introducir las rotaciones requeridas de fase. En consecuencia, en tales sistemas, la operacion compatible de envolvente de matriz no puede invertirse en la parte de valor real de la representacion del dominio de frecuencia LP que conduce a una calidad reducida de la decodificacion.
Por lo tanto, sena ventajosa una decodificacion mejorada de audio.
Por consiguiente, la invencion busca preferentemente mitigar, aliviar o eliminar una o mas de las desventajas mencionadas con anterioridad ya sean solas o en cualquier combinacion.
De acuerdo con un primer aspecto de la invencion se proporciona un decodificador de audio que comprende: medios para recibir datos de entrada que comprenden una senal de N canales que corresponde a una senal de mezclado descendente de una senal de audio de M canales M>N, que tiene matrices de codificacion de subbanda de valor complejo aplicadas en subbandas de frecuencia y datos parametricos de multiples canales asociados con la senal de mezclado descendente; medios para generar subbandas de frecuencia para la senal de N canales, al menos algunas de las subbandas de frecuencia son subbandas de frecuencia de valor real; medios de determinacion para determinar las matrices de decodificacion de subbanda de valor real para compensar la aplicacion de las matrices de codificacion en respuesta a los datos parametricos de multiples canales; medios para generar los datos de mezclado descendente que corresponden a la senal de mezclado descendente a traves de la multiplicacion de matriz de las matrices de decodificacion de subbanda de valor real y los datos de la senal de N canales en al menos algunas subbandas de frecuencia de valor real.
La invencion puede permitir la decodificacion mejorada y/o facilitada. En particular, la invencion puede permitir una reduccion sustancial de la complejidad mientras consigue una alta calidad de audio. La invencion puede permitir por ejemplo, el efecto de una multiplicacion de matriz de subbanda de valor complejo de manera que se invierta, al menos parcialmente, en un decodificador que utilice subbandas de frecuencia de valor real.
Como un ejemplo espedfico, la invencion puede permitir, por ejemplo, que la codificacion compatible de matriz MPEG se invierta parcialmente en un decodificador de Envolvente MPEG que utilice subbandas de frecuencia de valor real.
El decodificador puede comprender medios para generar la senal de mezclado descendente en respuesta a los datos de mezclado descendente y ademas puede comprender medios para generar la senal de audio de M canales en respuesta a los datos de mezclado descendente y los datos parametricos de multiples canales. La invencion puede generar en tales realizaciones una senal precisa de audio de multiples canales al menos parcialmente, basandose en las subbandas de frecuencia de valor real.
Una matriz de decodificacion diferente puede determinarse para cada subbanda de frecuencia.
De acuerdo con una caractenstica opcional de la invencion, el medio de determinacion esta dispuesto para determinar las matrices inversas de subbanda de valor complejo de las matrices de codificacion y para determinar las matrices de decodificacion en respuesta a las matrices inversas.
Esto puede permitir una implementacion particularmente eficiente y/o calidad mejorada de la decodificacion.
De acuerdo con una caractenstica opcional de la invencion, el medio de determinacion esta dispuesto para determinar cada coeficiente de matriz de valor real de las matrices de decodificacion en respuesta a un valor absoluto del coeficiente correspondiente de matriz de las matrices inversas.
Esto puede permitir una implementacion particularmente eficiente y/o calidad mejorada de la decodificacion. Cada coeficiente de matriz de valor real de las matrices de decodificacion puede determinarse en respuesta a un valor absoluto solo del coeficiente correspondiente de matriz de la matriz inversa sin considerar cualquier otro coeficiente de matriz. Un coeficiente de matriz correspondiente puede ser un coeficiente de matriz en la misma ubicacion de la matriz inversa para la misma subbanda de frecuencia.
De acuerdo con una caractenstica opcional de la invencion, el medio de determinacion esta dispuesto para determinar cada coeficiente de matriz de valor real sustancialmente como un valor absoluto del correspondiente coeficiente de matriz de las matrices inversas.
Esto puede permitir una implementacion particularmente eficiente y/o calidad mejorada de la decodificacion.
De acuerdo con una caractenstica opcional de la invencion, un medio de determinacion esta dispuesto para
5
10
15
20
25
30
35
40
45
50
determinar las matrices de decodificacion en respuesta a las matrices de transferencia de subbanda que son una multiplicacion de las correspondientes matrices de decodificacion y matrices de codificacion.
Esto puede permitir una implementacion particularmente eficiente y/o calidad mejorada de la decodificacion. Las correspondientes matrices de decodificacion y de codificacion pueden ser matrices de codificacion y de decodificacion para la misma subbanda de frecuencia. El medio de determinacion puede estar dispuesto en particular para seleccionar los valores de coeficiente de las matrices de decodificacion, de manera que las matrices de transferencia tengan una caracteristica deseada.
De acuerdo con una caracteristica opcional de la invencion, el medio de determinacion esta dispuesto para determinar las matrices de decodificacion en respuesta a mediciones de magnitud solo de las matrices de transferencia.
Esto puede permitir una implementacion particularmente eficiente y/o calidad mejorada de la decodificacion. En particular, el medio de determinacion puede estar dispuesto para ignorar las medidas de fase cuando se determinan las matrices de decodificacion. Esto puede reducir la complejidad mientras se mantiene una baja degradacion de la calidad de audio perceptible.
De acuerdo con una caracteristica opcional de la invencion, las matrices de transferencia de cada subbanda se proporcionan por
imagen3
donde G es una matriz de decodificacion de subbanda y H es una matriz de codificacion de subbanda y el medio de determinacion esta dispuesto para seleccionar los coeficientes de matriz
£n Sn
§2\ S22
de manera que la medicion de potencia de pi2 y p2i cumpla un criterio.
Esto puede permitir una implementacion particularmente eficiente y/o calidad mejorada de la decodificacion. La matriz de decodificacion puede seleccionarse para dar como resultado una medicion de potencia por debajo de un umbral (que puede determinarse en respuesta a las restricciones o a otros parametros) o puede seleccionarse, por ejemplo, como la matriz de decodificacion que da como resultado la medicion minima de potencia.
De acuerdo con una caracteristica opcional de la invencion, la medicion de magnitud se determina en respuesta a
imagen4
Esto puede permitir una implementacion particularmente eficiente y/o calidad mejorada de la decodificacion.
De acuerdo con una caracteristica opcional de la invencion, el medio de determinacion ademas esta dispuesto para seleccionar los coeficientes de matriz de acuerdo con la restriccion de una magnitud de p1 y p22 que son sustancialmente iguales a uno.
Esto puede permitir una implementacion particularmente eficiente y/o calidad mejorada de la decodificacion.
De acuerdo con una caracteristica opcional de la invencion, la senal de mezclado descendente y los datos parametricos de multiples canales estan de acuerdo con el estandar de Envolvente MPEG.
La invencion puede permitir una decodificacion particularmente eficiente, de baja complejidad y/o de calidad de audio mejorada para una senal compatible de Envolvente MPEG.
De acuerdo con una caracteristica opcional de la invencion, la matriz de codificacion es una matriz de codificacion de Compatibilidad Envolvente de Matriz MPEG y la primera senal de N canales es una senal de Compatibilidad Envolvente de Matriz MPEG.
5
10
15
20
25
30
35
40
45
50
55
60
La invencion puede permitir una calidad de audio particularmente eficiente, de baja complejidad y/o mejorada y en particular puede permitir una decodificacion de baja complejidad para compensar de manera eficiente las operaciones de Compatibilidad Envolvente de Matriz MPEG realizadas en un codificador.
De acuerdo con otro aspecto de la invencion, se proporciona un metodo de decodificacion de audio, el metodo comprende: recibir datos de entrada que comprenden una senal de N canales que corresponde a una senal de mezclado descendente de una senal de audio de M canales, M>N, que tiene matrices de codificacion de subbanda de valor complejo aplicadas en subbandas de frecuencia y datos parametricos de multiples canales asociados con la senal de mezclado descendente; generar subbandas de frecuencia para la senal de N canales, al menos algunas de las subbandas de frecuencia son subbandas de frecuencia de valor real; determinar las matrices de decodificacion de subbanda de valor real para compensar la aplicacion de las matrices de codificacion en respuesta a los datos parametricos de multiples canales; y generar datos de mezclado descendente que corresponden a la senal de mezclado descendente mediante una multiplicacion de matriz de las matrices de decodificacion de subbanda de valor real y los datos de la senal de N canales al menos en algunas de las subbandas de frecuencia de valor real.
De acuerdo con otro aspecto de la invencion, se proporciona un receptor que recibe una senal de N canales, el receptor comprende: medios para recibir los datos de entrada que comprenden una senal de N canales que corresponde a una senal de mezclado descendente de una senal de audio de M canales, M>N, que tiene matrices de codificacion de subbanda de valor complejo aplicadas en subbandas de frecuencia y datos parametricos de multiples canales asociados con la senal de mezclado descendente; medios de generacion de subbandas de frecuencia para la senal de N canales, al menos algunas de las subbandas de frecuencia son subbandas de frecuencia de valor real; medios de determinacion para determinar las matrices de decodificacion de subbanda de valor real para compensar la aplicacion de las matrices de codificacion en respuesta a los datos parametricos de multiples canales; medios para generar datos de mezclado descendente que corresponden a la senal de mezclado descendente a traves de la multiplicacion de matriz de las matrices de decodificacion de subbanda de valor real y los datos de la senal de N canales al menos en algunas de las subbandas de frecuencia de valor real.
De acuerdo con otro aspecto de la invencion, se proporciona un sistema de transmision para transmitir una senal de audio, el sistema de transmision comprende: un transmisor que comprende: medios para generar una senal de N canales de mezclado descendente de una senal de audio de M canales, M>N, medios para generar datos parametricos de multiples canales asociados con la senal de mezclado descendente, medios para generar una primera senal de N canales mediante la aplicacion de matrices de codificacion de subbanda de valor complejo en la senal de N canales de mezclado descendente en subbandas de frecuencia, medios para generar una segunda senal de N canales que comprende la primera senal de N canales y los datos parametricos de multiples canales, y medios para transmitir la segunda senal de N canales a un receptor; y el receptor comprende: medios para recibir la segunda senal de N canales, medios para generar las subbandas de frecuencia para la primera senal de N canales, al menos algunas de las subbandas de frecuencia son subbandas de frecuencia de valor real, medios de determinacion para determinar las matrices de decodificacion de subbanda de valor real para compensar la aplicacion de las matrices de codificacion en respuesta a los datos parametricos de multiples canales, y medios para generar datos de mezclado descendente que corresponden a la senal de N canales de mezclado descendente mediante una multiplicacion de matriz de las matrices de decodificacion de subbanda de valor real y los datos de la senal de N canales al menos en algunas de las subbandas de frecuencia de valor real.
La segunda senal de N canales puede tener un canal adicional asociado que comprende los datos parametricos de multiples canales.
De acuerdo con otro aspecto de la invencion, se proporciona un metodo de recepcion de una senal de audio a partir de un flujo de bits de audio escalable, el metodo comprende: recibir datos de entrada que comprenden una senal de N canales que corresponde a una senal de mezclado descendente de una senal de audio de M canales, M>N, que tiene matrices de codificacion de subbanda de valor complejo aplicadas en subbandas de frecuencia y datos parametricos de multiples canales asociados con la senal de mezclado descendente; generar subbandas de frecuencia para la senal de N canales, al menos algunas de las subbandas de frecuencia son subbandas de frecuencia de valor real; determinar las matrices de decodificacion de subbanda de valor real para compensar la aplicacion de las matrices de codificacion en respuesta a los datos parametricos de multiples canales; y generar los datos de mezclado descendente que corresponden a la senal de mezclado descendente mediante una multiplicacion de matriz de las matrices de decodificacion de subbanda de valor real y los datos de la senal de N canales al menos en algunas de las subbandas de frecuencia de valor real.
De acuerdo con otro aspecto de la invencion, se proporciona un metodo de transmision y recepcion de una senal de audio, el metodo comprende: en un transmisor realizar las etapas de: generar una senal de N canales de mezclado descendente de una senal de audio de M canales, M>N, generar datos parametricos de multiples canales asociados con la senal de mezclado descendente, generar una primera senal de N canales mediante la aplicacion de matrices de codificacion de subbanda de valor complejo a la senal de N canales de mezclado descendente en subbandas de frecuencia, generar una segunda senal de N canales que comprende la primera senal de N canales y los datos
5
10
15
20
25
30
35
40
45
50
55
60
parametricos de multiples canales, y transmits la segunda senal de N canales a un receptor; y en el receptor realizar las etapas de: recibir la segunda senal de N canales; generar subbandas de frecuencia para la primera senal de N canales, al menos algunas de las subbandas de frecuencia son subbandas de frecuencia de valor real; determinar las matrices de decodificacion de subbanda de valor real para compensar la aplicacion de las matrices de codificacion en respuesta a los datos parametricos de multiples canales; generar los datos de mezclado descendente que corresponden a la senal de N canales de mezclado descendente mediante la multiplicacion de matriz de las matrices de decodificacion de subbanda de valor real y los datos de la senal de N canales al menos en algunas de las subbandas de frecuencia de valor real.
Estos y otros aspectos, caractensticas y ventajas de la invencion seran evidentes y se aclararan con referencia a las realizaciones descritas de aqu en adelante.
Las realizaciones de la invencion se describiran, a modo de ejemplo unicamente, con referencia a los dibujos, en los que:
La Figura 1 ilustra un ejemplo de un codificador para codificar senales de audio de multiples canales de acuerdo con la tecnica anterior;
La Figura 2 ilustra un ejemplo de un decodificador para decodificar senales de audio de multiples canales de acuerdo con la tecnica anterior;
La Figura 3 ilustra un ejemplo de un sistema de codificacion/decodificacion envolvente de matriz de acuerdo con la tecnica anterior;
La Figura 4 ilustra un ejemplo de un codificador para codificar senales de audio de multiples canales de acuerdo con la tecnica anterior;
La Figura 5 ilustra un ejemplo de un decodificador para decodificar senales de audio de multiples canales de acuerdo con la tecnica anterior;
La Figura 6 ilustra un ejemplo de un banco de filtros para generar subbandas de frecuencia complejas y de valor real;
La Figura 7 ilustra un sistema de transmision para la comunicacion de una senal de audio de acuerdo con algunas realizaciones de la invencion;
La Figura 8 ilustra un decodificador de acuerdo con algunas realizaciones de la invencion;
Las Figuras 9-14 ilustran caractensticas de rendimiento para un decodificador de acuerdo con algunas realizaciones de la invencion; y
La Figura 15 ilustra un metodo de decodificacion de acuerdo con algunas realizaciones de la invencion.
La siguiente descripcion se centra en las realizaciones de la invencion que son aplicables a un decodificador para la decodificacion de una senal codificada de Envolvente MPEG que incluye una codificacion de Compatibilidad Envolvente de Matriz. Sin embargo, se apreciara que la invencion no se limita a esta aplicacion sino que puede aplicarse en muchas otras normas de codificacion.
La Figura 7 ilustra un sistema de transmision 700 para la comunicacion de una senal de audio de acuerdo con algunas realizaciones de la invencion. El sistema de transmision 700 comprende un transmisor 701 que esta acoplado a un receptor 703 a traves de una red 705 que puede ser, de manera espedfica, internet.
En el ejemplo espedfico, el transmisor 701 es un dispositivo de grabacion de senal y el receptor 703 es un dispositivo de reproduccion de senal aunque se apreciara que en otras realizaciones el transmisor y el receptor puede utilizarse en otras aplicaciones y para otros fines.
En el ejemplo espedfico donde se soporta una funcion de grabacion de senal, el transmisor 701 comprende un digitalizador 707 que recibe una senal analogica de multiples canales que se convierte a una senal digital de multiples canales PCM (Modulada y Codificada por Pulso) mediante el muestreo y la conversion de analogica a digital.
El transmisor 701 esta acoplado al codificador 709 de la Figura 1 que codifica la senal PCM de acuerdo con un algoritmo de codificacion de Envolvente MPEG que incluye la funcionalidad para la codificacion de Compatibilidad Envolvente de Matriz. El codificador 709 puede ser, por ejemplo, el decodificador de la tecnica anterior de la Figura 4. En el ejemplo, el codificador 709 genera, de manera espedfica, una senal de mezclado descendente de estereo Compatible Envolvente de Matriz MPEG de estereo.
De esta manera, el codificador 709 genera una senal dada por
imagen5
Ai As LA i As
imagen6
5
10
15
20
25
30
35
40
45
50
55
60
donde L, R es un mezclado descendente convencional estereo MPEG, y Lmtx, Rmtx es el mezclado descendente codificado compatible envolvente de matriz emitido por el codificador 709. Ademas, la senal generada por el codificador 709 comprende los datos parametricos de multiples canales generados por la codificacion de Envolvente MPEG. Ademas, hxy son los coeficientes complejos determinados en respuesta a los parametros de multiples canales. Como se entendera facilmente por el experto en la materia, el procesamiento realizado por el codificador 709 se realiza en subbandas de valor complejo y se utilizan operaciones complejas.
El codificador 709 esta acoplado a un transmisor de red 711 que recibe la senal codificada y se interconecta con la red 705. El transmisor de red 711 puede transmitir la senal codificada al receptor 703 a traves de la red 705.
El receptor 703 comprende una interfaz de red 713 que se interconecta con la red 705 y que esta dispuesta para recibir la senal codificada del transmisor 701.
La interfaz de red 713 esta acoplada a un decodificador 715. El decodificador 715 recibe la senal codificada y la decodifica de acuerdo con un algoritmo de decodificacion. En el ejemplo, el decodificador 715 regenera la senal original de multiples canales. De manera espedfica, el decodificador 715 en primer lugar genera un mezclado descendente compensado de estereo que corresponde al mezclado descendente generado por la codificacion de Envolvente MPEG antes de que se realicen las operaciones compatibles de envolvente de matriz MPEG. Entonces, se genera una senal decodificada de multiples canales a partir de este mezclado descendente y los datos parametricos de multiples canales recibidos.
En el ejemplo espedfico donde se soporta una funcion de reproduccion de senal, el receptor 703 ademas comprende un reproductor de senal 717 que recibe la senal decodificada de audio de multiples canales del decodificador 715 y presenta esta al usuario. De manera espedfica, el reproductor de senal 717 puede comprender un convertidor de digital a analogico, amplificadores y altavoces segun se requiera para emitir la senal decodificada de audio.
La Figura 8 ilustra el decodificador 715 en mayor detalle.
El decodificador 715 comprende el receptor 801 que recibe la senal generada por el codificador 709. Como se menciono con anterioridad, la senal es una senal de estereo que corresponde a una senal de mezclado descendente que se ha procesado por los valores complejos de muestra en subbandas de frecuencia de valor complejo que se multiplican por una matriz de codificacion de valor complejo H. Ademas, la senal recibida comprende datos parametricos de multiples canales que corresponden a la senal de mezclado descendente. De manera espedfica, la senal recibida es una senal codificada de Envolvente MPEG con procesamiento de compatibilidad envolvente de matriz.
El receptor 801 ademas proporciona la decodificacion central de la senal recibida para generar la senal de PCM de mezclado descendente.
El receptor 801 esta acoplado al procesador de datos parametricos 803 que extrae los datos parametricos de multiples canales de la senal recibida.
El receptor 801 ademas esta acoplado a un banco de filtros de subbanda 805 que transforma la senal recibida estereo en el dominio de frecuencia. De manera espedfica, el banco de filtros de subbanda 805 genera una pluralidad de subbandas de frecuencia. Al menos algunas de estas subbandas de frecuencia son subbandas de frecuencia de valor real. El banco de filtros de subbanda 805 puede corresponder, de manera espedfica, con la funcionalidad que se ilustra en la Figura 6. De esta manera, el banco de filtros de subbanda 805 puede generar K subbandas de valor complejo y M-K subbandas de valor real. Las subbandas de valor real normalmente seran las subbandas de frecuencia mas alta, tal como las subbandas por encima de 2 kHz. El uso de las subbandas de valor real facilita, de manera sustancial, la generacion de subbanda, asf como tambien, las operaciones realizadas en las muestras en estas subbandas. De esta manera, en el decodificador 715 se procesan M-K subbandas como datos y operaciones de valor real en lugar de como datos y operaciones de valor complejo, proporcionando de esta manera una complejidad sustancial y una reduccion de coste.
El banco de filtros de subbanda 805 esta acoplado a un procesador de compensacion 807 que genera los datos de mezclado descendente que corresponden a la senal de mezclado descendente. De manera espedfica, el procesador de compensacion 807 compensa la operacion de compatibilidad envolvente de matriz al buscar invertir la multiplicacion por la matriz de codificacion H en las subbandas de frecuencia del codificador 709. Esta compensacion se realiza multiplicando los valores de datos de las subbandas por una matriz de decodificacion de subbanda G. Sin embargo, en contraste al procesamiento en el codificador 709, la multiplicacion de matriz en las subbandas de valor real del decodificador 715 se realiza de manera exclusiva en el dominio real. Por lo tanto, no solo son muestras de valor real de los valores de muestra sino que los coeficientes de matriz de la matriz de decodificacion G tambien son coeficientes de valor real.
5
10
15
20
25
30
35
40
45
50
55
60
El procesador de compensacion 807 esta acoplado a un procesador de matriz 809, que determina las matrices de decodificacion que se aplicaran en las subbandas. Para las K subbandas de valor complejo, la matriz de decodificacion G simplemente puede determinarse como la inversa de la matriz de codificacion H en la misma subbanda. No obstante, para las subbandas de valor real el procesador de matriz 809 determina los coeficientes de matriz de valor real que pueden proporcionar una compensacion eficiente para la operacion de matriz de codificacion.
De esta manera, la salida del procesador de compensacion 807 corresponde a la representacion de subbanda de la senal de mezclado descendente codificada de Envolvente MPEG. En consecuencia, el efecto de las operaciones de compatibilidad envolvente de matriz puede reducirse o eliminarse de manera sustancial.
El procesador de compensacion 807 esta acoplado a un banco de filtros de subbanda de smtesis 811 que genera una senal de mezclado descendente decodificada de Envolvente MPEG de PCM de dominio de tiempo a partir de la representacion de subbanda. En el ejemplo espedfico, el banco de filtros de subbanda de smtesis 811 forma de esta manera la parte contraria del banco de filtros de subbanda 805 al convertir la senal de vuelta al dominio de tiempo.
El banco de filtros de subbanda de smtesis 811 se alimenta a un decodificador de multiples canales 813 que ademas esta acoplado al procesador de datos parametricos 803. El decodificador de multiples canales 813 recibe la senal de mezclado descendente PCM de dominio de tiempo y los datos parametricos de multiples canales y genera la senal original de multiples canales.
En el ejemplo, el banco de filtros de subbanda de smtesis 811 transforma la senal de subbanda en la cual se han realizado las operaciones de matriz en el dominio de tiempo. El decodificador de multiples canales 813 recibe de esta manera una senal codificada de Envolvente MPEG comparable a la que se hubiera recibido si no se hubieran aplicado operaciones compatibles de envolvente de matriz en el decodificador. De esta manera, el mismo algoritmo de decodificacion de multiples canales MPEG puede utilizarse para las senales compatibles envolventes de matriz y para las senales compatibles envolventes sin matriz. Sin embargo, en otras realizaciones, el decodificador de multiples canales 813 puede operar directamente en las muestras de subbanda despues de la compensacion mediante el procesador de compensacion 807. En tales casos, el banco de filtros de subbanda de smtesis 811 puede omitirse o alguna de la funcionalidad del banco de filtros de subbanda de smtesis 811 puede integrarse con el decodificador de multiples canales 813.
De esta manera, para reducir la complejidad a menudo es preferible permanecer en el dominio de subbanda cuando se proporciona la senal compensada al decodificador de multiples canales 813. Como tal es posible evitar la complejidad del banco de filtros de subbanda de smtesis 811 y los bancos de filtros de analisis que son parte del decodificador de multiples canales 813.
De hecho si fuera posible, se prefiere normalmente no moverse hacia atras y hacia adelante entre el dominio de frecuencia y el dominio de tiempo puesto que esto es computacionalmente caro. Por lo tanto, en algunos decodificadores de acuerdo con algunas realizaciones de la invencion, despues de que las senales se han convertido al dominio de subbanda (frecuencia) (que a su vez se han determinado decodificando el flujo central de bits y aplicando los bancos de filtros en las senales resultantes PCM), la inversion envolvente de matriz se aplica en el procesador de compensacion 807 (si fuera aplicable, es decir, si se senalizara en el flujo de bits) y posteriormente, las senales resultantes del dominio de subbanda se utilizanan directamente para reconstruir las senales de multiples canales (dominio de subbanda). Finalmente, los bancos de filtros de smtesis se aplican para obtener las senales de multiples canales de dominio de tiempo.
De esta manera, en el sistema de la Figura 7, el codificador 709 puede generar una senal compatible envolvente de matriz que puede decodificarse por los decodificadores envolventes de matriz heredados tales como los decodificadores Dolby Pro Logic™. Aunque esto requiere una distorsion de la senal original codificada de mezclado descendente de Envolvente MPEG mediante una operacion de compatibilidad envolvente de matriz, esta operacion puede eliminarse de manera efectiva en un decodificador de multiples canales MPEG, permitiendo de esta manera una representacion precisa de los multiples canales originales que han de generar utilizando los datos parametricos.
Ademas, el decodificador 715 permite la compensacion para que la operacion de compatibilidad de envolvente de matriz se realice en subbandas de frecuencia de valor real en lugar de requerir subbandas de frecuencia de valor complejo, reduciendo de esta manera sustancialmente la complejidad del decodificador 715 mientras se consigue una alta calidad de audio.
A continuacion, se describiran ejemplos de la determinacion de coeficientes adecuados de matriz para las matrices de decodificacion.
El codificador 709 realiza la operacion de compatibilidad envolvente de matriz mediante aplicando la siguiente matriz de codificacion de valor complejo en cada subbanda (se apreciara que cada subbanda tiene una matriz de
codificacion diferente):
p
_ AfTV
imagen7
imagen8
donde L, R es el mezclado descendente convencional estereo MPEG, y Lmtx, Rmtx es el mezclado descendente codificado envolvente de matriz. La matriz de codificador H se proporciona por:
imagen9
10 donde wi y W2 dependen de los parametros espaciales generados por la codificacion de Envolvente MPEG. De manera espedfica:
1 — /----------------------T-
.V1 - 2wi, + 2wi,
vv2 - -------------------— ,
V1 - 2w21 + 2w2.,
15 donde wi,t y W2,t son ponderaciones no normalizadas, que se definen como:
imagen10
CLDr
C2MTX 20
W2, = --------------CLD —
1 + 10~ 20
donde CLDi y CLDr representan las diferencias de nivel de canal (expresadas en dB) de los pares de canales izquierdo-frontal, izquierdo-envolvente y derecho-frontal, derecho-envolvente, respectivamente. ci,mtx y C2,mtx son los coeficientes de matriz que son una funcion de los coeficientes de prediccion ci y C2 utilizados para derivar las senales intermedias izquierda L, central C y derecha R de las senales de mezclado descendente izquierda Ldmx y
5
10
15
20
25
30
35
40
derecha Rdmx en el decodificador como sigue:
L
R
C
c, + 2 t',-1 -1 tj + - [ - c, l - LV
Aliwtv
^DMX
ci,mtx y C2,mtx se determinan como:
imagen11
' -1-2c, i/ <l/3 + 2c,/3 if 1
-1 <cx <-0,5 - 0,5 < cx < 1 , en otra parte
con x = {0,1} respectivamente.
Como alternativa, el decodificador de Envolvente MPEG soporta un modo donde los coeficientes c y C2 representan relaciones de potencia de izquierdo contra izquierdo mas central y derecho contra derecho mas central, respectivamente. En ese caso, se aplican diferentes funciones para ci,mtx y C2,mtx.
De esta manera, para cada mosaico de tiempo/frecuencia, una matriz de codificacion de valor complejo H se aplica en valores complejos de muestra. Si las senales frontales fueran dominantes en la senal original de entrada de multiples canales, las ponderaciones wi y W2 estanan cercanas a cero. Como resultado, el mezclado descendente envolvente de matriz estana cercano al mezclado descendente de estereo de entrada. Si las senales envolventes (posteriores) fueran dominantes en la senal original de entrada de multiples canales, las ponderaciones wi y W2 estanan cercanas a uno. Como resultado, la senal de mezclado descendente envolvente de matriz contendna una version altamente fuera de fase del mezclado descendente de estereo original proporcionado por el codificador de Envolvente MPEG.
Una ventaja principal de proporcionar senales estereo compatibles de matriz por medio de una matriz de 2x2 es el hecho que estas matrices pueden invertirse. Como resultado, el decodificador de Envolvente MPEG todavfa puede suministrar la misma calidad de salida de audio independientemente de si se empleo o no un mezclado descendente de estereo compatible de matriz por el codificador.
El procesamiento inverso en el lado del decodificador en un decodificador de Envolvente MPEG donde todas las subbandas de frecuencia son subbandas de valor complejo (por ejemplo, utilizando un banco QMF modulado complejo) se proporciona entonces por:
imagen12
donde
N-huh22 hi2h^
12
5
10
15
20
25
30
35
40
Sin embargo, una operacion inversa de este tipo requiere que se utilicen valores complejos y por lo tanto, no puede aplicarse en el decodificador 715 de la Figura 7, puesto que este utiliza (al menos parcialmente) subbandas de valor real. Por consiguiente, el procesador de matriz 809 genera una matriz de decodificacion de valor real que puede aplicarse para reducir, de manera significativa, el efecto de la matriz de codificacion.
El impacto total de las matrices de codificacion y de decodificacion en cada subbanda puede representarse por la matriz de transferencia P dada como
imagen13
Pm
Pn
imagen14
£2:.
^11
K K 5
donde H representa la matriz del codificador y G representa la matriz del decodificador.
De manera ideal, G = H-1, de manera que: P = H-1 • H = I, la matriz unitaria. Debido al hecho que las ponderaciones hxy de la matriz del codificador H todas son de valor complejo, la matriz no puede invertirse en el decodificador para las subbandas de valor real.
Normalmente, las subbandas de valor real se encuentran en frecuencias mas altas tales como las subbandas por encima de 2 kHz. En estas frecuencias, las relaciones de fase son mucho menos importantes, de manera perceptual, y por lo tanto, el procesador de matriz 809 determina los coeficientes de matriz de decodificacion que tienen caractensticas adecuadas de magnitud (potencia) sin consideracion de las caractensticas de fase. De manera espedfica, el procesador de matriz 809 puede determinar los coeficientes de matriz de valor real que daran como resultado un valor de baja magnitud o potencia de los terminos de diafoma P12 y P21 bajo la suposicion o restriccion de que \p11\~ 1 y \p22\ “ 1.
En algunas realizaciones, el procesador de matriz 809 puede determinar la matriz inversa de subbanda de valor complejo H-1 de las matrices de codificacion y entonces, puede determinar la matriz de decodificacion de valor real G a partir de los coeficientes de matriz de esta matriz. De manera espedfica, cada coeficiente de G puede determinarse a partir del coeficiente de H-1 que se encuentra en la misma ubicacion. Por ejemplo, un coeficiente de valor real puede determinarse a partir del valor de magnitud del coeficiente correspondiente de H-1. De hecho, en algunas realizaciones, el procesador de matriz puede determinar los coeficientes de H-1 y posteriormente, puede determinar los coeficientes de G como el valor absoluto del coeficiente de matriz correspondiente de la matriz inversa H-1.
De esta manera, el procesador de matriz 809 puede determinar
como
imagen15
imagen16
5
10
15
20
25
30
35
40
45
50
donde
J^—^11^22 ^12^21-
Puede mostrarse que esta solucion satisface de manera perfecta las restricciones mencionadas con anterioridad (|pn| = |p22| = 1 y |p-d = |p211 = 0 ) para los casos espedficos de W1 = W2 = 0 y W1 = W2 = 1.
La Figura 9 ilustra la magnitud del termino principal de matriz (10logio|pi|2) de transferencia para esta solucion. La Figura 10 ilustra el angulo de fase de p-n y la Figura 11 el termino de diafoma (10logio|p2i |2).
De manera espedfica, la Figura 9 muestra la desviacion en dB de la magnitud de este termino de matriz principal p— con relacion al valor ideal de |p111 = 1 como una funcion de wi y W2. Como puede observarse, la desviacion maxima del caso ideal es menor de 1 dB. La Figura 10 muestra el angulo de p— como una funcion de W1 y W2. Como puede esperarse a partir de la diferencia con respecto al caso ideal de valor complejo, las diferencias de fase son hasta de 90 grados. La Figura 11 muestra la magnitud del termino de matriz de diafoma p21 medido en dB como una funcion de las ponderaciones W1 y W2. Debe observarse que otros elementos de matriz de transferencia pueden obtenerse intercambiando W1 y W2.
En algunas realizaciones, el procesador de matriz 809 puede determinar la matriz de decodificacion G para una subbanda en respuesta a la matriz de transferencia de subbanda P = GH. De manera espedfica, el procesador de matriz puede seleccionar valores de coeficiente de G, de manera que se consigue una caracteristica dada para P.
Una vez mas, puesto que los valores de fase para las subbandas de valor real tienden a tener una baja ponderacion perceptual, solo las caracteristicas de magnitud de P se consideran por el decodificador de ejemplo 715. Un rendimiento de alta calidad puede conseguirse a traves del procesador de matriz 809 seleccionando los coeficientes de matriz de decodificacion, de manera que una medicion de potencia de p12 y p21 cumpla con un criterio - tal como por ejemplo que la medicion de potencia se minimice o que la medicion de potencia se encuentre por debajo de un criterio dado. El procesador de matriz 809 puede buscar, por ejemplo, a traves de un intervalo de posibles coeficientes de valor real y seleccionar los que dan como resultado la medicion de potencia mas baja para p« y p21. Ademas, la evaluacion puede someterse a otras restricciones, tal como una restriccion de que pn y p22 son sustancialmente iguales a uno (por ejemplo, entre 0,9 y 1,1).
En algunas realizaciones, el procesador de matriz 809 puede realizar un algoritmo matematico para determinar los valores adecuados de coeficiente de valor real para el enfoque de decodificacion. Un ejemplo espedfico de esto se describe a continuacion, en el que el algoritmo busca minimizar la diafoma total: |p12|2 + |p21|2 bajo la restriccion de |pn|2 = 1 y |p22|2 =1.
Este problema puede resolverse a traves de herramientas convencionales de analisis matematico de multiples variables. En particular, sena adecuado utilizar los metodos de multiplicadores de Lagrange, que, para cada vector de fila v de G, se traducen a un problema de valor propio de matriz de la forma vA = XvB con un requisito de normalizacion q-(v) = 1 dado por una forma cuadratica q. Las matrices A y B y las formas cuadraticas q dependen de las entradas de la matriz compleja H.
Mas adelante se proporciona la solucion para v = [g— g12]. Tambien es trivial resolver v = [g21 ^22] intercambiando las variables Wi y W2 en la solucion a continuacion. Las matrices de Lagrange A y B se definen como:
Si.
71
imagen17
donde q1 y q2 se definen como:
imagen18
imagen19
5
10
15
20
25
30
imagen20
Los valores propios se hallan mediante:
imagen21
que da como resultado las rafoes de un polinomio cuadratico:
imagen22
donde
imagen23
Ahora pueden determinarse dos soluciones candidatas:
(A-A.^bVu = 0
La solucion final se determina por v = c, v,, donde i es cualquiera de 1 o 2 de manera que |p-ii|2 = 1 y con diafoma minima. En primer lugar se calcula c, como:
imagen24
A continuacion se calcula la diafoma |p^|2 para ambas soluciones:
imagen25
El mdice i que produce la diafoma minima proporciona v = c, ■ v. Sin prueba adicional se establece que independientemente de las variables W1 y W2, el mdice i siempre es igual a 2.
Para completitud, la solucion completa para G en terminos de ecuaciones analfticas se proporciona a continuacion. Las se definen las siguientes variables:
imagen26
b = 1 1/j! +(4.s-14)/m-1
5 Dos rafces ra y rB para ambas filas de la matriz G se calculan como:
imagen27
10
Las soluciones no escaladas vtemp.i y vtemp,2 pueden determinarse a continuacion como:
imagen28
Las constantes de normalizacion C se calculan como:
5
10
15
20
25
30
35
40
45
50
c. =1/J(1-^i)vLp.i
'■-4
3 J
C2 92^Vlemp,2.2 + #2
Finalmente, la matriz G se proporciona mediante:
fi-4
3 J
imagen29
Las Figuras 12, 13 y 14 ilustran el rendimiento para esta solucion. La Figura 12 muestra la desviacion en dB de la magnitud del termino principal de matriz pn al valor ideal de Ipul = 1 como una funcion de W1 y W2. Como puede observarse, debido a las restricciones establecidas en esta solucion, la magnitud siempre es identica al valor ideal |P11|= 1.
La Figura 13 muestra el angulo de pn como una funcion de W1 y W2. Debe observarse que debido a las restricciones posefdas por toda solucion real, tambien en este punto las diferencias de fase son hasta de 90 grados.
La Figura 14 ilustra la magnitud del termino de matriz de diafoma P21, medido en dB como una funcion de las ponderaciones de W1 y W2.
Como se ilustra mediante las figuras, la solucion del establecimiento de los coeficientes de matriz de decodificacion a los valores absolutos de los coeficientes de la matriz de codificacion inversa solo se desvfa +/- 1 dB del enfoque mas complejo de minimizacion de la diafoma, tanto en terminos de ganancia principal de termino como de supresion de diafoma.
La Figura 15 ilustra un metodo de decodificacion de audio de acuerdo con algunas realizaciones de la invencion.
En la etapa 1501 un decodificador recibe datos de entrada que comprenden una senal de N canales que corresponde a una senal de mezclado descendente de una senal de audio de M canales, M>N, que tiene matrices de codificacion de subbanda de valor complejo aplicadas en subbandas de frecuencia y datos parametricos de multiples canales asociados con la senal de mezclado descendente.
La etapa 1501 se sigue por la etapa 1503, en la que las subbandas de frecuencia se generan para la senal de N canales. Al menos algunas de las subbandas de frecuencia son subbandas de frecuencia de valor real.
La etapa 1503 se sigue por la etapa 1505, en la que las matrices de decodificacion de subbanda de valor real para compensar la aplicacion de las matrices de codificacion se determinan en respuesta a los datos parametricos de multiples canales.
La etapa 1505 se sigue por la etapa 1507, en la que los datos de mezclado descendente que corresponden a la senal de mezclado descendente se generan por una multiplicacion de matriz de las matrices de decodificacion de subbanda de valor real y los datos de la senal de N canales al menos en las subbandas de frecuencia de valor real.
Se apreciara que la descripcion anterior por claridad ha descrito realizaciones de la invencion con referencia a las distintas unidades y procesadores funcionales. Sin embargo, sera evidente que cualquier distribucion adecuada de funcionalidad entre las diferentes unidades o procesadores funcionales puede utilizarse sin apartarse de la invencion. Por ejemplo, la funcionalidad ilustrada a realizarse por procesadores o controladores separados puede realizarse por el mismo procesador o controladores. Por lo tanto, las referencias a las unidades funcionales espedficas solo se han de observar como referencias a los medios adecuados para proporcionar la funcionalidad descrita en lugar de indicativas de una estructura u organizacion logica o ffsica estricta.
La invencion puede implementarse en cualquier forma adecuada que incluya hardware, software, firmware o cualquier combinacion de estos. De manera opcional, la invencion puede implementarse al menos parcialmente como software de computadora que se ejecuta en uno o mas procesadores de datos y/o procesadores de senal digital. Los elementos y componentes de una realizacion de la invencion pueden implementarse ffsica, funcional y logicamente en cualquier manera adecuada. De hecho, la funcionalidad puede implementarse en una unidad unica,
5
10
15
20
25
en una pluralidad de unidades o como parte de otras unidades funcionales. Como tal, la invencion puede implementarse en una unidad unica o puede distribuirse ffsica y funcionalmente entre diferentes unidades y procesadores.
Aunque la presente invencion se ha descrito en relacion con algunas realizaciones, no se pretende que este limitada a la forma espedfica senalada en este documento. En su lugar, el alcance de la presente invencion solo esta limitado por las reivindicaciones que la acompanan. Ademas, aunque una caractenstica pueda aparecer que esta descrita en relacion con realizaciones particulares, un experto en la materia reconocena que diversas caractensticas de las realizaciones descritas pueden combinarse de acuerdo con la invencion. En las reivindicaciones, el termino que comprende no excluye la presencia de otros elementos o etapas.
Ademas, aunque se enumeran de manera individual, una pluralidad de medios, elementos o etapas de metodo pueden implementarse por ejemplo, mediante una unidad o procesador unico. Ademas, aunque las caractensticas individuales pueden incluirse en diferentes reivindicaciones, posiblemente, estas pueden combinarse ventajosamente y la inclusion en diferentes reivindicaciones no implica que una combinacion de caractensticas no sea factible y/o ventajosa. Asimismo, la inclusion de una caractenstica en una categona de reivindicaciones no implica una limitacion a esta caractenstica sino mas bien, indica que la caractenstica puede aplicarse igualmente en otras categonas de reivindicacion, segun sea adecuado. Ademas, el orden de caractensticas en las reivindicaciones no implica ningun orden espedfico en el cual las caractensticas tengan que hacerse funcionar y en particular, el orden de las etapas individuales en una reivindicacion de metodo no implica que las etapas tengan que realizarse en este orden. Mas bien, las etapas pueden realizarse en cualquier orden adecuado. Ademas, las referencias en singular no excluyen una pluralidad. De esta manera, las referencias a “un”, “una”, “primero”, “segundo”, etc., no excluyen una pluralidad. Los signos de referencia en las reivindicaciones simplemente se proporcionan como un ejemplo de claridad que no debe interpretarse como que limita el alcance de las reivindicaciones en modo alguno.

Claims (18)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    REIVINDICACIONES
    1. Un decodificador de audio (715) que comprende:
    - medios (801) para recibir datos de entrada que comprenden una senal de N canales que corresponde a una senal de mezclado descendente de una senal de audio de M canales, M>N, que tiene matrices de codificacion de subbanda de valor complejo aplicadas en subbandas de frecuencia y datos parametricos de multiples canales asociados con la senal de mezclado descendente; y caracterizado por comprender adicionalmente:
    - medios (805) para generar subbandas de frecuencia para la senal de N canales, siendo al menos algunas de las subbandas de frecuencia subbandas de frecuencia de valor real;
    - medios de determinacion (809) para determinar matrices de decodificacion de subbanda de valor real para compensar la aplicacion de las matrices de codificacion en respuesta a los datos parametricos de multiples canales; y
    - medios (807) para generar datos de mezclado descendente que corresponden a la senal de mezclado descendente mediante una multiplicacion de matriz de las matrices de decodificacion de subbanda de valor real y datos de la senal de N canales al menos en algunas subbandas de frecuencia de valor real.
  2. 2. El decodificador de audio (715) de la reivindicacion 1, en el que el medio de determinacion (809) esta dispuesto para determinar matrices inversas de subbanda de valor complejo de las matrices de codificacion y para determinar las matrices de decodificacion en respuesta a las matrices inversas.
  3. 3. El decodificador de audio (715) de la reivindicacion 2, en el que el medio de determinacion (809) esta dispuesto para determinar cada coeficiente de matriz de valor real de las matrices de decodificacion en respuesta a un valor absoluto de coeficientes de matriz correspondientes de las matrices inversas.
  4. 4. El decodificador de audio (715) de la reivindicacion 3, en el que el medio de determinacion (809) esta dispuesto para determinar cada coeficiente de matriz de valor real, de manera sustancial, como un valor absoluto del coeficiente de matriz correspondiente de las matrices inversas.
  5. 5. El decodificador de audio (715) de la reivindicacion 1, en el que el medio de determinacion (809) esta dispuesto para determinar las matrices de decodificacion en respuesta a las matrices de transferencia de subbanda que son una multiplicacion de las matrices de decodificacion y las matrices de codificacion correspondientes.
  6. 6. El decodificador de audio (715) de la reivindicacion 5, en el que el medio de determinacion (809) esta dispuesto para determinar las matrices de decodificacion en respuesta solo a las mediciones de magnitud de las matrices de transferencia.
  7. 7. El decodificador de audio (715) de la reivindicacion 5, en el que las matrices de transferencia de cada subbanda se proporcionan por
    imagen1
    I ^12
    donde G es una matriz de decodificacion de subbanda y H es una matriz de codificacion de subbanda y el medio de determinacion esta dispuesto para seleccionar los coeficientes de matriz
    ^»1 L 3
    tfil Sit
    de manera que una medicion de potencia de p12 y p21 cumple un criterio.
  8. 8. El decodificador de audio (715) de la reivindicacion 7, en el que la medicion de magnitud se determina en respuesta a
    imagen2
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
  9. 9. El decodificador de audio (715) de la reivindicacion 7, en el que el medio de determinacion (809) ademas esta dispuesto para seleccionar los coeficientes de matriz bajo la restriccion de una magnitud de pn y p22 que son sustancialmente iguales a uno.
  10. 10. El decodificador de audio de la reivindicacion 1, en el que la senal de mezclado descendente y los datos parametricos de multiples canales se encuentran de acuerdo con la norma de Envolvente MPEG.
  11. 11. El decodificador de audio (715) de la reivindicacion 1, en el que la matriz de codificacion es una matriz de codificacion de Compatibilidad Envolvente de Matriz MPEG y la primera senal de N canales es una senal Compatible Envolvente de Matriz MPEG.
  12. 12. Un metodo de decodificacion de audio, comprendiendo el metodo:
    - recibir (1501) datos de entrada que comprenden una senal de N canales que corresponde a una senal de mezclado descendente de una senal de audio de M canales, M>N, que tiene matrices de codificacion de subbanda de valor complejo aplicadas en subbandas de frecuencia y datos parametricos de multiples canales asociados con la senal de mezclado descendente; y caracterizado por comprender adicionalmente:
    - generar (1503) subbandas de frecuencia para la senal de N canales, siendo al menos algunas de las subbandas de frecuencia subbandas de frecuencia de valor real;
    - determinar (1505) matrices de decodificacion de subbanda de valor real para compensar la aplicacion de las matrices de codificacion en respuesta a los datos parametricos de multiples canales; y
    - generar (1507) datos de mezclado descendente que corresponden a la senal de mezclado descendente mediante una multiplicacion de matriz de las matrices de decodificacion de subbanda de valor real y los datos de la senal de N canales al menos en algunas de las subbandas de frecuencia de valor real.
  13. 13. Un receptor (703) para recibir una senal de N canales, comprendiendo el receptor (703):
    - medios (801) para recibir datos de entrada que comprenden una senal de N canales que corresponde a una senal de mezclado descendente de una senal de audio de M canales, M>N, que tiene matrices de codificacion de subbanda de valor complejo aplicadas en subbandas de frecuencia y datos parametricos de multiples canales asociados con la senal de mezclado descendente; y caracterizado por comprender adicionalmente:
    - medios (805) para generar subbandas de frecuencia para la senal de N canales, siendo al menos algunas de las subbandas de frecuencia subbandas de frecuencia de valor real;
    - medios de determinacion (809) para determinar las matrices de decodificacion de subbanda de valor real para compensar la aplicacion de las matrices de codificacion en respuesta a los datos parametricos de multiples canales;
    - medios (807) para generar datos de mezclado descendente que corresponden a la senal de mezclado descendente mediante una multiplicacion de matriz de las matrices de decodificacion de subbanda de valor real y datos de la senal de N canales al menos en algunas de las subbandas de frecuencia de valor real.
  14. 14. Un sistema de transmision (700) para transmitir una senal de audio, comprendiendo el sistema de transmision: un transmisor (701) que comprende:
    - medios (709) para generar una senal de N canales de mezclado descendente de una senal de audio de M canales, M>N,
    - medios (709) para generar datos parametricos de multiples canales asociados con la senal de mezclado descendente,
    - medios (709) para generar una primera senal de N canales aplicando matrices de codificacion de subbanda de valor complejo en la senal de N canales de mezclado descendente en subbandas de frecuencia,
    - medios (709) para generar una segunda senal de N canales que comprende la primera senal de N canales y los datos parametricos de multiples canales, y
    - medios (711) para transmitir la segunda senal de N canales a un receptor (703); y
    - comprendiendo el receptor (703):
    - medios (801) para recibir la segunda senal de N canales, y estando el sistema de transmision caracterizado por comprender adicionalmente el receptor:
    - medios (805) para generar subbandas de frecuencia para la primera senal de N canales, siendo al menos algunas de las subbandas de frecuencia subbandas de frecuencia de valor real,
    - medios de determinacion (809) para determinar matrices de decodificacion de subbanda de valor real para compensar la aplicacion de las matrices de codificacion en respuesta a los datos parametricos de multiples canales, y
    - medios (807) para generar datos de mezclado descendente que corresponden a la senal de N canales de mezclado descendente mediante una multiplicacion de matriz de las matrices de decodificacion de subbanda de
    5
    10
    15
    20
    25
    30
    35
    40
    45
    valor real y los datos de la senal de N canales al menos en algunas de las subbandas de frecuencia de valor real.
  15. 15. Un metodo de recepcion de una senal de audio, comprendiendo el metodo:
    - recibir (1501) datos de entrada que comprenden una senal de N canales que corresponde a una senal de mezclado descendente de una senal de audio de M canales, M>N, que tiene matrices de codificacion de subbanda de valor complejo aplicadas en subbandas de frecuencia y datos parametricos de multiples canales asociados con la senal de mezclado descendente; y caracterizado por comprender adicionalmente:
    - generar (1503) subbandas de frecuencia para la senal de N canales, siendo al menos algunas de las subbandas de frecuencia subbandas de frecuencia de valor real;
    - determinar (1505) las matrices de decodificacion de subbanda de valor real para compensar la aplicacion de las matrices de codificacion en respuesta a los datos parametricos de multiples canales; y
    - generar (1507) datos de mezclado descendente que corresponden a la senal de mezclado descendente mediante una multiplicacion de matriz de las matrices de decodificacion de subbanda de valor real y los datos de la senal de N canales al menos en algunas de las subbandas de frecuencia de valor real.
  16. 16. Un metodo de transmision y recepcion de una senal de audio, comprendiendo el metodo:
    - en un transmisor (701) realizar las etapas de:
    - generar una senal de N canales de mezclado descendente de una senal de audio de M canales, M>N,
    - generar datos parametricos de multiples canales asociados con la senal de mezclado descendente,
    - generar una primera senal de N canales aplicando matrices de codificacion de subbanda de valor complejo a la senal de N canales de mezclado descendente en subbandas de frecuencia,
    - generar una segunda senal de N canales que comprende la primera senal de N canales y los datos parametricos de multiples canales, y
    - transmitir la segunda senal de N canales a un receptor (703); y
    - en el receptor (703) realizar la etapa de:
    - recibir (1501) la segunda senal de N canales; y estando el metodo caracterizado por realizar adicionalmente el receptor las etapas de:
    - generar (1503) subbandas de frecuencia para la primera senal de N canales, siendo al menos algunas de las subbandas de frecuencia subbandas de frecuencia de valor real;
    - determinar (1505) las matrices de decodificacion de subbanda de valor real para compensar la aplicacion de las matrices de codificacion en respuesta a los datos parametricos de multiples canales;
    - generar (1507) datos de mezclado descendente que corresponden a la senal de N canales de mezclado descendente mediante una multiplicacion de matriz de las matrices de decodificacion de subbanda de valor real y los datos de la senal de N canales al menos en algunas de las subbandas de frecuencia de valor real.
  17. 17. Un producto de programa de computadora para ejecutar el metodo de cualquiera de las reivindicaciones 12, 15, 16.
  18. 18. Un dispositivo de reproduccion de audio (703), que comprende un decodificador (715) de acuerdo con la reivindicacion 1.
ES07735236.7T 2006-03-29 2007-03-23 Decodificación de audio Active ES2609449T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP06111916 2006-03-29
EP06111916 2006-03-29
PCT/IB2007/051024 WO2007110823A1 (en) 2006-03-29 2007-03-23 Audio decoding

Publications (1)

Publication Number Publication Date
ES2609449T3 true ES2609449T3 (es) 2017-04-20

Family

ID=38318626

Family Applications (1)

Application Number Title Priority Date Filing Date
ES07735236.7T Active ES2609449T3 (es) 2006-03-29 2007-03-23 Decodificación de audio

Country Status (13)

Country Link
US (1) US8433583B2 (es)
EP (1) EP1999747B1 (es)
JP (1) JP5154538B2 (es)
KR (1) KR101015037B1 (es)
CN (1) CN101484936B (es)
BR (1) BRPI0709235B8 (es)
ES (1) ES2609449T3 (es)
HK (1) HK1135791A1 (es)
MX (1) MX2008012217A (es)
PL (1) PL1999747T3 (es)
RU (1) RU2420814C2 (es)
TW (1) TWI413108B (es)
WO (1) WO2007110823A1 (es)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8959016B2 (en) 2002-09-27 2015-02-17 The Nielsen Company (Us), Llc Activating functions in processing devices using start codes embedded in audio
US9711153B2 (en) 2002-09-27 2017-07-18 The Nielsen Company (Us), Llc Activating functions in processing devices using encoded audio and detecting audio signatures
US8359205B2 (en) 2008-10-24 2013-01-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8121830B2 (en) * 2008-10-24 2012-02-21 The Nielsen Company (Us), Llc Methods and apparatus to extract data encoded in media content
US9667365B2 (en) 2008-10-24 2017-05-30 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8508357B2 (en) 2008-11-26 2013-08-13 The Nielsen Company (Us), Llc Methods and apparatus to encode and decode audio for shopper location and advertisement presentation tracking
EP2425563A1 (en) 2009-05-01 2012-03-07 The Nielsen Company (US), LLC Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content
CN103854651B (zh) * 2009-12-16 2017-04-12 杜比国际公司 Sbr比特流参数缩混
BR112012025878B1 (pt) 2010-04-09 2021-01-05 Dolby International Ab sistema decodificador, sistema codificador, método de decodificação e método de codificação.
TWI665659B (zh) * 2010-12-03 2019-07-11 美商杜比實驗室特許公司 音頻解碼裝置、音頻解碼方法及音頻編碼方法
JP2013050663A (ja) * 2011-08-31 2013-03-14 Nippon Hoso Kyokai <Nhk> 多チャネル音響符号化装置およびそのプログラム
US8442591B1 (en) * 2011-09-29 2013-05-14 Rockwell Collins, Inc. Blind source separation of co-channel communication signals
EP2717262A1 (en) 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding
ES2640815T3 (es) 2013-05-24 2017-11-06 Dolby International Ab Codificación eficiente de escenas de audio que comprenden objetos de audio
MY178342A (en) * 2013-05-24 2020-10-08 Dolby Int Ab Coding of audio scenes
JP6192813B2 (ja) 2013-05-24 2017-09-06 ドルビー・インターナショナル・アーベー オーディオ・オブジェクトを含むオーディオ・シーンの効率的な符号化
KR102244379B1 (ko) * 2013-10-21 2021-04-26 돌비 인터네셔널 에이비 오디오 신호들의 파라메트릭 재구성
WO2015150384A1 (en) 2014-04-01 2015-10-08 Dolby International Ab Efficient coding of audio scenes comprising audio objects
FI126923B (fi) * 2014-09-26 2017-08-15 Genelec Oy Menetelmä ja laitteisto digitaalisen audiosignaalin tunnistamiseksi
WO2016108655A1 (ko) 2014-12-31 2016-07-07 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
KR20160081844A (ko) 2014-12-31 2016-07-08 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7451006B2 (en) 2001-05-07 2008-11-11 Harman International Industries, Incorporated Sound processing system using distortion limiting techniques
EP1421579B1 (en) * 2001-08-21 2006-04-05 Koninklijke Philips Electronics N.V. Audio coding with non-uniform filter bank
KR20060090984A (ko) 2003-09-29 2006-08-17 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 신호들을 엔코딩하는 방법 및 장치
BR122018007834B1 (pt) 2003-10-30 2019-03-19 Koninklijke Philips Electronics N.V. Codificador e decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, e, meio de armazenamento legível por computador
US8923785B2 (en) * 2004-05-07 2014-12-30 Qualcomm Incorporated Continuous beamforming for a MIMO-OFDM system
PL1905006T3 (pl) * 2005-07-19 2014-02-28 Koninl Philips Electronics Nv Generowanie wielokanałowych sygnałów audio

Also Published As

Publication number Publication date
BRPI0709235A2 (pt) 2011-06-28
HK1135791A1 (en) 2010-06-11
RU2008142752A (ru) 2010-05-10
TW200746046A (en) 2007-12-16
KR20080105135A (ko) 2008-12-03
EP1999747B1 (en) 2016-10-12
US20090240505A1 (en) 2009-09-24
WO2007110823A1 (en) 2007-10-04
CN101484936A (zh) 2009-07-15
KR101015037B1 (ko) 2011-02-16
JP2009536360A (ja) 2009-10-08
JP5154538B2 (ja) 2013-02-27
RU2420814C2 (ru) 2011-06-10
MX2008012217A (es) 2008-11-12
CN101484936B (zh) 2012-02-15
US8433583B2 (en) 2013-04-30
BRPI0709235B1 (pt) 2019-10-15
PL1999747T3 (pl) 2017-05-31
TWI413108B (zh) 2013-10-21
BRPI0709235B8 (pt) 2019-10-29
EP1999747A1 (en) 2008-12-10

Similar Documents

Publication Publication Date Title
ES2609449T3 (es) Decodificación de audio
US11343631B2 (en) Compatible multi-channel coding/decoding
US20200335115A1 (en) Audio encoding and decoding
ES2378734T3 (es) Codificación mejorada y representación de parámetros de codificación de objetos de mezcla descendente multicanal
JP5185337B2 (ja) レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
RU2418385C2 (ru) Кодирование и декодирование звука
NO342863B1 (no) Konsept for kopling av gapet mellom parametrisk flerkanals audiokoding og matrise-surround flerkanalkoding
RU2696952C2 (ru) Аудиокодировщик и декодер
MX2008011994A (es) Generacion de mezclas descendentes espaciales a partir de representaciones parametricas de señales de multicanal.
BR112017006278B1 (pt) Método para aprimorar o diálogo num decodificador em um sistema de áudio e decodificador
BRPI0518507B1 (pt) Informações auxiliares compactas para a codificação paramétrica de áudio espacial