ES2623365T3 - Compactación de información secundaria para la codificación paramétrica de audio espacial - Google Patents

Compactación de información secundaria para la codificación paramétrica de audio espacial Download PDF

Info

Publication number
ES2623365T3
ES2623365T3 ES05796746.5T ES05796746T ES2623365T3 ES 2623365 T3 ES2623365 T3 ES 2623365T3 ES 05796746 T ES05796746 T ES 05796746T ES 2623365 T3 ES2623365 T3 ES 2623365T3
Authority
ES
Spain
Prior art keywords
channels
track
code
transmitted
codes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES05796746.5T
Other languages
English (en)
Inventor
Jürgen HERRE
Christof Faller
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Agere Systems LLC
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Agere Systems LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV, Agere Systems LLC filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2623365T3 publication Critical patent/ES2623365T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Abstract

Un método para codificar canales de audio, el método comprende: generar (1102, 1104) uno o más códigos de pista a ser transmitidos para dos o más canales de audio, en que: al menos un código de pista de los códigos de pista a ser transmitidos es un código de pista combinado generado mediante la combinación (1104) de dos o más códigos de pista estimados utilizando una función promedio ponderada; la función promedio ponderada considerando la importancia de los canales individuales; y cada código de pista estimado se estima de un grupo diferente de dos o más de los canales de audio; y transmitir (1106) o almacenar los uno o más códigos de pista a ser transmitidos.

Description

imagen1
DESCRIPCIÓN
Compactación de información secundaria para la codificación paramétrica de audio espacial
5 ANTECEDENTES DE LA INVENCIÓN
La materia de esta solicitud se relaciona a la materia de las siguientes solicitudes de E.U.A.:
o Solicitud de E.U.A., No. De Serie 09/848,877, presentada el 4 de Mayo del 2001, con número de expediente del 10 apoderado Faller 5;
o Solicitud de E.U.A., No. De Serie 10/045,458, presentada el 7 de Noviembre del 2001, con número de expediente del apoderado Baumgarte 1-6-8, la cual reclama por sí misma el beneficio de la fecha de presentación de la solicitud provisional de E.U.A., No. 60/311,565, presentada el 10 de Agosto del 2001;
15
o Solicitud de E.U.A., No. De Serie 10/155,437, presentada el 24 de mayo del 3002, con número de expediente del apoderado Baumgarte 2-10;
o Solicitud de E.U.A., No. De Serie 10/246,570, presentada el 17 de Septiembre del 2002, con número de expediente 20 del apoderado Baumgarte 3-11;
o Solicitud de E.U.A., No. De Serie 10/815,591, presentada el 1 de Abril del 2004, con número de expediente del apoderado Baumgarte 7-12;
25 o Solicitud de E.U.A., No. De Serie 10/936,.464, presentada el 8 de Septiembre del 2004, con número de expediente del apoderado Baumgarte 8-7-15;
o Solicitud de E.U.A., No. De Serie 10/762,100, presentada el 20 de Enero del 2005 (Faller 13-1);
30 o Solicitud de E.U.A., No. De Serie 11/006,492, presentada el 7 de Diciembre del 2001, con número de expediente del apoderado Allamanche 1-2-17-3; y
o Solicitud de E.U.A., No. De Serie 10/006,xxx, presentada el 7 de Diciembre del 2001, con número de expediente del apoderado Allamanche 2-3-18-4.
35 La materia de esta solicitud también se refiere a la materia descrita en los siguientes documentos:
o F. Baumgarte y C. Faller, “Binaural Cue Coding – Part I: Psychoacoustic fundamentals and design principles.” IEEE
Trans on Speech and Audio Proc., vol. 11, no. 6, Noviembre del 2003; 40
o C. Faller y F. Baumgarte, “Binaural Cue Coding – Parte II: Schemes and applications, IEEE Trans. On Speech and Audio Proc., vol. 11, no. 6, Noviembre del 2003; y
o . C.Faller, “Coding of spatial audio compatible with different playback formats,” Preprint 117th Conv. Aud. Eng. Soc., 45 Octubre del 2004.
Campo de la Invención
La presente invención se refiere a la codificación de señales de audio y a la síntesis subsiguiente de escenas de auditorio de 50 los datos de audio codificados.
Descripción de la Técnica Relacionada
Cuando una persona oye una señal de audio (es decir, sonidos) generada por una fuente de audio particular, esta señal de
55 audio típicamente llegará a .los oídos, izquierdo y derecho, de la persona, en dos diferentes momentos y con dos diferentes niveles de audio (es decir, decibeles), donde esos diferentes momentos y niveles son funcione de las diferencias en las trayectorias a través de las cuales la señal de audio viaja para llegar a los oídos, izquierdo y derecho, respectivamente. El cerebro de la persona interpreta estas diferencias en el tiempo y nivel para suministrar a la persona la percepción. Esa señal de audio recibida está siendo generada por una fuente de audio ubicada en una posición particular (por ejemplo, dirección y
60 distancia) con relación a la persona. Una escena de auditorio es el efecto neto que una persona oye simultáneamente las señales de audio generadas por una o más fuentes de audio ubicadas en una o más diferentes posiciones con relación a la persona.
imagen2
La existencia de este proceso por el cerebro puede ser usado para sintetizar escenas de auditorio, donde las señales de audio 5 de una o más diferentes fuentes de audio son modificadas a propósito, para generar señales de audio izquierdas y derechas, que dan la percepción que diferentes fuentes de audio se ubican en diferentes posiciones con relación al escucha.
La Figura 1 muestra un diagrama de bloques de alto nivel del sintetizador 100 de señal biaural convencional, el cual convierte una sola señal de una fuente de audio (por ejemplo, una mono-señal) en señales de audio, izquierdas y derechas de una 10 señal binaural, donde una señal binaural se define será las dos señales recibidas en los tambores del oído de un escucha. Además de la señal de fuente de audio, el sintetizador 100 recibe un conjunto de señales espaciales, que corresponden a la posición deseada de la fuente de audio con relación al escucha, En formas de realización típicas, el conjunto de señales espaciales comprende un valor de diferencia del nivel Inter.-canales (ICLD) (el cual identifica la diferencia en el nivel de audio entre las señales de audio, izquierdas y derechas, conforme son recibidas en los oídos izquierdo y derecho, respectivamente) 15 y un valor de diferencia de tiempo Inter.-canales (ICTD) (el cual identifica la diferencia en el tiempo de la llegada entre las señalas de audio izquierdas y derechas, según se reciben en los oíos, izquierdo y derecho, respectivamente). Además, o como una alternativa, algunas técnicas de síntesis implican el modelo de una dirección dependiente de la función de transferencia para el sonido, desde la fuente de señal a los tambores del oído, también referida como la función de transferencia (HRTF). Véase, por ejemplo, B. Blauert, The Psychophysics of Human Sound Localization (La Psicofísica de la
20 Localización del Sonido Humano) MIT Press, 1983.
Usando el sintetizador 100 de señale binaurales de la Figura 1, la señal de mono audio generada por una sola fuente de sonido, puede ser procesada, de modo que, cuando se escuche en los audífonos, la fuente de sonido es colocada espacialmente por la aplicación de un conjunto apropiado de indicadores espaciales (por ejemplo, ICLD, ICTD y/o HRTF) para
25 generar la señal de audio para cada oído. Véase, D.R. Begault, 3-D Sound for Virtual Reality and Multimedia, (Sonido en tres dimensiones para realidad virtual y multimedia), Academic Press, Cambridge, Mass, 1994.
El sintetizador 100 de señal binaural de la Figura 1, genera el tiempo más simple de escenas de auditorio, aquellas que tienen una sola fuente de audio colocada con relación al escucha. Escenas de auditorio más complejas, que comprenden dos o más
30 fuentes de audio, ubicadas en diferentes posiciones con relación del escucha, pueden ser generadas usando un sintetizador de escena de auditorio, que es esencialmente realizado usando múltiples casos del sintetizador de señales binaurales, donde cada caso de sintetizador de la señal binaural genera la señal binaural que corresponde a una diferente fuente de audio. Puesto que cada diferente fuente de audio tiene una diferente ubicación con relación al escucha, un diferente conjunto de pistas espaciales se usa para generar la señal de audio binaural para cada diferente fuente de audio.
35 La tesis de doctorado PHD " Parametric coding of spatial audio" de Christof Faller describe diferentes escenarios BCC, en los que los canales originales se mezclan de manera descendente a uno o una pluralidad de canales de mezcla descendente, y donde se calcula la información paramétrica secundaria para los canales originales, se transmite a un decodificador y se utiliza para mezclar de manera ascendente el uno o más canales de mezcla descendente.
40 El documento WO2004/049309A describe un método para codificar una señal de audio, en el que se calculan primeros parámetros cuya característica representa un aspecto de la señal de audio en una primera instancia. Además, también se calculan valores de segundos parámetros que representan el aspecto de la señal de audio en una instancia posterior. Un subconjunto de los segundos parámetros está asociado con una porción particular de un rango de frecuencias de la señal de
45 audio. Este rango de frecuencias se selecciona para cubrir todas las frecuencias presentes en la señal de audio.
El documento WO2005/069274A1 describe un aparato y un método para construir una señal de salida multicanal o para generar una señal de mezcla descendente, en que pistas ICC y pistas ICTD para ambos lados se calculan en un codificador. Estos dos valores pueden ser transmitidos desde un codificador a un decodificador. Alternativamente, el codificador puede
50 calcular una pista resultante de ICC o ICTD introduciendo las pistas para ambos lados en una función matemática tal como una función de promedio, etc., para derivar el valor resultante de las dos medidas de coherencia. La fecha de prioridad del documento WO 2005/069274 A1 es anterior a la fecha de prioridad de la presente memoria descriptiva y la fecha de publicación del documento WO 2005/069274 A1 es posterior a la fecha de prioridad de la presente memoria descriptiva.
55 Es un objeto de la presente invención proporcionar un concepto de codificación/decodificación mejorado para canales de audio.
Este objeto se consigue mediante un método para codificar canales de audio de acuerdo con la reivindicación 1, un aparato para codificar canales de audio de acuerdo con la reivindicación 9, un medio legible por máquina de acuerdo con la 60 reivindicación 12, una secuencia de bits de audio codificado de acuerdo con la reivindicación 13, un método para decodificar
imagen3
de acuerdo con la reivindicación 14, un aparato para decodificar de acuerdo con la reivindicación 24, o un medio legible por máquina de acuerdo con la reivindicación 26.
DESCRIPCIÓN DE LA INVENCIÓN
5 De acuerdo con una realización, la presente invención es un método, aparato, y medio leíble por máquina para codificar canales de audio. Uno o más códigos de pista se generan por dos o más canales de audio, en que al menos un código de pista es un código de pista combinado, generado mediante la combinación de dos o más códigos de pista estimados utilizando una función promedio ponderada considerando la importancia de los canales individuales, y cada código de pista estimado es
10 estimado desde un grupo de dos más canales de audio.
De acuerdo con otra realización, la presente invención es un aparato para codificar canales de audio de entrada C, para generar E canales de audio transmitidos. El aparato comprende un estimador de código y un mezclador descendente. El estimador de código genera uno o más códigos de pista para dos o más canales de audio, en que al menos un código de pista
15 es un código de pista combinado, generado mediante la combinación de dos o más códigos de pista estimados utilizando una función promedio ponderada considerando la importancia de los canales individuales, y cada código de pista estimado se estima de un grupo de dos o más de los canales de audio. El mezclador descendente mezcla hacia abajo los canales de entrada C, para generar los E canales transmitidos, donde C > E > 1, en que el aparato está adaptado para transmitir información acerca de los códigos de pista para habilitar a un decodificador a ejecutar un procesamiento de síntesis durante
20 la decodificación de los E canales transmitidos.
De acuerdo con otra realización, la presente invención es una secuencia de bits de audio codificado, generador por codificar canales de audio, en que uno o más códigos de pista son generados por dos o más canales de audio, en que al menos un código de pista es un código de pista combinado, generado combinando dos o más códigos de pista estimados utilizando una
25 función promedio ponderada considerando la importancia de los canales individuales, y cada código de pista estimado se estima de un grupo de dos o más de los canales de audio. Este uno o más códigos de pista y canales de audio transmitidos E corresponden a dos o más canales de audio, en que E > 1, se codifican en la secuencia de bits de audio codificado.
De acuerdo con otra realización, la presente invención es una secuencia de bits de audio codificado, que comprende uno o
30 más códigos de pista y E canales de audio transmitidos. Este uno o más códigos de pista son generados por dos o más canales de audio, en que al menos un código de pista es un código de pista combinado, generado combinando dos o más códigos de pista estimados utilizando una función promedio ponderada considerando la importancia de los canales individuales, y cada código de pista estimado se estima de un grupo de dos o más de los canales de audio. Los E canales de audio transmitidos corresponden a dos o más canales de audio.
35 De acuerdo con otra realización, la presente invención es un método, aparato y medio que se puede leer por máquina para decodificar los E canales de audio transmitidos, para generar canales de audio de reproducción C, donde C > E > 1. Los códigos de pista que corresponden a los E canales transmitidos son recibidos, en que al menos un código de pista es un código de pista combinado, generado combinando dos o más códigos de pista estimados, y cada código de pista estimado se
40 estima de un grupo de dos o más canales de audio, que corresponden a los E canales transmitidos Uno o más de los E canales transmitidos se mezclan en forma ascendente, para generar uno o más canales mezclados ascendentemente. Uno o más de los canales de reproducción C se sintetizan aplicando los códigos de pista a este uno o más canales mezclados en forma ascendente, en que dos o más códigos de pista derivados se derivan del código de pista combinado y cada código de pista derivado es aplicado para generar dos o más canales sintetizados.
45
BREVE DESCRIPCIÓN DE LOS DIBUJOS
Otros aspectos, características y ventajas de la presente invención llegarán a ser más completamente evidentes de la siguiente descripción detallada, las reivindicaciones anexas y los dibujos acompañantes, en los cuales números de referencia similares
50 identifican elementos similares o idénticos.
La Figura 1 muestra un diagrama de bloques de alto nivel del sintetizador de señal binaural;
La Figura 2 es un diagrama de bloques de una codificación de pista binaural genérica (BCC)de un sistema de procesamiento 55 de audio;
La Figura 3 muestra un diagrama de bloques de un mezclador descendente, que puede ser usado como el mezclador descendente de la Figura 2;
60 La Figura 4 muestra un diagrama de bloques de un sintetizador de BCC;, que puede ser usado para el decodificador de la Figura 2; La Figura 5 muestra un diagrama de bloques del estimador BCC de la Figura 2, de acuerdo con una realización de la presente invención;
imagen4
5 La Figura 6 ilustra la generación de los datos de la ICTD y la ICLD para el audio de cinco canales;
La Figura 7 ilustra la generación de datos ICC para el audio de cinco canales;
La Figura 8 muestra un diagrama de bloques de una forma de realización del sintetizador BCC de la Figura 4, que puede ser 10 usado en el decodificador BCC, para generar una señal de audio estéreo o de múltiples canales, dada una señal de suma transmitida sencilla s(n) más las pistas espaciales;
La Figura 9 ilustra cómo son variados los ICTL y las ICLD dentro de una sub-banda, como una función de la frecuencia;
15 La Figura 10 muestra un diagrama de bloques de un sintetizador de BCC que puede ser usados para el decodificador de la Figura 2 para un esquema 5 a 2 de BCC; y
la Figura 11 muestra un diagrama de flujo del proceso de un sistema BCC, tal como aquel mostrado en la Figura 2, con relación 20 a una realización de la invención.
DESCRIPCIÓN DETALLADA
En la codificación de pista binaural (BCC), un codificador codifica los canales de audio de entrada C para generar E canales
25 de audio transmitidos, donde C > E > 1. En particular, dos o más de los canales de entrada C son provistos en un dominio de frecuencia, y uno o más de los códigos de pista son generados para cada cual de uno o más bandas de frecuencia diferentes, en los dos o más canales de entrada en el dominio de frecuencia. Además, los canales de entrada C son mezclados en forma descendente para generar los E canales transmitidos. En algunas formas de realización de la mezcla descendente, al menos uno de los E canales transmitidos se basa en dos o más de los canales de entrada C y al menos uno de los E canales
30 transmitidos se basa en solamente uno de los canales de entrada.
En una realización, un codificador de BCC tiene dos o más bancos de filtros, un estimador de código y un mezclador descendente. Los dos o más bancos de filtros convierten dos o más de los canales de entrada C desde un dominio de tiempo en un dominio de frecuencia. El estimador de código genera uno o más códigos de pista para cada cual de una o más diferentes
35 bandas de frecuencia, en dos o más canales de entrada convertidos. El mezclador descendente, mezcla los canales de entrada C para generar los E canales transmitidos, donde C > E > 1.
En la decodificación de BCC, los E canales de audio transmitidos son decodificador para generar canales de audio de reproducción en particular, para cada uno o más bandas de frecuencia diferente, uno o más de los E canales transmitidos se 40 mezclan en forma ascendente en un dominio de frecuencia para generar dos o más de los canales de reproducción C en el dominio de frecuencia, donde C > E > 1. Uno o más de los códigos de pista se aplican a cada cual de uno o más bandas de frecuencia diferentes en dos o más canales de reproducción en el dominio de frecuencia ara generar dos o más canales modificados, y los dos o más canales modificados son convertidos desde el dominio de frecuencia en un dominio de tiempo. En algunas formas de realización de mezcla ascendente, al menos uno de los canales de reproducción C se basa en al menos
45 uno de los E canales transmitidos y al menos un código de pista y al menos uno de los canales de reproducción C se basa en solamente uno de los E canales transmitidos, sencillo e independiente de cualquier código de pista.
En una realización, un decodificador de BCC tiene un mezclador ascendente, un sintetizador y uno o más bancos de filtro inversos. Para cada una o más diferentes bandas de frecuencia, el mezclador ascendente mezcla uno o más de los E canales 50 transmitidos en un dominio de frecuencia para generar dos o más de los canales de reproducción c en el dominio de frecuencia, donde C > E > 1. El sintetizador aplica uno o más códigos de pista a cada una o más bandas de frecuencia diferentes en dos
o más canales de reproducción en el dominio de frecuencia, para generar dos o más canales modificados. Este uno o más bancos de filtro inversos convierten los dos o más canales modificados del dominio de frecuencia en un dominio de tiempo.
55 Dependiendo de la forma de realización particular, un canal de reproducción dado puede ser basado en un canal transmitido sencillo, más bien que una combinación de dos o más canales transmitidos. Por ejemplo, cuando hay solamente un canal transmitido, cada uno de los C canales de reproducción se basa en ese canal transmitido. En estas situaciones, la mezcla ascendente corresponde a la copia del canal transmitido correspondiente. Como tal, para aplicaciones en que hay solamente un canal transmitido, el mezclador ascendente puede ser realizado usando un replicador, que copia el canal transmitido para
60 cada canal de reproducción.
imagen5
Los codificadores de BCC y/o decodificadores pueden ser incorporados en un número de sistemas o aplicaciones, que incluyen, por ejemplo grabadoras / reproductoras de video digital, grabadoras/reproductoras de audio digital, computadoras, transmisores/receptores de satélite, transmisores/receptores de cable, transmisores/receptores de comunicaciones terrestres, sistemas de entretenimiento del hogar y sistemas de películas.
5 Proceso BCC Genérico
La Figura 2 es un diagrama de bloques de un sistema 200 de procesamiento de audio de codificación de pista binaural genérico (BCC), que comprende un codificador 202 y un decodificador 204. El codificador 202 incluye el mezclador descendente 206 y
10 un estimador 208 del BCC.
El mezclador descendente 206 convierte los C canales de audio de entrada xi(n) en E canales de audio transmitidos yi(n), donde C > E > 1. En este documento, las señales expresadas usando la variable n son señales de dominio de tiempo, mientras las señales expresadas usando la variable k son señales de dominio de frecuencia. Dependiendo de la forma de realización 15 particular, la mezcla descendente puede ser realizada en cualquiera del dominio de tiempo o el dominio de frecuencia. El estimador de BCC 208 genera códigos de BCC de los canales de audio de entrada C y transmite sus códigos de BCC como información secundaria en banda o fuera de banda, con relación a los E canales de audio transmitidos. Los códigos de BCC típicos incluyen uno o más de diferencia de tiempo de Inter.-canales (ICTD), diferencia de nivel de Inter.-canales (ICLD) y datos de correlación Inter.-canales (ICC) estimados entre ciertas parejas de canales de entrada, como una función de la
20 frecuencia y el tiempo. La forma de realización particular dictará entre cuáles parejas particulares de canales de entrada y códigos de BCC se estima.
Los datos de ICC que corresponden a la coherencia de una señal binaural, que se relaciona al ancho percibido de la fuente de audio. Cuanto más ancha es la fuente de audio, menor será la coherencia entre los canales izquierdo y derecho de la señal 25 binaural resultante. Por ejemplo, la coherencia de la señal binaural, que corresponde a una orquesta se difunde sobre una etapa de auditorio que es típicamente menor que la coherencia de la señal binaural que corresponde a un solo violín, que se toca solo. En general, una señal de audio con coherencia menor, es usualmente percibida como mayor difundida en el espacio del auditorio. Como tal, los datos de ICC se relacionan típicamente al ancho de fuente aparente y un grado del escucha encerrado. Véase, por ejemplo, en J. Blauert, The Psychophysics of Human Sound Localización (La Psicofísica de la Ubicación
30 del Sonido Humano, por MIT Press, 1983.
Dependiendo de la aplicación particular, los E canales de audio transmitidos y los códigos de B correspondientes, pueden ser transmitidos directamente al decodificador 204 o almacenados en algún tipo adecuado de dispositivo de almacenamiento, para el acceso subsiguiente por el decodificador 204. Dependiendo de la situación, el término de “transmisión” puede referirse
35 a cualquiera de la transmisión directa a un decodificador o almacenamiento para la provisión subsiguiente a un decodificador. En cualquier caso, el decodificador 204 recibe los canales de audio transmitidos y la información secundaria y realiza la mezcla ascendente y la síntesis de BCC usando los códigos de BCC para convertir los E canales de audio transmitidos, los canales de audio de reproducción), xi(n) para la reproducción de audio. Dependiendo de la forma de realización particular, la mezcla ascendente puede ser realizada en cualquiera del dominio de tiempo o el dominio de frecuencia.
40 Además del proceso BCC mostrado en la Figura 2, un sistema de procesamiento de audio de BCC genérico puede incluir codificación adicional y etapas de decodificación para comprimir ulteriormente las señales de audio en el codificador y luego descomprimir las señales de audio en el decodificador, respectivamente Estas codificaciones de audio se pueden basar en las técnicas de compresión / descompresión de audio convencionales, tal como aquéllas basadas en la modulación del código
45 de pulso (PCM), PCM diferencial (DPCM) o DPCM adaptivo (ADPCM).
Cuando el mezclador descendente 206 genera una simple señal de suma (es decir, E = 1), la codificación BCC es capaz de representar señales de audio de múltiples canales en un régimen de bits sólo ligeramente mayor del requerido para representar una señal de mono-audio. Esto es así, debido a que la ICTD, ICLD estimadas y los datos de ICC entre una pareja de canales,
50 contienen alrededor de dos órdenes de magnitud menor de información que una forma de onda de audio.
No sólo el régimen de bits bajo de la codificación de BCC, sino también su aspecto de compatibilidad anterior, son de interés. Una señal de suma transmitida sencilla corresponde a una mono mezcla descendente de la señal del estéreo original o de múltiples canales. Para receptores que no soportan la reproducción de sonido estéreo o de múltiples canales. Escuchar la 55 señal de suma transmitida es un método válido de presentar el material de audio en el equipo de reproducción único de bajo perfil. La codificación BCC puede, por lo tanto, ser usado para aumentar los servicios existentes que implican la entrega de material de mono-audio hacia el audio de múltiples canales. Por ejemplo, los sistemas de radio-transmisión de mono-audio existentes, pueden ser aumentados por la reproducción del estéreo o de múltiples canales si la información secundaria de BCC puede ser incrustada en el canal de transmisión existente. Capacidades análogas existen cuando el audio de multi
60 canales de mezcla descenderte de dos señales de suma, corresponden al audio de estéreo.
imagen6
La BCC procesa las señales de audio con un cierto tiempo y resolución de frecuencia. La resolución de frecuencia usada es en su mayor parte motivada por la resolución de frecuencia del sistema del auditorio humano. La psicoacústica sugiere que la percepción espacial es más probablemente basada en la representación crítica de banda de la señal de entrada acústica. Esta resolución de frecuencia está considerada usando un banco de filtro invertible (por ejemplo, basado en una
5 transformación rápida de Fourier (FFT) o un filtro de espejo de cuadratura (QMF)) con sub-bandas con anchos de banda iguales o proporcionales al ancho de banda crítico del sistema de auditorio humano.
Mezcla Descendente Genérica
10 En formas de realización preferidas, las señales de suma transmitidas contienen todos los componentes de señal de dicha señal de audio de entrada. La meta es que cada componente de señal se mantenga completamente. La suma sencilla de los canales de entrada de audio a menudo resulta en la amplificación o atenuación de los componentes de señal. En otras palabras, la potencia de los componentes de señal en una suma “simple” es a menudo mayor o menor que la suma de la potencia del componente de señal correspondiente de cada canal. Una técnica de mezcla descendente puede ser usada, que
15 iguala la señal de suma de manera que la potencia de los componentes de señal sea la señal de suma de aproximadamente la misma como la potencia correspondiente de todos los canales de entrada.
La Figura 3 muestra un diagrama de bloques de un mezclador descendente 300, que puede ser usado para el mezclador descendente 206 de la Figura 2, de acuerdo con ciertas formas de realización del sistema BCC 200. El mezclador descendente 20 300 tiene un banco de filtros (FB) 302 para cada canal de entrada xi(n), un bloque de mezcla descendente 304, un bloque opcional de escala/retardo y un FB inverso (IFB) para cada canal codificado yi(n).
Cada banco 302 de filtros convierte cada marco (por ejemplo, de 20 mseg) de un canal de entrada digital correspondiente imagen7
xi(n), en el dominio de tiempo en un conjunto de coeficientes de entrada
en el dominio de frecuencia. El bloque 304 de 25 mezcla descendente mezcla cada sub-banda de coeficientes de entrada correspondiente C en una sub-banda de coeficientes
imagen8
imagen9
30 donde DCE es una matriz de mezcla descendente C por E de valor real.
El bloque 306 opcional de escala/retardo comprende un conjunto de multiplicadores 310, cada uno de los cuales multiplica un imagen10coeficiente de mezcla descendente correspondiente por un factor de escala ei(k), para generar un coeficiente de escala correspondiente
imagen11. La motivación para la operación de escala es equivalente a la igualación generalizada para la mezcla 35 descendente con factores de ponderación arbitrarios para cada canal. Si los canales de entrada son independientes, luego la imagen12
potencia de la señal de mezcla descendente en cada sub-banda es dada por la Ecuación (2) como sigue: donde
imagen13
imagen14
imagen15se deriva elevando al cuadrado cada elemento de matriz en la matriz de mezcla descendente C por E, DCE y
imagen16es la potencia de la sub-banda k del canal de entrada i.
Si las sub-bandas no son independientes, entonces los valores de potencia imagen17de la señal de mezcla descendente serán mayores o menores que esa calculada usando la Ecuación (2), debido a las amplificaciones o cancelaciones cuando los componentes de señal son en fase o fuera de fase, respectivamente. Para prevenir esto, la operación de mezcla descendente de la Ecuación (1) se aplica en las sub-bandas, seguido por la operación de escala de los multiplicadores 310. Los factores de escala ei(k) (1 < i < E) pueden derivarse usando la Ecuación (3) como sigue:
imagen18
10 donde es la potencia de sub-banda como se calculó de la Ecuación (2) y es la potencia de la señal de sub
imagen19
banda imagen20de mezcla descendente correspondiente.
Además de, o en lugar de, proporcionar la escala opcional, el bloque 306 de escala/retardo puede, opcionalmente, aplicar retardos a las señales.
15
Cada banco 308 de filtros inversos convierte un conjunto de coeficientes escalados correspondientes imagen21en el dominio de frecuencia en un marco de un canal yi(n) transmitido digital correspondiente.
Aunque la Figura 3 muestra todos los canales de entrada C siendo convertidos en el dominio de frecuencia para la mezcla
20 descendente subsiguiente, en formas de realización alternativas, uno o más (pero menor de C-1) de los canales de entrada C pueden desviarse algo o todo el proceso mostrado en la Figura 3 y ser transmitidos como un número equivalente de canales de audio sin modificar. Dependiendo de la forma de realización particular, estos canales de audio o modificados pueden o no ser usados por el estimador 208 de BCC de la Figura 2, en generar los códigos de BCC transmitidos.
25 En una forma de realización del mezclador descendente 300, que genera una señal de suma sencilla y(n), E = 1 y las señales
de cada sub-banda de cada canal de entrada c, son agregados y luego multiplicados con un factor e(k), de acuerdo
imagen22
imagen23
30 el factor e(k) se da por la Ecuación (5), como sigue:
imagen24
donde imagen25es una estimación de tiempo corto de la potencia de imagen26 imagen27en el índice k de tiempo y imagen28es una estimación
de tempo breve de la potencia de . Las sub-bandas igualadas se transforman de nuevo al dominio de tempo que 35 resulta en la señal de suma y(n) que es transmitida al decodificador de BCC.
5
10
15
20
25
30
35
40
45
Síntesis de BCC Genérica
La Figura 4 muestra un diagrama de bloques de un sintetizador de B 400, que puede ser usado para el decodificador 204 de la Figura 2, de acuerdo a ciertas formas de realización del sistema de BCC 200. Este sintetizador de BCC 400 tiene un banco 402 de filtros para cada canal transmitido yi(n), un bloque mezclador ascendente 404, los retardos 406, multiplicadores 408,
imagen29
bloque 410 de correlación y un banco 412 de filtros inversos, para cada canal de reproducción Cada banco 402 de filtros convierte cada marco de un canal imagen30yi(n) transmitido digital correspondiente en el dominio del marco en un conjunto de coeficientes de entrada en el dominio de frecuencia. El bloque de mezcla ascendente 404 mezcla cada sub-banda de E, que corresponde a los coeficientes de canal transmitidos, en una sub-banda correspondiente de
imagen31
imagen32
donde UEC es una matriz de mezcla ascendente E por C de valor real. Ejecutando la mezcla ascendente en el dominio de frecuencia habilita que esta mezcla ascendente sea aplicada individualmente en cada diferente subbanda.
Cada retardo 407 aplica un valor di(k) de retardo basado en un código BCC correspondiente para datos de ICTD, con el fin de asegurar que los valores de ICTD deseados aparezcan entre ciertas parejas de canales de reproducción. Cada multiplicador 408 aplica un factor de escala ai(k) con base en un código de BCC correspondiente para datos ICLD con el fin de asegurar que los valores de ICLD deseados aparezcan entre ciertas parejas de canales de reproducción. El bloque 410 de correlación realiza una operación de descorrelación A basada en códigos de BCC correspondientes para datos de ICC con el fin de asegurar que los valores de ICC deseados aparezcan entre ciertas parejas de canales de reproducción. Una descripción ulterior de las operaciones del bloque 410 de correlación puede ser encontrada en la solicitud de patente de E.U.A., No. De Serie 10/155,437, presentada el 24 de Mayo del 3003, como Baumgarte 2-10.
La síntesis de los valores de ICLD pueden ser menos problemática que la síntesis de los valores de ICTD y de ICC, puesto que la síntesis de ICLD implica escalar meramente las señales de sub-bandas. Puesto que las pistas de ICLD son las pistas direccionales may usadas comúnmente es usualmente más importante que los valores de ICLD se aproximen a aquellos de la señal de audio original. Como tal, los datos de ICLD pueden ser estimados entre todas las parejas de canales. Los factores de escala ai(k) (1 < i < C) para cada sub-banda se escogen preferiblemente de modo que la potencia de sub-banda de cada canal de reproducción se aproxime a la potencia correspondiente del canal de audio de entrada original.
Una meta puede ser aplica modificaciones de señales relativamente pocas para sintetizar los valores de ICTD y de ICC. Como tal, los datos de BCC pueden no incluir los valores de ICTD y de ICC, para todas las parejas de canales. En ese caso, el sintetizador de BCC 400 sintetizará los valores de ICTD y de ICC solamente entre ciertas parejas de canales.
imagen33
Aunque la Figura 4 muestra todos los E de los canales transmitidos siendo convertidos en el dominio de frecuencia para la mezcla ascendente subsiguiente y el proceso de BCC, en formas de realización alternativas, uno o más (pero no todos) los E canales transmitidos pueden desviarse algo o todo del proceso mostrado en la Figura 4. Por ejemplo, uno o más de los canales transmitidos pueden ser canales sin modificar, que no se someten a alguna mezcla ascendente. Además de ser uno o más de los canales de reproducción C, estos canales sin modificar, a su vez, pueden ser, pero no tienen que ser, usados como canales de referencia a los cuales el proceso de BCC se aplica para sintetizar uno o más de los otros canales de reproducción.
imagen34
En cualquier caso, tales canales sin modificar pueden ser sometidos a retardos para compensar el tiempo de proceso implicado en la mezcla ascendente y/o el proceso de BCC usado para generar el resto de los canales de reproducción.
Nótese que, aunque la Figura 4 muestra canales de producción C siendo sintetizados de e canales transmitidos, donde C es
5 también el número de canales de entrada originales, la síntesis de BCC no se limita a ese número de canales de reproducción. En general, el número de canales de reproducción puede ser cualquier número de canales, que incluyen números mayores de o menores de, y posiblemente aún situaciones donde el número de canales de reproducción es igual a, o menor que, el número de canales transmitidos.
10 “Diferencias Relevantes Perceptualmente” entre Canales de Audio
Suponiendo una señal simple de suma, la BCC sintetiza una señal de audio de canal estéreo o de múltiples canales, de manera que ICTD, ICLD e ICC se aproximen a las pistas o indicaciones correspondientes de la señal de audio original. En lo siguiente, el papel de ICTD, ICLD e ICC, en relación con los atributos de imagen espacial del auditorio, se discute.
15 El conocimiento acerca del oído espacial implica que un evento de auditorio, ICTD e ICLD se relacionen a la dirección percibida. Cuando se consideran respuestas de impulso de espacio binaural (BRIRx), de una fuente, hay una relación entre el ancho del evento de auditorio y el envolvente del escucha y los datos de ICC estimados para las partes temprana y tardía de las BTIRs. Sin embargo, la relación entre ICC y estas propiedades para señales generales (y no justamente las BRIRs) no
20 son directas.
Las señales de audio de estéreo y de múltiples canales, usualmente contienen una mezcla compleja de señales de fuentes activas concurrentemente superpuestas de componentes de señal reflejadas, que resultan de grabar en espacios encerrados
o agregados por el ingeniero de grabación para crear artificialmente una impresión espacial. Diferentes señales de fuente y
25 sus reflexiones ocupan diferentes regiones en el plano de tiempo-frecuencia. Esto es reflejado por ICTD, ICLD e ICC, que varía como una función de tiempo y frecuencia. En este caso, la relación entre el ICTD, ICLD e ICC instantáneos y las direcciones de eventos de auditorio y la impresión espacial no son obvias. La estrategia de ciertas realizaciones de BCC es sintetizar a ciegas estas pistas o indicaciones de modo que se aproximen a las pistas correspondientes de la señal de audio original.
30 Los bancos de filtros con sub-bandas de anchos de banda iguales a do veces el ancho de banda rectangular equivalente (ERB) se usan. La escucha informal revela que la calidad de audio de BCC no mejora notablemente cuando se escoge la resolución de frecuencia mayor. Una resolución de frecuencia menor puede ser conveniente, puesto que resulta en valores menores de ICTD, ICLD e ICC, de los necesarios para ser transmitidos al decodificador y sí en un régimen menor de bits.
35 Considerando el tiempo de resolución, ICTD, ICLD e ICC se consideran típicamente en intervalos de tiempo regulares. Se obtiene el alto desempeño cuando ICTD, ICLD e ICC se consideran aproximadamente cada 4 a 16 ms. Nótese que, a no ser que las pistas se consideren en intervalos de tiempo muy cortos, el efecto de precedencia no se considera directamente. Suponiendo una pareja clásica de guía retardada de estímulos de sonido, si esta guía y retardo caen en un intervalo de tiempo
40 donde solamente un conjunto de pistas se sintetiza, entonces el dominio de ubicación de la guía no se considera. A pesar de esto, BCC logra calidad de audio reflejada en una clasificación promedio de MUSHRA de aproximadamente 87 (es decir, “excelente” calidad de audio) en promedio hasta casi 100 para ciertas señales de audio.
La pequeña diferencia perceptualmente, lograda a menudo, entre la señal de referencia y la señal sintetizada, implica que las
45 pistas relacionadas a un amplio intervalo de atributos de imagen especial de auditorio son consideradas implícitamente sintetizando ICTD, ICLD e ICC en intervalos de tiempo regulares. En lo siguiente, se dan algunos argumentos de cómo ICTD, ICLD e ICC pueden relacionarse a un intervalo de atributos de imagen espaciales de auditorio.
Estimación de Pistas Espaciales
50 En lo siguiente, se describirá cómo ICTD, ICLD e ICC se estimaron. La tasa de bits para la transmisión de estas pistas espaciales (cuantificadas y codificadas) puede ser justamente de unos cuantos kb/s y así, con BCC, es posible transmitir señales de audio estéreo y de múltiples canales a regímenes de bits cercanos a los que se requieren para un solo canal de audio.
55 La Figura 5 muestra un diagrama de bloques del estimador de BCC 208 de la Figura 2, de acuerdo con una realización de la presente invención. El estimador 208 de BCC comprende bancos de filtros (FB) 502 que pueden ser los mismos que los bancos de filtros 302 de la Figura 3, y el bloque 504 de estimación, el cual genera las pistas espaciales ICTD, ICLD e ICC para cada sub-banda de frecuencia, generada por los bancos de filtro 502.
60 Estimación de ICTD, ICLD e ICC para señales Estéreo
imagen35
Se usan las siguientes medidas para ICTD, ICLD e ICC para las señales de sub-bandas correspondientes de dos canales de audio (por ejemplo estéreo).
o ICTD (muestras)
imagen36
imagen37
con una estimación de tiempo breve de la función de correlación transversal normalizada, dada por la ecuación (8) como sigue:
imagen38
donde
imagen39
y
imagen40es una estimación de tiempo breve del medio de
imagen41.
o ICLD [dB]:
20 o ICC:
imagen42
Nótese que el valor absoluto de la correlación transversal normalizada se considera y c12(k) tiene un intervalo de [0,1].
Estimación de ICTD, ICLD e ICC para Señales de Audio de Múltiples canales
25 Cuando hay más de dos canales de entrada, es típicamente suficiente definir ICTD e ICLD entre un canal de referencia por
ejemplo el número 1 de canal) y los otros canales, como se ilustró en la Figura, para el caso de canales C = 5, donde ΔL1C(k) denotan ICTD e ICLD, respectivamente, entre el canal de referencia 1 y el canal c.
30 En formas opuestas a ICTD e ICLD, ICC típicamente tiene más grados de libertad. La ICC según se definió, puede tener diferentes valores entre todas las posibles parejas de canal de entrada. Para los canales C, hay C(C–1)/2 parejas de canales posibles, p.ej. para 5 canales hay 10 parejas de canales como se ilustra en la Figura 7(a). Sin embargo, tal esquema requiere que para cada sub-banda en cada índice de tiempo, C(C–1)/2 valores de ICC se estimen y transmitan, lo que resulta en alta complejidad computacional y alto régimen de bits.
35 Alternativamente, para cada sub-banda, ICTD e ICLD determinan la dirección en la cual el evento de auditorio del componente de señal correspondiente en la sub-banda se realizó. Un parámetro de ICC simple por sub-banda, puede luego ser usado para describir la coherencia general entre todos los canales de audio. Buenos resultados pueden ser obtenidos estimando y transmitiendo pistas de ICC sólo entre los dos canales con más energía en cada sub-banda en cada índice de tiempo. Esto
imagen43
imagen44
5 se ilustra en la Figura 7(b), donde para los instantes de tiempo k-1 y k, las parejas de canales (3, 4) y (1, 2) son más fuertes respectivamente. Una regla heurística puede ser usada para determinar ICC entre las otras parejas de canales.
Síntesis de Pistas Espaciales
10 La Figura 8 muestra un diagrama de bloques de una forma de realización del sintetizador de BCC 400 de la Figura 4, que puede ser usado en un decodificador de BCC para generar una señal de audio estéreo o de múltiples canales, dada una señal s(n) de suma transmitida sencilla, más las pistas o indicaciones espaciales. La señal de suma imagen45s(n) se descompone en sub
bandas, donde
denota una de tales sub-bandas. Para generar las sub-bandas correspondientes de cada canal de salida, se aplican los retardos dc, factores de escala ac y filtros hc a la sub-banda correspondiente de la señal de suma. (Para
15 simplicidad de notación, el índice de tiempo k es ignorado en los retardos, factores de escala y filtros.) Las ICTD se sintetizan por imponer retardos, las ICLD por escala, y las ICLD por aplicar filtros de descorrelación. El proceso mostrado en la Figura 8 se aplicó independientemente a cada sub-banda.
Síntesis de ICTD 20
Los retardos dc se determinaron de los ICTD
imagen46, de acuerdo con la Ecuación (12), como sigue:
imagen47
El retardo para el canal de referencia d1 es calculado de modo que la magnitud máxima de los retardos dc sea mínima. Cuanto menos señales de sub-banda sean modificados, menor seré la ocurrencia de un peligro para los artefactos. Si el régimen de 25 muestreo de la sub-banda no proporciona una resolución de tiempo suficientemente alta para la síntesis de la ICTD, los retardos se pueden imponer más precisamente por usar filtros adecuados de todos los pasos.
Síntesis de la ICLD
30 Con el fin que las señales de sub-banda de salida tengan las ICLDs ΔL12 (k) deseadas entre el canal c y el canal 1 de referencia, los factores de ganancia ac deben satisfacer la Ecuación (13) como sigue:
imagen48
Adicionalmente, las sub-bandas de salida son normalizadas preferiblemente, de modo que la suma de la potencia de todos los canales de salida sea igual a la potencia de la señal de suma de entrada. Puesto que la potencia de la señal original total
35 en cada sub-banda se preserva en la señal de suma, esta normalización resulta en la potencia de sub-banda absoluta para cada canal de salida, que se aproxima a la potencia correspondiente de la señal de audio de entada del codificador original. Dadas estas restricciones, los factores de escala ac son dados estas restricciones, los factores de escala ac son dados por la Ecuación 14 como sigue:
imagen49
imagen50
Síntesis de la ICC
En ciertas realizaciones, el objeto de la síntesis de la ICC es reducir la correlación entre las sub-bandas después que los retardos y el escalado se han logrado. Sin afectar la ICTD y la ICLD. Esto puede lograrse por diseñar los filtros hc en la Figura 5 6, de modo que ICTD e ICLD sean variadas efectivamente como una función de frecuencia, de modo que la variación promedio sea de cero, en cada sub-banda (banda crítica de auditorio).
La Figura 9 ilustra cómo ICTD e ICLD son variadas dentro de una subbanda comoo una función de la frecuencia. La amplitud de la variación de ICTD e ICLD determina el grado de la descorrelación y se controla como una función de la ICC, mientras la
10 ICLD varían aleatoriamente (como en la Figura 9(b)).Se puede variar ICLD tan suavemente como ICTD, pero esto resultaría en mayor correlacion de las señales de audio resultantes.
Otro método de sintetizar la ICC, particularmente adecuado para la síntesis de ICC de múltiples canales, se describe en mayor detalle en C. Faller, “Codificación de audio de múltiples canales paramétricos. Síntesis de pistas de coherencia” IEEE Trans
15 on Speech Síntesis and Audio Proc., 2003, cuyas enseñanzas se incorporan aquí como referencia. Como una función de tiempo y frecuencia, cantidades específicas de reverberación tardía artificial se agregan a cada uno de los canales de salida para lograr una ICC deseada. Adicionalmente, la modificación espectral puede ser aplicada, tal como la envoltura espectral de los acercamientos de señales resultantes, la envoltura espectral de la señal de audio original.
20 Otras técnicas de síntesis de la ICC relacionas y no relacionadas para las señales estéreo (o parejas de canales de audio) se han presentado en E. Chuijiers, W. Oomenm B den Brinker y J. Breebaart. “Avances en la codificación paramétrica para audio de alta calidad”, en Preprint 114° Conv. Aud. Eng. Soc., Marzo del 2003 y J. Engdegard, H. Purnhagen, J. Roden y L. Liljeryd, “Ambiente Sintético en la codificación estéreo paramétrica! En Preprint 117° Conv. Aud. Eng. Soc. Mayo del 2004, las enseñanzas de ambos se incorporan aquí como referencia.
25 C a E BCC
Como se describió previamente, BCC se puede llevar a cabo con más de un canal de transmisión. Una variación de BCC se ha descrito, la cual representa canales de audio C no como un canal simple (transmitido), sino como E canales denotados C
30 a E BCC. Hay (al menos) dos motivaciones para C a E BCC.
o BCC con un canal de transmisión proporciona una trayectoria compatible hacia atrás para mejorar los mono-sistemas existentes, para la reproducción de audio estéreo o de múltiples canales. Los sistemas mejorados transmiten la señal de suma mezclada en forma descendente de BCC a través de la mono-infraestructura existente, mientras transmite
35 adicionalmente la información secundaria de BCC, C a E BCC es aplicable a la codificación compatible hacia atrás del canal E de audio del canal C.
o C a E BCC introduce la capacidad de escalabilidad en términos de diferentes grados de reducción del número de
canales transmitidos. Se espera que cuantos más canales de audio que se transmitan, mejor será la calidad del 40 audio.
Los detalles del proceso de señal para C a E BCC, tal como cómo definir las pistas ICTD, ICLD e ICC, se describen en la solicitud de E.U.A, No. De Serie 10/762,100, presentada el 20 de enero del 2004 (Faller 13-1).
45 Compactar Información Secundaria
Como se describió antes, en un esquema de BCC típico, el codificador transmite al decodificador ICTD, ICLD y/o ICC códigos estimados entre parejas o grupos diferentes de canales de audio. Esta información secundaria se transmite además a las señales de mezcla descendente (por ejemplo, mono o estéreo), con el fin de obtener una señal de audio de múltiples canales
50 después de la decodificación de BCC. Así, e conveniente minimizar la cantidad de la información secundaria mientras no degrade la calidad subjetiva del sonido decodificado.
Puesto que los valores de ICLD e ICTD típicamente se relacionan a un canal de referencia, los valores C-1 de ICLD e ICTD son suficientes para describir las características de los C canales codificados. Por otra parte, las ICC se definen entre parejas
55 arbitrarias de canales. Como tales, para C canales codificados, hay C(C-1)/2 parejas ICC posibles. Para 5 canales codificados, esto corresponderá a 10 parejas de ICC. En la práctica, con el fin de limitar la cantidad de información de ICC transmitida, sólo la información de ICC para ciertas parejas será transmitida.
La Figura 10 muestra un diagrama de bloques de un sintetizador de BCC 1000, que puede ser usado para el decodificador 60 204 de la Figura 2 para un esquema de BCC 5 a 2. Como se muestra en la Figura 10, el sintetizador de BCC 1000 recibe dos
imagen51señales de entrada y1(n) e y2(n) y la información secundaria BCC (no mostrada) y genera cinco señales de salida sintetizadas
, donde la primera, segunda, tercera, cuarta y quinta señales de salida corresponden a las señales envolventes izquierda, derecha, centro, izquierda posterior y derecha posterior, respectivamente, mostradas en las Figuras 6 y 7.
5 Los parámetros de retardo, escala y descorrelación, derivados de la información secundaria de ICTD, ICLD e ICC transmitidas, imagen52
se aplican a los elementos 1004, 1006 y 1008, respectivamente, para sintetizar las cinco señales de salida imagen53desde las
cinco señales de “mezcla ascendente”
, generadas por el elemento 1002 de mezcla ascendente. Como se muestra en la Figura 10, la descorrelación se realiza solamente entre los canales izquierdo y posterior izquierdo (es decir los canales 1 y 4) y entre los canales derecho y posterior derecho, (es decir, los canales 2 y 5). Como tal, no más de dos conjuntos de datos de
10 ICC necesitan ser transmitidos al sintetizador 1000 de BCC, donde estos dos conjuntos caracterizan los valores de ICC entre las dos parejas de canales para cada sub-banda. Mientras esto ya es una reducción considerable en la cantidad de la información lateral de ICC, es conveniente una reducción ulterior.
De acuerdo con una realización de la presente invención, en el contexto del esquema BCC de 5 a 2 de la Figura 10 para cada
15 sub-banda, el codificador de BCC correspondiente combina el valor de ICC estimado a la pareja de canal “izquierdo / posterior izquierdo” con el valor de ICC estimado para la pareja del canal “derecho / posterior derecho con el fin de generar un valor de ICC combinado sencillo, que indique efectivamente una cantidad global de descorrelación frontal/posterior y que se transmite al decodificador de BCC como la información secundaria de ICC. Experimentos informales indicaron que esta simplificación resulta en virtualmente ninguna pérdida en la calidad de audio, mientras reduce la información de ICC transmitida por un factor
20 de dos.
En general, realizaciones de la presente invención se dirigen a esquemas de BCC en los cuales dos o más diferentes ICC estimadas entre diferentes parejas de canales, o grupos de canales, se combinan para la transmisión, como se indica por la Ecuación (15) como sigue:
25
imagen54
donde f es una función que combina N diferentes ICCs.
Con el fin de obtener una medida de la ICC, que sea representativa de la imagen espacial, puede ser ventajoso usar un 30 promedio ponderado para la función f, que considere la importancia de canales individuales, donde la importancia del canal puede ser basad en las potencias del canal, como se representa por la Ecuación (16) como sigue:
imagen55
35 donde pi es la potencia de la pareja de canales correspondiente en la sub-banda. En este caso, las ICC estimadas de las parejas de Canales más fuertes son ponderadas más que las ICC estimadas de las parejas de canales más débiles. La potencia combinada pi de una pareja de canales puede ser calculada como la suma de potencias de canales individuales para cada sub-banda.
40 En el decodificador, dada la ICCtransmitida, las ICC pueden ser derivadas para cada pareja de canales. En una posible forma de realización, el decodificador usa simplemente la ICCtransmitida como el código de ICC derivado para cada pareja de canales. Por ejemplo, en el contexto del esquema de BCC 5 a 2 de la Figura 10, la ICCtransmitida puede ser usada directamente para la descorrelación de la pareja de canales tanto izquierdo/posterior izquierdo como la pareja de canales derecho/posterior derecho.
45 En otra posible forma de realización, si el decodificador estima potencias de parejas de canales de las señales sintetizadas, entonces la ponderación de la Ecuación (16) puede ser estimada y el proceso del decodificador puede usar opcionalmente esta información y otros argumentos preceptúales y estadísticos de señal para generar una regla para derivar dos códigos de ICC optimizados perceptualmente, individuales.
50 Aunque la combinación de los valores de ICC se ha descrito en el contexto de un esquema de BCC de 5 a 2 particular, la presente invención puede ser realizad en el contexto de cualquier esquema de BCC de C a E, que incluye aquellos en donde E = 1.
imagen56
5 La Figura 11 muestra un diagrama de flujo del procesamiento de un sistema BCC, tal como el mostrado en la Figura 2, relacionado a una realización de la presente invención. La Figura 11 muestra sólo esas etapas asociadas con el procesamiento relacionado con la ICC.
En particular, el codificador de BCC estima los valores de ICC entre dos o más grupos de canales (Etapa 1102), combina dos
10 o más de estos valores de ICC estimados, para generar uno o más valores de ICC combinados (etapa 1104) y transmite los valores de ICC combinados (posiblemente junto con uno o más valores de ICC “no combinados”) como la información secundaria de BCC a un decodificador de BCC (etapa 1106). El decodificador de BCC deriva dos o más valores de ICC desde los valores de ICC combinados, recibidos (etapa 1108) y descorrelaciona grupos de canales usando los valores de ICC derivados (y posiblemente uno o más valores de ICC no combinados, recibidos) (etapa 1110).
15 Otras Realizaciones Alternativas
La presente invención se ha descrito en el contexto del esquema de BCC de 5 a 2 de la Figura 10. En ese ejemplo, un codificador de BCC (1) estima dos códigos de ICC para dos parejas de canales, que consisten de cuatro canales diferentes 20 (es decir, izquierdo / posterior izquierdo y derecho / posterior derecho) y (2) promedios de esos dos códigos de ICC, para generar un código de IC combinado, el cual se transmite al decodificador de BCC. Este decodificador (1) de BCC deriva dos códigos de ICC deseados del código de ICC combinado, transmitido (nótese que el código de ICC combinado puede simplemente ser usado para ambos de los códigos de ICC derivados) y (2) aplica cada uno de los dos códigos de ICC derivados a una pareja diferente de canales sintetizados, para generar cuatro canales descorrelacionados (es decir, canales
25 izquierdo / posterior izquierdo, derecho y posterior derecho, sintetizados.
La presente invención puede también ser llevada a cabo en otros contextos. Por ejemplo, un codificador de BCC puede estimar dos códigos de ICC de tres canales de entrada, A, B y C, donde un código de ICC estimado corresponde a los canales A y B y el otro código de ICC estimado corresponde a los canales A y C. En ese caso, el codificador puede ser el que estima dos 30 códigos de ICC de dos parejas de canales de entrada, donde las dos parejas de canales de entrada comparten un canal común (es decir el canal de entrada A). El codificador puede luego generar y transmitir un código de ICC combinado, sencillo, basado en los dos códigos de ICC estimados. Un decodificador de BCC puede luego derivar dos códigos de ICC del código de ICC combinado, transmitido, y aplicar esos dos códigos de ICC derivados para sintetizar tres canales descorrelacionados (es decir, canales sintetizados A, B y C). En este caso, cada código de ICC derivado puede decirse que será aplicado para
35 generar una pareja de canales descorrelacionados, donde las dos parejas de canales descorrelacionados comparten un canal común (es decir, el canal A sintetizado).
Aunque la presente invención se ha descrito en el contexto de los esquemas de codificación de BCC, que emplean códigos de ICC combinados, la presente invención puede también ser realizada en el contexto de esquemas de codificación de BCC
40 que emplean códigos de pista de BCC combinados, que se generan combinando dos o más códigos de pista de BCC, además de los códigos de ICC, tal como códigos de ICTD y/o de ICLD, en lugar de, o además de, emplear los códigos de ICC combinados.
Aunque la presente invención se ha descrito en el contexto de esquemas de codificación de BCC, que implican los códigos
45 ICTD, ICLD e ICC, la presente invención puede también ser realizada en el contexto de otros esquemas de codificación de BCC, que implican solamente uno o dos de estos tres tipos de códigos (es decir, ICLD e ICC, pero no ICTD) y/o uno o más tipos adicional de códigos.
En el esquema de BCC de 5 a 2, representado en la Figura 10, los dos canales transmitidos y1(n) e y2(n) son típicamente
50 generados aplicando un esquema de mezcla descendente de una etapa, particular, para los cinco canales mostrados en las Figuras 6 y 7, donde el canal y1 es generado como una suma ponderada de canales 1, 3 y 4, y el canal y2 es generado como una suma ponderada de canales 2, 3 y 5, donde, por ejemplo, en cada suma ponderada, el factor de ponderación para el canal 3 es la mitad del factor de ponderación usado para cada uno de los otros dos canales. En este esquema de BCC de una etapa, los códigos de pista de BCC estimados corresponden a diferentes parejas de los cinco canales de entrada
55 originales. Por ejemplo, un conjunto de códigos de ICC estimados se basa en los canales 1 y 4, y otro conjunto de códigos de ICC estimados se basa en los canales 2 y 5.
En una alternativa, relativa a un esquema de BCC de múltiples etapas, los canales son mezclados en forma descendente en secuencia, con los códigos de pista BCC que corresponden potencialmente a diferentes grupos de canales en cada etapa, en 60 la secuencia de mezcla descendente. Por ejemplo, para los cinco canales en las Figuras 6 y 7, en un codificador de BCC, los canales originales izquierdo y posterior izquierdo pueden ser mezclados en forma descendente, para formar un canal izquierdo primero mezclado en forma ascendente con un primer conjunto de códigos de pista de BCC generados, que corresponden a aquellos dos canales originales. Similarmente, los canales originales derecho y posterior derecho pueden ser mezclados en forma descendente para formar el canal derecho primero mezclado en forma descenderte, con un segundo conjunto de códigos de pista de BCC generados, que corresponden a aquellos dos canales originales. En una segunda etapa de mezcla 5 descendente, el canal izquierdo primero mezclado en forma descendente, puede ser mezclado hacia abajo con el canal central original para formar un canal izquierdo segundo mezclado en forma descendente, con un tercer conjunto de códigos de pista de BCC generados, que corresponde al canal izquierdo primero mezclado en forma descendente y el canal central original. Similarmente, el canal derecho primero mezclado en forma descenderte, puede ser mezclado hacia abajo con el canal central original, para formar un canal derecho segundo mezclado en forma descendente, con un cuarto conjunto de códigos de pista 10 de BCC, generados, que corresponden al canal derecho primero mezclado en forma descendente y el canal central original. Los canales izquierdo y derecho, segundos mezclados en forma descendente, pueden ser luego transmitidos con todos los cuatro conjuntos de códigos de pista de BCC como la información secundaria. En una manera análoga, un decodificador de BCC correspondiente puede luego aplicar subsiguientemente estos cuatro conjuntos de códigos de pista de BCC, en diferentes etapas de un esquema de mezcla ascendente en secuencia, de dos etapas, para sintetizar cinco canales de salida
imagen57
15 desde los dos canales “estéreo” transmitidos.
Aunque la presente invención se ha descrito en el contexto de los esquemas de codificación de BCC, en los cuales los códigos de pista de ICC combinados se transmiten con uno o más canales de audio (es decir, los E canales transmitidos) junto con otros códigos de BCC, en realizaciones alternativas, los códigos de pista de ICC combinados pueden ser transmitidos, o solos
20 o con otros códigos de BCC, a un sitio (por ejemplo un decodificador o un dispositivo de almacenamiento) que ya tiene canales transmitidos y posiblemente otros códigos de BCC.
Aunque la presente invención se ha descrito en el contexto de los esquemas de codificación de BCC, la presente invención puede también ser realizada en el contexto de otros sistemas de procesamiento de audio, en los cuales las señales de audio
25 son descorrelacionadas u otros procesamientos de audio que necesitan señales descorrelacionadas.
Aunque la presente invención se ha descrito en el contexto de formas de realización en las cuales el codificador recibe la señal de audio de entrada en el dominio de tiempo y genera señales de audio transmitidas en el dominio de tiempo y el decodificador recibe las señales de audio transmitidas en el dominio de tiempo y genera señales de audio de reproducción en
30 el dominio de tiempo, la presente invención no se limita así. Por ejemplo, en otras formas de realización cualquiera de una o más de las señales de audio de la entrada, transmitidas y de reproducción pueden ser representadas en un dominio de frecuencia.
Los codificadores y/o decodificadores de BCC pueden ser usados en conjunto con o incorporados en una variedad de
35 diferentes aplicaciones o sistemas, que incluyen los sistemas para la televisión o distribución de música electrónica, películas, radiodifusión, flujo y/o recepción. Estos incluyen sistemas para codificar/decodificar transmisiones por vía, por ejemplo, terrestre, de satélite, cable, internet, intranets o medios físicos (por ejemplo discos compactos, discos versátiles digitales, microcircuitos semiconductores, discos duros, tarjetas de memoria y similares). Los codificadores y/o decodificadores pueden también ser empleados en juegos y sistemas de juegos, que incluyen, por ejemplo, productos de software interactivos,
40 intentados para actuar con un usuario para entretenimiento (acción, juegos de funciones, estrategia, aventuras, simulaciones, carreras, deportes, galerías, tarjetas y juegos de tablero) y/o educación, que puede ser publicada para múltiples máquinas, plataformas u otros medios. Además, los codificadores y/o decodificadores de BCC pueden ser incorporados en grabadoras/reproductoras de audio o sistemas de CD-ROM/DVD. Los codificadores y/o decodificadores pueden también ser incorporados en aplicaciones de software de computadoras personales (PC), que incorporan un decodificador digital (por
45 ejemplo, reproductor, decodificador) y aplicaciones de software que incorporan capacidades de codificaciones digitales (por ejemplo, un codificador, grabadora y tocadiscos automático).
La presente invención puede también ser llevada a cabo como procesos a base de circuitos, que incluyen la posible realización como un solo circuito integrado, (tal como un ASIC o un FPGA) un módulo de múltiples microcircuitos, una tarjeta sencilla o
50 un paquete de circuitos de múltiples tarjetas. Como será evidente a un experto en la técnica, varias funciones de elementos de circuito pueden también ser realizadas como etapas de proceso en un programa de software. Tal software puede ser empleado en, por ejemplo, un procesador de señales digitales, microcontrolador o un ordenador para propósitos generales.
La presente invención puede también ser llevada a cabo en la forma de métodos y aparatos para practicar esos métodos. La
55 presente invención puede también ser incorporada en la forma de códigos de programas incorporados en medios tangibles, tal como en disquetes, CD-ROMs, discos duros o cualquier otro medio de almacenamiento que se pueda leer por una máquina, en que, cuando el código del programa se carga dentro y se ejecuta por una máquina, tal como por un ordenador, esta máquina llega a ser un aparato para practicar la invención. La presente invención puede también ser incorporada en la forma de un código de programa, por ejemplo, cuando se almacena en un medio de almacenamiento, cargado en, y/o ejecutado por, una
60 máquina o transmitido sobre algún medio de transmisión o portador, por ejemplo sobre un alambrado o cableado eléctrico, a través de fibras ópticas o por medio de la radiación electromagnética, en que, cuando el código de programa se carga en y se ejecuta por una máquina, tal como por un ordenador, esta máquina llega a ser un aparato para practicar la invención. Cuando se incorpora en un procesador para propósitos generales, los segmentos del código del programa se combinan con el procesador para proporcionar un dispositivo único que opera análogamente a los circuitos lógicos específicos.
imagen58
5 Asimismo se entenderá que varios cambios en los detalles, materiales y arreglos de las partes, que se han descrito e ilustrado, con el fin de explicar la naturaleza de esta invención, se pueden hacer por los expertos en la técnica, sin apartarse del ámbito de la invención, como se expresa en las siguientes reivindicaciones.
Aunque las etapas en las siguientes reivindicaciones del método, si las hay, se exponen en una secuencia particular, con el
10 rotulado correspondiente, a no ser que las exposiciones de las reivindicaciones expresen de otra manera una secuencia particular para llevar a cabo algunas o todas estas etapas. Las etapas no necesariamente se intentan para estar limitadas a las formas de realización expuestas en esa secuencia particular.

Claims (16)

  1. imagen1
    REIVINDICACIONES
    1.-Un método para codificar canales de audio, el método comprende:
    5 generar (1102, 1104) uno o más códigos de pista a ser transmitidos para dos o más canales de audio, en que:
    al menos un código de pista de los códigos de pista a ser transmitidos es un código de pista combinado generado mediante la combinación (1104) de dos o más códigos de pista estimados utilizando una función promedio ponderada; la función promedio ponderada considerando la importancia de los canales individuales; y
    10 cada código de pista estimado se estima de un grupo diferente de dos o más de los canales de audio; y
    transmitir (1106) o almacenar los uno o más códigos de pista a ser transmitidos.
    15 2.-El método de la reivindicación 1, que además comprende transmitir E canales de audio transmitidos, que corresponden a los dos o más canales de audio, donde E < 1.
  2. 3.-El método de la reivindicación 2, en que
    20 los dos o más canales de audio comprenden C canales de audio de entrada, donde C > E, y los C canales de entrada se mezclan en forma descendente para generar los E canales transmitidos.
  3. 4.-El método de la reivindicación 1, en que los uno o más códigos de pista a ser transmitidos se transmiten para habilitar a
    25 un decodificador a ejecutar un procesamiento de síntesis durante la decodificación de los E canales transmitidos basado en los códigos de pista combinados, en que los E canales de audio transmitidos corresponden a los dos o más canales de audio, dondeE > 1.
  4. 5.-El método de la reivindicación 1, en que los uno o más códigos de pista a ser transmitidos comprenden uno o más de los 30 siguientes códigos: un código de correlación de inter-canales combinados (ICC), un código de una diferencia de nivel de intercanales combinados (ICLD), y un código de una diferencia de tiempo inter-canales combinados (ICTD).
  5. 6.-El método de la reivindicación 1, en que:
    35 cada código de pista estimado usado para generar el código de pista combinado se asocia con un factor de ponderación, usado en generar el promedio ponderado; y
    el factor de ponderación para cada código de pista estimado se basa en la potencia en el grupo de canales que corresponde al código de pista estimado. 40 7.-El método de la reivindicación 1, en que el código de pista combinado es un código de ICC combinado.
  6. 8.-El método de la reivindicación 7, en que
    45 los dos o más canales de audio comprenden un canal izquierdo, un canal posterior izquierdo, un canal derecho y un canal posterior derecho;
    se genera un primer código de ICC estimado desde los canales izquierdo y posterior izquierdo;
    50 se genera un segundo código de ICC estimado desde los canales derecho y posterior derecho; y
    se genera el código de ICC combinado, combinando el primero y segundo códigos de ICC estimados.
    55 9.-Aparato (202) para codificar canales de audio, el aparato comprende:
    medios (208) para generar uno o más códigos de pista a ser transmitidos para dos o más canales de audio, en que al menos un código de pista de los uno o más códigos de pista a ser transmitidos es un código de pista combinado generado mediante la combinación de dos o más códigos de pista estimados utilizando una función promedio
    60 ponderada; la función promedio ponderada considerando la importancia de los canales individuales; y
    imagen2
    medios para transmitir o almacenar los uno o más códigos de pista a ser transmitidos.
    5 10.-El aparato de la reivindicación 9,
    en que el aparato es para codificar C canales de audio de entrada, para generar E canales de audio transmitidos:
    10 donde los medios para generar incluyen un estimador de códigos,
    donde el aparato comprende adicionalmente un mezclador descendente (206) adaptado para mezclar, en forma descendente, los C canales de entrada, para generar los E canales transmitidos, donde C > E > 1, y
    15 en que el aparato está adaptado para transmitir información acerca de los uno o más códigos de pista a ser transmitidos, para habilitar a un decodificador a realizar un procesamiento de síntesis durante la decodificación de los E canales transmitidos.
  7. 11.-El aparato de la reivindicación 10, en que
    20 el aparato es un sistema seleccionado del grupo que consiste de una grabadora digital de video, una grabadora digital de audio, un ordenador, un transmisor de satélite, un transmisor de cable, un transmisor de radiodifusión terrestre, un sistema de entretenimiento del hogar, y un sistema para reproducir películas; y
    el sistema comprende el estimador de códigos y el mezclador de tipo descendente.
    25 12.-Un medio que se puede leer por máquina, que tiene codificado un código de programa, en que, cuando el código de programa se ejecuta en una máquina, la máquina implementa un método para codificar canales de audio, el método comprende:
    30 generar (1102, 1104) uno o más códigos de pista a ser transmitidos para dos o más canales de audio, en que:
    al menos un código de pista de los uno o más códigos de pista a ser transmitidos es un código de pista combinado generado mediante la combinación (1104) de dos o más códigos de pista estimados utilizando una función promedio ponderada, la función promedio ponderada considerando la importancia de los canales individuales; y
    35 cada código de pista estimado se estima de un grupo diferente de dos o más de los canales de audio; y
    transmitir (1106) o almacenar los uno o más códigos de pista a ser transmitidos.
    40 13.-Una secuencia de bits de audio codificado generada mediante la codificación de canales de audio, en que:
    se generan uno o más códigos de pista a ser transmitidos para dos o más canales de audio, en que:
    45 al menos un código de pista de los uno o más códigos de pista a ser transmitidos es un código de pista combinado generado mediante la combinación de dos o más códigos de pista estimados utilizando una función promedio ponderada, la función promedio ponderada considerando la importancia de los canales individuales; y
    cada código de pista estimado se estima de un grupo diferente de dos o más de los canales de audio; y
    50 en que los uno o más códigos de pista a ser transmitidos y E canales de audio transmitidos que corresponden a los dos o más canales de audio, donde E > 1, se codifican en la secuencia de bits de audio codificado.
  8. 14.-Un método para decodificar E canales de audio transmitidos, para generar C canales de audio de reproducción, donde 55 C > E > 1, el método comprende:
    recibir códigos de pista que corresponden a los E canales transmitidos, en que:
    al menos un código de pista de los códigos de pista recibidos es un código de pista combinado generado mediante la 60 combinación de dos o más códigos de pista estimados; y cada código de pista estimado se estima de un grupo diferente de dos o más canales de audio de entrada de codificación;
    imagen3
    realizar una mezcla ascendente de uno o más de los E canales transmitidos para generar uno o más canales con mezcla 5 ascendente, y
    sintetizar uno o más de los C canales de reproducción mediante la aplicación de los códigos de pista recibidos al uno o más canales de mezcla ascendente, en que:
    10 dos o más códigos de pista derivados son derivados del código de pista combinado (1108); y
    cada código de pista derivado es aplicado (1110) para generar dos o más canales sintetizados.
  9. 15.-El método de la reivindicación 14, en que los códigos de pista comprenden uno o más de un código de ICC combinado, 15 un código de ICLD combinado, y un código de ICTD combinado.
  10. 16.-El método de la reivindicación 14, en que el código de pista combinado es un promedio de dos o más códigos de pista estimados.
    20 17.-El método de la reivindicación 16, en que el código de pista combinado es un promedio ponderado de los dos o más códigos de pista estimados.
  11. 18.-El método de la reivindicación 17, en que
    25 cada código de pista estimado usado para generar el código de pista combinado se asocia con un factor de ponderación usado para generar el promedio ponderado; y
    el factor de ponderación para cada código de pista estimado se basa en la potencia en el grupo de canales que corresponde al código de pista estimado. 30 19.-El método de la reivindicación 14, en que los dos o más códigos de pista derivados son derivados mediante:
    la derivación de un factor de ponderación para cada grupo de dos o más canales asociados con un código de pista estimado, y
    35 la derivación de los dos o más códigos de pista derivados como una función del código de pista combinado y dos o más factores de ponderación derivados.
  12. 20.-El método de la reivindicación 19, en que cada factor de ponderación derivado se deriva mediante: 40 la estimación de la potencia en el grupo de canales que corresponden a un código de pista estimado; y
    la derivación del factor de ponderación basada en las potencias estimadas para los diferentes grupos de canales que corresponden a diferentes códigos de pista estimadas. 45 21.-El método de la reivindicación 14, en que el código de pista combinado es un código de ICC combinado.
  13. 22.-El método de la reivindicación 21, en que
    50 los dos o más canales de audio comprenden un canal izquierdo, un canal posterior izquierdo, un canal derecho, y un canal posterior derecho;
    un primer código de ICC estimado se genera a partir de los canales izquierdo y posterior izquierdo;
    55 un segundo código de ICC estimado se genera a partir de los canales derecho y posterior derecho; y
    el código de ICC combinado se genera combinando el primero y segundo códigos de ICC estimados.
  14. 23.-El método de la reivindicación 22, en que 60 el código de ICC combinado se usa para descorrelacionar los canales izquierdo y posterior izquierdo sintetizados; y
    imagen4
  15. 24.-Aparato (204) para decodificar E canales de audio transmitidos para generar C canales de audio de reproducción, donde 5 C > E > 1, el aparato comprende:
    medios para recibir códigos de pista que corresponden a los E canales transmitidos, en que:
    al menos un código de pista de los códigos de pista recibidos es un código de pista combinado generado mediante la 10 combinación de dos o más códigos de pista estimados; y
    cada código de pista estimado se estima de un grupo diferente de dos o más canales de audio de entrada de codificación;
    15 medios para la mezcla ascendente de uno o más de los E canales transmitidos para generar uno o más canales de mezcla ascendente; y
    medios para sintetizar uno o más de los C canales de reproducción mediante la aplicación de los códigos de pista recibidos a los uno o más canales de mezcla ascendente, en que: 20 los dos o más códigos de pista derivados se derivan del código de pista combinado; y
    cada código de pista derivado se aplica para generar dos o más canales sintetizados.
    25 25.-El aparato de la reivindicación 24, en que:
    el aparato es un sistema seleccionado del grupo que consiste de un reproductor digital de video, un reproductor digital de audio, un ordenador, un receptor de satélite, un receptor de cable, un receptor de radiodifusión terrestre, un sistema de entretenimiento del hogar, y un sistema para reproducir películas; y
    30 el sistema comprende el receptor, el mezclador de tipo ascendente, y el sintetizador.
  16. 26.-Un medio que se puede leer por una máquina, que tiene codificado un código de programa, en que, cuando este código de programa se ejecuta por una máquina, la máquina implementa un método para decodificar E canales de audio transmitidos 35 para generar C canales de audio de reproducción, donde C > E > 1, el método comprende:
    recibir unos códigos de pista que corresponden a los E canales transmitidos, en que:
    al menos un código de pista de los códigos de pista recibidos es un código de pista combinado generado mediante la 40 combinación de dos o más códigos de pista estimados; y
    cada código de pista estimado se estima de un grupo diferente de dos o más canales de audio de entrada de codificación;
    45 realizar una mezcla ascendente de uno o más de los E canales transmitidos para generar uno o más canales de mezcla ascendente; y
    sintetizar uno o más de los C canales de reproducción mediante la aplicación de los códigos de pista recibidos a los uno o 50 más de canales de mezcla ascendente; en que
    dos o más códigos de pista derivados son derivados del código de pista combinado; y
    cada código de pista derivado se aplica para generar dos o más canales sintetizados.
ES05796746.5T 2005-01-10 2005-09-30 Compactación de información secundaria para la codificación paramétrica de audio espacial Active ES2623365T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US32689 2005-01-10
US11/032,689 US7903824B2 (en) 2005-01-10 2005-01-10 Compact side information for parametric coding of spatial audio
PCT/EP2005/010595 WO2006072270A1 (en) 2005-01-10 2005-09-30 Compact side information for parametric coding of spatial audio

Publications (1)

Publication Number Publication Date
ES2623365T3 true ES2623365T3 (es) 2017-07-11

Family

ID=35798481

Family Applications (1)

Application Number Title Priority Date Filing Date
ES05796746.5T Active ES2623365T3 (es) 2005-01-10 2005-09-30 Compactación de información secundaria para la codificación paramétrica de audio espacial

Country Status (17)

Country Link
US (1) US7903824B2 (es)
EP (1) EP1829026B1 (es)
JP (1) JP5156386B2 (es)
KR (1) KR100895609B1 (es)
CN (1) CN101160618B (es)
AU (1) AU2005324210C1 (es)
CA (1) CA2593290C (es)
ES (1) ES2623365T3 (es)
IL (1) IL184340A (es)
MX (1) MX2007008262A (es)
MY (1) MY142581A (es)
NO (1) NO339299B1 (es)
PL (1) PL1829026T3 (es)
PT (1) PT1829026T (es)
RU (1) RU2383939C2 (es)
TW (1) TWI289025B (es)
WO (1) WO2006072270A1 (es)

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9008812B2 (en) 2008-06-19 2015-04-14 Sirius Xm Radio Inc. Method and apparatus for using selected content tracks from two or more program channels to automatically generate a blended mix channel for playback to a user upon selection of a corresponding preset button on a user interface
US8223975B2 (en) * 2008-06-19 2012-07-17 Xm Satellite Radio Inc. Method and apparatus for multiplexing audio program channels from one or more received broadcast streams to provide a playlist style listening experience to users
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US8204261B2 (en) 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
KR100682904B1 (ko) 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
ES2313646T3 (es) * 2005-03-30 2009-03-01 Koninklijke Philips Electronics N.V. Codificacion y descodificacion de audio.
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
KR100857102B1 (ko) * 2005-07-29 2008-09-08 엘지전자 주식회사 인코딩된 오디오 신호 생성 및 처리 방법
JP5113052B2 (ja) * 2005-07-29 2013-01-09 エルジー エレクトロニクス インコーポレイティド 符号化されたオーディオ信号の生成方法及びオーディオ信号の処理方法
KR100857107B1 (ko) * 2005-09-14 2008-09-05 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US8111830B2 (en) * 2005-12-19 2012-02-07 Samsung Electronics Co., Ltd. Method and apparatus to provide active audio matrix decoding based on the positions of speakers and a listener
KR100644715B1 (ko) * 2005-12-19 2006-11-10 삼성전자주식회사 능동적 오디오 매트릭스 디코딩 방법 및 장치
US8296155B2 (en) * 2006-01-19 2012-10-23 Lg Electronics Inc. Method and apparatus for decoding a signal
ES2446245T3 (es) * 2006-01-19 2014-03-06 Lg Electronics Inc. Método y aparato para procesar una señal de medios
WO2007091845A1 (en) 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
KR20080093422A (ko) * 2006-02-09 2008-10-21 엘지전자 주식회사 오브젝트 기반 오디오 신호의 부호화 및 복호화 방법과 그장치
TWI336599B (en) 2006-02-23 2011-01-21 Lg Electronics Inc Method and apparatus for processing a audio signal
KR100773562B1 (ko) * 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
KR100754220B1 (ko) 2006-03-07 2007-09-03 삼성전자주식회사 Mpeg 서라운드를 위한 바이노럴 디코더 및 그 디코딩방법
EP1999745B1 (en) * 2006-03-30 2016-08-31 LG Electronics Inc. Apparatuses and methods for processing an audio signal
ATE527833T1 (de) 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
US8027479B2 (en) 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
US20080235006A1 (en) 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
EP2084901B1 (en) * 2006-10-12 2015-12-09 LG Electronics Inc. Apparatus for processing a mix signal and method thereof
US7555354B2 (en) * 2006-10-20 2009-06-30 Creative Technology Ltd Method and apparatus for spatial reformatting of multi-channel audio content
BRPI0719884B1 (pt) 2006-12-07 2020-10-27 Lg Eletronics Inc método, aparelho e mídia legível por computador para decodificar um sinal de áudio
EP2137726B1 (en) * 2007-03-09 2011-09-28 LG Electronics Inc. A method and an apparatus for processing an audio signal
KR20080082917A (ko) 2007-03-09 2008-09-12 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
WO2009031870A1 (en) 2007-09-06 2009-03-12 Lg Electronics Inc. A method and an apparatus of decoding an audio signal
WO2009046223A2 (en) * 2007-10-03 2009-04-09 Creative Technology Ltd Spatial audio analysis and synthesis for binaural reproduction and format conversion
WO2009057327A1 (ja) * 2007-10-31 2009-05-07 Panasonic Corporation 符号化装置および復号装置
KR101438389B1 (ko) * 2007-11-15 2014-09-05 삼성전자주식회사 오디오 매트릭스 디코딩 방법 및 장치
US9886503B2 (en) 2007-12-27 2018-02-06 Sirius Xm Radio Inc. Method and apparatus for multiplexing audio program channels from one or more received broadcast streams to provide a playlist style listening experience to users
US8831936B2 (en) 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
ATE538469T1 (de) * 2008-07-01 2012-01-15 Nokia Corp Vorrichtung und verfahren zum justieren von räumlichen hinweisinformationen eines mehrkanaligen audiosignals
KR20110052562A (ko) 2008-07-15 2011-05-18 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
US8639368B2 (en) * 2008-07-15 2014-01-28 Lg Electronics Inc. Method and an apparatus for processing an audio signal
BRPI0905069A2 (pt) * 2008-07-29 2015-06-30 Panasonic Corp Aparelho de codificação de áudio, aparelho de decodificação de áudio, aparelho de codificação e de descodificação de áudio e sistema de teleconferência
US8346380B2 (en) * 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
KR101108061B1 (ko) * 2008-09-25 2012-01-25 엘지전자 주식회사 신호 처리 방법 및 이의 장치
US8346379B2 (en) * 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
ES2452569T3 (es) * 2009-04-08 2014-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato, procedimiento y programa de computación para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavización de valor fase
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
EP2439736A1 (en) * 2009-06-02 2012-04-11 Panasonic Corporation Down-mixing device, encoder, and method therefor
KR101391110B1 (ko) 2009-09-29 2014-04-30 돌비 인터네셔널 에이비 오디오 신호 디코더, 오디오 신호 인코더, 업믹스 신호 표현을 제공하는 방법, 다운믹스 신호 표현을 제공하는 방법, 공통 객체 간의 상관 파라미터 값을 이용한 컴퓨터 프로그램 및 비트스트림
EP2491553B1 (en) * 2009-10-20 2016-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using an iterative interval size reduction
CN102792370B (zh) 2010-01-12 2014-08-06 弗劳恩霍弗实用研究促进协会 使用描述有效状态值及区间边界的散列表的音频编码器、音频解码器、编码音频信息的方法及解码音频信息的方法
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
KR101666465B1 (ko) 2010-07-22 2016-10-17 삼성전자주식회사 다채널 오디오 신호 부호화/복호화 장치 및 방법
PL2647222T3 (pl) 2010-12-03 2015-04-30 Fraunhofer Ges Forschung Pozyskiwanie dźwięku za pomocą ekstrakcji informacji geometrycznej z estymacji kierunku nadejścia sygnału
CN103534753B (zh) 2012-04-05 2015-05-27 华为技术有限公司 用于信道间差估计的方法和空间音频编码装置
ES2560402T3 (es) * 2012-04-05 2016-02-18 Huawei Technologies Co., Ltd Método para la codificación y la decodificación de audio espacial paramétrica, codificador de audio espacial paramétrico y decodificador de audio espacial paramétrico
WO2013192111A1 (en) 2012-06-19 2013-12-27 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
CN104488026A (zh) * 2012-07-12 2015-04-01 杜比实验室特许公司 使用饱和参数调制将数据嵌入立体声音频中
CN109509478B (zh) * 2013-04-05 2023-09-05 杜比国际公司 音频处理装置
US10075795B2 (en) 2013-04-19 2018-09-11 Electronics And Telecommunications Research Institute Apparatus and method for processing multi-channel audio signal
WO2014171791A1 (ko) 2013-04-19 2014-10-23 한국전자통신연구원 다채널 오디오 신호 처리 장치 및 방법
US9659569B2 (en) 2013-04-26 2017-05-23 Nokia Technologies Oy Audio signal encoder
US9319819B2 (en) 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
CN107770717B (zh) 2014-01-03 2019-12-13 杜比实验室特许公司 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
CN104768121A (zh) 2014-01-03 2015-07-08 杜比实验室特许公司 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
RU2648632C2 (ru) 2014-01-13 2018-03-26 Нокиа Текнолоджиз Ой Классификатор многоканального звукового сигнала
WO2016049106A1 (en) * 2014-09-25 2016-03-31 Dolby Laboratories Licensing Corporation Insertion of sound objects into a downmixed audio signal

Family Cites Families (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US611958A (en) * 1898-10-04 Jar or bottle fastener
US4236039A (en) * 1976-07-19 1980-11-25 National Research Development Corporation Signal matrixing for directional reproduction of sound
US4815132A (en) 1985-08-30 1989-03-21 Kabushiki Kaisha Toshiba Stereophonic voice signal transmission system
DE3715921A1 (de) * 1986-05-16 1987-11-19 Asea Ab Vorrichtung zur ueberfuehrung von kabeln zwischen zwei gelenkig miteinander verbundenen bauteilen
DE3639753A1 (de) 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
DE3912605B4 (de) 1989-04-17 2008-09-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
KR100228688B1 (ko) * 1991-01-08 1999-11-01 쥬더 에드 에이. 다차원 음장용 인코우더/디코우더
DE4209544A1 (de) 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
US5371799A (en) 1993-06-01 1994-12-06 Qsound Labs, Inc. Stereo headphone sound source localization system
US5463424A (en) 1993-08-03 1995-10-31 Dolby Laboratories Licensing Corporation Multi-channel transmitter/receiver system providing matrix-decoding compatible signals
JP3227942B2 (ja) 1993-10-26 2001-11-12 ソニー株式会社 高能率符号化装置
DE4409368A1 (de) 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
JP3277679B2 (ja) 1994-04-15 2002-04-22 ソニー株式会社 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置
JPH0969783A (ja) 1995-08-31 1997-03-11 Nippon Steel Corp オーディオデータ符号化装置
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5771295A (en) 1995-12-26 1998-06-23 Rocktron Corporation 5-2-5 matrix system
ATE309644T1 (de) 1996-02-08 2005-11-15 Koninkl Philips Electronics Nv Mit 2-kanal- und 1-kanal-übertragung kompatible n-kanalübertragung
US7012630B2 (en) 1996-02-08 2006-03-14 Verizon Services Corp. Spatial sound conference system and apparatus
US5825776A (en) 1996-02-27 1998-10-20 Ericsson Inc. Circuitry and method for transmitting voice and data signals upon a wireless communication channel
US5889843A (en) 1996-03-04 1999-03-30 Interval Research Corporation Methods and systems for creating a spatial auditory environment in an audio conference system
US5812971A (en) 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US6987856B1 (en) 1996-06-19 2006-01-17 Board Of Trustees Of The University Of Illinois Binaural signal processing techniques
US6697491B1 (en) 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
JP3707153B2 (ja) 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
SG54379A1 (en) 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
SG54383A1 (en) 1996-10-31 1998-11-16 Sgs Thomson Microelectronics A Method and apparatus for decoding multi-channel audio data
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
US6111958A (en) 1997-03-21 2000-08-29 Euphonics, Incorporated Audio spatial enhancement apparatus and methods
US5860060A (en) 1997-05-02 1999-01-12 Texas Instruments Incorporated Method for left/right channel self-alignment
US5946352A (en) 1997-05-02 1999-08-31 Texas Instruments Incorporated Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain
US6108584A (en) 1997-07-09 2000-08-22 Sony Corporation Multichannel digital audio decoding method and apparatus
DE19730130C2 (de) 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US5890125A (en) 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6021389A (en) 1998-03-20 2000-02-01 Scientific Learning Corp. Method and apparatus that exaggerates differences between sounds to train listener to recognize and identify similar sounds
US6016473A (en) 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
TW444511B (en) 1998-04-14 2001-07-01 Inst Information Industry Multi-channel sound effect simulation equipment and method
JP3657120B2 (ja) 1998-07-30 2005-06-08 株式会社アーニス・サウンド・テクノロジーズ 左,右両耳用のオーディオ信号を音像定位させるための処理方法
JP2000151413A (ja) 1998-11-10 2000-05-30 Matsushita Electric Ind Co Ltd オーディオ符号化における適応ダイナミック可変ビット割り当て方法
JP2000152399A (ja) 1998-11-12 2000-05-30 Yamaha Corp 音場効果制御装置
US6408327B1 (en) 1998-12-22 2002-06-18 Nortel Networks Limited Synthetic stereo conferencing over LAN/WAN
US6282631B1 (en) 1998-12-23 2001-08-28 National Semiconductor Corporation Programmable RISC-DSP architecture
JP4610087B2 (ja) * 1999-04-07 2011-01-12 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 損失のない符号化・復号へのマトリックス改良
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
JP4438127B2 (ja) 1999-06-18 2010-03-24 ソニー株式会社 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体
US6823018B1 (en) 1999-07-28 2004-11-23 At&T Corp. Multiple description coding communication system
US6434191B1 (en) 1999-09-30 2002-08-13 Telcordia Technologies, Inc. Adaptive layered coding for voice over wireless IP applications
US6614936B1 (en) 1999-12-03 2003-09-02 Microsoft Corporation System and method for robust video coding using progressive fine-granularity scalable (PFGS) coding
US6498852B2 (en) 1999-12-07 2002-12-24 Anthony Grimani Automatic LFE audio signal derivation system
US6845163B1 (en) 1999-12-21 2005-01-18 At&T Corp Microphone array for preserving soundfield perceptual cues
CN1264382C (zh) 1999-12-24 2006-07-12 皇家菲利浦电子有限公司 多通道音频信号处理装置和方法
US6782366B1 (en) 2000-05-15 2004-08-24 Lsi Logic Corporation Method for independent dynamic range control
JP2001339311A (ja) 2000-05-26 2001-12-07 Yamaha Corp オーディオ信号圧縮回路および伸長回路
US6850496B1 (en) 2000-06-09 2005-02-01 Cisco Technology, Inc. Virtual conference room for voice conferencing
US6973184B1 (en) 2000-07-11 2005-12-06 Cisco Technology, Inc. System and method for stereo conferencing over low-bandwidth links
US7236838B2 (en) 2000-08-29 2007-06-26 Matsushita Electric Industrial Co., Ltd. Signal processing apparatus, signal processing method, program and recording medium
JP3426207B2 (ja) 2000-10-26 2003-07-14 三菱電機株式会社 音声符号化方法および装置
TW510144B (en) 2000-12-27 2002-11-11 C Media Electronics Inc Method and structure to output four-channel analog signal using two channel audio hardware
US6885992B2 (en) 2001-01-26 2005-04-26 Cirrus Logic, Inc. Efficient PCM buffer
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US6934676B2 (en) 2001-05-11 2005-08-23 Nokia Mobile Phones Ltd. Method and system for inter-channel signal redundancy removal in perceptual audio coding
US7668317B2 (en) 2001-05-30 2010-02-23 Sony Corporation Audio post processing in DVD, DTV and other audio visual products
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
EP1421720A4 (en) 2001-08-27 2005-11-16 Univ California COCHLEAR IMPLANTS AND APPARATUSES / METHODS FOR IMPROVING AUDIO SIGNALS BY IMPLEMENTING FREQUENCY MODULATION AND AMPLITUDE (FAME) CODING STRATEGIES
WO2003069954A2 (en) 2002-02-18 2003-08-21 Koninklijke Philips Electronics N.V. Parametric audio coding
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
WO2003090207A1 (en) 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
US8340302B2 (en) * 2002-04-22 2012-12-25 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
JP4187719B2 (ja) 2002-05-03 2008-11-26 ハーマン インターナショナル インダストリーズ インコーポレイテッド マルチチャネル・ダウンミキシング装置
US6940540B2 (en) 2002-06-27 2005-09-06 Microsoft Corporation Speaker detection and tracking using audiovisual data
RU2363116C2 (ru) * 2002-07-12 2009-07-27 Конинклейке Филипс Электроникс Н.В. Аудиокодирование
US7516066B2 (en) 2002-07-16 2009-04-07 Koninklijke Philips Electronics N.V. Audio coding
JP2005533271A (ja) * 2002-07-16 2005-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化
ATE348386T1 (de) 2002-11-28 2007-01-15 Koninkl Philips Electronics Nv Audiosignalkodierung
ES2273216T3 (es) * 2003-02-11 2007-05-01 Koninklijke Philips Electronics N.V. Codificacion de audio.
FI118247B (fi) 2003-02-26 2007-08-31 Fraunhofer Ges Forschung Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa
KR20050116828A (ko) 2003-03-24 2005-12-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 다채널 신호를 나타내는 주 및 부 신호의 코딩
US20050069143A1 (en) 2003-09-30 2005-03-31 Budnikov Dmitry N. Filtering for spatial audio rendering
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7761289B2 (en) 2005-10-24 2010-07-20 Lg Electronics Inc. Removing time delays in signal paths

Also Published As

Publication number Publication date
CA2593290C (en) 2011-07-12
PL1829026T3 (pl) 2017-09-29
JP2008527431A (ja) 2008-07-24
MY142581A (en) 2010-12-15
CA2593290A1 (en) 2006-07-13
TW200631449A (en) 2006-09-01
AU2005324210C1 (en) 2011-03-17
AU2005324210B2 (en) 2009-11-19
AU2005324210A1 (en) 2006-07-13
KR20070110266A (ko) 2007-11-16
US20060153408A1 (en) 2006-07-13
PT1829026T (pt) 2017-05-04
NO339299B1 (no) 2016-11-21
RU2007130545A (ru) 2009-02-20
CN101160618B (zh) 2012-03-21
KR100895609B1 (ko) 2009-04-30
NO20074122L (no) 2007-08-09
CN101160618A (zh) 2008-04-09
EP1829026B1 (en) 2017-01-25
WO2006072270A1 (en) 2006-07-13
US7903824B2 (en) 2011-03-08
IL184340A (en) 2011-10-31
EP1829026A1 (en) 2007-09-05
TWI289025B (en) 2007-10-21
BRPI0518507A2 (pt) 2008-11-25
MX2007008262A (es) 2007-08-22
RU2383939C2 (ru) 2010-03-10
JP5156386B2 (ja) 2013-03-06
IL184340A0 (en) 2007-10-31

Similar Documents

Publication Publication Date Title
ES2623365T3 (es) Compactación de información secundaria para la codificación paramétrica de audio espacial
ES2317297T3 (es) Conformacion de envolvente de sonido difuso para esquemas de codificacion de indicacion binaural y similares.
ES2323275T3 (es) Conformacion de envolvente temporal de canal individual para esquemas de codificacion de indicacion binaural y similares.
ES2387248T3 (es) Aparato y procedimiento para generar una señal de salida multi-canal
TWI427621B (zh) 編碼聲音通道及解碼經傳輸之聲音通道之方法、裝置及機器可讀取媒體
KR101215872B1 (ko) 송신되는 채널들에 기초한 큐들을 갖는 공간 오디오의파라메트릭 코딩
KR101236259B1 (ko) 오디오 채널들을 인코딩하는 방법 및 장치
BRPI0518507B1 (pt) Informações auxiliares compactas para a codificação paramétrica de áudio espacial