ES2293556T3 - Codificacion basada en frecuencia de canales de audio en sistemas de codificacion multicanal parametrica. - Google Patents

Codificacion basada en frecuencia de canales de audio en sistemas de codificacion multicanal parametrica. Download PDF

Info

Publication number
ES2293556T3
ES2293556T3 ES05723489T ES05723489T ES2293556T3 ES 2293556 T3 ES2293556 T3 ES 2293556T3 ES 05723489 T ES05723489 T ES 05723489T ES 05723489 T ES05723489 T ES 05723489T ES 2293556 T3 ES2293556 T3 ES 2293556T3
Authority
ES
Spain
Prior art keywords
audio
channels
subset
frequency
parametric
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES05723489T
Other languages
English (en)
Inventor
Christof Faller
Juergen Herre
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Agere Systems LLC
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Agere Systems LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV, Agere Systems LLC filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2293556T3 publication Critical patent/ES2293556T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Método para codificar una señal de audio multicanal que presenta una pluralidad de canales de entrada de audio, comprendiendo el método: aplicar una técnica de codificación de audio paramétrica para generar códigos de audio paramétricos para un primer subconjunto de los canales de entrada de audio para una primera región de frecuencia; y aplicar la técnica de codificación de audio paramétrica para generar códigos de audio paramétricos para un segundo subconjunto de los canales de entrada de audio para una segunda región de frecuencia, en el que: la segunda región de frecuencia es diferente de la primera región de frecuencia; y el segundo subconjunto es diferente del primer subconjunto.

Description

Codificación basada en frecuencia de canales de audio en sistemas de codificación multicanal paramétrica.
\global\parskip0.920000\baselineskip
Antecedentes de la invención Campo de la invención
La presente invención se refiere a la codificación de señales de audio y la posterior síntesis de escenas auditivas a partir de los datos de audio codificados.
Referencia cruzada con solicitudes relacionadas
Esta solicitud reivindica el beneficio de la fecha de presentación de la solicitud provisional estadounidense número 60/549.972, presentada el 04/03/2004. El contenido de esta solicitud se refiere al contenido de la solicitud de patente estadounidense US-A-2 003 026 441, presentada el 04/05/2001 ("la solicitud '441"), la solicitud de patente estadounidense US-A-2 003 035 553 presentada el 07/11/2001 ("la solicitud '553"), y la solicitud de patente estadounidense US-A-2 003 219 130, presentada el 24/05/2002 ("la solicitud '130"), y la solicitud de patente estadounidense US-A-2 005 180 579, presentada el 01/04/2004 ("la solicitud '579") y publicada el 18/08/2005.
Descripción de la técnica relacionada
Los sistemas de audio envolvente multicanal han sido estándar en salas de cine durante años. A medida que la tecnología ha avanzado, se ha vuelto asequible producir sistemas envolventes multicanal para uso doméstico. En la actualidad, tales sistemas se venden en su mayoría como "sistemas de cine en casa". De acuerdo con una recomendación ITU-R, la amplia mayoría de estos sistemas proporciona cinco canales de audio regulares y un canal de infragraves de baja frecuencia (denotado canal de efectos de baja frecuencia o LFE). Tal sistema multicanal se denota sistema envolvente 5,1. Existen otros sistemas envolventes, tales como 7,1 (siete canales regulares y un canal LFE) y 10,2 (diez canales regulares y dos canales LFE).
C. Faller y F. Baumgarte, "Efficient representation of spatial audio coding using perceptual parametrization," IEEE Workshop on Appl. of Sig. Proc. to Audio and Acoust., octubre de 2001, y C. Faller y F. Baumgarte,"Binaural Cue Coding Applied to Stereo and Multi-Channel Audio Compression," Preprint 112th Conv. Aud. Eng. Soc., mayo de 2002, (conjuntamente, "los documentos BCC") las enseñanzas de ambos de los cuales están incorporadas en el presente documento por referencia, describen una técnica de codificación de audio multicanal paramétrica (denominada como codificación BCC).
La figura 1 muestra un diagrama de bloques de un sistema 100 de procesamiento de audio que realiza codificación de indicación binaural (BCC, Binaural Cue Coding) según los documentos BCC. El sistema 100 BCC presenta un codificador 102 BCC que recibe C canales 108 de entrada de audio, por ejemplo, uno desde cada uno de C micrófonos 106 diferentes. El codificador 102 BCC presenta un elemento 110 de downmix, que convierte los C canales de entrada de audio en una señal 112 de suma de audio mono.
Además, el codificador 102 BCC presenta un analizador 114 BCC, que genera flujo 116 de datos de códigos de indicación BCC para los C canales de entrada. Los códigos de indicación BCC (también denominados como parámetros de escena auditiva) incluyen datos de diferencia de nivel entre canales (ICLD, Inter-Channel Level Difference) y de diferencia de tiempo entre canales (ICTD, Inter-Channel Time Difference) para cada canal de entrada. El analizador 114 BCC realiza procesamiento basado en banda para generar datos ICLD e ICTD para cada una de una o más subbandas de frecuencia diferentes (por ejemplo, bandas críticas diferentes) de los canales de entrada de audio.
El codificador 102 BCC transmite la señal 112 de suma y el flujo 116 de datos de códigos de indicación BCC (por ejemplo, como información lateral o bien en banda o bien fuera de banda con respecto a la señal de suma) a un descodificador 104 BCC del sistema 100 BCC. El descodificador 104 BCC presenta un procesador 118 de información lateral, que procesa el flujo 116 de datos para recuperar los códigos 120 de indicación BCC (por ejemplo, datos ICLD e ICTD). El descodificador 104 BCC también presenta un sintetizador 122 BCC, que utiliza los códigos 120 de indicación BCC recuperados para sintetizar C canales 126 de salida de audio a partir de una señal 112 de suma para dar mediante los C altavoces 126, respectivamente.
El sistema 100 de procesamiento de audio puede implementarse en el contexto de señales de audio multicanal, tales como sonido envolvente 5,1. En particular, el elemento 110 de downmix del codificador 102 BCC convertiría los seis canales de entrada del sonido envolvente 5,1 convencional (es decir, cinco canales regulares + un canal LFE) en la señal 112 de suma. Además, el analizador 114 BCC del codificador 102 transformaría los seis canales de entrada al dominio de la frecuencia para generar los códigos 116 de indicación BCC correspondientes. Análogamente, el procesador 118 de información lateral del codificador 104 BCC recuperaría los códigos 120 de indicación BCC del flujo 116 de información lateral recibido, y el sintetizador 122 BCC del descodificador 104 (1) transformaría la señal 112 de suma recibida al dominio de la frecuencia, (2) aplicaría los códigos 120 de indicación BCC recuperados a la señal de suma en el dominio de la frecuencia para generar seis señales en el dominio de la frecuencia, y (3) transformaría esas señales en el dominio de la frecuencia en seis canales en el dominio del tiempo de sonido envolvente 5,1 sintetizado (es decir, cinco canales regulares sintetizados + un canal LFE sintetizado) para dar mediante los altavoces 126.
\global\parskip1.000000\baselineskip
Sumario de la invención
Para aplicaciones de sonido envolvente, las realizaciones de la presente invención implican una técnica de codificación de audio paramétrica basada en BCC en la que la codificación BCC basada en banda no se aplica al (a los) canal(es) de infragraves de baja frecuencia (LFE) para subbandas de frecuencia por encima de una frecuencia de corte. Por ejemplo, para sonido envolvente 5,1, la codificación BCC se aplica a todos los seis canales (es decir, los cinco canales regulares más el un canal LFE) para subbandas por debajo de la frecuencia de corte, mientras que la codificación BCC se aplica a sólo los cinco canales regulares (es decir, y no al canal LFE) para subbandas por encima de la frecuencia de corte. Evitando la codificación BCC del canal LFE a "altas" frecuencias, estas realizaciones de la presente invención (1) han reducido las cargas de procesamiento tanto en el codificador como en el descodificador y (2) presentan flujos de bits de códigos BCC más pequeños que los correspondientes a sistemas basados en BCC que procesan todos los seis canales en todas las frecuencias.
Más generalmente, la presente invención implica la aplicación de técnicas de codificación de audio paramétrica, tales como codificación BCC, pero no necesariamente limitadas a codificación BCC, en la que dos o más subconjuntos diferentes de canales de entrada se procesan para dos o más intervalos de frecuencia diferentes. Tal como se utiliza en esta memoria descriptiva, el término "subconjunto" puede referirse al conjunto que contiene todos los canales de entrada así como esos subconjuntos apropiados que incluyen menos que todos los canales de entrada. La aplicación de la presente invención a codificación BCC de 5,1 y otras señales de sonido envolvente es sólo un ejemplo particular de la presente invención.
\vskip1.000000\baselineskip
Breve descripción de los dibujos
Otros aspectos, características, y ventajas de la presente invención se volverán completamente evidentes a partir de la siguiente descripción detallada, las reivindicaciones adjuntas, y los dibujos adjuntos, en los que:
la figura 1 muestra un diagrama de bloques de un sistema de procesamiento de audio que realiza codificación de indicación binaural (BCC); y
la figura 2 muestra un diagrama de bloques de un sistema de procesamiento de audio que realiza codificación BCC según una realización de la presente invención.
\vskip1.000000\baselineskip
Descripción detallada
La figura 2 muestra un diagrama de bloques de un sistema 200 de procesamiento que realiza codificación de indicación binaural (BCC) para audio envolvente 5,1, según una realización de la presente invención. El sistema 200 BCC presenta un codificador 202 BCC, que recibe seis canales 208 de entrada de audio (es decir, cinco canales regulares y un canal LFE). El codificador 202 BCC presenta un elemento 210 de downmix, que convierte (por ejemplo, promedia) los canales de entrada de audio (incluyendo el canal LFE) en uno o más, pero menos de seis, canales 212 combinados.
Además, el codificador 202 BCC presenta un analizador 214 BCC, que genera un flujo 216 de datos de códigos de indicación BCC para los canales de entrada. Tal como se indica en la figura 2, para subbandas de frecuencia en o por debajo de una frecuencia f_{c} de corte especificada, el analizador 214 BCC utiliza todos los seis canales de entrada de sonido envolvente 5,1 (incluyendo el canal LFE) cuando genera los datos de códigos de indicación BCC. Para todas las otras subbandas (es decir, de alta frecuencia), el analizador 214 BCC utiliza sólo los cinco canales regulares (y no el canal LFE) para generar los datos de códigos de indicación BCC. Como resultado, el canal LFE aporta códigos BCC para sólo subbandas en o por debajo de la frecuencia de corte en vez de para el intervalo de frecuencia BCC completo, reduciendo así el tamaño total del flujo de bits de información lateral.
La frecuencia de corte se elige preferiblemente de tal manera que el ancho de banda de audio efectivo del canal LFE es menos o igual a f_{c} (es decir, el canal LFE presenta sustancialmente energía cero o contenido de audio insustancial más allá de la frecuencia de corte). A menos que las subbandas de frecuencia están alineadas con la frecuencia de corte, la frecuencia de corte cae dentro de una subbanda de frecuencia particular. En ese caso, parte de esa subbanda superará la frecuencia de corte. Para fines de esta memoria descriptiva, una subbanda de este tipo se denomina como que está "en" la frecuencia de corte. En realizaciones preferidas, la totalidad de esa subbanda del canal LFE se codifica por BCC, y la siguiente subbanda de frecuencia superior es la primera subbanda de alta frecuencia que no se codifica por BCC.
En una posible implementación, los códigos de indicación BCC incluyen datos de diferencia de nivel entre canales (ICLD), diferencia de tiempo entre canales (ICTD), y correlación entre canales (ICC, Inter-Channel Correlation). El analizador 214 BCC realiza preferiblemente procesamiento basado en banda análogo al descrito en las solicitudes '411 y '553 para generar datos ICLD e ICTD para diferentes subbandas de frecuencia de los canales de entrada de audio. Además, el analizador 214 BCC genera preferiblemente medidas de coherencia tales como los datos ICC para las diferentes subbandas de frecuencia. Estas medidas de coherencia se describen en mayor detalle en las solicitudes '130 y '579.
El codificador 202 BCC transmite el uno o más canales 212 combinados y el flujo 216 de datos de códigos de indicación BCC (por ejemplo, como información lateral o bien en banda o bien fuera de banda con respecto a los canales combinados) a un descodificador 204 BCC del sistema 200 BCC. El descodificador 204 BCC presenta un procesador 218 de información lateral, que procesa el flujo 216 de datos para recuperar los códigos 220 de indicación BCC (por ejemplo, datos ICLD, ICTD, e ICC). El descodificador 204 BCC también presenta un sintetizador 222 BCC, que utiliza los códigos 220 de indicación BCC recuperados para sintetizar seis canales 224 de salida de audio a partir del uno o más canales 212 combinados para dar mediante seis altavoces 226 de sonido envolvente, respectivamente.
Tal como se indica en la figura 2, el sintetizador 22 realiza síntesis BCC de seis canales para subbandas en o por debajo de la frecuencia f_{c} de corte para generar contenido de frecuencia para todos los seis canales envolventes 5,1 (es decir, incluyendo el canal LFE), mientras que realiza síntesis BCC de cinco canales para subbandas por encima de la frecuencia de corte para generar contenido de frecuencia para sólo los cinco canales regulares del sonido envolvente 5,1. En particular, el sintetizador 222 BCC descompone el (los) canal(es) 212 combinado(s) recibido(s) en un número de subbandas de frecuencia (por ejemplo, bandas críticas). En estas subbandas, se aplica diferente procesamiento para obtener las subbandas correspondientes de los canales de audio de salida. El resultado es que, para el canal LFE, sólo se obtienen subbandas con frecuencias en o por debajo de la frecuencia de corte. Dicho de otro modo, el canal LFE presenta contenido de frecuencia sólo para subbandas en o por debajo de la frecuencia de corte. Las subbandas superiores del canal LFE (es decir, aquellas por encima de la frecuencia de corte) pueden llenarse con señales cero (si es necesario).
Dependiendo de la implementación particular, un codificador BCC podría diseñarse para generar códigos de indicación BCC para todas las frecuencias y simplemente no transmitir aquellos códigos para subbandas particulares (por ejemplo, subbandas por encima de la frecuencia de corte y/o subbandas que presentan energía cero sustancialmente). De manera similar, el descodificador BCC correspondiente podría diseñarse para realizar síntesis BCC convencional para todas las frecuencias, donde el descodificador BCC aplica valores de códigos de indicación BCC apropiados para aquellas subbandas que no presentan códigos transmitidos de manera explícita.
Aunque la presente invención se ha descrito en el contexto de descodificadores BCC que aplican las técnicas de las solicitudes '411 y '553 para sintetizar escenas auditivas, la presente invención también puede implementarse en el contexto de descodificadores BCC que aplican otras técnicas para sintetizar escenas auditivas que no se basan necesariamente en las técnicas de las solicitudes '441 y '553. Por ejemplo, el procesamiento BCC de la presente invención puede implementarse sin datos ICTD, ICLD, y/o ICC, con o sin otros códigos de indicación adecuados, tales como, por ejemplo, aquellos asociados con funciones de transferencia relacionadas con la parte de cabeza.
En la realización de la figura 2, se codifica sonido envolvente 5,1 aplicando análisis BCC de seis canales a subbandas en o por debajo de la frecuencia de corte y análisis BCC de cinco canales a subbandas por encima de la frecuencia de corte. En otra realización, la presente invención puede aplicarse a sonido envolvente 7,1 en el que se aplica análisis BCC de ocho canales a subbandas en o por debajo de una frecuencia de corte especificada y se aplica análisis BCC de siete canales (excluyendo el único canal LFE) a subbandas por encima de la frecuencia de corte.
La presente invención también puede aplicarse a audio envolvente que presenta más de un canal LFE. Por ejemplo, para sonido envolvente 10,2, podría aplicarse análisis BCC de doce canales a subbandas en o por debajo de una frecuencia de corte especificada, mientras que podría aplicarse análisis BCC de diez canales (excluyendo los dos canales LFE) a subbandas por encima de la frecuencia de corte. Como alternativa, podría haber dos frecuencias de corte diferentes especificadas: una primera frecuencia de corte para un primer canal LFE del sonido envolvente 10,2 y una segunda frecuencia de corte para el segundo canal LFE. En este caso y suponiendo que la primera frecuencia de corte es menor que la segunda frecuencia de corte, podría aplicarse análisis BCC de doce canales a subbandas en o por debajo de la primera frecuencia de corte, podría aplicarse análisis BCC de once canales (excluyendo el primer canal LFE) a subbandas que están (1) por encima de la primera frecuencia de corte y (2) en o por debajo de la segunda frecuencia de corte, y podría aplicarse análisis BCC de diez canales (excluyendo ambos canales LFE) a subbandas por encima de la segunda frecuencia de corte.
De manera similar, algunos equipos multicanal de consumo están diseñados a propósito con diferentes canales de salida que presentan diferentes intervalos de frecuencia. Por ejemplo, algunos equipos de sonido envolvente 5,1 presentan dos canales posteriores que están diseñados para reproducir sólo frecuencias por debajo de 7 kHz. La presente invención podría aplicarse a sistemas de este tipo especificando dos frecuencias de corte: una para el canal LFE y una mayor para los canales posteriores. En este caso, podría aplicarse análisis BCC de seis canales a subbandas en o por debajo de la frecuencia de corte de LFE, podría aplicarse análisis BCC de cinco canales (excluyendo el canal LFE) a subbandas que están (1) por encima de la frecuencia de corte de LFE y (2) en o por debajo de la frecuencia de corte de los canales posteriores, y podría aplicarse análisis BCC de tres canales (excluyendo el canal LFE y los dos canales posteriores) a subbandas por encima de la frecuencia de corte de los canales posteriores.
La presente invención puede generalizarse además para aplicar codificación de audio paramétrica a dos o más subconjuntos diferentes de canales de entrada para dos o más regiones de frecuencia diferentes, en la que la codificación de audio paramétrica podría ser distinta a la codificación BCC y las diferentes regiones de frecuencia se eligen de tal manera que el contenido de frecuencia de los diferentes canales de entrada se refleja en estas regiones. Dependiendo de la aplicación particular, podrían excluirse diferentes canales de diferentes regiones de frecuencia en cualquier combinación apropiada. Por ejemplo, los canales de baja frecuencia podrían excluirse de las regiones de alta frecuencia y/o los canales de alta frecuencia podrían excluirse de las regiones de baja frecuencia. Incluso puede darse el caso de que ninguna región de frecuencia única implique todos los canales de entrada.
Tal como se describió previamente, aunque se puede realizar downmix sobre los canales 208 de entrada para formar un único canal 212 combinado (por ejemplo, mono), en implementaciones alternativas, puede realizarse downmix sobre los múltiples canales de entrada para formar dos o más canales "combinados" diferentes, dependiendo de la aplicación de procesamiento de audio particular. Puede encontrarse más información de tales técnicas en la solicitud de patente estadounidense US-A-2 005 157 883, presentada el 20/01/04, publicada el 21/07/2005.
En algunas implementaciones, cuando el downmix genera múltiples canales combinados, los datos de canales combinados pueden transmitirse utilizando técnicas de transmisión de audio convencionales. Por ejemplo, cuando se generan dos canales combinados, puede que puedan emplearse técnicas de transmisión estéreo convencionales. En este caso, un descodificador BCC puede extraer y utilizar los códigos BCC para sintetizar una señal multicanal (por ejemplo, sonido envolvente 5,1) a partir de dos canales combinados. Además, esto puede proporcionar retrocompatibilidad, donde los dos canales combinados por BCC se reproducen utilizando descodificadores estéreos convencionales (es decir, no basados en BCC) que ignoran los códigos BCC. Análogamente, la retrocompatibilidad puede conseguirse para un descodificador mono convencional cuando se genera un único canal combinado por BCC. Obsérvese que, en teoría, cuando hay múltiples canales "combinados", uno o más de los canales combinados pueden basarse realmente en canales de entrada individuales.
Aunque el sistema 200 BCC puede presentar el mismo número de canales de entrada de audio que de canales de salida de audio, en realizaciones alternativas, el número de canales de entrada podría ser o bien mayor o bien menor que el número de canales de salida, dependiendo de la aplicación particular. Por ejemplo, el audio de entrada podría corresponder a sonido envolvente 7,1 y el audio de salida sintetizado podría corresponder a sonido envolvente 5,1, o viceversa.
En general, los codificadores BCC de la presente invención pueden implementarse en el contexto de convertir M canales de audio de entrada en N canales de audio combinados y uno o más conjuntos correspondientes de códigos BCC, donde M>N\geq1. De manera similar, los descodificadores BCC de la presente invención pueden implementarse en el contexto de generar P canales de audio de salida a partir de los N canales de audio combinados y los conjuntos correspondientes de códigos BCC, donde P>N, y P puede igual a o diferente de M.
Dependiendo de la implementación particular, las diversas señales recibidas y generadas por tanto el codificador 202 BCC como el descodificador 204 BCC de la figura 2 pueden ser cualquier combinación adecuada de señales analógicas y/o digitales, incluyendo todas analógicas o todas digitales. Aunque no se muestra en la figura 2, los expertos en la técnica apreciarán que el uno o más canales 212 combinados y el flujo 216 de datos de códigos de indicación BCC pueden codificarse adicionalmente mediante el codificador 202 BCC y descodificarse en consecuencia mediante el descodificador 204 BCC, por ejemplo, basándose en algún esquema de compresión apropiado (por ejemplo, ADPCM) para reducir adicionalmente el tamaño de los datos transmitidos.
La definición de transmisión de datos desde el codificador 202 BCC hasta el descodificador 204 BCC dependerá de la aplicación particular del sistema 200 de procesamiento de audio. Por ejemplo, en algunas aplicaciones, tales como emisiones en directo de conciertos de música, la transmisión puede implicar transmisión en tiempo real de los datos para la reproducción inmediata en una ubicación remota. En otras aplicaciones, "transmisión" puede implicar almacenamiento de los datos en CD u otros medios de almacenamiento adecuados para la reproducción posterior (es decir, en tiempo no real). Por supuesto también pueden ser posibles otras aplicaciones.
Dependiendo de la implementación particular, los canales de transmisión pueden ser cableados o inalámbricos y pueden utilizar protocolos personalizados o estandarizados (por ejemplo, IP). Pueden utilizarse para el almacenamiento medios como CD, DVD, grabadoras de cinta digital, y memorias de estado sólido. Además, la transmisión y/o el almacenamiento pueden, pero no necesitan, incluir codificación de canales. De manera similar, aunque la presente invención se ha descrito en el contexto de sistemas de audio digital, los expertos en la técnica entenderán que la presente invención también puede implementarse en el contexto de sistemas de audio analógico, tales como radio AM, radio FM, y la parte de audio de emisión de televisión analógica, cada uno de los cuales soporta la inclusión de un canal de transmisión de baja tasa de bits en banda adicional.
La presente invención puede implementarse para muchas aplicaciones diferentes, tales como reproducción de música, radiodifusión, y telefonía. Por ejemplo, la presente invención puede implementarse para emisión de radio/TV/Internet digitales (por ejemplo, difusión por Internet ("Webcast")) tales como Sirius Satellite Radio o XM. Otras aplicaciones incluyen voz sobre IP, PSTN y otras redes de voz, emisión de radio analógica, y radio por Internet.
Dependiendo de la aplicación particular, pueden emplearse diferentes técnicas para embeber los conjuntos de códigos BCC en un canal combinado para conseguir una señal BCC de la presente invención. La disponibilidad de cualquier técnica particular puede depender, al menos en parte, del (de los) medio(s) de transmisión/almacenamiento particular(es) utilizado(s) para la señal BCC. Por ejemplo, los protocolos para emisión de radio digital soportan normalmente la inclusión de bits de mejora adicionales (por ejemplo, en la parte de cabecera de paquetes de datos) que los receptores convencionales ignoran. Estos bits adicionales pueden utilizarse para representar los conjuntos de parámetros de escenas auditivas para proporcionar una señal BCC. En general, la presente invención puede implementarse utilizando cualquier técnica adecuada para realizar marca de agua digital sobre señales de audio en las que los datos correspondientes a los conjuntos de parámetros de escenas auditivas están embebidos en la señal de audio para formar una señal BCC. Por ejemplo, estas técnicas pueden implicar ocultación de datos bajo curvas de enmascaramiento de percepción u ocultación de datos en ruido pseudoaleatorio. El ruido pseudoaleatorio puede percibirse como ruido aceptable. El embeber los datos también puede implementarse utilizando métodos similares al robo de bits ("bit robbing") utilizado en transmisión TDM (multiplexación por división de tiempo, Time Division Multiplexing) para señalización en banda. Otra posible técnica es inversión de bits ("bit flipping") LSB de ley mu, donde los bits menos significativos se utilizan para transmitir datos.
La presente invención puede implementarse como procesos basados en circuitos, incluyendo posible implementaciones sobre un único circuito integrado. Tal como sería evidente para un experto en la técnica, también pueden implementarse diversas funciones de elementos de circuito como etapas de procesamiento en un programa de software. Tal software puede emplearse en, por ejemplo, un procesador de señal digital, microcontrolador u ordenador de propósito general.
La presente invención puede realizarse en la forma de métodos y aparatos para poner en práctica esos métodos. La presente invención también puede realizarse en la forma de código de programa realizado en medios tangibles, tales como disquetes, CD-ROM, discos duros, o cualquier otro medio de almacenamiento legible por máquina, en los que, cuando el código de programa se carga en y se ejecuta por una máquina, tal como un ordenador, la máquina se vuelve un aparato para poner en práctica la invención. La presente invención también puede realizarse en la forma de código de programa, por ejemplo, o bien almacenado en un medio de almacenamiento, cargado en y/o ejecutado por una máquina, o bien transmitido sobre algún medio o portador de transmisión, tal como sobre cableado o alambrado eléctrico, a través de fibra óptica, o a través de radiación electromagnética, en la que, cuando el código de programa se carga en y se ejecuta por una máquina, tal como un ordenador, la máquina se vuelve un aparato para poner en práctica la invención. Cuando se implementa sobre un procesador de propósito general, los segmentos del código de programa se combinan con el procesador para proporcionar un dispositivo único que funciona análogamente a circuitos lógicos específicos.
Además se entenderá que los expertos en la técnica pueden realizar diversos cambios en los detalles, materiales, y disposiciones de las partes que se han descrito e ilustrado con el fin de explicar la naturaleza de esta invención sin apartarse del alcance de la invención tal como se expresa en las siguientes reivindicaciones.

Claims (22)

  1. \global\parskip0.900000\baselineskip
    1. Método para codificar una señal de audio multicanal que presenta una pluralidad de canales de entrada de audio, comprendiendo el método:
    aplicar una técnica de codificación de audio paramétrica para generar códigos de audio paramétricos para un primer subconjunto de los canales de entrada de audio para una primera región de frecuencia; y
    aplicar la técnica de codificación de audio paramétrica para generar códigos de audio paramétricos para un segundo subconjunto de los canales de entrada de audio para una segunda región de frecuencia, en el que:
    la segunda región de frecuencia es diferente de la primera región de frecuencia; y
    el segundo subconjunto es diferente del primer subconjunto.
  2. 2. Método según la reivindicación 1, en el que la técnica de codificación de audio paramétrica es codificación de tipo codificación de indicación binaural (BCC).
  3. 3. Método según la reivindicación 1, en el que:
    la señal de audio multicanal es una señal de sonido envolvente que presenta una pluralidad de canales regulares y al menos un canal de baja frecuencia (LFE);
    el primer subconjunto incluye todos los canales de entrada de audio;
    la primera región de frecuencia corresponde a subbandas en o por debajo de una frecuencia de corte especificada;
    el segundo subconjunto excluye el canal LFE; y
    la segunda región de frecuencia corresponde a subbandas por encima de la frecuencia de corte.
  4. 4. Método según la reivindicación 3, en el que la técnica de codificación de audio paramétrica es codificación BCC.
  5. 5. Método según la reivindicación 3, en el que la frecuencia de corte es al menos el ancho de banda de audio efectivo del canal LFE.
  6. 6. Método según la reivindicación 3, en el que la señal de audio multicanal es una señal de sonido envolvente 5,1.
  7. 7. Método según la reivindicación 1, que comprende además transmitir los códigos de audio paramétricos para el primer y segundo subconjuntos de canales de entrada de audio.
  8. 8. Aparato para codificar una señal de audio multicanal que presenta una pluralidad de canales de entrada de audio, comprendiendo el aparato:
    medios para aplicar una técnica de codificación de audio paramétrica para generar códigos de audio paramétricos para un primer subconjunto de los canales de entrada de audio para una primera región de frecuencia; y
    medios para aplicar la técnica de codificación de audio paramétrica para generar códigos de audio paramétricos para un segundo subconjunto de los canales de entrada de audio para una segunda región de frecuencia, en el que:
    la segunda región de frecuencia es diferente de la primera región de frecuencia; y
    el segundo subconjunto es diferente del primer subconjunto.
  9. 9. Codificador de audio paramétrico, que comprende:
    un elemento de downmix adaptado para generar uno o más canales combinados a partir de una pluralidad de canales de entrada de audio de una señal de audio multicanal; y
    un analizador adaptado para generar:
    (1)
    códigos de audio paramétricos para un primer subconjunto de los canales de salida de audio en una primera región de frecuencia; y
    (2)
    códigos de audio paramétricos para un segundo subconjunto de los canales de salida de audio en una segunda región de frecuencia, en el que:
    la segunda región de frecuencia es diferente de la primera región de frecuencia; y
    el segundo subconjunto es diferente del primer subconjunto.
    \global\parskip1.000000\baselineskip
  10. 10. Codificador según la reivindicación 9, en el que los códigos de audio paramétricos son códigos BCC.
  11. 11. Codificador según la reivindicación 9, en el que:
    la señal de audio multicanal es una señal de sonido envolvente que presenta una pluralidad de canales regulares y al menos un canal LFE;
    el primer subconjunto incluye todos los canales de salida de audio;
    la primera región de frecuencia corresponde a subbandas en o por debajo de una frecuencia de corte especificada;
    el segundo subconjunto excluye el canal LFE; y
    la segunda región de frecuencia corresponde a subbandas por encima de la frecuencia de corte.
  12. 12. Codificador según la reivindicación 9, codificador de audio paramétrico que además está adaptado para transmitir los códigos de audio paramétricos para el primer y segundo subconjuntos de canales de entrada de audio.
  13. 13. Método para sintetizar una señal de audio multicanal que presenta una pluralidad de canales de salida de audio, comprendiendo el método:
    aplicar una técnica de descodificación de audio paramétrica para generar un primer subconjunto de los canales de salida de audio para una primera región de frecuencia; y
    aplicar la técnica de descodificación de audio paramétrica para generar un segundo subconjunto de los canales de salida de audio para una segunda región de frecuencia, en el que:
    la segunda región de frecuencia es diferente de la primera región de frecuencia; y
    el segundo subconjunto es diferente del primer subconjunto.
  14. 14. Invención según la reivindicación 13, en la que la técnica de descodificación de audio paramétrica es descodificación BCC.
  15. 15. Invención según la reivindicación 13, en la que:
    la señal de audio multicanal es una señal de sonido envolvente que presenta una pluralidad de canales regulares y al menos un canal LFE;
    el primer subconjunto incluye todos los canales de salida de audio;
    la primera región de frecuencia corresponde a subbandas en o por debajo de una frecuencia de corte especificada;
    el segundo subconjunto excluye el canal LFE; y
    la segunda región de frecuencia corresponde a subbandas por encima de la frecuencia de corte.
  16. 16. Invención según la reivindicación 15, en la que la técnica de descodificación de audio paramétrica es descodificación BCC.
  17. 17. Invención según la reivindicación 15, en la que la frecuencia de corte es al menos el ancho de banda de audio efectivo del canal LFE.
  18. 18. Invención según la reivindicación 15, en la que la señal de audio multicanal es una señal de sonido envolvente 5,1.
  19. 19. Aparato para sintetizar una señal de audio multicanal que presenta una pluralidad de canales de salida de audio, comprendiendo el aparato:
    medios para aplicar una técnica de descodificación de audio paramétrica para generar un primer subconjunto de los canales de salida de audio para una primera región de frecuencia; y
    medios para aplicar la técnica de descodificación de audio paramétrica para generar un segundo subconjunto de los canales de salida de audio para una segunda región de frecuencia, en el que:
    la segunda región de frecuencia es diferente de la primera región de frecuencia; y
    el segundo subconjunto es diferente del primer subconjunto.
  20. 20. Descodificador de audio paramétrico, que comprende:
    un procesador de códigos paramétricos adaptado para generar códigos paramétricos; y
    el aparato para sintetizar según la reivindicación 19.
  21. 21. Descodificador según la reivindicación 20, en el que los códigos paramétricos son códigos BCC.
  22. 22. Descodificador según la reivindicación 20, en el que:
    la señal de audio multicanal es una señal de sonido envolvente que presenta una pluralidad de canales regulares y al menos un canal LFE;
    el primer subconjunto incluye todos los canales de salida de audio;
    la primera región de frecuencia corresponde a subbandas en o por debajo de una frecuencia de corte especificada;
    el segundo subconjunto excluye el canal LFE; y
    la segunda región de frecuencia corresponde a subbandas por encima de la frecuencia de corte.
ES05723489T 2004-03-04 2005-02-23 Codificacion basada en frecuencia de canales de audio en sistemas de codificacion multicanal parametrica. Active ES2293556T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US54997204P 2004-03-04 2004-03-04
US549972P 2004-03-04
US10/827,900 US7805313B2 (en) 2004-03-04 2004-04-20 Frequency-based coding of channels in parametric multi-channel coding systems
US827900 2004-04-20

Publications (1)

Publication Number Publication Date
ES2293556T3 true ES2293556T3 (es) 2008-03-16

Family

ID=34915657

Family Applications (1)

Application Number Title Priority Date Filing Date
ES05723489T Active ES2293556T3 (es) 2004-03-04 2005-02-23 Codificacion basada en frecuencia de canales de audio en sistemas de codificacion multicanal parametrica.

Country Status (16)

Country Link
US (1) US7805313B2 (es)
EP (1) EP1721489B1 (es)
JP (1) JP4418493B2 (es)
KR (1) KR100717598B1 (es)
AT (1) ATE373402T1 (es)
AU (1) AU2005226536B2 (es)
BR (1) BRPI0508146B1 (es)
CA (1) CA2557993C (es)
DE (1) DE602005002463T2 (es)
ES (1) ES2293556T3 (es)
HK (1) HK1101634A1 (es)
MX (1) MXPA06009931A (es)
NO (1) NO340421B1 (es)
PT (1) PT1721489E (es)
TW (1) TWI376967B (es)
WO (1) WO2005094125A1 (es)

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
KR20070001139A (ko) * 2004-02-17 2007-01-03 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들
DE602005006777D1 (de) * 2004-04-05 2008-06-26 Koninkl Philips Electronics Nv Mehrkanal-codierer
KR101183862B1 (ko) * 2004-04-05 2012-09-20 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 신호를 처리하기 위한 방법 및 디바이스, 인코더 장치, 디코더 장치 및 오디오 시스템
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
CN1922655A (zh) * 2004-07-06 2007-02-28 松下电器产业株式会社 音频信号编码装置、音频信号解码装置、方法及程序
EP1769491B1 (en) * 2004-07-14 2009-09-30 Koninklijke Philips Electronics N.V. Audio channel conversion
JP4892184B2 (ja) * 2004-10-14 2012-03-07 パナソニック株式会社 音響信号符号化装置及び音響信号復号装置
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US20080255857A1 (en) * 2005-09-14 2008-10-16 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
KR100803212B1 (ko) * 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
EP1974344A4 (en) * 2006-01-19 2011-06-08 Lg Electronics Inc METHOD AND APPARATUS FOR DECODING A SIGNAL
US8411869B2 (en) * 2006-01-19 2013-04-02 Lg Electronics Inc. Method and apparatus for processing a media signal
US9426596B2 (en) 2006-02-03 2016-08-23 Electronics And Telecommunications Research Institute Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue
KR100878816B1 (ko) * 2006-02-07 2009-01-14 엘지전자 주식회사 부호화/복호화 장치 및 방법
US20090177479A1 (en) * 2006-02-09 2009-07-09 Lg Electronics Inc. Method for Encoding and Decoding Object-Based Audio Signal and Apparatus Thereof
DE602007004451D1 (de) 2006-02-21 2010-03-11 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
KR100904437B1 (ko) * 2006-02-23 2009-06-24 엘지전자 주식회사 오디오 신호의 처리 방법 및 장치
KR100773560B1 (ko) 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
KR100773562B1 (ko) 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
FR2899423A1 (fr) * 2006-03-28 2007-10-05 France Telecom Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme.
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
US8626515B2 (en) * 2006-03-30 2014-01-07 Lg Electronics Inc. Apparatus for processing media signal and method thereof
ATE527833T1 (de) * 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
KR100763920B1 (ko) * 2006-08-09 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치
US20080235006A1 (en) 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US20100040135A1 (en) * 2006-09-29 2010-02-18 Lg Electronics Inc. Apparatus for processing mix signal and method thereof
CN101617360B (zh) 2006-09-29 2012-08-22 韩国电子通信研究院 用于编码和解码具有各种声道的多对象音频信号的设备和方法
EP2084901B1 (en) * 2006-10-12 2015-12-09 LG Electronics Inc. Apparatus for processing a mix signal and method thereof
KR100891670B1 (ko) 2006-10-13 2009-04-02 엘지전자 주식회사 신호 처리 방법 및 장치
SG175632A1 (en) * 2006-10-16 2011-11-28 Dolby Sweden Ab Enhanced coding and parameter representation of multichannel downmixed object coding
JP5337941B2 (ja) * 2006-10-16 2013-11-06 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャネル・パラメータ変換のための装置および方法
EP2092516A4 (en) * 2006-11-15 2010-01-13 Lg Electronics Inc METHOD AND APPARATUS FOR AUDIO SIGNAL DECODING
US8265941B2 (en) * 2006-12-07 2012-09-11 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
KR101111520B1 (ko) * 2006-12-07 2012-05-24 엘지전자 주식회사 오디오 처리 방법 및 장치
CN101578656A (zh) * 2007-01-05 2009-11-11 Lg电子株式会社 用于处理音频信号的装置和方法
KR20090115200A (ko) * 2007-02-13 2009-11-04 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US20100121470A1 (en) * 2007-02-13 2010-05-13 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US20100241434A1 (en) * 2007-02-20 2010-09-23 Kojiro Ono Multi-channel decoding device, multi-channel decoding method, program, and semiconductor integrated circuit
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8184726B2 (en) * 2007-09-10 2012-05-22 Industrial Technology Research Institute Method and apparatus for multi-rate control in a multi-channel communication system
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
EP2215627B1 (en) * 2007-11-27 2012-09-19 Nokia Corporation An encoder
WO2009075510A1 (en) * 2007-12-09 2009-06-18 Lg Electronics Inc. A method and an apparatus for processing a signal
KR101441898B1 (ko) * 2008-02-01 2014-09-23 삼성전자주식회사 주파수 부호화 방법 및 장치와 주파수 복호화 방법 및 장치
US9111525B1 (en) * 2008-02-14 2015-08-18 Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) Apparatuses, methods and systems for audio processing and transmission
JP5668923B2 (ja) * 2008-03-14 2015-02-12 日本電気株式会社 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム
US8509092B2 (en) * 2008-04-21 2013-08-13 Nec Corporation System, apparatus, method, and program for signal analysis control and signal control
US20100223061A1 (en) * 2009-02-27 2010-09-02 Nokia Corporation Method and Apparatus for Audio Coding
CN102656627B (zh) * 2009-12-16 2014-04-30 诺基亚公司 多信道音频处理方法和装置
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
CN104050969A (zh) 2013-03-14 2014-09-17 杜比实验室特许公司 空间舒适噪声
WO2014147441A1 (en) * 2013-03-20 2014-09-25 Nokia Corporation Audio signal encoder comprising a multi-channel parameter selector
EP3023984A4 (en) * 2013-07-15 2017-03-08 Electronics and Telecommunications Research Institute Encoder and encoding method for multichannel signal, and decoder and decoding method for multichannel signal
KR101841380B1 (ko) 2014-01-13 2018-03-22 노키아 테크놀로지스 오와이 다중-채널 오디오 신호 분류기
WO2015147434A1 (ko) * 2014-03-25 2015-10-01 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 장치 및 방법
CN104064194B (zh) * 2014-06-30 2017-04-26 武汉大学 用于提高三维音频空间感距离感的参数编解码方法及系统
CN106471575B (zh) 2014-07-01 2019-12-10 韩国电子通信研究院 多信道音频信号处理方法及装置
WO2016003206A1 (ko) * 2014-07-01 2016-01-07 한국전자통신연구원 다채널 오디오 신호 처리 방법 및 장치
US10121487B2 (en) * 2016-11-18 2018-11-06 Samsung Electronics Co., Ltd. Signaling processor capable of generating and synthesizing high frequency recover signal
US11765536B2 (en) 2018-11-13 2023-09-19 Dolby Laboratories Licensing Corporation Representing spatial audio by means of an audio signal and associated metadata
WO2020232631A1 (zh) * 2019-05-21 2020-11-26 深圳市汇顶科技股份有限公司 一种语音分频传输方法、源端、播放端、源端电路和播放端电路

Family Cites Families (81)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4236039A (en) * 1976-07-19 1980-11-25 National Research Development Corporation Signal matrixing for directional reproduction of sound
US4815132A (en) * 1985-08-30 1989-03-21 Kabushiki Kaisha Toshiba Stereophonic voice signal transmission system
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
DE3943881B4 (de) * 1989-04-17 2008-07-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
WO1992012607A1 (en) * 1991-01-08 1992-07-23 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
DE4209544A1 (de) * 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
US5703999A (en) * 1992-05-25 1997-12-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Process for reducing data in the transmission and/or storage of digital signals from several interdependent channels
DE4236989C2 (de) * 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
US5371799A (en) * 1993-06-01 1994-12-06 Qsound Labs, Inc. Stereo headphone sound source localization system
US5463424A (en) * 1993-08-03 1995-10-31 Dolby Laboratories Licensing Corporation Multi-channel transmitter/receiver system providing matrix-decoding compatible signals
JP3227942B2 (ja) 1993-10-26 2001-11-12 ソニー株式会社 高能率符号化装置
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
JP3277679B2 (ja) * 1994-04-15 2002-04-22 ソニー株式会社 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置
JPH0969783A (ja) 1995-08-31 1997-03-11 Nippon Steel Corp オーディオデータ符号化装置
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5771295A (en) * 1995-12-26 1998-06-23 Rocktron Corporation 5-2-5 matrix system
US7012630B2 (en) * 1996-02-08 2006-03-14 Verizon Services Corp. Spatial sound conference system and apparatus
DE69734543T2 (de) * 1996-02-08 2006-07-20 Koninklijke Philips Electronics N.V. Mit 2-kanal- und 1-kanal-übertragung kompatible n-kanalübertragung
US5825776A (en) * 1996-02-27 1998-10-20 Ericsson Inc. Circuitry and method for transmitting voice and data signals upon a wireless communication channel
US5889843A (en) * 1996-03-04 1999-03-30 Interval Research Corporation Methods and systems for creating a spatial auditory environment in an audio conference system
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
KR0175515B1 (ko) * 1996-04-15 1999-04-01 김광호 테이블 조사 방식의 스테레오 구현 장치와 방법
US6987856B1 (en) * 1996-06-19 2006-01-17 Board Of Trustees Of The University Of Illinois Binaural signal processing techniques
US6697491B1 (en) * 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
JP3707153B2 (ja) 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
SG54379A1 (en) * 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
SG54383A1 (en) * 1996-10-31 1998-11-16 Sgs Thomson Microelectronics A Method and apparatus for decoding multi-channel audio data
US5912976A (en) * 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
US6131084A (en) * 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
US6111958A (en) * 1997-03-21 2000-08-29 Euphonics, Incorporated Audio spatial enhancement apparatus and methods
US6236731B1 (en) * 1997-04-16 2001-05-22 Dspfactory Ltd. Filterbank structure and method for filtering and separating an information signal into different bands, particularly for audio signal in hearing aids
US5860060A (en) * 1997-05-02 1999-01-12 Texas Instruments Incorporated Method for left/right channel self-alignment
US5946352A (en) * 1997-05-02 1999-08-31 Texas Instruments Incorporated Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain
US6108584A (en) * 1997-07-09 2000-08-22 Sony Corporation Multichannel digital audio decoding method and apparatus
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6021389A (en) * 1998-03-20 2000-02-01 Scientific Learning Corp. Method and apparatus that exaggerates differences between sounds to train listener to recognize and identify similar sounds
US6016473A (en) 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
TW444511B (en) 1998-04-14 2001-07-01 Inst Information Industry Multi-channel sound effect simulation equipment and method
JP3657120B2 (ja) * 1998-07-30 2005-06-08 株式会社アーニス・サウンド・テクノロジーズ 左,右両耳用のオーディオ信号を音像定位させるための処理方法
JP2000152399A (ja) * 1998-11-12 2000-05-30 Yamaha Corp 音場効果制御装置
US6408327B1 (en) * 1998-12-22 2002-06-18 Nortel Networks Limited Synthetic stereo conferencing over LAN/WAN
US6282631B1 (en) * 1998-12-23 2001-08-28 National Semiconductor Corporation Programmable RISC-DSP architecture
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
JP4438127B2 (ja) 1999-06-18 2010-03-24 ソニー株式会社 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体
US6823018B1 (en) * 1999-07-28 2004-11-23 At&T Corp. Multiple description coding communication system
US6434191B1 (en) * 1999-09-30 2002-08-13 Telcordia Technologies, Inc. Adaptive layered coding for voice over wireless IP applications
US6614936B1 (en) * 1999-12-03 2003-09-02 Microsoft Corporation System and method for robust video coding using progressive fine-granularity scalable (PFGS) coding
US6498852B2 (en) * 1999-12-07 2002-12-24 Anthony Grimani Automatic LFE audio signal derivation system
US6845163B1 (en) * 1999-12-21 2005-01-18 At&T Corp Microphone array for preserving soundfield perceptual cues
KR100718829B1 (ko) * 1999-12-24 2007-05-17 코닌클리케 필립스 일렉트로닉스 엔.브이. 다채널 오디오 신호 처리 장치
US6782366B1 (en) * 2000-05-15 2004-08-24 Lsi Logic Corporation Method for independent dynamic range control
US6850496B1 (en) * 2000-06-09 2005-02-01 Cisco Technology, Inc. Virtual conference room for voice conferencing
US6973184B1 (en) * 2000-07-11 2005-12-06 Cisco Technology, Inc. System and method for stereo conferencing over low-bandwidth links
US7236838B2 (en) * 2000-08-29 2007-06-26 Matsushita Electric Industrial Co., Ltd. Signal processing apparatus, signal processing method, program and recording medium
JP3426207B2 (ja) 2000-10-26 2003-07-14 三菱電機株式会社 音声符号化方法および装置
TW510144B (en) 2000-12-27 2002-11-11 C Media Electronics Inc Method and structure to output four-channel analog signal using two channel audio hardware
US6885992B2 (en) * 2001-01-26 2005-04-26 Cirrus Logic, Inc. Efficient PCM buffer
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US6934676B2 (en) * 2001-05-11 2005-08-23 Nokia Mobile Phones Ltd. Method and system for inter-channel signal redundancy removal in perceptual audio coding
US7668317B2 (en) * 2001-05-30 2010-02-23 Sony Corporation Audio post processing in DVD, DTV and other audio visual products
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ES2255678T3 (es) 2002-02-18 2006-07-01 Koninklijke Philips Electronics N.V. Codificacion de audio parametrica.
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
EP1500084B1 (en) 2002-04-22 2008-01-23 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
KR101021079B1 (ko) 2002-04-22 2011-03-14 코닌클리케 필립스 일렉트로닉스 엔.브이. 파라메트릭 다채널 오디오 표현
KR100635022B1 (ko) 2002-05-03 2006-10-16 하만인터내셔날인더스트리스인코포레이티드 다채널 다운믹싱 장치
US6940540B2 (en) * 2002-06-27 2005-09-06 Microsoft Corporation Speaker detection and tracking using audiovisual data
AU2003244932A1 (en) * 2002-07-12 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
EP1523863A1 (en) 2002-07-16 2005-04-20 Koninklijke Philips Electronics N.V. Audio coding
CN100370517C (zh) * 2002-07-16 2008-02-20 皇家飞利浦电子股份有限公司 一种对编码信号进行解码的方法
RU2005120236A (ru) 2002-11-28 2006-01-20 Конинклейке Филипс Электроникс Н.В. (Nl) Кодирование аудиосигнала
EP1595247B1 (en) * 2003-02-11 2006-09-13 Koninklijke Philips Electronics N.V. Audio coding
FI118247B (fi) 2003-02-26 2007-08-31 Fraunhofer Ges Forschung Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa
KR20050116828A (ko) 2003-03-24 2005-12-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 다채널 신호를 나타내는 주 및 부 신호의 코딩
US20050069143A1 (en) * 2003-09-30 2005-03-31 Budnikov Dmitry N. Filtering for spatial audio rendering
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7653533B2 (en) * 2005-10-24 2010-01-26 Lg Electronics Inc. Removing time delays in signal paths

Also Published As

Publication number Publication date
NO20064472L (no) 2006-10-03
US20050195981A1 (en) 2005-09-08
NO340421B1 (no) 2017-04-18
MXPA06009931A (es) 2007-03-21
WO2005094125A1 (en) 2005-10-06
EP1721489A1 (en) 2006-11-15
JP2007526520A (ja) 2007-09-13
DE602005002463D1 (de) 2007-10-25
BRPI0508146B1 (pt) 2019-04-16
AU2005226536B2 (en) 2008-09-04
CA2557993A1 (en) 2005-10-06
EP1721489B1 (en) 2007-09-12
DE602005002463T2 (de) 2008-06-12
JP4418493B2 (ja) 2010-02-17
US7805313B2 (en) 2010-09-28
KR20060131866A (ko) 2006-12-20
HK1101634A1 (en) 2007-10-18
ATE373402T1 (de) 2007-09-15
KR100717598B1 (ko) 2007-05-15
TWI376967B (en) 2012-11-11
AU2005226536A1 (en) 2005-10-06
TW200603653A (en) 2006-01-16
PT1721489E (pt) 2007-12-21
BRPI0508146A (pt) 2007-07-31
CA2557993C (en) 2012-11-27

Similar Documents

Publication Publication Date Title
ES2293556T3 (es) Codificacion basada en frecuencia de canales de audio en sistemas de codificacion multicanal parametrica.
JP5452915B2 (ja) オーディオ信号の符号化/復号化方法及び符号化/復号化装置
RU2323551C1 (ru) Частотно-ориентированное кодирование каналов в параметрических системах многоканального кодирования
KR101283783B1 (ko) 고품질 다채널 오디오 부호화 및 복호화 장치
RU2007139918A (ru) Кодирование многоканального аудио
JP6759277B2 (ja) マルチチャネル・オーディオ・コンテンツの符号化
EP3818522A1 (en) Synchronizing enhanced audio transports with backward compatible audio transports
ES2906957T3 (es) Compresión intermedia por capas de datos de audio ambisónicos de orden superior
EP3818523A1 (en) Embedding enhanced audio transports in backward compatible audio bitstreams
KR20080066537A (ko) 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치
KR20190031460A (ko) 오디오 객체 전송 장치 및 방법