ES2293556T3 - Codificacion basada en frecuencia de canales de audio en sistemas de codificacion multicanal parametrica. - Google Patents
Codificacion basada en frecuencia de canales de audio en sistemas de codificacion multicanal parametrica. Download PDFInfo
- Publication number
- ES2293556T3 ES2293556T3 ES05723489T ES05723489T ES2293556T3 ES 2293556 T3 ES2293556 T3 ES 2293556T3 ES 05723489 T ES05723489 T ES 05723489T ES 05723489 T ES05723489 T ES 05723489T ES 2293556 T3 ES2293556 T3 ES 2293556T3
- Authority
- ES
- Spain
- Prior art keywords
- audio
- channels
- subset
- frequency
- parametric
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims abstract description 46
- 230000005236 sound signal Effects 0.000 claims abstract description 20
- 230000002194 synthesizing effect Effects 0.000 claims 2
- 230000005540 biological transmission Effects 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000009429 electrical wiring Methods 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Método para codificar una señal de audio multicanal que presenta una pluralidad de canales de entrada de audio, comprendiendo el método: aplicar una técnica de codificación de audio paramétrica para generar códigos de audio paramétricos para un primer subconjunto de los canales de entrada de audio para una primera región de frecuencia; y aplicar la técnica de codificación de audio paramétrica para generar códigos de audio paramétricos para un segundo subconjunto de los canales de entrada de audio para una segunda región de frecuencia, en el que: la segunda región de frecuencia es diferente de la primera región de frecuencia; y el segundo subconjunto es diferente del primer subconjunto.
Description
Codificación basada en frecuencia de canales de
audio en sistemas de codificación multicanal paramétrica.
\global\parskip0.920000\baselineskip
La presente invención se refiere a la
codificación de señales de audio y la posterior síntesis de escenas
auditivas a partir de los datos de audio codificados.
Esta solicitud reivindica el beneficio de la
fecha de presentación de la solicitud provisional estadounidense
número 60/549.972, presentada el 04/03/2004. El contenido de esta
solicitud se refiere al contenido de la solicitud de patente
estadounidense US-A-2 003 026 441,
presentada el 04/05/2001 ("la solicitud '441"), la solicitud de
patente estadounidense US-A-2 003
035 553 presentada el 07/11/2001 ("la solicitud '553"), y la
solicitud de patente estadounidense
US-A-2 003 219 130, presentada el
24/05/2002 ("la solicitud '130"), y la solicitud de patente
estadounidense US-A-2 005 180 579,
presentada el 01/04/2004 ("la solicitud '579") y publicada el
18/08/2005.
Los sistemas de audio envolvente multicanal han
sido estándar en salas de cine durante años. A medida que la
tecnología ha avanzado, se ha vuelto asequible producir sistemas
envolventes multicanal para uso doméstico. En la actualidad, tales
sistemas se venden en su mayoría como "sistemas de cine en
casa". De acuerdo con una recomendación ITU-R,
la amplia mayoría de estos sistemas proporciona cinco canales de
audio regulares y un canal de infragraves de baja frecuencia
(denotado canal de efectos de baja frecuencia o LFE). Tal sistema
multicanal se denota sistema envolvente 5,1. Existen otros sistemas
envolventes, tales como 7,1 (siete canales regulares y un canal
LFE) y 10,2 (diez canales regulares y dos canales LFE).
C. Faller y F. Baumgarte, "Efficient
representation of spatial audio coding using perceptual
parametrization," IEEE Workshop on Appl. of Sig. Proc. to Audio
and Acoust., octubre de 2001, y C. Faller y F. Baumgarte,"Binaural
Cue Coding Applied to Stereo and Multi-Channel
Audio Compression," Preprint 112th Conv. Aud. Eng. Soc., mayo de
2002, (conjuntamente, "los documentos BCC") las enseñanzas de
ambos de los cuales están incorporadas en el presente documento por
referencia, describen una técnica de codificación de audio
multicanal paramétrica (denominada como codificación BCC).
La figura 1 muestra un diagrama de bloques de un
sistema 100 de procesamiento de audio que realiza codificación de
indicación binaural (BCC, Binaural Cue Coding) según los
documentos BCC. El sistema 100 BCC presenta un codificador 102 BCC
que recibe C canales 108 de entrada de audio, por ejemplo, uno desde
cada uno de C micrófonos 106 diferentes. El codificador 102 BCC
presenta un elemento 110 de downmix, que convierte los C canales de
entrada de audio en una señal 112 de suma de audio mono.
Además, el codificador 102 BCC presenta un
analizador 114 BCC, que genera flujo 116 de datos de códigos de
indicación BCC para los C canales de entrada. Los códigos de
indicación BCC (también denominados como parámetros de escena
auditiva) incluyen datos de diferencia de nivel entre canales (ICLD,
Inter-Channel Level Difference) y de
diferencia de tiempo entre canales (ICTD,
Inter-Channel Time Difference) para cada
canal de entrada. El analizador 114 BCC realiza procesamiento
basado en banda para generar datos ICLD e ICTD para cada una de una
o más subbandas de frecuencia diferentes (por ejemplo, bandas
críticas diferentes) de los canales de entrada de audio.
El codificador 102 BCC transmite la señal 112 de
suma y el flujo 116 de datos de códigos de indicación BCC (por
ejemplo, como información lateral o bien en banda o bien fuera de
banda con respecto a la señal de suma) a un descodificador 104 BCC
del sistema 100 BCC. El descodificador 104 BCC presenta un
procesador 118 de información lateral, que procesa el flujo 116 de
datos para recuperar los códigos 120 de indicación BCC (por ejemplo,
datos ICLD e ICTD). El descodificador 104 BCC también presenta un
sintetizador 122 BCC, que utiliza los códigos 120 de indicación BCC
recuperados para sintetizar C canales 126 de salida de audio a
partir de una señal 112 de suma para dar mediante los C altavoces
126, respectivamente.
El sistema 100 de procesamiento de audio puede
implementarse en el contexto de señales de audio multicanal, tales
como sonido envolvente 5,1. En particular, el elemento 110 de
downmix del codificador 102 BCC convertiría los seis canales de
entrada del sonido envolvente 5,1 convencional (es decir, cinco
canales regulares + un canal LFE) en la señal 112 de suma. Además,
el analizador 114 BCC del codificador 102 transformaría los seis
canales de entrada al dominio de la frecuencia para generar los
códigos 116 de indicación BCC correspondientes. Análogamente, el
procesador 118 de información lateral del codificador 104 BCC
recuperaría los códigos 120 de indicación BCC del flujo 116 de
información lateral recibido, y el sintetizador 122 BCC del
descodificador 104 (1) transformaría la señal 112 de suma recibida
al dominio de la frecuencia, (2) aplicaría los códigos 120 de
indicación BCC recuperados a la señal de suma en el dominio de la
frecuencia para generar seis señales en el dominio de la
frecuencia, y (3) transformaría esas señales en el dominio de la
frecuencia en seis canales en el dominio del tiempo de sonido
envolvente 5,1 sintetizado (es decir, cinco canales regulares
sintetizados + un canal LFE sintetizado) para dar mediante los
altavoces 126.
\global\parskip1.000000\baselineskip
Para aplicaciones de sonido envolvente, las
realizaciones de la presente invención implican una técnica de
codificación de audio paramétrica basada en BCC en la que la
codificación BCC basada en banda no se aplica al (a los)
canal(es) de infragraves de baja frecuencia (LFE) para
subbandas de frecuencia por encima de una frecuencia de corte. Por
ejemplo, para sonido envolvente 5,1, la codificación BCC se aplica a
todos los seis canales (es decir, los cinco canales regulares más
el un canal LFE) para subbandas por debajo de la frecuencia de
corte, mientras que la codificación BCC se aplica a sólo los cinco
canales regulares (es decir, y no al canal LFE) para subbandas por
encima de la frecuencia de corte. Evitando la codificación BCC del
canal LFE a "altas" frecuencias, estas realizaciones de la
presente invención (1) han reducido las cargas de procesamiento
tanto en el codificador como en el descodificador y (2) presentan
flujos de bits de códigos BCC más pequeños que los correspondientes
a sistemas basados en BCC que procesan todos los seis canales en
todas las frecuencias.
Más generalmente, la presente invención implica
la aplicación de técnicas de codificación de audio paramétrica,
tales como codificación BCC, pero no necesariamente limitadas a
codificación BCC, en la que dos o más subconjuntos diferentes de
canales de entrada se procesan para dos o más intervalos de
frecuencia diferentes. Tal como se utiliza en esta memoria
descriptiva, el término "subconjunto" puede referirse al
conjunto que contiene todos los canales de entrada así como esos
subconjuntos apropiados que incluyen menos que todos los canales de
entrada. La aplicación de la presente invención a codificación BCC
de 5,1 y otras señales de sonido envolvente es sólo un ejemplo
particular de la presente invención.
\vskip1.000000\baselineskip
Otros aspectos, características, y ventajas de
la presente invención se volverán completamente evidentes a partir
de la siguiente descripción detallada, las reivindicaciones
adjuntas, y los dibujos adjuntos, en los que:
la figura 1 muestra un diagrama de bloques de un
sistema de procesamiento de audio que realiza codificación de
indicación binaural (BCC); y
la figura 2 muestra un diagrama de bloques de un
sistema de procesamiento de audio que realiza codificación BCC
según una realización de la presente invención.
\vskip1.000000\baselineskip
La figura 2 muestra un diagrama de bloques de un
sistema 200 de procesamiento que realiza codificación de indicación
binaural (BCC) para audio envolvente 5,1, según una realización de
la presente invención. El sistema 200 BCC presenta un codificador
202 BCC, que recibe seis canales 208 de entrada de audio (es decir,
cinco canales regulares y un canal LFE). El codificador 202 BCC
presenta un elemento 210 de downmix, que convierte (por ejemplo,
promedia) los canales de entrada de audio (incluyendo el canal LFE)
en uno o más, pero menos de seis, canales 212 combinados.
Además, el codificador 202 BCC presenta un
analizador 214 BCC, que genera un flujo 216 de datos de códigos de
indicación BCC para los canales de entrada. Tal como se indica en la
figura 2, para subbandas de frecuencia en o por debajo de una
frecuencia f_{c} de corte especificada, el analizador 214 BCC
utiliza todos los seis canales de entrada de sonido envolvente 5,1
(incluyendo el canal LFE) cuando genera los datos de códigos de
indicación BCC. Para todas las otras subbandas (es decir, de alta
frecuencia), el analizador 214 BCC utiliza sólo los cinco canales
regulares (y no el canal LFE) para generar los datos de códigos de
indicación BCC. Como resultado, el canal LFE aporta códigos BCC
para sólo subbandas en o por debajo de la frecuencia de corte en
vez de para el intervalo de frecuencia BCC completo, reduciendo así
el tamaño total del flujo de bits de información lateral.
La frecuencia de corte se elige preferiblemente
de tal manera que el ancho de banda de audio efectivo del canal LFE
es menos o igual a f_{c} (es decir, el canal LFE presenta
sustancialmente energía cero o contenido de audio insustancial más
allá de la frecuencia de corte). A menos que las subbandas de
frecuencia están alineadas con la frecuencia de corte, la
frecuencia de corte cae dentro de una subbanda de frecuencia
particular. En ese caso, parte de esa subbanda superará la
frecuencia de corte. Para fines de esta memoria descriptiva, una
subbanda de este tipo se denomina como que está "en" la
frecuencia de corte. En realizaciones preferidas, la totalidad de
esa subbanda del canal LFE se codifica por BCC, y la siguiente
subbanda de frecuencia superior es la primera subbanda de alta
frecuencia que no se codifica por BCC.
En una posible implementación, los códigos de
indicación BCC incluyen datos de diferencia de nivel entre canales
(ICLD), diferencia de tiempo entre canales (ICTD), y correlación
entre canales (ICC, Inter-Channel
Correlation). El analizador 214 BCC realiza preferiblemente
procesamiento basado en banda análogo al descrito en las solicitudes
'411 y '553 para generar datos ICLD e ICTD para diferentes
subbandas de frecuencia de los canales de entrada de audio. Además,
el analizador 214 BCC genera preferiblemente medidas de coherencia
tales como los datos ICC para las diferentes subbandas de
frecuencia. Estas medidas de coherencia se describen en mayor
detalle en las solicitudes '130 y '579.
El codificador 202 BCC transmite el uno o más
canales 212 combinados y el flujo 216 de datos de códigos de
indicación BCC (por ejemplo, como información lateral o bien en
banda o bien fuera de banda con respecto a los canales combinados)
a un descodificador 204 BCC del sistema 200 BCC. El descodificador
204 BCC presenta un procesador 218 de información lateral, que
procesa el flujo 216 de datos para recuperar los códigos 220 de
indicación BCC (por ejemplo, datos ICLD, ICTD, e ICC). El
descodificador 204 BCC también presenta un sintetizador 222 BCC,
que utiliza los códigos 220 de indicación BCC recuperados para
sintetizar seis canales 224 de salida de audio a partir del uno o
más canales 212 combinados para dar mediante seis altavoces 226 de
sonido envolvente, respectivamente.
Tal como se indica en la figura 2, el
sintetizador 22 realiza síntesis BCC de seis canales para subbandas
en o por debajo de la frecuencia f_{c} de corte para generar
contenido de frecuencia para todos los seis canales envolventes 5,1
(es decir, incluyendo el canal LFE), mientras que realiza síntesis
BCC de cinco canales para subbandas por encima de la frecuencia de
corte para generar contenido de frecuencia para sólo los cinco
canales regulares del sonido envolvente 5,1. En particular, el
sintetizador 222 BCC descompone el (los) canal(es) 212
combinado(s) recibido(s) en un número de subbandas de
frecuencia (por ejemplo, bandas críticas). En estas subbandas, se
aplica diferente procesamiento para obtener las subbandas
correspondientes de los canales de audio de salida. El resultado es
que, para el canal LFE, sólo se obtienen subbandas con frecuencias
en o por debajo de la frecuencia de corte. Dicho de otro modo, el
canal LFE presenta contenido de frecuencia sólo para subbandas en o
por debajo de la frecuencia de corte. Las subbandas superiores del
canal LFE (es decir, aquellas por encima de la frecuencia de corte)
pueden llenarse con señales cero (si es necesario).
Dependiendo de la implementación particular, un
codificador BCC podría diseñarse para generar códigos de indicación
BCC para todas las frecuencias y simplemente no transmitir aquellos
códigos para subbandas particulares (por ejemplo, subbandas por
encima de la frecuencia de corte y/o subbandas que presentan energía
cero sustancialmente). De manera similar, el descodificador BCC
correspondiente podría diseñarse para realizar síntesis BCC
convencional para todas las frecuencias, donde el descodificador
BCC aplica valores de códigos de indicación BCC apropiados para
aquellas subbandas que no presentan códigos transmitidos de manera
explícita.
Aunque la presente invención se ha descrito en
el contexto de descodificadores BCC que aplican las técnicas de las
solicitudes '411 y '553 para sintetizar escenas auditivas, la
presente invención también puede implementarse en el contexto de
descodificadores BCC que aplican otras técnicas para sintetizar
escenas auditivas que no se basan necesariamente en las técnicas de
las solicitudes '441 y '553. Por ejemplo, el procesamiento BCC de
la presente invención puede implementarse sin datos ICTD, ICLD, y/o
ICC, con o sin otros códigos de indicación adecuados, tales como,
por ejemplo, aquellos asociados con funciones de transferencia
relacionadas con la parte de cabeza.
En la realización de la figura 2, se codifica
sonido envolvente 5,1 aplicando análisis BCC de seis canales a
subbandas en o por debajo de la frecuencia de corte y análisis BCC
de cinco canales a subbandas por encima de la frecuencia de corte.
En otra realización, la presente invención puede aplicarse a sonido
envolvente 7,1 en el que se aplica análisis BCC de ocho canales a
subbandas en o por debajo de una frecuencia de corte especificada y
se aplica análisis BCC de siete canales (excluyendo el único canal
LFE) a subbandas por encima de la frecuencia de corte.
La presente invención también puede aplicarse a
audio envolvente que presenta más de un canal LFE. Por ejemplo,
para sonido envolvente 10,2, podría aplicarse análisis BCC de doce
canales a subbandas en o por debajo de una frecuencia de corte
especificada, mientras que podría aplicarse análisis BCC de diez
canales (excluyendo los dos canales LFE) a subbandas por encima de
la frecuencia de corte. Como alternativa, podría haber dos
frecuencias de corte diferentes especificadas: una primera
frecuencia de corte para un primer canal LFE del sonido envolvente
10,2 y una segunda frecuencia de corte para el segundo canal LFE. En
este caso y suponiendo que la primera frecuencia de corte es menor
que la segunda frecuencia de corte, podría aplicarse análisis BCC
de doce canales a subbandas en o por debajo de la primera frecuencia
de corte, podría aplicarse análisis BCC de once canales (excluyendo
el primer canal LFE) a subbandas que están (1) por encima de la
primera frecuencia de corte y (2) en o por debajo de la segunda
frecuencia de corte, y podría aplicarse análisis BCC de diez
canales (excluyendo ambos canales LFE) a subbandas por encima de la
segunda frecuencia de corte.
De manera similar, algunos equipos multicanal de
consumo están diseñados a propósito con diferentes canales de
salida que presentan diferentes intervalos de frecuencia. Por
ejemplo, algunos equipos de sonido envolvente 5,1 presentan dos
canales posteriores que están diseñados para reproducir sólo
frecuencias por debajo de 7 kHz. La presente invención podría
aplicarse a sistemas de este tipo especificando dos frecuencias de
corte: una para el canal LFE y una mayor para los canales
posteriores. En este caso, podría aplicarse análisis BCC de seis
canales a subbandas en o por debajo de la frecuencia de corte de
LFE, podría aplicarse análisis BCC de cinco canales (excluyendo el
canal LFE) a subbandas que están (1) por encima de la frecuencia de
corte de LFE y (2) en o por debajo de la frecuencia de corte de los
canales posteriores, y podría aplicarse análisis BCC de tres
canales (excluyendo el canal LFE y los dos canales posteriores) a
subbandas por encima de la frecuencia de corte de los canales
posteriores.
La presente invención puede generalizarse además
para aplicar codificación de audio paramétrica a dos o más
subconjuntos diferentes de canales de entrada para dos o más
regiones de frecuencia diferentes, en la que la codificación de
audio paramétrica podría ser distinta a la codificación BCC y las
diferentes regiones de frecuencia se eligen de tal manera que el
contenido de frecuencia de los diferentes canales de entrada se
refleja en estas regiones. Dependiendo de la aplicación particular,
podrían excluirse diferentes canales de diferentes regiones de
frecuencia en cualquier combinación apropiada. Por ejemplo, los
canales de baja frecuencia podrían excluirse de las regiones de
alta frecuencia y/o los canales de alta frecuencia podrían excluirse
de las regiones de baja frecuencia. Incluso puede darse el caso de
que ninguna región de frecuencia única implique todos los canales
de entrada.
Tal como se describió previamente, aunque se
puede realizar downmix sobre los canales 208 de entrada para formar
un único canal 212 combinado (por ejemplo, mono), en
implementaciones alternativas, puede realizarse downmix sobre los
múltiples canales de entrada para formar dos o más canales
"combinados" diferentes, dependiendo de la aplicación de
procesamiento de audio particular. Puede encontrarse más información
de tales técnicas en la solicitud de patente estadounidense
US-A-2 005 157 883, presentada el
20/01/04, publicada el 21/07/2005.
En algunas implementaciones, cuando el downmix
genera múltiples canales combinados, los datos de canales combinados
pueden transmitirse utilizando técnicas de transmisión de audio
convencionales. Por ejemplo, cuando se generan dos canales
combinados, puede que puedan emplearse técnicas de transmisión
estéreo convencionales. En este caso, un descodificador BCC puede
extraer y utilizar los códigos BCC para sintetizar una señal
multicanal (por ejemplo, sonido envolvente 5,1) a partir de dos
canales combinados. Además, esto puede proporcionar
retrocompatibilidad, donde los dos canales combinados por BCC se
reproducen utilizando descodificadores estéreos convencionales (es
decir, no basados en BCC) que ignoran los códigos BCC. Análogamente,
la retrocompatibilidad puede conseguirse para un descodificador
mono convencional cuando se genera un único canal combinado por BCC.
Obsérvese que, en teoría, cuando hay múltiples canales
"combinados", uno o más de los canales combinados pueden
basarse realmente en canales de entrada individuales.
Aunque el sistema 200 BCC puede presentar el
mismo número de canales de entrada de audio que de canales de
salida de audio, en realizaciones alternativas, el número de canales
de entrada podría ser o bien mayor o bien menor que el número de
canales de salida, dependiendo de la aplicación particular. Por
ejemplo, el audio de entrada podría corresponder a sonido
envolvente 7,1 y el audio de salida sintetizado podría corresponder
a sonido envolvente 5,1, o viceversa.
En general, los codificadores BCC de la presente
invención pueden implementarse en el contexto de convertir M
canales de audio de entrada en N canales de audio combinados y uno o
más conjuntos correspondientes de códigos BCC, donde M>N\geq1.
De manera similar, los descodificadores BCC de la presente invención
pueden implementarse en el contexto de generar P canales de audio
de salida a partir de los N canales de audio combinados y los
conjuntos correspondientes de códigos BCC, donde P>N, y P puede
igual a o diferente de M.
Dependiendo de la implementación particular, las
diversas señales recibidas y generadas por tanto el codificador 202
BCC como el descodificador 204 BCC de la figura 2 pueden ser
cualquier combinación adecuada de señales analógicas y/o digitales,
incluyendo todas analógicas o todas digitales. Aunque no se muestra
en la figura 2, los expertos en la técnica apreciarán que el uno o
más canales 212 combinados y el flujo 216 de datos de códigos de
indicación BCC pueden codificarse adicionalmente mediante el
codificador 202 BCC y descodificarse en consecuencia mediante el
descodificador 204 BCC, por ejemplo, basándose en algún esquema de
compresión apropiado (por ejemplo, ADPCM) para reducir
adicionalmente el tamaño de los datos transmitidos.
La definición de transmisión de datos desde el
codificador 202 BCC hasta el descodificador 204 BCC dependerá de la
aplicación particular del sistema 200 de procesamiento de audio. Por
ejemplo, en algunas aplicaciones, tales como emisiones en directo
de conciertos de música, la transmisión puede implicar transmisión
en tiempo real de los datos para la reproducción inmediata en una
ubicación remota. En otras aplicaciones, "transmisión" puede
implicar almacenamiento de los datos en CD u otros medios de
almacenamiento adecuados para la reproducción posterior (es decir,
en tiempo no real). Por supuesto también pueden ser posibles otras
aplicaciones.
Dependiendo de la implementación particular, los
canales de transmisión pueden ser cableados o inalámbricos y pueden
utilizar protocolos personalizados o estandarizados (por ejemplo,
IP). Pueden utilizarse para el almacenamiento medios como CD, DVD,
grabadoras de cinta digital, y memorias de estado sólido. Además, la
transmisión y/o el almacenamiento pueden, pero no necesitan,
incluir codificación de canales. De manera similar, aunque la
presente invención se ha descrito en el contexto de sistemas de
audio digital, los expertos en la técnica entenderán que la
presente invención también puede implementarse en el contexto de
sistemas de audio analógico, tales como radio AM, radio FM, y la
parte de audio de emisión de televisión analógica, cada uno de los
cuales soporta la inclusión de un canal de transmisión de baja tasa
de bits en banda adicional.
La presente invención puede implementarse para
muchas aplicaciones diferentes, tales como reproducción de música,
radiodifusión, y telefonía. Por ejemplo, la presente invención puede
implementarse para emisión de radio/TV/Internet digitales (por
ejemplo, difusión por Internet ("Webcast")) tales como
Sirius Satellite Radio o XM. Otras aplicaciones incluyen voz sobre
IP, PSTN y otras redes de voz, emisión de radio analógica, y radio
por Internet.
Dependiendo de la aplicación particular, pueden
emplearse diferentes técnicas para embeber los conjuntos de códigos
BCC en un canal combinado para conseguir una señal BCC de la
presente invención. La disponibilidad de cualquier técnica
particular puede depender, al menos en parte, del (de los)
medio(s) de transmisión/almacenamiento particular(es)
utilizado(s) para la señal BCC. Por ejemplo, los protocolos
para emisión de radio digital soportan normalmente la inclusión de
bits de mejora adicionales (por ejemplo, en la parte de cabecera de
paquetes de datos) que los receptores convencionales ignoran. Estos
bits adicionales pueden utilizarse para representar los conjuntos
de parámetros de escenas auditivas para proporcionar una señal BCC.
En general, la presente invención puede implementarse utilizando
cualquier técnica adecuada para realizar marca de agua digital sobre
señales de audio en las que los datos correspondientes a los
conjuntos de parámetros de escenas auditivas están embebidos en la
señal de audio para formar una señal BCC. Por ejemplo, estas
técnicas pueden implicar ocultación de datos bajo curvas de
enmascaramiento de percepción u ocultación de datos en ruido
pseudoaleatorio. El ruido pseudoaleatorio puede percibirse como
ruido aceptable. El embeber los datos también puede implementarse
utilizando métodos similares al robo de bits ("bit
robbing") utilizado en transmisión TDM (multiplexación por
división de tiempo, Time Division Multiplexing) para
señalización en banda. Otra posible técnica es inversión de bits
("bit flipping") LSB de ley mu, donde los bits menos
significativos se utilizan para transmitir datos.
La presente invención puede implementarse como
procesos basados en circuitos, incluyendo posible implementaciones
sobre un único circuito integrado. Tal como sería evidente para un
experto en la técnica, también pueden implementarse diversas
funciones de elementos de circuito como etapas de procesamiento en
un programa de software. Tal software puede emplearse en, por
ejemplo, un procesador de señal digital, microcontrolador u
ordenador de propósito general.
La presente invención puede realizarse en la
forma de métodos y aparatos para poner en práctica esos métodos. La
presente invención también puede realizarse en la forma de código de
programa realizado en medios tangibles, tales como disquetes,
CD-ROM, discos duros, o cualquier otro medio de
almacenamiento legible por máquina, en los que, cuando el código de
programa se carga en y se ejecuta por una máquina, tal como un
ordenador, la máquina se vuelve un aparato para poner en práctica
la invención. La presente invención también puede realizarse en la
forma de código de programa, por ejemplo, o bien almacenado en un
medio de almacenamiento, cargado en y/o ejecutado por una máquina,
o bien transmitido sobre algún medio o portador de transmisión, tal
como sobre cableado o alambrado eléctrico, a través de fibra
óptica, o a través de radiación electromagnética, en la que, cuando
el código de programa se carga en y se ejecuta por una máquina, tal
como un ordenador, la máquina se vuelve un aparato para poner en
práctica la invención. Cuando se implementa sobre un procesador de
propósito general, los segmentos del código de programa se combinan
con el procesador para proporcionar un dispositivo único que
funciona análogamente a circuitos lógicos específicos.
Además se entenderá que los expertos en la
técnica pueden realizar diversos cambios en los detalles,
materiales, y disposiciones de las partes que se han descrito e
ilustrado con el fin de explicar la naturaleza de esta invención
sin apartarse del alcance de la invención tal como se expresa en las
siguientes reivindicaciones.
Claims (22)
-
\global\parskip0.900000\baselineskip
1. Método para codificar una señal de audio multicanal que presenta una pluralidad de canales de entrada de audio, comprendiendo el método:aplicar una técnica de codificación de audio paramétrica para generar códigos de audio paramétricos para un primer subconjunto de los canales de entrada de audio para una primera región de frecuencia; yaplicar la técnica de codificación de audio paramétrica para generar códigos de audio paramétricos para un segundo subconjunto de los canales de entrada de audio para una segunda región de frecuencia, en el que:- la segunda región de frecuencia es diferente de la primera región de frecuencia; y
- el segundo subconjunto es diferente del primer subconjunto.
- 2. Método según la reivindicación 1, en el que la técnica de codificación de audio paramétrica es codificación de tipo codificación de indicación binaural (BCC).
- 3. Método según la reivindicación 1, en el que:la señal de audio multicanal es una señal de sonido envolvente que presenta una pluralidad de canales regulares y al menos un canal de baja frecuencia (LFE);el primer subconjunto incluye todos los canales de entrada de audio;la primera región de frecuencia corresponde a subbandas en o por debajo de una frecuencia de corte especificada;el segundo subconjunto excluye el canal LFE; yla segunda región de frecuencia corresponde a subbandas por encima de la frecuencia de corte.
- 4. Método según la reivindicación 3, en el que la técnica de codificación de audio paramétrica es codificación BCC.
- 5. Método según la reivindicación 3, en el que la frecuencia de corte es al menos el ancho de banda de audio efectivo del canal LFE.
- 6. Método según la reivindicación 3, en el que la señal de audio multicanal es una señal de sonido envolvente 5,1.
- 7. Método según la reivindicación 1, que comprende además transmitir los códigos de audio paramétricos para el primer y segundo subconjuntos de canales de entrada de audio.
- 8. Aparato para codificar una señal de audio multicanal que presenta una pluralidad de canales de entrada de audio, comprendiendo el aparato:medios para aplicar una técnica de codificación de audio paramétrica para generar códigos de audio paramétricos para un primer subconjunto de los canales de entrada de audio para una primera región de frecuencia; ymedios para aplicar la técnica de codificación de audio paramétrica para generar códigos de audio paramétricos para un segundo subconjunto de los canales de entrada de audio para una segunda región de frecuencia, en el que:
- la segunda región de frecuencia es diferente de la primera región de frecuencia; y
- el segundo subconjunto es diferente del primer subconjunto.
- 9. Codificador de audio paramétrico, que comprende:un elemento de downmix adaptado para generar uno o más canales combinados a partir de una pluralidad de canales de entrada de audio de una señal de audio multicanal; yun analizador adaptado para generar:
- (1)
- códigos de audio paramétricos para un primer subconjunto de los canales de salida de audio en una primera región de frecuencia; y
- (2)
- códigos de audio paramétricos para un segundo subconjunto de los canales de salida de audio en una segunda región de frecuencia, en el que:
- la segunda región de frecuencia es diferente de la primera región de frecuencia; y
- el segundo subconjunto es diferente del primer subconjunto.
\global\parskip1.000000\baselineskip
- 10. Codificador según la reivindicación 9, en el que los códigos de audio paramétricos son códigos BCC.
- 11. Codificador según la reivindicación 9, en el que:la señal de audio multicanal es una señal de sonido envolvente que presenta una pluralidad de canales regulares y al menos un canal LFE;el primer subconjunto incluye todos los canales de salida de audio;la primera región de frecuencia corresponde a subbandas en o por debajo de una frecuencia de corte especificada;el segundo subconjunto excluye el canal LFE; yla segunda región de frecuencia corresponde a subbandas por encima de la frecuencia de corte.
- 12. Codificador según la reivindicación 9, codificador de audio paramétrico que además está adaptado para transmitir los códigos de audio paramétricos para el primer y segundo subconjuntos de canales de entrada de audio.
- 13. Método para sintetizar una señal de audio multicanal que presenta una pluralidad de canales de salida de audio, comprendiendo el método:aplicar una técnica de descodificación de audio paramétrica para generar un primer subconjunto de los canales de salida de audio para una primera región de frecuencia; yaplicar la técnica de descodificación de audio paramétrica para generar un segundo subconjunto de los canales de salida de audio para una segunda región de frecuencia, en el que:
- la segunda región de frecuencia es diferente de la primera región de frecuencia; y
- el segundo subconjunto es diferente del primer subconjunto.
- 14. Invención según la reivindicación 13, en la que la técnica de descodificación de audio paramétrica es descodificación BCC.
- 15. Invención según la reivindicación 13, en la que:la señal de audio multicanal es una señal de sonido envolvente que presenta una pluralidad de canales regulares y al menos un canal LFE;el primer subconjunto incluye todos los canales de salida de audio;la primera región de frecuencia corresponde a subbandas en o por debajo de una frecuencia de corte especificada;el segundo subconjunto excluye el canal LFE; yla segunda región de frecuencia corresponde a subbandas por encima de la frecuencia de corte.
- 16. Invención según la reivindicación 15, en la que la técnica de descodificación de audio paramétrica es descodificación BCC.
- 17. Invención según la reivindicación 15, en la que la frecuencia de corte es al menos el ancho de banda de audio efectivo del canal LFE.
- 18. Invención según la reivindicación 15, en la que la señal de audio multicanal es una señal de sonido envolvente 5,1.
- 19. Aparato para sintetizar una señal de audio multicanal que presenta una pluralidad de canales de salida de audio, comprendiendo el aparato:medios para aplicar una técnica de descodificación de audio paramétrica para generar un primer subconjunto de los canales de salida de audio para una primera región de frecuencia; ymedios para aplicar la técnica de descodificación de audio paramétrica para generar un segundo subconjunto de los canales de salida de audio para una segunda región de frecuencia, en el que:
- la segunda región de frecuencia es diferente de la primera región de frecuencia; y
- el segundo subconjunto es diferente del primer subconjunto.
- 20. Descodificador de audio paramétrico, que comprende:un procesador de códigos paramétricos adaptado para generar códigos paramétricos; yel aparato para sintetizar según la reivindicación 19.
- 21. Descodificador según la reivindicación 20, en el que los códigos paramétricos son códigos BCC.
- 22. Descodificador según la reivindicación 20, en el que:la señal de audio multicanal es una señal de sonido envolvente que presenta una pluralidad de canales regulares y al menos un canal LFE;el primer subconjunto incluye todos los canales de salida de audio;la primera región de frecuencia corresponde a subbandas en o por debajo de una frecuencia de corte especificada;el segundo subconjunto excluye el canal LFE; yla segunda región de frecuencia corresponde a subbandas por encima de la frecuencia de corte.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US54997204P | 2004-03-04 | 2004-03-04 | |
US549972P | 2004-03-04 | ||
US10/827,900 US7805313B2 (en) | 2004-03-04 | 2004-04-20 | Frequency-based coding of channels in parametric multi-channel coding systems |
US827900 | 2004-04-20 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2293556T3 true ES2293556T3 (es) | 2008-03-16 |
Family
ID=34915657
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES05723489T Active ES2293556T3 (es) | 2004-03-04 | 2005-02-23 | Codificacion basada en frecuencia de canales de audio en sistemas de codificacion multicanal parametrica. |
Country Status (16)
Country | Link |
---|---|
US (1) | US7805313B2 (es) |
EP (1) | EP1721489B1 (es) |
JP (1) | JP4418493B2 (es) |
KR (1) | KR100717598B1 (es) |
AT (1) | ATE373402T1 (es) |
AU (1) | AU2005226536B2 (es) |
BR (1) | BRPI0508146B1 (es) |
CA (1) | CA2557993C (es) |
DE (1) | DE602005002463T2 (es) |
ES (1) | ES2293556T3 (es) |
HK (1) | HK1101634A1 (es) |
MX (1) | MXPA06009931A (es) |
NO (1) | NO340421B1 (es) |
PT (1) | PT1721489E (es) |
TW (1) | TWI376967B (es) |
WO (1) | WO2005094125A1 (es) |
Families Citing this family (72)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
KR20070001139A (ko) * | 2004-02-17 | 2007-01-03 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들 |
DE602005006777D1 (de) * | 2004-04-05 | 2008-06-26 | Koninkl Philips Electronics Nv | Mehrkanal-codierer |
KR101183862B1 (ko) * | 2004-04-05 | 2012-09-20 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 스테레오 신호를 처리하기 위한 방법 및 디바이스, 인코더 장치, 디코더 장치 및 오디오 시스템 |
SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
CN1922655A (zh) * | 2004-07-06 | 2007-02-28 | 松下电器产业株式会社 | 音频信号编码装置、音频信号解码装置、方法及程序 |
EP1769491B1 (en) * | 2004-07-14 | 2009-09-30 | Koninklijke Philips Electronics N.V. | Audio channel conversion |
JP4892184B2 (ja) * | 2004-10-14 | 2012-03-07 | パナソニック株式会社 | 音響信号符号化装置及び音響信号復号装置 |
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
JP4988717B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
WO2006126843A2 (en) * | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding audio signal |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US20080221907A1 (en) * | 2005-09-14 | 2008-09-11 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
US20080255857A1 (en) * | 2005-09-14 | 2008-10-16 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
KR100803212B1 (ko) * | 2006-01-11 | 2008-02-14 | 삼성전자주식회사 | 스케일러블 채널 복호화 방법 및 장치 |
KR101218776B1 (ko) * | 2006-01-11 | 2013-01-18 | 삼성전자주식회사 | 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체 |
EP1974344A4 (en) * | 2006-01-19 | 2011-06-08 | Lg Electronics Inc | METHOD AND APPARATUS FOR DECODING A SIGNAL |
US8411869B2 (en) * | 2006-01-19 | 2013-04-02 | Lg Electronics Inc. | Method and apparatus for processing a media signal |
US9426596B2 (en) | 2006-02-03 | 2016-08-23 | Electronics And Telecommunications Research Institute | Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue |
KR100878816B1 (ko) * | 2006-02-07 | 2009-01-14 | 엘지전자 주식회사 | 부호화/복호화 장치 및 방법 |
US20090177479A1 (en) * | 2006-02-09 | 2009-07-09 | Lg Electronics Inc. | Method for Encoding and Decoding Object-Based Audio Signal and Apparatus Thereof |
DE602007004451D1 (de) | 2006-02-21 | 2010-03-11 | Koninkl Philips Electronics Nv | Audiokodierung und audiodekodierung |
KR100904437B1 (ko) * | 2006-02-23 | 2009-06-24 | 엘지전자 주식회사 | 오디오 신호의 처리 방법 및 장치 |
KR100773560B1 (ko) | 2006-03-06 | 2007-11-05 | 삼성전자주식회사 | 스테레오 신호 생성 방법 및 장치 |
KR100773562B1 (ko) | 2006-03-06 | 2007-11-07 | 삼성전자주식회사 | 스테레오 신호 생성 방법 및 장치 |
FR2899423A1 (fr) * | 2006-03-28 | 2007-10-05 | France Telecom | Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme. |
US7965848B2 (en) * | 2006-03-29 | 2011-06-21 | Dolby International Ab | Reduced number of channels decoding |
US8626515B2 (en) * | 2006-03-30 | 2014-01-07 | Lg Electronics Inc. | Apparatus for processing media signal and method thereof |
ATE527833T1 (de) * | 2006-05-04 | 2011-10-15 | Lg Electronics Inc | Verbesserung von stereo-audiosignalen mittels neuabmischung |
KR100763920B1 (ko) * | 2006-08-09 | 2007-10-05 | 삼성전자주식회사 | 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치 |
US20080235006A1 (en) | 2006-08-18 | 2008-09-25 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
US20100040135A1 (en) * | 2006-09-29 | 2010-02-18 | Lg Electronics Inc. | Apparatus for processing mix signal and method thereof |
CN101617360B (zh) | 2006-09-29 | 2012-08-22 | 韩国电子通信研究院 | 用于编码和解码具有各种声道的多对象音频信号的设备和方法 |
EP2084901B1 (en) * | 2006-10-12 | 2015-12-09 | LG Electronics Inc. | Apparatus for processing a mix signal and method thereof |
KR100891670B1 (ko) | 2006-10-13 | 2009-04-02 | 엘지전자 주식회사 | 신호 처리 방법 및 장치 |
SG175632A1 (en) * | 2006-10-16 | 2011-11-28 | Dolby Sweden Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
JP5337941B2 (ja) * | 2006-10-16 | 2013-11-06 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル・パラメータ変換のための装置および方法 |
EP2092516A4 (en) * | 2006-11-15 | 2010-01-13 | Lg Electronics Inc | METHOD AND APPARATUS FOR AUDIO SIGNAL DECODING |
US8265941B2 (en) * | 2006-12-07 | 2012-09-11 | Lg Electronics Inc. | Method and an apparatus for decoding an audio signal |
KR101111520B1 (ko) * | 2006-12-07 | 2012-05-24 | 엘지전자 주식회사 | 오디오 처리 방법 및 장치 |
CN101578656A (zh) * | 2007-01-05 | 2009-11-11 | Lg电子株式会社 | 用于处理音频信号的装置和方法 |
KR20090115200A (ko) * | 2007-02-13 | 2009-11-04 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
US20100121470A1 (en) * | 2007-02-13 | 2010-05-13 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
US20100241434A1 (en) * | 2007-02-20 | 2010-09-23 | Kojiro Ono | Multi-channel decoding device, multi-channel decoding method, program, and semiconductor integrated circuit |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8184726B2 (en) * | 2007-09-10 | 2012-05-22 | Industrial Technology Research Institute | Method and apparatus for multi-rate control in a multi-channel communication system |
KR101464977B1 (ko) * | 2007-10-01 | 2014-11-25 | 삼성전자주식회사 | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 |
US8249883B2 (en) | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
EP2215627B1 (en) * | 2007-11-27 | 2012-09-19 | Nokia Corporation | An encoder |
WO2009075510A1 (en) * | 2007-12-09 | 2009-06-18 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
KR101441898B1 (ko) * | 2008-02-01 | 2014-09-23 | 삼성전자주식회사 | 주파수 부호화 방법 및 장치와 주파수 복호화 방법 및 장치 |
US9111525B1 (en) * | 2008-02-14 | 2015-08-18 | Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) | Apparatuses, methods and systems for audio processing and transmission |
JP5668923B2 (ja) * | 2008-03-14 | 2015-02-12 | 日本電気株式会社 | 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム |
US8509092B2 (en) * | 2008-04-21 | 2013-08-13 | Nec Corporation | System, apparatus, method, and program for signal analysis control and signal control |
US20100223061A1 (en) * | 2009-02-27 | 2010-09-02 | Nokia Corporation | Method and Apparatus for Audio Coding |
CN102656627B (zh) * | 2009-12-16 | 2014-04-30 | 诺基亚公司 | 多信道音频处理方法和装置 |
US12002476B2 (en) | 2010-07-19 | 2024-06-04 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
CN104050969A (zh) | 2013-03-14 | 2014-09-17 | 杜比实验室特许公司 | 空间舒适噪声 |
WO2014147441A1 (en) * | 2013-03-20 | 2014-09-25 | Nokia Corporation | Audio signal encoder comprising a multi-channel parameter selector |
EP3023984A4 (en) * | 2013-07-15 | 2017-03-08 | Electronics and Telecommunications Research Institute | Encoder and encoding method for multichannel signal, and decoder and decoding method for multichannel signal |
KR101841380B1 (ko) | 2014-01-13 | 2018-03-22 | 노키아 테크놀로지스 오와이 | 다중-채널 오디오 신호 분류기 |
WO2015147434A1 (ko) * | 2014-03-25 | 2015-10-01 | 인텔렉추얼디스커버리 주식회사 | 오디오 신호 처리 장치 및 방법 |
CN104064194B (zh) * | 2014-06-30 | 2017-04-26 | 武汉大学 | 用于提高三维音频空间感距离感的参数编解码方法及系统 |
CN106471575B (zh) | 2014-07-01 | 2019-12-10 | 韩国电子通信研究院 | 多信道音频信号处理方法及装置 |
WO2016003206A1 (ko) * | 2014-07-01 | 2016-01-07 | 한국전자통신연구원 | 다채널 오디오 신호 처리 방법 및 장치 |
US10121487B2 (en) * | 2016-11-18 | 2018-11-06 | Samsung Electronics Co., Ltd. | Signaling processor capable of generating and synthesizing high frequency recover signal |
US11765536B2 (en) | 2018-11-13 | 2023-09-19 | Dolby Laboratories Licensing Corporation | Representing spatial audio by means of an audio signal and associated metadata |
WO2020232631A1 (zh) * | 2019-05-21 | 2020-11-26 | 深圳市汇顶科技股份有限公司 | 一种语音分频传输方法、源端、播放端、源端电路和播放端电路 |
Family Cites Families (81)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4236039A (en) * | 1976-07-19 | 1980-11-25 | National Research Development Corporation | Signal matrixing for directional reproduction of sound |
US4815132A (en) * | 1985-08-30 | 1989-03-21 | Kabushiki Kaisha Toshiba | Stereophonic voice signal transmission system |
DE3639753A1 (de) * | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
DE3943881B4 (de) * | 1989-04-17 | 2008-07-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Digitales Codierverfahren |
WO1992012607A1 (en) * | 1991-01-08 | 1992-07-23 | Dolby Laboratories Licensing Corporation | Encoder/decoder for multidimensional sound fields |
DE4209544A1 (de) * | 1992-03-24 | 1993-09-30 | Inst Rundfunktechnik Gmbh | Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale |
US5703999A (en) * | 1992-05-25 | 1997-12-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Process for reducing data in the transmission and/or storage of digital signals from several interdependent channels |
DE4236989C2 (de) * | 1992-11-02 | 1994-11-17 | Fraunhofer Ges Forschung | Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle |
US5371799A (en) * | 1993-06-01 | 1994-12-06 | Qsound Labs, Inc. | Stereo headphone sound source localization system |
US5463424A (en) * | 1993-08-03 | 1995-10-31 | Dolby Laboratories Licensing Corporation | Multi-channel transmitter/receiver system providing matrix-decoding compatible signals |
JP3227942B2 (ja) | 1993-10-26 | 2001-11-12 | ソニー株式会社 | 高能率符号化装置 |
DE4409368A1 (de) * | 1994-03-18 | 1995-09-21 | Fraunhofer Ges Forschung | Verfahren zum Codieren mehrerer Audiosignale |
JP3277679B2 (ja) * | 1994-04-15 | 2002-04-22 | ソニー株式会社 | 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置 |
JPH0969783A (ja) | 1995-08-31 | 1997-03-11 | Nippon Steel Corp | オーディオデータ符号化装置 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5771295A (en) * | 1995-12-26 | 1998-06-23 | Rocktron Corporation | 5-2-5 matrix system |
US7012630B2 (en) * | 1996-02-08 | 2006-03-14 | Verizon Services Corp. | Spatial sound conference system and apparatus |
DE69734543T2 (de) * | 1996-02-08 | 2006-07-20 | Koninklijke Philips Electronics N.V. | Mit 2-kanal- und 1-kanal-übertragung kompatible n-kanalübertragung |
US5825776A (en) * | 1996-02-27 | 1998-10-20 | Ericsson Inc. | Circuitry and method for transmitting voice and data signals upon a wireless communication channel |
US5889843A (en) * | 1996-03-04 | 1999-03-30 | Interval Research Corporation | Methods and systems for creating a spatial auditory environment in an audio conference system |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
KR0175515B1 (ko) * | 1996-04-15 | 1999-04-01 | 김광호 | 테이블 조사 방식의 스테레오 구현 장치와 방법 |
US6987856B1 (en) * | 1996-06-19 | 2006-01-17 | Board Of Trustees Of The University Of Illinois | Binaural signal processing techniques |
US6697491B1 (en) * | 1996-07-19 | 2004-02-24 | Harman International Industries, Incorporated | 5-2-5 matrix encoder and decoder system |
JP3707153B2 (ja) | 1996-09-24 | 2005-10-19 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置 |
SG54379A1 (en) * | 1996-10-24 | 1998-11-16 | Sgs Thomson Microelectronics A | Audio decoder with an adaptive frequency domain downmixer |
SG54383A1 (en) * | 1996-10-31 | 1998-11-16 | Sgs Thomson Microelectronics A | Method and apparatus for decoding multi-channel audio data |
US5912976A (en) * | 1996-11-07 | 1999-06-15 | Srs Labs, Inc. | Multi-channel audio enhancement system for use in recording and playback and methods for providing same |
US6131084A (en) * | 1997-03-14 | 2000-10-10 | Digital Voice Systems, Inc. | Dual subframe quantization of spectral magnitudes |
US6111958A (en) * | 1997-03-21 | 2000-08-29 | Euphonics, Incorporated | Audio spatial enhancement apparatus and methods |
US6236731B1 (en) * | 1997-04-16 | 2001-05-22 | Dspfactory Ltd. | Filterbank structure and method for filtering and separating an information signal into different bands, particularly for audio signal in hearing aids |
US5860060A (en) * | 1997-05-02 | 1999-01-12 | Texas Instruments Incorporated | Method for left/right channel self-alignment |
US5946352A (en) * | 1997-05-02 | 1999-08-31 | Texas Instruments Incorporated | Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain |
US6108584A (en) * | 1997-07-09 | 2000-08-22 | Sony Corporation | Multichannel digital audio decoding method and apparatus |
DE19730130C2 (de) * | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
US5890125A (en) * | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
US6021389A (en) * | 1998-03-20 | 2000-02-01 | Scientific Learning Corp. | Method and apparatus that exaggerates differences between sounds to train listener to recognize and identify similar sounds |
US6016473A (en) | 1998-04-07 | 2000-01-18 | Dolby; Ray M. | Low bit-rate spatial coding method and system |
TW444511B (en) | 1998-04-14 | 2001-07-01 | Inst Information Industry | Multi-channel sound effect simulation equipment and method |
JP3657120B2 (ja) * | 1998-07-30 | 2005-06-08 | 株式会社アーニス・サウンド・テクノロジーズ | 左,右両耳用のオーディオ信号を音像定位させるための処理方法 |
JP2000152399A (ja) * | 1998-11-12 | 2000-05-30 | Yamaha Corp | 音場効果制御装置 |
US6408327B1 (en) * | 1998-12-22 | 2002-06-18 | Nortel Networks Limited | Synthetic stereo conferencing over LAN/WAN |
US6282631B1 (en) * | 1998-12-23 | 2001-08-28 | National Semiconductor Corporation | Programmable RISC-DSP architecture |
US6539357B1 (en) * | 1999-04-29 | 2003-03-25 | Agere Systems Inc. | Technique for parametric coding of a signal containing information |
JP4438127B2 (ja) | 1999-06-18 | 2010-03-24 | ソニー株式会社 | 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体 |
US6823018B1 (en) * | 1999-07-28 | 2004-11-23 | At&T Corp. | Multiple description coding communication system |
US6434191B1 (en) * | 1999-09-30 | 2002-08-13 | Telcordia Technologies, Inc. | Adaptive layered coding for voice over wireless IP applications |
US6614936B1 (en) * | 1999-12-03 | 2003-09-02 | Microsoft Corporation | System and method for robust video coding using progressive fine-granularity scalable (PFGS) coding |
US6498852B2 (en) * | 1999-12-07 | 2002-12-24 | Anthony Grimani | Automatic LFE audio signal derivation system |
US6845163B1 (en) * | 1999-12-21 | 2005-01-18 | At&T Corp | Microphone array for preserving soundfield perceptual cues |
KR100718829B1 (ko) * | 1999-12-24 | 2007-05-17 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다채널 오디오 신호 처리 장치 |
US6782366B1 (en) * | 2000-05-15 | 2004-08-24 | Lsi Logic Corporation | Method for independent dynamic range control |
US6850496B1 (en) * | 2000-06-09 | 2005-02-01 | Cisco Technology, Inc. | Virtual conference room for voice conferencing |
US6973184B1 (en) * | 2000-07-11 | 2005-12-06 | Cisco Technology, Inc. | System and method for stereo conferencing over low-bandwidth links |
US7236838B2 (en) * | 2000-08-29 | 2007-06-26 | Matsushita Electric Industrial Co., Ltd. | Signal processing apparatus, signal processing method, program and recording medium |
JP3426207B2 (ja) | 2000-10-26 | 2003-07-14 | 三菱電機株式会社 | 音声符号化方法および装置 |
TW510144B (en) | 2000-12-27 | 2002-11-11 | C Media Electronics Inc | Method and structure to output four-channel analog signal using two channel audio hardware |
US6885992B2 (en) * | 2001-01-26 | 2005-04-26 | Cirrus Logic, Inc. | Efficient PCM buffer |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US20030035553A1 (en) * | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US7006636B2 (en) * | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US7116787B2 (en) * | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US6934676B2 (en) * | 2001-05-11 | 2005-08-23 | Nokia Mobile Phones Ltd. | Method and system for inter-channel signal redundancy removal in perceptual audio coding |
US7668317B2 (en) * | 2001-05-30 | 2010-02-23 | Sony Corporation | Audio post processing in DVD, DTV and other audio visual products |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
ES2255678T3 (es) | 2002-02-18 | 2006-07-01 | Koninklijke Philips Electronics N.V. | Codificacion de audio parametrica. |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
EP1500084B1 (en) | 2002-04-22 | 2008-01-23 | Koninklijke Philips Electronics N.V. | Parametric representation of spatial audio |
KR101021079B1 (ko) | 2002-04-22 | 2011-03-14 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 파라메트릭 다채널 오디오 표현 |
KR100635022B1 (ko) | 2002-05-03 | 2006-10-16 | 하만인터내셔날인더스트리스인코포레이티드 | 다채널 다운믹싱 장치 |
US6940540B2 (en) * | 2002-06-27 | 2005-09-06 | Microsoft Corporation | Speaker detection and tracking using audiovisual data |
AU2003244932A1 (en) * | 2002-07-12 | 2004-02-02 | Koninklijke Philips Electronics N.V. | Audio coding |
EP1523863A1 (en) | 2002-07-16 | 2005-04-20 | Koninklijke Philips Electronics N.V. | Audio coding |
CN100370517C (zh) * | 2002-07-16 | 2008-02-20 | 皇家飞利浦电子股份有限公司 | 一种对编码信号进行解码的方法 |
RU2005120236A (ru) | 2002-11-28 | 2006-01-20 | Конинклейке Филипс Электроникс Н.В. (Nl) | Кодирование аудиосигнала |
EP1595247B1 (en) * | 2003-02-11 | 2006-09-13 | Koninklijke Philips Electronics N.V. | Audio coding |
FI118247B (fi) | 2003-02-26 | 2007-08-31 | Fraunhofer Ges Forschung | Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa |
KR20050116828A (ko) | 2003-03-24 | 2005-12-13 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다채널 신호를 나타내는 주 및 부 신호의 코딩 |
US20050069143A1 (en) * | 2003-09-30 | 2005-03-31 | Budnikov Dmitry N. | Filtering for spatial audio rendering |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US7653533B2 (en) * | 2005-10-24 | 2010-01-26 | Lg Electronics Inc. | Removing time delays in signal paths |
-
2004
- 2004-04-20 US US10/827,900 patent/US7805313B2/en active Active
-
2005
- 2005-02-22 TW TW094105257A patent/TWI376967B/zh not_active IP Right Cessation
- 2005-02-23 PT PT05723489T patent/PT1721489E/pt unknown
- 2005-02-23 EP EP05723489A patent/EP1721489B1/en active Active
- 2005-02-23 AT AT05723489T patent/ATE373402T1/de active
- 2005-02-23 AU AU2005226536A patent/AU2005226536B2/en active Active
- 2005-02-23 KR KR1020067017673A patent/KR100717598B1/ko active IP Right Grant
- 2005-02-23 DE DE602005002463T patent/DE602005002463T2/de active Active
- 2005-02-23 WO PCT/US2005/005605 patent/WO2005094125A1/en active IP Right Grant
- 2005-02-23 MX MXPA06009931A patent/MXPA06009931A/es active IP Right Grant
- 2005-02-23 BR BRPI0508146-7A patent/BRPI0508146B1/pt active IP Right Grant
- 2005-02-23 ES ES05723489T patent/ES2293556T3/es active Active
- 2005-02-23 JP JP2007501824A patent/JP4418493B2/ja active Active
- 2005-02-23 CA CA2557993A patent/CA2557993C/en active Active
-
2006
- 2006-10-03 NO NO20064472A patent/NO340421B1/no unknown
-
2007
- 2007-06-12 HK HK07106238.2A patent/HK1101634A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
NO20064472L (no) | 2006-10-03 |
US20050195981A1 (en) | 2005-09-08 |
NO340421B1 (no) | 2017-04-18 |
MXPA06009931A (es) | 2007-03-21 |
WO2005094125A1 (en) | 2005-10-06 |
EP1721489A1 (en) | 2006-11-15 |
JP2007526520A (ja) | 2007-09-13 |
DE602005002463D1 (de) | 2007-10-25 |
BRPI0508146B1 (pt) | 2019-04-16 |
AU2005226536B2 (en) | 2008-09-04 |
CA2557993A1 (en) | 2005-10-06 |
EP1721489B1 (en) | 2007-09-12 |
DE602005002463T2 (de) | 2008-06-12 |
JP4418493B2 (ja) | 2010-02-17 |
US7805313B2 (en) | 2010-09-28 |
KR20060131866A (ko) | 2006-12-20 |
HK1101634A1 (en) | 2007-10-18 |
ATE373402T1 (de) | 2007-09-15 |
KR100717598B1 (ko) | 2007-05-15 |
TWI376967B (en) | 2012-11-11 |
AU2005226536A1 (en) | 2005-10-06 |
TW200603653A (en) | 2006-01-16 |
PT1721489E (pt) | 2007-12-21 |
BRPI0508146A (pt) | 2007-07-31 |
CA2557993C (en) | 2012-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2293556T3 (es) | Codificacion basada en frecuencia de canales de audio en sistemas de codificacion multicanal parametrica. | |
JP5452915B2 (ja) | オーディオ信号の符号化/復号化方法及び符号化/復号化装置 | |
RU2323551C1 (ru) | Частотно-ориентированное кодирование каналов в параметрических системах многоканального кодирования | |
KR101283783B1 (ko) | 고품질 다채널 오디오 부호화 및 복호화 장치 | |
RU2007139918A (ru) | Кодирование многоканального аудио | |
JP6759277B2 (ja) | マルチチャネル・オーディオ・コンテンツの符号化 | |
EP3818522A1 (en) | Synchronizing enhanced audio transports with backward compatible audio transports | |
ES2906957T3 (es) | Compresión intermedia por capas de datos de audio ambisónicos de orden superior | |
EP3818523A1 (en) | Embedding enhanced audio transports in backward compatible audio bitstreams | |
KR20080066537A (ko) | 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치 | |
KR20190031460A (ko) | 오디오 객체 전송 장치 및 방법 |