ES2295837T3 - Sistesis de una señal de audio monofonica sobre la base de una señal de audio multicanal codificada. - Google Patents
Sistesis de una señal de audio monofonica sobre la base de una señal de audio multicanal codificada. Download PDFInfo
- Publication number
- ES2295837T3 ES2295837T3 ES04720099T ES04720099T ES2295837T3 ES 2295837 T3 ES2295837 T3 ES 2295837T3 ES 04720099 T ES04720099 T ES 04720099T ES 04720099 T ES04720099 T ES 04720099T ES 2295837 T3 ES2295837 T3 ES 2295837T3
- Authority
- ES
- Spain
- Prior art keywords
- audio signal
- multiple channels
- signal
- channels
- band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 96
- 230000000694 effects Effects 0.000 claims abstract description 34
- 238000000034 method Methods 0.000 claims abstract description 23
- 230000015572 biosynthetic process Effects 0.000 claims description 31
- 238000003786 synthesis reaction Methods 0.000 claims description 31
- 238000011156 evaluation Methods 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 238000001308 synthesis method Methods 0.000 abstract 1
- 108091006146 Channels Proteins 0.000 description 133
- 230000005284 excitation Effects 0.000 description 22
- 238000012545 processing Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 230000003595 spectral effect Effects 0.000 description 11
- 238000001914 filtration Methods 0.000 description 7
- 238000012935 Averaging Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
Método de síntesis de una señal de audio monofónica sobre la base de una señal de audio multicanal codificada disponible, comprendiendo dicha señal de audio multicanal codificada por lo menos para una parte de una banda de audiofrecuencia valores de parámetros independientes para cada uno de los canales de dicha señal de audio multicanal, comprendiendo dicho método por lo menos para una parte de una banda de audiofrecuencia: - combina los valores de parámetros de dichos canales múltiples en el dominio de los parámetros; y - utilizar dichos valores de parámetros combinados para sintetizar una señal de audio monofónica; en el que la combinación de dichos valores de parámetros se controla para por lo menos un parámetro basándose en información sobre la actividad respectiva en dichos canales múltiples.
Description
Síntesis de una señal de audio monofónica sobre
la base de una señal de audio multicanal codificada.
La presente invención se refiere a un método de
síntesis de una señal de audio monofónica sobre la base de una
señal de audio multicanal codificada disponible, comprendiendo dicha
señal de audio multicanal codificada por lo menos para una parte de
una banda de audiofrecuencia valores de parámetros independientes
para cada uno de los canales de la señal de audio multicanal. La
invención se refiere asimismo a un decodificador de audio
correspondiente, a un sistema de codificación correspondiente y a un
producto de programa de software correspondiente.
Los sistemas de codificación de audio son bien
conocidos a partir del estado de la técnica. Los mismos se utilizan
en particular para transmitir o almacenar señales de audio.
Uno de los sistemas de codificación de audio que
se utiliza para la transmisión de señales de audio comprende un
codificador en un extremo transmisor y un decodificador en un
extremo receptor. El extremo transmisor y el extremo receptor
pueden ser, por ejemplo, terminales móviles. Al codificador se le
suministra una señal de audio que va a ser transmitida. El
codificador es responsable de adaptar la velocidad de los datos de
audio entrantes a un nivel de velocidad binaria en el cual no se
infrinjan las condiciones de ancho de banda en el canal de
transmisión. Idealmente, en este proceso de codificación el
codificador descarta de la señal de audio únicamente información
irrelevante. A continuación, la señal de audio codificada es
transmitida por el extremo transmisor del sistema de codificación
de audio y recibida en el extremo receptor del sistema de
codificación de audio. El decodificador en el extremo receptor
invierte el proceso de codificación para obtener una señal de audio
decodificada con un deterioro reducido o no
audible.
audible.
Si el sistema de codificación de audio se
utiliza para archivar datos de audio, los datos de audio codificados
proporcionados por el codificador se almacenan en alguna unidad de
almacenamiento, y el decodificador decodifica datos de audio
recuperados a partir de esta unidad de almacenamiento, por ejemplo,
para que sean presentados por parte de algún reproductor de medios.
En esta alternativa, el objetivo es que el codificador logre una
velocidad binaria que sea lo más baja posible, para ahorrar espacio
de almacenamiento.
Dependiendo de la velocidad binaria permitida, a
una señal de audio se le pueden aplicar diferentes esquemas de
codificación.
En la mayoría de los casos, una banda de
frecuencias inferior y una banda de frecuencias superior de una
señal de audio están en correlación mutua. Por esta razón
típicamente los algoritmos de extensión del ancho de banda con
códec de audio en primer lugar dividen en dos bandas de frecuencia
el ancho de banda de la señal de audio que se va a codificar. A
continuación, la banda de frecuencias inferior es procesada de forma
independiente por el denominado códec central, mientras que la
banda de frecuencias superior se procesa usando información sobre
los parámetros de codificación y señales de la banda de frecuencias
inferior. El uso de parámetros de la codificación de la banda de
frecuencias baja en la codificación de la banda de frecuencias alta
reduce significativamente la velocidad binaria resultante en la
codificación de la banda alta.
La figura 1 presenta un sistema típico de
codificación y decodificación con división de banda. El sistema
comprende un codificador de audio 10 y un decodificador de audio 20.
El codificador de audio 10 incluye un banco de filtros de análisis
de dos bandas 11, un codificador de banda baja 12 y un codificador
de banda alta 13. El decodificador de audio 20 incluye un
decodificador de banda baja 21, un decodificador de banda alta 22 y
un banco de filtros de síntesis de dos bandas 23. El codificador 12
y el decodificador 21 de banda baja pueden ser, por ejemplo, el
codificador y decodificador normalizados de Banda Ancha con
Multivelocidad Adaptativa (AMR-WB), mientras que el
codificador 13 y el decodificador 22 de banda alta pueden comprender
una cualquiera de entre las siguientes opciones: un algoritmo de
codificación independiente, un algoritmo de extensión de ancho de
banda o una combinación de ambos. A título de ejemplo, se considera
que el sistema presentado usa como algoritmo de codificación con
división de banda el códec AMR-WB ampliado
(AMR-WB+).
Una señal de audio de entrada 1 es procesada en
primer lugar por el banco de filtros de análisis de dos bandas 11,
en el cual la banda de frecuencias de audio se divide en una banda
de frecuencias inferior y una banda de frecuencias superior. Con
fines ilustrativos, la figura 2 presenta un ejemplo de una respuesta
de frecuencia de un banco de filtros de dos bandas para el caso de
la AMR-WB+. Una banda de audio de 12 kHz se divide
en una banda L de entre 0 kHz y 6,4 kHz y una banda H de entre 6,4
kHz y 12 kHz. Por otra parte, en el banco de filtros de análisis de
dos bandas 11, las bandas de frecuencia resultantes se diezman de
forma ajustada. Es decir, la banda de frecuencias baja se diezma a
12,8 kHz y la banda de frecuencias alta se remuestrea a 11,2
kHz.
A continuación, la banda de frecuencias baja y
la banda de frecuencias alta se codifican de forma mutuamente
independiente por parte, respectivamente, del codificador de banda
baja 12 y el codificador de banda alta 13.
Con este fin, el codificador de banda baja 12
comprende algoritmos de codificación de señales fuente completas.
Los algoritmos incluyen un tipo de algoritmo de predicción lineal
con excitación por código algebraico (ACELP) y un algoritmo basado
en transformadas. El algoritmo utilizado concretamente se selecciona
basándose en las características de la señal correspondientes a la
señal de audio introducida respectivamente. El algoritmo ACELP se
selecciona típicamente para codificar señales de voz y transitorios,
mientras que el algoritmo basado en transformadas se selecciona
típicamente para codificar señales de tipo musical y de tipo tono
con vistas a tratar más satisfactoriamente la resolución
frecuencial.
En un códec AMR-WB+, el
codificador de banda alta 13 utiliza una codificación de predicción
lineal (LPC) para modelar la envolvente espectral de la señal de
banda de alta frecuencia. A continuación, la banda de alta
frecuencia se puede describir por medio de coeficientes de filtrado
de síntesis LPC los cuales definen las características espectrales
de la señal sintetizada, y de factores de ganancia para una señal de
excitación los cuales controlan la amplitud de la señal de audio
sintetizada de banda alta de frecuencias. La señal de excitación de
la banda alta se copia del codificador de banda baja 12. Para la
transmisión se proporcionan únicamente los coeficientes LPC y los
factores de ganancia.
La salida del codificador de banda baja 12 y del
codificador de banda alta 13 se multiplexan en un único flujo
continuo de bits 2.
El flujo continuo de bits multiplexado 2 se
transmite, por ejemplo, a través de un canal de comunicaciones
hacia el decodificador de audio 20, en el cual se decodifica por
separado la banda de frecuencias baja y la banda de frecuencias
alta.
En el decodificador de banda baja 21, el
procesado en el codificador de banda baja 12 se invierte para
sintetizar la señal de audio de banda baja de frecuencias.
En el decodificador de banda alta 22, se genera
una señal de excitación mediante el remuestreo de una excitación de
banda baja de frecuencias proporcionada por el decodificador de
banda baja 21 a la frecuencia de muestreo usada en la banda alta de
frecuencias. Es decir, la señal de excitación de la banda baja de
frecuencias se reutiliza para la decodificación de la banda alta de
frecuencias transponiendo la señal de la banda baja de frecuencias
en la banda alta de frecuencias. Alternativamente, para la
reconstrucción de la señal de la banda alta de frecuencias se
podría generar una señal de excitación aleatoria. A continuación, se
reconstruye la señal de la banda alta de frecuencias filtrando la
señal de excitación escalada a través del modelo LPC de banda alta
definido por los coeficientes LPC.
En el banco de filtros de síntesis de dos bandas
23, las señales de la banda baja de frecuencias y las señales de la
banda alta de frecuencias decodificadas se sobremuestrean a la
frecuencia de muestreo original y se combinan en una señal de audio
de salida sintetizada 3.
La señal de audio de entrada 1 que se va a
codificar puede ser una señal de audio monofónica o una señal de
audio multicanal que contenga por lo menos una señal de un primer y
de un segundo canal. Uno de los ejemplos de señal de audio
multicanal es una señal de audio estereofónica, que está compuesta
por una señal de canal izquierdo y una señal de canal derecho.
Para un funcionamiento estereofónico de un códec
AMR-WB+, la señal de audio de entrada se divide
igualmente en una señal de banda baja de frecuencias y una señal de
banda alta de frecuencias en el banco de filtros de análisis de dos
bandas 11. El codificador de banda baja 12 genera una señal
monofónica combinando las señales del canal izquierdo y las señales
del canal derecho en la banda baja de frecuencias. La señal
monofónica se codifica tal como se ha descrito anteriormente.
Adicionalmente, el codificador de banda baja 12 usa una codificación
paramétrica para codificar las diferencias de las señales del canal
izquierdo y derecho en la señal monofónica. El codificador de banda
alta 13 codifica el canal izquierdo y el canal derecho por separado
determinando coeficientes LPC y factores de ganancia independientes
para cada uno de los canales.
En el caso de que la señal de audio de entrada 1
sea una señal de audio multicanal, pero el dispositivo que va a
presentar la señal de audio sintetizada 3 no soporte una salida de
audio multicanal, el flujo continuo de bits multicanal entrante 2
debe ser convertido por el decodificador de audio 20 en una señal de
audio monofónica. En la banda baja de frecuencias, la conversión de
la señal multicanal en una señal monofónica es directa, ya que el
decodificador de banda baja 21 puede simplemente omitir los
parámetros de estereofonía en el flujo continuo de bits recibido y
decodificar únicamente la parte monofónica. No obstante para la
banda alta de frecuencias, se requiere un procesado mayor ya que en
el flujo continuo de bits no hay disponible ninguna parte de la
señal monofónica independiente de la banda alta de frecuencias.
Convencionalmente, el flujo continuo de bits
estereofónico para la banda alta de frecuencias se decodifica por
separado para las señales del canal izquierdo y derecho, y a
continuación se crea la señal monofónica combinando las señales del
canal izquierdo y derecho en un proceso de submezcla. Este
planteamiento se ilustra en la Figura 3.
La Figura 3 presenta esquemáticamente detalles
del decodificador de banda alta 22 de la Figura 1 para una salida
de una señal de audio monofónica. Con este fin, el decodificador de
banda alta comprende una parte de procesado de canal izquierdo 30 y
una parte de procesado de canal derecho 33. La parte de procesado de
canal izquierdo 30 incluye un mezclador 31, el cual está conectado
a un filtro de síntesis LPC 32. La parte de procesado de canal
derecho 33 incluye del mismo modo un mezclador 34, el cual está
conectado a un filtro de síntesis LPC 35. La salida de ambos
filtros de síntesis LPC 32, 35 está conectada a un mezclador
adicional 36.
Una señal de excitación de banda baja de
frecuencias que es proporcionada por el decodificador de banda baja
21 es alimentada a uno de los mezcladores 31 y 34. El mezclador 31
aplica los factores de ganancia para el canal izquierdo en la señal
de excitación de banda baja de frecuencias. A continuación, el
filtro de síntesis LPC 32 reconstruye la señal de banda alta del
canal izquierdo filtrando la señal de excitación escalada a través
de un modelo LPC de banda alta definido por los coeficientes LPC
para el canal izquierdo. El mezclador 34 aplica los factores de
ganancia para el canal derecho en la señal de excitación de la banda
baja de frecuencias. A continuación, el filtro de síntesis LPC 35
reconstruye la señal de banda alta del canal derecho filtrando la
señal de excitación escalada a través de un modelo LPC de banda alta
definido por los coeficientes LPC para el canal derecho.
A continuación, el mezclador 36 convierte la
señal reconstruida de la banda alta de frecuencias del canal
izquierdo y la señal reconstruida de la banda alta de frecuencias
del canal derecho en una señal de banda alta de frecuencias
monofónica calculando su media en el dominio del tiempo.
En principio, éste es un planteamiento sencillo
y útil. No obstante, el mismo requiere una síntesis independiente
de canales múltiples, incluso aunque al final se necesite solamente
una señal de un único canal.
El documento US 5.274.740 da a conocer un método
en el cual los valores de parámetros de canales múltiples se
combinan antes de la síntesis, evitando de este modo la necesidad de
una síntesis independiente de canales múltiples.
Si la señal de entrada de audio multicanal 1
está desequilibrada de tal manera que la mayor parte de la energía
de la señal de audio multicanal reside en uno de los canales, una
mezcla directa de los multicanales mediante el cálculo de su media
dará como resultado una atenuación de la señal combinada. En un caso
extremo, uno de los canales está completamente en silencio, lo cual
conduce a un nivel de energía de la señal combinada que es la mitad
del nivel de energía del canal de entrada activo original.
El documento
EP-A-1 377 123 da a conocer un
método que permite que el nivel de energía y/o sonoridad de las
señales de salida de un mezclador coincidan con el nivel de energía
y/o sonoridad de las señales de entrada del mezclador.
Uno de los objetivos de la invención consiste en
reducir la carga de procesado que se requiere para sintetizar una
señal de audio monofónica basándose en una señal de audio multicanal
codificada.
Se propone un método de síntesis de una señal de
audio monofónica basándose en una señal de audio multicanal
codificada disponible, según la reivindicación independiente 1.
Por otra parte, se propone un decodificador de
audio para sintetizar una señal de audio monofónica basándose en
una señal de audio multicanal codificada disponible, según la
reivindicación independiente 9.
Por otra parte, se propone un sistema de
codificación, el cual comprende además del decodificador propuesto
un codificador de audio que proporciona la señal de audio multicanal
codificada, según la reivindicación independiente 17.
Finalmente, se propone un producto de programa
de software, en el cual se almacena un código de software para
sintetizar una señal de audio monofónica basándose en una señal de
audio multicanal codificada disponible, según la reivindicación
independiente 19. La señal de audio multicanal codificada comprende
por lo menos para una parte de la banda de frecuencias de una señal
de audio multicanal original valores de parámetros independientes
para cada uno de los canales de la señal de audio multicanal. El
código de software propuesto realiza las etapas del método
propuesto cuando se ejecuta en un decodificador de audio.
La señal de audio multicanal codificada puede
ser, en particular, aunque no de forma exclusiva, una señal de
audio estereofónica codificada.
La invención tiene su origen en la consideración
de que para obtener una señal de audio monofónica, se puede evitar
una decodificación independiente de los canales múltiples
disponibles, si los valores de los parámetros que están disponibles
para estos canales múltiples se combinan ya en el dominio de los
parámetros antes de la decodificación. A continuación, los valores
de los parámetros combinados se pueden usar para una decodificación
de canal individual, tal como en el documento US nº 5.274.740.
Esta técnica permite ahorrar carga de procesado
en un decodificador y reduce la complejidad del decodificador. Si
los canales múltiples son canales estereofónicos que se procesan en
un sistema con división de banda, por ejemplo, se puede ahorrar
aproximadamente la mitad de la carga de procesado requerida para un
filtrado de síntesis de banda alta de frecuencias en comparación
con la realización del filtrado de síntesis de banda alta de
frecuencias por separado para ambos canales y la mezcla de las
señales resultantes del canal izquierdo y derecho.
En una de las formas de realización de la
invención, los parámetros comprenden factores de ganancia para cada
uno de los canales múltiples y coeficientes de predicción lineal
para cada uno de los canales múltiples.
La combinación de los valores de los parámetros
se puede realizar de una manera estática, por ejemplo, calculando
en general la media de los valores de los parámetros disponibles
para todos los canales. No obstante, de forma ventajosa, la
combinación de los valores de los parámetros se controla para por lo
menos un parámetro basándose en información sobre la actividad
respectiva en los canales múltiples. Esto permite lograr una señal
de audio monofónica con características espectrales y con un nivel
de señal lo más próximos posibles a las características espectrales
y al nivel de la señal de un canal activo respectivo, y por lo tanto
permite lograr una calidad de audio mejorada de la señal de audio
monofónica sintetizada.
Si la actividad en un primer canal es
significativamente mayor que en segundo canal, se puede considerar
que el primer canal es un canal activo, mientras que se puede
considerar que el segundo canal es un canal silencioso el cual no
proporciona básicamente ninguna contribución audible a la señal de
audio original. En el caso de que exista un canal silencioso, los
valores de los parámetros correspondientes a por lo menos uno de los
parámetros se omiten completamente de forma ventajosa cuando se
combinan los valores de los parámetros. Como consecuencia, la señal
monofónica sintetizada será similar al canal activo. En la totalidad
del resto de casos, los valores de los parámetros se pueden
combinar, por ejemplo, formando la media o una media ponderada por
todos los canales. Para una media ponderada, el peso asignado a un
canal aumenta con su actividad relativa en comparación con el otro
canal o canales. Para realizar la combinación también se pueden
utilizar otros métodos. Del mismo modo, los valores de parámetros
correspondientes a un canal silencioso que no se van a omitir se
pueden combinar con los valores de los parámetros de un canal
activo mediante promediado o algún otro método.
La información sobre la actividad respectiva en
los canales múltiples la pueden formar varios tipos de información.
Puede venir dada por ejemplo por un factor de ganancia para cada uno
de los canales múltiples, por una combinación de factores de
ganancia sobre un periodo breve de tiempo para cada uno de los
canales múltiples, o por coeficientes de predicción lineal para
cada uno de los canales múltiples. La información de actividad puede
venir dada por el nivel de energía en por lo menos parte de la
banda de frecuencias de la señal de audio multicanal para cada uno
de los canales múltiples, o por información colateral independiente
sobre la actividad recibida desde un codificador que proporciona la
señal de audio multicanal codificada.
Para obtener la señal de audio multicanal
codificada, una señal de audio multicanal original se puede dividir
por ejemplo en una señal de banda baja de frecuencias y una señal de
banda alta de frecuencias. A continuación, la señal de banda baja
de frecuencias se puede codificar de una manera convencional.
Además, la señal de banda alta de frecuencias se puede codificar
por separado para los canales múltiples según una manera
convencional, lo cual da como resultado valores de parámetros para
cada uno de los canales múltiples. A continuación, por lo menos la
parte de la banda de altas frecuencias
\hbox{codificada de la señal completa de audio multicanal codificada se puede tratar según la invención.}
No obstante, debe entenderse que para evitar un
desequilibrio entre la banda baja de frecuencias y la banda alta de
frecuencias, por ejemplo, un desequilibrio en el nivel de la señal,
también pueden tratarse según la invención valores de parámetros
multicanal de una parte de banda baja de frecuencias de la señal
completa. Alternativamente, en principio, podrían no descartarse
los valores de parámetros correspondientes a canales silenciosos en
la banda de alta frecuencias que influyen en el nivel de la señal,
sino únicamente los valores de parámetros correspondientes a
canales silenciosos que influyen en las características espectrales
de la señal.
La invención se puede implementar por ejemplo,
aunque no de forma exclusiva, en un sistema de codificación basado
en la AMR-WB+.
A partir de la siguiente descripción detallada
haciendo referencia con los dibujos adjuntos se pondrán de
manifiesto otros objetivos y características de la presente
invención.
La Figura 1 es un diagrama de bloques
esquemático de un sistema de codificación con división de banda;
la Figura 2 es un diagrama de la respuesta en
frecuencia de un banco de filtros de dos bandas;
la Figura 3 es un diagrama de bloques
esquemático de un decodificador de banda alta convencional para una
conversión de estereofonía a monofonía;
la Figura 4 es un diagrama de bloques
esquemático de un decodificador de banda alta para una conversión de
estereofonía a monofonía;
la Figura 5 es un diagrama que ilustra la
respuesta en frecuencia para señales estereofónicas y para la señal
monofónica que resulta con el decodificador de banda alta de la
Figura 4;
la Figura 6 es un diagrama de bloques
esquemático de un decodificador de banda alta para la conversión de
estereofonía a monofonía según una de las formas de realización de
la invención;
la Figura 7 es un diagrama de flujo que ilustra
el funcionamiento en un sistema que utiliza el decodificador de
banda alta de la Figura 6;
la Figura 8 es un diagrama de flujo que ilustra
una primera opción para la combinación de parámetros en el diagrama
de flujo de la figura 7; y
la Figura 9 es un diagrama de flujo que ilustra
una segunda opción para la combinación de parámetros en el diagrama
de flujo de la Figura 7.
Se considera que la invención se implementará en
el sistema de la Figura 1, al que por lo tanto se hará referencia
en adelante. Al codificador de audio 10 se le suministra una señal
de audio de entrada estereofónica 1 para su codificación, mientras
que el decodificador de audio 20 debe suministrar una señal de audio
monofónica decodificada 3 para su presentación.
Para poder suministrar dicha señal de audio
monofónica 3 con una baja carga de procesado, el decodificador de
banda alta 22 del sistema se puede realizar de la manera
siguiente.
La Figura 4 es un diagrama de bloques
esquemático de este decodificador de banda alta 22. Una entrada de
excitación de banda baja del decodificador de banda alta 22 está
conectada a través de un mezclador 40 y un filtro de síntesis LPC
41 a la salida del decodificador de banda alta 22. El decodificador
de banda alta 22 comprende adicionalmente un bloque de promediado
de ganancia 42 el cual está conectado al mezclador y un bloque de
promediado LPC 43 el cual está conectado al filtro de síntesis LPC
41.
El sistema funciona de la manera siguiente.
Una señal estereofónica introducida en el
codificador de audio 10 es dividida por el banco de filtros de
análisis de dos bandas 11 en una banda baja de frecuencias y una
banda alta de frecuencias. Un codificador de banda baja 11 codifica
la señal de audio de banda baja de frecuencias tal como se ha
descrito anteriormente. Un codificador de banda alta
AMR-WB+ 12 codifica la señal estereofónica de banda
alta por separado para los canales izquierdo y derecho. Más
específicamente, determina factores de ganancia y coeficientes de
predicción lineal para cada uno de los canales tal como se ha
descrito anteriormente.
La señal de banda baja de frecuencias monofónica
codificada, los valores de los parámetros de la banda baja de
frecuencias estereofónicos y los valores de los parámetros de la
banda alta de frecuencias estereofónicos se transmiten en un flujo
continuo de bits 2 hacia el decodificador de audio 20.
El decodificador de banda baja 21 recibe la
parte de la banda baja de frecuencias del flujo continuo de bits
para su decodificación. En esta decodificación, dicho decodificador
omite los parámetros de estereofonía y decodifica únicamente la
parte monofónica. El resultado es una señal de audio de banda baja
de frecuencias monofónica.
El decodificador de banda alta 22 recibe por un
lado los valores de los parámetros de la banda alta de frecuencias
del flujo continuo de bits transmitido y por otro lado la señal de
excitación de banda baja obtenida a la salida del decodificador de
banda baja 21.
Los parámetros de la banda alta de frecuencias
comprenden respectivamente un factor de ganancia del canal
izquierdo, un factor de ganancia del canal derecho, coeficientes LPC
del canal izquierdo y coeficientes LPC del canal derecho. En el
bloque de promediado de ganancia 42, se promedian los factores de
ganancia respectivos para el canal izquierdo y el canal derecho, y
el mezclador 40 usa el factor de ganancia medio para escalar la
señal de excitación de banda baja. La señal resultante se suministra
para el filtrado al filtro de síntesis LPC 41.
En el bloque de promediado LPC 43, se combinan
los coeficientes de predicción lineal respectivos para el canal
izquierdo y el canal derecho. En la AMR-WB+, la
combinación de los coeficientes LPC de ambos canales se puede
realizar, por ejemplo, calculando la media sobre los coeficientes
recibidos en el dominio del Par Espectral de Inmitancia (ISP). A
continuación, los coeficientes medios se usan para configurar el
filtro de síntesis LPC 41, al cual se somete la señal escalada de
excitación de banda baja.
La señal de excitación de banda baja escalada y
filtrada forma la señal de audio de banda alta monofónica
deseada.
La señal de audio de banda baja monofónica y la
señal de audio de banda alta monofónica se combinan en el banco de
filtros de síntesis de dos bandas 23, y se da salida a la señal
sintetizada resultante 3 para su presentación.
En comparación con un sistema que utilice el
codificador de banda alta de la Figura 3, un sistema que utilice el
codificador de banda alta de la Figura 4 presenta la ventaja de que
únicamente requiere aproximadamente la mitad del poder de procesado
para generar la señal sintetizada ya que la misma se genera
únicamente una vez.
\newpage
No obstante, debe señalarse que sigue existiendo
el problema mencionado anteriormente que consiste en una posible
atenuación en la señal combinada en el caso de una entrada de audio
estereofónica que tenga una señal activa en solamente uno de los
canales.
Además, para señales de entrada de audio
estereofónicas con solamente un canal activo, el promediado de los
coeficientes de predicción lineal conlleva un efecto colateral no
deseado de "aplanamiento" del espectro en la señal combinada
resultante. En lugar de presentar las características espectrales
del canal activo, la señal combinada presenta unas características
espectrales algo distorsionadas debido a la combinación del
espectro "real" del canal activo y un espectro prácticamente
plano o de tipo aleatorio del canal silencioso.
Este efecto se ilustra en la Figura 5. La Figura
5 es un diagrama que representa la amplitud con respecto a la
frecuencia para tres respuestas en frecuencia diferentes del filtro
de síntesis LPC calculadas sobre una trama de 80 ms. Una línea
continua representa la respuesta en frecuencia del filtro de
síntesis LPC de un canal activo. Una línea de puntos representa la
respuesta en frecuencia del filtro de síntesis LPC de un canal
silencioso. Una línea de trazos representa la respuesta en
frecuencia del filtro de síntesis LPC que resulta cuando se
promedian los módulos LPC de ambos canales en el dominio ISP. Puede
observarse que el filtro LPC promediado crea un espectro el cual no
se parece mucho a ninguno de los espectros reales. En la práctica
este fenómeno se puede percibir como una reducción de la calidad de
audio en la banda alta de frecuencias.
Para poder proporcionar una señal de audio
monofónica 3 no solamente con una baja carga de procesado sino
además evitando las limitaciones que no se resuelven con el
decodificador de banda alta de la Figura 4, el decodificador de
banda alta 22 del sistema de la Figura 1 se puede realizar de
acuerdo con una de las formas de realización de la invención.
La Figura 6 es un diagrama de bloques
esquemático de dicho decodificador de banda alta 22. Una entrada de
excitación de banda baja del decodificador de banda alta 22 está
conectada a través de un mezclador 60 y un filtro de síntesis LPC
61 a la salida del decodificador de banda alta 22. El decodificador
de banda alta 22 comprende además un módulo lógico de selección de
ganancia 62 que está conectado al mezclador 60, y un módulo lógico
de selección LPC 63 que está conectado al filtro de síntesis LPC
61.
A continuación se describirá el procesado en un
sistema que utiliza el codificador de banda alta 22 de la Figura 6
haciendo referencia a la Figura 7. La Figura 7 es un diagrama de
flujo que representa, en su parte superior, el procesado en el
codificador de audio 10 y, en su parte inferior, el procesado en el
decodificador de audio 20 del sistema. La parte superior y la parte
inferior están divididas por una línea de trazos horizontal.
El banco de filtros de análisis de dos bandas 11
divide una entrada de la señal de audio estereofónica 1 hacia el
codificador en una banda baja de frecuencias y una banda alta de
frecuencias. Un codificador de banda baja 12 codifica la banda baja
de frecuencias. Un codificador de banda alta AMR-WB+
13 codifica la banda alta de frecuencias por separado para los
canales izquierdo y derecho. Más específicamente, determina factores
de ganancia dedicados y coeficientes de predicción lineal para
ambos canales como parámetros de banda alta de frecuencias.
La señal de banda baja de frecuencias monofónica
codificada, los valores de los parámetros de la banda baja de
frecuencias de estereofonía y los valores de los parámetros de la
banda alta de frecuencia de estereofonía se transmiten en un flujo
continuo de bits 2 hacia el decodificador de audio 20.
El decodificador de banda baja 21 recibe la
parte del flujo continuo de bits 2 relacionada con la banda baja de
frecuencias, y decodifica dicha parte. En la decodificación, el
decodificador de banda baja 21 omite los parámetros de estereofonía
recibidos y decodifica únicamente la parte monofónica. El resultado
es una señal de audio monofónica de banda baja.
El decodificador de banda alta 22 recibe por un
lado un factor de ganancia del canal izquierdo, un factor de
ganancia del canal derecho, coeficientes de predicción lineal para
el canal izquierdo y coeficientes de predicción lineal para el
canal derecho, y por otro lado la señal de excitación de banda baja
obtenida a la salida del decodificador de banda baja 21. La
ganancia del canal izquierdo y la ganancia del canal derecho se
usan al mismo tiempo como información de actividad del canal. Debe
indicarse que, alternativamente, el codificador de banda alta 13
podría proporcionar como parámetro adicional alguna otra información
de actividad del canal que indique la distribución de actividad en
la banda alta de frecuencias para el canal izquierdo y el canal
derecho.
Se evalúa la información de actividad del canal,
y el módulo lógico de selección de ganancia 62 combina en un único
factor de ganancia los factores de ganancia correspondientes al
canal izquierdo y al canal derecho según dicha evaluación. A
continuación, la ganancia seleccionada se aplica a la señal de
excitación de la banda baja de frecuencias suministrada por el
decodificador de banda baja 21 por medio del mezclador 60.
Por otra parte, el módulo lógico de selección de
modelo LPC 63 combina los coeficientes LPC correspondientes al
canal izquierdo y al canal derecho según la evaluación, en un único
conjunto de coeficientes LPC. El modelo LPC combinado se suministra
al filtro de síntesis LPC 61. El filtro de síntesis LPC 61 aplica el
modelo LPC seleccionado a la señal de excitación de la banda baja
de frecuencias, escalada, suministrada por el mezclador 60.
A continuación, la señal resultante de audio de
banda alta de frecuencias se combina en el banco de filtros de
síntesis de dos bandas 23 con la señal de audio de la banda baja de
frecuencias, monofónica, en una señal de audio monofónica de banda
completa, a la cual se le puede dar salida para su presentación por
parte de un dispositivo o una aplicación que no sea capaz de
procesar señales de audio estereofónicas.
La evaluación propuesta de la información de
actividad del canal y la subsiguiente combinación de los valores de
los parámetros, que se indican en el diagrama de flujo de la Figura
7 en forma de un bloque con líneas dobles, se pueden implementar de
diferentes maneras. Se presentarán dos opciones haciendo referencia
a los diagramas de flujo de las Figuras 8 y 9.
En la primera opción ilustrada en la Figura 8,
en primer lugar los factores de ganancia correspondientes al canal
izquierdo se promedian sobre la duración de una trama, y del mismo
modo, los factores de ganancia correspondientes al canal derecho se
promedian sobre la duración de una trama.
A continuación, la ganancia promediada del canal
derecho se resta de la ganancia promediada del canal izquierdo,
dando como resultado una cierta diferencia de ganancia para cada
trama.
En el caso de que la diferencia de ganancia sea
inferior a un primer valor de umbral, los factores de ganancia
combinados para esta trama se fijan de manera que sean iguales a los
factores de ganancia proporcionados para el canal derecho. Por otra
parte, los modelos LPC combinados correspondientes a esta trama se
fijan de manera que sean iguales a los modelos LPC proporcionados
para el canal derecho.
En el caso de que la diferencia de ganancia sea
mayor que un segundo valor de umbral, los factores de ganancia
combinados correspondientes a esta trama se fijan de manera que sean
iguales a los factores de ganancia proporcionados para el canal
izquierdo. Por otra parte, los modelos LPC combinados
correspondientes a esta trama se fijan de manera que sean iguales a
los modelos LPC proporcionados para el canal izquierdo.
En la totalidad del resto de casos, los factores
de ganancia combinados correspondientes a esta trama se fijan de
manera que sean iguales a la media con respecto al factor de
ganancia respectivo para el canal izquierdo y el factor de ganancia
respectivo para el canal derecho. Los modelos LPC combinados para
esta trama se fijan de manera que sean iguales a la media con
respecto al modelo LPC respectivo para el canal izquierdo y el
modelo LPC respectivo para el canal derecho.
El primer valor de umbral y el segundo valor de
umbral se seleccionan dependiendo de la sensibilidad y tipo
requeridos de la aplicación para la cual se necesita la conversión
de estereofonía a monofonía. Son valores adecuados, por ejemplo,
-20 dB para el primer valor de umbral y 20 dB para el segundo valor
de umbral.
De este modo, si uno de los canales se puede
considerar como un canal silencioso mientras que el otro canal se
puede considerar como un canal activo durante una trama respectiva,
debido a las grandes diferencias en los factores de ganancia
medios, los factores de ganancia y los modelos LPC del canal
silencioso se desprecian para la duración correspondiente a la
trama. Esto es posible gracias a que el canal silencioso no presenta
ninguna contribución audible a la salida de audio mezclada. Dicha
combinación de valores de parámetros garantiza que las
características espectrales y el nivel de la señal son lo más
cercanos posibles al canal activo respectivo.
Debe indicarse que en lugar de omitir los
parámetros de estereofonía, el decodificador de banda baja también
podría formar valores de parámetros combinados y aplicarlos a la
parte monofónica de la señal, exactamente tal como se ha descrito
para el procesado de la banda alta de frecuencias.
En la segunda opción de la combinación de
valores de parámetros ilustrada en la Figura 9, los factores de
ganancia para el canal izquierdo y los valores de ganancia para el
canal derecho, respectivamente, también se promedian con respecto a
la duración de una trama.
A continuación, la ganancia promediada del canal
derecho se resta de la ganancia promediada del canal izquierdo,
dando como resultado una cierta diferencia de ganancia para cada una
de las tramas.
En el caso de que la diferencia de ganancia sea
menor que un primer valor de umbral bajo, los modelos LPC
combinados correspondientes a esta trama se fijan de manera que sean
iguales a los modelos LPC proporcionados para el canal derecho.
En el caso de que la diferencia de ganancia sea
mayor que un segundo valor de umbral alto, los modelos LPC
combinados correspondientes a esta trama se fijan de manera que sean
iguales a los modelos LPC proporcionados para el canal
izquierdo.
En la totalidad del resto de casos, los modelos
LPC combinados correspondientes a esta trama se fijan de manera que
sean iguales a la media con respecto al modelo LPC respectivo para
el canal izquierdo y el modelo LPC respectivo para el canal
derecho.
\newpage
En cualquiera de los casos, los factores de
ganancia combinados correspondientes a la trama se fijan de manera
que sean iguales a la media con respecto al factor de ganancia
respectivo para el canal izquierdo y al factor de ganancia
respectivo para el canal derecho.
Los coeficientes LPC tienen un efecto directo
únicamente sobre las características espectrales de la señal
sintetizada. De este modo, la combinación únicamente de los
coeficientes LPC da como resultado las características espectrales
deseadas, aunque no resuelve el problema de la atenuación de la
señal. No obstante, esta opción presenta la ventaja de que se
conserva el equilibrio entre la banda baja de frecuencias y la banda
alta de frecuencias, en el caso de que la banda baja de frecuencias
no se mezcle según la invención. La conservación del nivel de la
señal en la banda alta de frecuencias cambiaría el equilibrio entre
las bandas bajas de frecuencias y las bandas altas de frecuencias
introduciendo señales con una sonoridad relativamente demasiado
elevada en la banda alta de frecuencias, derivando así en una
posible reducción de la calidad subjetiva del audio.
Claims (19)
1. Método de síntesis de una señal de audio
monofónica sobre la base de una señal de audio multicanal codificada
disponible, comprendiendo dicha señal de audio multicanal
codificada por lo menos para una parte de una banda de
audiofrecuencia valores de parámetros independientes para cada uno
de los canales de dicha señal de audio multicanal, comprendiendo
dicho método por lo menos para una parte de una banda de
audiofrecuencia:
- -
- combina los valores de parámetros de dichos canales múltiples en el dominio de los parámetros; y
- -
- utilizar dichos valores de parámetros combinados para sintetizar una señal de audio monofónica;
en el que la combinación de dichos
valores de parámetros se controla para por lo menos un parámetro
basándose en información sobre la actividad respectiva en dichos
canales
múltiples.
2. Método según la reivindicación 1, en el que
dichos parámetros comprenden factores de ganancia para cada uno de
dichos canales múltiples y coeficientes de predicción lineal para
cada uno de dichos canales múltiples.
3. Método según una de las reivindicaciones
anteriores, en el que dicha información sobre la actividad
respectiva en dichos canales múltiples incluye por lo menos uno de
entre:
- -
- un factor de ganancia para cada uno de dichos canales múltiples;
- -
- una combinación de factores de ganancia durante un periodo breve de tiempo para cada uno de dichos canales múltiples;
- -
- los coeficientes de predicción lineal para cada uno de dichos canales múltiples;
- -
- el nivel de energía en por lo menos parte de la banda de frecuencias de dicha señal de audio multicanal para cada uno de dichos canales múltiples; y
- -
- la información colateral independiente sobre dicha actividad recibida desde un extremo codificador que proporciona dicha señal de audio multicanal codificada.
4. Método según una de las reivindicaciones
anteriores, en el que en el caso de que dicha información sobre la
actividad en dichos canales múltiples indique que la actividad en un
primero de entre dichos canales múltiples es considerablemente
menor que en por lo menos otro de dichos canales múltiples, se
desprecia el valor de por lo menos un parámetro que esté disponible
para dicho primer canal.
5. Método según la reivindicación 4, en el que
en el caso de que dicha información sobre la actividad en dichos
canales múltiples indique que la actividad en un primero de entre
dichos canales múltiples es considerablemente menor que en por lo
menos otro de dichos canales múltiples, se promedian los valores de
por lo menos otro parámetro que estén disponibles para dichos
canales múltiples.
6. Método según una de las reivindicaciones
anteriores, en el que en el caso de que dicha información sobre la
actividad en dichos canales múltiples no indique que la actividad en
uno de dichos canales múltiples es considerablemente menor que en
por lo menos otro de dichos canales múltiples, se promedian los
valores de dichos parámetros que están disponibles para dichos
canales múltiples.
7. Método según una de las reivindicaciones
anteriores, en el que dicha señal multicanal es una señal
estereo-
fónica.
fónica.
8. Método según una de las reivindicaciones
anteriores, que comprende las etapas anteriores que consisten en
dividir una señal de audio multicanal original en una señal de banda
baja de frecuencias y una señal de banda alta de frecuencias,
codificar dicha señal de baja frecuencia, y codificar dicha señal de
banda alta de frecuencias por separado para dichos canales
múltiples, dando como resultado dichos valores de parámetros para
cada uno de dichos canales múltiples, en el que por lo menos los
valores de los parámetros resultantes para dicha señal de banda
alta de frecuencias se combinan para sintetizar dicha señal de audio
monofónica.
9. Decodificador de audio para sintetizar una
señal de audio monofónica sobre la base de una señal de audio
multicanal codificada disponible, comprendiendo dicha señal de audio
multicanal codificada por lo menos para una parte de la banda de
frecuencias de una señal de audio multicanal original valores de
parámetros independientes para cada uno de los canales de dicha
señal de audio multicanal, comprendiendo dicho decodificador de
audio:
- -
- por lo menos una parte de selección de parámetros adaptada para combinar valores de parámetros de dichos canales múltiples en el dominio de los parámetros por lo menos para una parte de la banda de frecuencias de dicha señal de audio multicanal; y
- -
- una parte de síntesis de señales de audio adaptada para sintetizar una señal de audio monofónica por lo menos para una parte de la banda de frecuencias de dicha señal de audio multicanal basándose en valores de parámetros combinados proporcionados por dicha por lo menos una parte de selección de parámetros;
en el que dicha parte de selección
de parámetros está adaptada para combinar dichos valores de
parámetros para por lo menos un parámetro basándose en información
sobre la actividad respectiva en dichos canales
múltiples.
10. Decodificador de audio según la
reivindicación 9, en el que dichos parámetros comprenden factores de
ganancia para cada uno de dichos canales múltiples y coeficientes
de predicción lineal para cada uno de dichos canales múltiples.
11. Decodificador de audio según una de las
reivindicaciones 9 a 10, en el que dicha información sobre la
actividad respectiva en dichos canales múltiples incluye por lo
menos uno de entre:
- -
- un factor de ganancia para cada uno de dichos canales múltiples;
- -
- una combinación de factores de ganancia durante un periodo breve de tiempo para cada uno de dichos canales múltiples;
- -
- coeficientes de predicción lineal para cada uno de dichos canales múltiples;
- -
- el nivel de energía en por lo menos parte de la banda de frecuencias de dicha señal de audio multicanal para cada uno de dichos canales múltiples; e
- -
- información colateral independiente sobre dicha actividad recibida desde un extremo codificador que proporciona dicha señal de audio multicanal codificada.
12. Decodificador de audio según una de las
reivindicaciones 9 a 11, en el que dicha parte de selección de
parámetros está adaptada para despreciar en dicha combinación el
valor de por lo menos un parámetro que esté disponible para un
primero de entre dichos canales múltiples, en el caso de que dicha
información sobre la actividad en dichos canales múltiples indique
que la actividad en dicho primer canal es considerablemente menor
que en por lo menos otro de dichos canales múltiples.
13. Decodificador de audio según la
reivindicación 12, en el que dicha parte de selección de parámetros
está adaptada para promediar los valores de por lo menos otro
parámetro que estén disponibles para dichos canales múltiples en
dicha combinación, en el caso de que dicha información sobre la
actividad en dichos canales múltiples indique que la actividad en
un primero de entre dichos canales múltiples es considerablemente
menor que en por lo menos otro de dichos canales múltiples.
14. Decodificador de audio según una de las
reivindicaciones 9 a 13, en el que dicha parte de selección de
parámetros está adaptada para promediar los valores de dichos
parámetros que están disponibles para dichos canales múltiples, en
el caso de que dicha información sobre la actividad en dichos
canales múltiples no indique que la actividad en uno de dichos
canales múltiples es considerablemente menor que en por lo menos
otro de dichos canales múltiples.
15. Decodificador de audio según una de las
reivindicaciones 9 a 14, en el que dicha señal multicanal es una
señal estereofónica.
16. Terminal móvil que comprende un
decodificador de audio según una de las reivindicaciones 9 a 15.
17. Sistema de codificación que incluye un
codificador de audio que proporciona una señal de audio multicanal
codificada, comprendiendo dicha señal de audio multicanal codificada
por lo menos para una parte de la banda de frecuencias de una señal
de audio multicanal original valores de parámetros independientes
para cada uno de los canales de dicha señal de audio multicanal, y
un decodificador de audio según una de las reivindicaciones 9 a
15.
18. Sistema de codificación según la
reivindicación 17, en el que dicho codificador de audio comprende un
componente de evaluación adaptado para determinar información sobre
la actividad en dichos canales múltiples y adaptado para
proporcionar dicha información para ser usada por dicho
decodificador de audio.
19. Producto de programa de software en el que
se almacena un código de software para sintetizar una señal de
audio monofónica sobre la base de una señal de audio multicanal
codificada disponible, comprendiendo dicha señal de audio
multicanal codificada por lo menos para una parte de la banda de
frecuencias de una señal de audio multicanal original valores de
parámetros independientes para cada uno de los canales de dicha
señal de audio multicanal, realizando dicho código de software las
etapas del método según una de las reivindicaciones 1 a 8 cuando se
ejecuta en un decodificador de audio.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/IB2004/000715 WO2005093717A1 (en) | 2004-03-12 | 2004-03-12 | Synthesizing a mono audio signal based on an encoded miltichannel audio signal |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2295837T3 true ES2295837T3 (es) | 2008-04-16 |
Family
ID=34957094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES04720099T Expired - Lifetime ES2295837T3 (es) | 2004-03-12 | 2004-03-12 | Sistesis de una señal de audio monofonica sobre la base de una señal de audio multicanal codificada. |
Country Status (12)
Country | Link |
---|---|
US (1) | US7899191B2 (es) |
EP (1) | EP1723639B1 (es) |
JP (1) | JP4495209B2 (es) |
CN (1) | CN1926610B (es) |
AT (1) | ATE378677T1 (es) |
AU (1) | AU2004317678C1 (es) |
BR (1) | BRPI0418665B1 (es) |
CA (1) | CA2555182C (es) |
DE (1) | DE602004010188T2 (es) |
ES (1) | ES2295837T3 (es) |
RU (1) | RU2381571C2 (es) |
WO (1) | WO2005093717A1 (es) |
Families Citing this family (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006025337A1 (ja) * | 2004-08-31 | 2006-03-09 | Matsushita Electric Industrial Co., Ltd. | ステレオ信号生成装置およびステレオ信号生成方法 |
KR20070090217A (ko) * | 2004-12-28 | 2007-09-05 | 마츠시타 덴끼 산교 가부시키가이샤 | 스케일러블 부호화 장치 및 스케일러블 부호화 방법 |
US8271872B2 (en) * | 2005-01-05 | 2012-09-18 | Apple Inc. | Composite audio waveforms with precision alignment guides |
CN101111887B (zh) * | 2005-02-01 | 2011-06-29 | 松下电器产业株式会社 | 可扩展编码装置和可扩展编码方法 |
DE602005025027D1 (de) * | 2005-03-30 | 2011-01-05 | Nokia Corp | Quellencodierung und/oder -decodierung |
FR2891098B1 (fr) * | 2005-09-16 | 2008-02-08 | Thales Sa | Procede et dispositif de mixage de flux audio numerique dans le domaine compresse. |
KR100647336B1 (ko) | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
US9515843B2 (en) * | 2006-06-22 | 2016-12-06 | Broadcom Corporation | Method and system for link adaptive Ethernet communications |
BRPI0713236B1 (pt) * | 2006-07-07 | 2020-03-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Conceito para combinação de múltiplas fontes de áudio parametricamente codificadas |
KR101393298B1 (ko) * | 2006-07-08 | 2014-05-12 | 삼성전자주식회사 | 적응적 부호화/복호화 방법 및 장치 |
KR101434198B1 (ko) * | 2006-11-17 | 2014-08-26 | 삼성전자주식회사 | 신호 복호화 방법 |
KR20080052813A (ko) * | 2006-12-08 | 2008-06-12 | 한국전자통신연구원 | 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법 |
KR101379263B1 (ko) | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
US8655650B2 (en) | 2007-03-28 | 2014-02-18 | Harris Corporation | Multiple stream decoder |
US8392198B1 (en) * | 2007-04-03 | 2013-03-05 | Arizona Board Of Regents For And On Behalf Of Arizona State University | Split-band speech compression based on loudness estimation |
CN101925953B (zh) * | 2008-01-25 | 2012-06-20 | 松下电器产业株式会社 | 编码装置、解码装置以及其方法 |
KR101452722B1 (ko) * | 2008-02-19 | 2014-10-23 | 삼성전자주식회사 | 신호 부호화 및 복호화 방법 및 장치 |
KR101223835B1 (ko) | 2008-07-11 | 2013-01-17 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 신호 합성기 및 오디오 신호 인코더 |
PL2346030T3 (pl) | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Koder audio, sposób kodowania sygnału audio oraz program komputerowy |
KR101381513B1 (ko) | 2008-07-14 | 2014-04-07 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
CN101662688B (zh) * | 2008-08-13 | 2012-10-03 | 韩国电子通信研究院 | 音频信号的编码和解码方法及其装置 |
KR20100115215A (ko) * | 2009-04-17 | 2010-10-27 | 삼성전자주식회사 | 가변 비트율 오디오 부호화 및 복호화 장치 및 방법 |
CN102598123B (zh) * | 2009-10-23 | 2015-07-22 | 松下电器(美国)知识产权公司 | 编码装置、解码装置及其方法 |
US9508351B2 (en) * | 2009-12-16 | 2016-11-29 | Dobly International AB | SBR bitstream parameter downmix |
CA2792011C (en) | 2010-07-19 | 2016-04-26 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
TWI450266B (zh) * | 2011-04-19 | 2014-08-21 | Hon Hai Prec Ind Co Ltd | 電子裝置及音頻資料的解碼方法 |
CN103188595B (zh) * | 2011-12-31 | 2015-05-27 | 展讯通信(上海)有限公司 | 处理多声道音频信号的方法和系统 |
CN103220058A (zh) * | 2012-01-20 | 2013-07-24 | 旭扬半导体股份有限公司 | 音频数据与视觉数据同步装置及其方法 |
WO2013120531A1 (en) | 2012-02-17 | 2013-08-22 | Huawei Technologies Co., Ltd. | Parametric encoder for encoding a multi-channel audio signal |
CN104517610B (zh) * | 2013-09-26 | 2018-03-06 | 华为技术有限公司 | 频带扩展的方法及装置 |
US11308928B2 (en) | 2014-09-25 | 2022-04-19 | Sunhouse Technologies, Inc. | Systems and methods for capturing and interpreting audio |
EP3889954B1 (en) | 2014-09-25 | 2024-05-08 | Sunhouse Technologies, Inc. | Method for extracting audio from sensors electrical signals |
BR112017003218B1 (pt) | 2014-12-12 | 2021-12-28 | Huawei Technologies Co., Ltd. | Aparelho de processamento de sinal para aprimorar um componente de voz dentro de um sinal de áudio multicanal |
SG11201806256SA (en) | 2016-01-22 | 2018-08-30 | Fraunhofer Ges Forschung | Apparatus and method for mdct m/s stereo with global ild with improved mid/side decision |
US10109284B2 (en) * | 2016-02-12 | 2018-10-23 | Qualcomm Incorporated | Inter-channel encoding and decoding of multiple high-band audio signals |
CN109155803B (zh) * | 2016-08-26 | 2021-07-20 | 荣耀终端有限公司 | 音频数据处理方法、终端设备和存储介质 |
EP3891737A4 (en) * | 2019-01-11 | 2022-08-31 | Boomcloud 360, Inc. | SOUND STAGE CONTAINING FROM AUDIO CHANNEL SUMMATION |
US11140483B2 (en) | 2019-03-05 | 2021-10-05 | Maxim Integrated Products, Inc. | Management of low frequency components of an audio signal at a mobile computing device |
CN112218020B (zh) * | 2019-07-09 | 2023-03-21 | 海信视像科技股份有限公司 | 一种多声道平台音频数据传输方法及其装置 |
WO2021004049A1 (zh) * | 2019-07-09 | 2021-01-14 | 海信视像科技股份有限公司 | 显示装置、音频数据传输方法及装置 |
CN113192523A (zh) * | 2020-01-13 | 2021-07-30 | 华为技术有限公司 | 一种音频编解码方法和音频编解码设备 |
CN113223539B (zh) * | 2020-01-20 | 2023-05-26 | 维沃移动通信有限公司 | 一种音频传输方法及电子设备 |
CN111654745B (zh) * | 2020-06-08 | 2022-10-14 | 海信视像科技股份有限公司 | 多声道的信号处理方法及显示设备 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1992012607A1 (en) * | 1991-01-08 | 1992-07-23 | Dolby Laboratories Licensing Corporation | Encoder/decoder for multidimensional sound fields |
US5274740A (en) * | 1991-01-08 | 1993-12-28 | Dolby Laboratories Licensing Corporation | Decoder for variable number of channel presentation of multidimensional sound fields |
JP3793235B2 (ja) | 1996-02-08 | 2006-07-05 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 2チャネル伝送及び1チャネル伝送に適合するnチャネル伝送 |
US5899969A (en) * | 1997-10-17 | 1999-05-04 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with gain-control words |
US6757659B1 (en) * | 1998-11-16 | 2004-06-29 | Victor Company Of Japan, Ltd. | Audio signal processing apparatus |
US6765930B1 (en) * | 1998-12-11 | 2004-07-20 | Sony Corporation | Decoding apparatus and method, and providing medium |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US7447321B2 (en) * | 2001-05-07 | 2008-11-04 | Harman International Industries, Incorporated | Sound processing system for configuration of audio signals in a vehicle |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7039204B2 (en) | 2002-06-24 | 2006-05-02 | Agere Systems Inc. | Equalization for audio mixing |
CN100481735C (zh) * | 2002-08-21 | 2009-04-22 | 广州广晟数码技术有限公司 | 用于从编码后的音频数据流中解码重建多声道音频信号的解码方法 |
CN100349207C (zh) * | 2003-01-14 | 2007-11-14 | 北京阜国数字技术有限公司 | 高频耦合的伪小波5声道音频编/解码方法 |
-
2004
- 2004-03-12 CN CN200480042422.XA patent/CN1926610B/zh not_active Expired - Lifetime
- 2004-03-12 JP JP2007502419A patent/JP4495209B2/ja not_active Expired - Lifetime
- 2004-03-12 BR BRPI0418665A patent/BRPI0418665B1/pt active IP Right Grant
- 2004-03-12 WO PCT/IB2004/000715 patent/WO2005093717A1/en active IP Right Grant
- 2004-03-12 AU AU2004317678A patent/AU2004317678C1/en not_active Expired
- 2004-03-12 EP EP04720099A patent/EP1723639B1/en not_active Expired - Lifetime
- 2004-03-12 AT AT04720099T patent/ATE378677T1/de active
- 2004-03-12 RU RU2006131451/09A patent/RU2381571C2/ru active
- 2004-03-12 US US10/592,255 patent/US7899191B2/en active Active
- 2004-03-12 ES ES04720099T patent/ES2295837T3/es not_active Expired - Lifetime
- 2004-03-12 DE DE602004010188T patent/DE602004010188T2/de not_active Expired - Lifetime
- 2004-03-12 CA CA2555182A patent/CA2555182C/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
BRPI0418665A (pt) | 2007-06-05 |
BRPI0418665B1 (pt) | 2018-08-28 |
RU2006131451A (ru) | 2008-04-20 |
AU2004317678B2 (en) | 2009-02-05 |
CN1926610A (zh) | 2007-03-07 |
AU2004317678C1 (en) | 2009-09-24 |
CN1926610B (zh) | 2010-10-06 |
US7899191B2 (en) | 2011-03-01 |
DE602004010188T2 (de) | 2008-09-11 |
WO2005093717A8 (en) | 2006-04-13 |
WO2005093717A1 (en) | 2005-10-06 |
RU2381571C2 (ru) | 2010-02-10 |
ATE378677T1 (de) | 2007-11-15 |
US20070208565A1 (en) | 2007-09-06 |
CA2555182C (en) | 2011-01-04 |
CA2555182A1 (en) | 2005-10-06 |
EP1723639B1 (en) | 2007-11-14 |
AU2004317678A1 (en) | 2005-10-06 |
DE602004010188D1 (de) | 2007-12-27 |
JP2007529031A (ja) | 2007-10-18 |
EP1723639A1 (en) | 2006-11-22 |
JP4495209B2 (ja) | 2010-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2295837T3 (es) | Sistesis de una señal de audio monofonica sobre la base de una señal de audio multicanal codificada. | |
ES2309969T3 (es) | Procedimiento y dispositivo para la ampliacion artificial de la anchura de banda de señales de voz. | |
ES2266003T3 (es) | Suavizador de la ganancia en un descodificador de señal de habla y audio de banda ancha. | |
ES2401487T3 (es) | Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena | |
ES2391292T3 (es) | Sistemas, procedimientos y aparato para la generación de una señal de excitación de banda alta | |
JP6606190B2 (ja) | マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ | |
ES2218462T3 (es) | Mejora del rendimiento de sistemas de cifrado que usan metodos de reconstruccion de alta frecuencia. | |
ES2205892T3 (es) | Aumento de la periodicidad al descodificar señales de banda ancha. | |
ES2338117T3 (es) | Codificacion de audio con diferentes longitudes de trama de codificacion. | |
ES2592416T3 (es) | Esquema de codificación/decodificación de audio que tiene una derivación conmutable | |
ES2439549T3 (es) | Un aparato y un método para decodificar una señal de audio codificada | |
ES2337270T3 (es) | Clasificacion de señales audio. | |
CN101180677B (zh) | 用于宽频带语音编码的系统、方法和设备 | |
ES2770146T3 (es) | Conformación temporal y espacial de señales de audio multicanal | |
ES2519415T3 (es) | Codificación estéreo avanzada basada en una combinación de codificación estéreo izquierda/derecha o central/lateral seleccionable de manera adaptativa y de codificación estéreo paramétrica | |
ES2434251T3 (es) | Método y aparato para generar una capa de mejora dentro de un sistema de codificación de audio de múltiples canales | |
ES2745289T3 (es) | Procedimiento y dispositivo de extensión de ancho de banda | |
ES2725305T3 (es) | Aparato y procedimiento para codificar una señal de audio usando una parte de anticipación alineada | |
US20090061785A1 (en) | Scalable decoder and scalable decoding method | |
KR101407120B1 (ko) | 오디오 신호를 처리하고 결합된 통합형 음성 및 오디오 코덱(usac)을 위한 보다 높은 시간적 입도를 제공하기 위한 장치 및 방법 | |
CN105280190A (zh) | 带宽扩展编码和解码方法以及装置 | |
JP4927264B2 (ja) | オーディオ信号を符号化する方法 | |
ES2406422T3 (es) | Esquema multimodo para codificación mejorada de audio | |
KR100923478B1 (ko) | 부호화된 다중채널 오디오 신호에 기반하여 모노 오디오신호를 합성하는 방법 및 장치 | |
ZA200607569B (en) | Synthesizing a mono audio signal based on an encoded multichannel audio signal |