ES2433316T3 - Generación de señales de audio de multiples canales - Google Patents

Generación de señales de audio de multiples canales Download PDF

Info

Publication number
ES2433316T3
ES2433316T3 ES06780055T ES06780055T ES2433316T3 ES 2433316 T3 ES2433316 T3 ES 2433316T3 ES 06780055 T ES06780055 T ES 06780055T ES 06780055 T ES06780055 T ES 06780055T ES 2433316 T3 ES2433316 T3 ES 2433316T3
Authority
ES
Spain
Prior art keywords
channels
signal
audio
channel
decoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES06780055T
Other languages
English (en)
Inventor
Dirk J. Breebaart
Lars F. Villemoes
Heiko Purnhagen
Christof Faller
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Dolby International AB
Agere Systems LLC
Original Assignee
Koninklijke Philips NV
Dolby International AB
Koninklijke Philips Electronics NV
Agere Systems LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=37398669&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2433316(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Koninklijke Philips NV, Dolby International AB, Koninklijke Philips Electronics NV, Agere Systems LLC filed Critical Koninklijke Philips NV
Application granted granted Critical
Publication of ES2433316T3 publication Critical patent/ES2433316T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)

Abstract

Un decodificador para generar una señal de audio de canal múltiple, caracterizado porque comprende: - un medio para recibir (401) una primera señal que comprende un primer conjunto de canales de audio; - un medio de cálculo (405) para generar datos paramétricos calculados para un segundo conjunto de canales de audio en respuesta a características del primer conjunto de canales de audio; los datos paramétricos calculados relacionan características del segundo conjunto de canales de audio con características del primer conjunto de canales de audio; y - un decodificador de audio espacial (403) para decodificar la primera señal en respuesta a los datos paramétricos calculados para generar una señal de audio de canal múltiple que comprende el segundo conjunto de canales.

Description

Generacion de señales de audio de multiples canales
[0001] La invención se refiere a la generación de las 5 señales de audio de múltiples canales mediante la decodificación de audio espacial y en particular, aunque no de manera exclusiva, a la generación de señales de audio de múltiples canales a partir de una señal de estéreo de sonido envolvente codificada de matriz.
[0002] La codificación digital de varias señales de origen se ha vuelto cada vez más importante a través de las últimas décadas a medida que la representación de señal digital y la comunicación han reemplazado cada vez más a la representación y a la comunicación analógica. Por ejemplo, los sistemas telefónicos móviles, tales como El Sistema Global para Comunicaciones Móviles, están basados en la codificación digital de voz o conversación. También la distribución del contenido de medios, tal como el video y la música, cada vez más está basada en la codificación digital de contenido.
[0003] Además, en la última década ha existido la tendencia hacia el audio de múltiples canales y de manera específica, hacia el audio espacial que se extiende más allá de las señales convencionales de estéreo. Por ejemplo, las grabaciones tradicionales de estéreo sólo comprenden dos 25 canales mientras que los sistemas avanzados modernos de audio normalmente utilizan cinco o seis canales, como en los populares sistemas de sonido envolvente de 5.1 canales. Esto proporciona una experiencia de escucha más involucrada en donde el usuario puede ser rodeado o envuelto por fuentes de 5 sonido.
[0004] varias técnicas y estándares han sido desarrollados para la comunicación de estas señales de múltiples canales. Por ejemplo, seis canales discretos que representan un sistema envolvente de 5.1 canales podrían ser transmitidos de acuerdo con los estándares tales como la Codificación Avanzada de Audio (AAC) o los estándares Dolby Digital.
[0005] No obstante, con el fin de proporcionar una compatibilidad hacia atrás, es conocido el mezclado descendente de un número más alto de canales en un número más 15 bajo y de manera específica, es frecuentemente utilizado para el mezclado descendente o hacia abajo de una señal de sonido envolvente de 5.1 canales con una señal de estéreo que permite que la señal de estéreo sea reproducida por los decodificadores de legado (estéreo) y una señal de 5.1 canales por los decodificadores de sonido envolvente.
[0006] Estos procedimientos existentes para las transmisiones de múltiples canales compatibles hacia atrás, sin una información adicional de múltiples canales normalmente, pueden estar caracterizados como procedimientos envolventes de 25 matriz. Los ejemplos de la codificación de sonido envolvente de matriz incluyen procedimientos tales como Dolby Prologic II y Logic-7. El principio común de estos procedimientos es que la matriz multiplica los múltiples canales de la señal de entrada por una matriz adecuada no cuadrática, con lo cual, se genera una señal de salida con un número más bajo de canales. De manera específica, un codificador de matriz normalmente aplica cambios de fase a los canales envolventes antes de su mezclado con los canales frontal y central. La generación
[0007] De esta manera, la señal izquierda de mezclado descendente (Lt) consiste de la señal izquierda-frontal (Lf), la señal central (c) multiplicada por un factor q, la señal izquierda-envolvente (Ls) girada de fase en 90 grados (,j') y de escala por un factor a, y finalmente, la señal derechaenvolvente (Rs) que también es girada de fase en 90 grados y de escala por un factor b. La señal derecha de mezclado descendente (Rt) es generada de manera similar. Los factores comunes de mezclado descendente son 0.707 para q y a, y 0.408 para b.
[0008] Lo racional para los signos opuestos para la señal 25 derecha de mezclado descendente (Rt) es que los canales envolventes son mezclados en una fase contraria en el par de mezclado descendente (Lt, Rt). Esta propiedad ayuda al decodificador a discriminar entre los canales frontal y posterior del par de señales de mezclado descendente. Un decodificador puede reconstruir (de manera parcial) la señal de múltiples canales a partir del mezclado descendente de estéreo aplicando una operación de eliminación de matriz. La manera como la señal de múltiples canales se asemeja con exactitud a la señal original de múltiples canales estará en función de las propiedades específicas del contenido del audio de múltiples canales.
[0009] Aunque los sistemas de sonido envolvente de matriz proporcionan compatibilidad hacia atrás, estos sólo pueden proporcionar una baja calidad de audio si se compara con los sistemas/codificadores discretos envolventes, tales como los sistemas AAC o Dolby Digital.
[0010] Una técnica de codificación/decodificación conocida como Codificación de Audio Espacial (SAC) ha sido desarrollada a fin de proporcionar una calidad mejorada para las señales de audio de mezclado descendente. En la SAC, el decodificador mezcla hacia abajo los canales hasta un número más bajo y además genera datos paramétricos, los cuales describen las características de las señales de múltiples canales con relación a las señales de mezclado descendente. A continuación, los datos paramétricos adicionales son incluidos en el flujo de bits junto con la señal de mezclado descendente que normalmente es una señal de audio mono o estéreo. De esta manera, los decodificadores de legado pueden ignorar los datos paramétricos adicionales y volver a generar una señal mono
o estéreo (o posiblemente una señal de sonido envolvente decodificada de matriz de baja calidad). Además, los decodificadores SAC pueden extraer los datos paramétricos y utilizar estos para generar una señal de múltiples canales de calidad más alta.
[0011] Sin embargo, un problema con este procedimiento es que muchos sistemas no están equipados para las señales codificadas SAC. Por ejemplo, muchos sistemas sólo utilizan la codificación de sonido envolvente de matriz que no genera datos paramétricos SAC. Además, muchos estándares de señal y de decodificación no proporcionan la flexibilidad que permita que los datos paramétricos adicionales sean incluidos, de esta manera, se requiere un cambio completo hacia un nuevo estándar antes de que pueda ser desplegada la SAC. Esto podría requerir que todos los codificadores y decodificadores existentes en el sistema sean remplazados por codificadores y decodificadores activados SAC. De manera específica, existen muchos sistemas de legado basados en dos canales de estéreo (tales como radio, radio digital, etc.) en donde el esfuerzo para agregar información adicional necesaria para la SAC no es factible, es decir, el costo para extender estos sistemas a la utilización de la SAC es demasiado alto. Además, existen grandes cantidades disponibles de materiales de audio codificados de matriz y esto necesitaría una nueva codificación por un codificador SAC antes que puedan ser conseguidos los beneficios de la decodificación SAC.
[0012] Por lo tanto, un sistema mejorado para el procesamiento y/o comunicación de señales de audio de múltiples canales sería ventajoso y en particular, sería ventajoso que permita de manera funcional el aumento en la flexibilidad, el incremento de la calidad de audio, el aumento de aplicabilidad de los principios y/o el rendimiento mejorado SAC.
[0013] US 2005/0058304 A1 describe un esquema de codificación / decodificación de audio basado en colas. Específicamente , se proporcionan dos o más canales de entrada en el dominio de la frecuencia . Se generan uno o más códigos de referencia para cada una de una o más bandas de frecuencia diferentes en los dos o más canales de entrada en el dominio de la frecuencia . Por otra parte , los canales de entrada se mezclan para generar un número de canales de transmisión . En el lado del decodificador , se utiliza un sintetizador BCC que tiene un banco de filtros para cada canal de transmisión , un bloque de mezcla ascendente , retardos , multiplicadores , un bloque de correlación y un banco de filtros inversos para cada canal de reproducción .
[0014] US 2003/0040822 A1 da a conocer un sistema de procesamiento de sonido para reducir la distorsión de altavoz a altos niveles de volumen mediante la atenuación de la ganancia del filtro y / o el tono de las señales de salida de audio y mixtas . El sistema de procesamiento de sonido tiene uno o más filtros para atenuar la ganancia y el tono de filtro en respuesta a los altos niveles de volumen . El sistema de procesamiento de sonido también puede atenuar la ganancia y el tono del filtro en respuesta a un nivel de presión de sonido , que puede ser proporcionado por un micrófono .
[0015] Es un objeto de la presente invención proporcionar un sistema mejorado para procesar y/o comunicar señales de audio multi-canal.
[0016] Este objeto se consigue mediante un decodificador de acuerdo con la reivindicación 1, un procedimiento de generación de una señal de audio multicanal según la reivindicación 15, un producto de programa de ordenador según la reivindicación 16, un receptor de acuerdo con la reivindicación 17, un sistema de transmisión de conformidad con la reivindicación 18, un procedimiento de transmisión y recepción de acuerdo con la reivindicación 19, o un dispositivo de reproducción de audio según la reivindicación 20.
[0017] Por consiguiente, la invención busca de preferencia mitigar, aliviar o eliminar una o más de las desventajas mencionadas con anterioridad, solas o en combinación.
[0018] La invención podría permitir un rendimiento mejorado. De manera específica, la invención podría permitir que los principios de la decodificación de audio espacial sean utilizados para las señales que no comprenden los parámetros de la Codificación de Audio Espacial (SAC). La aplicabilidad del decodificador podría ser sustancialmente incrementada y por ejemplo, podría utilizarse con los codificadores de matriz y las señales codificadas. Una calidad mejorada de audio puede ser conseguida a través de la decodificación de audio espacial.
[0019] De manera general, el segundo conjunto de canales comprende más canales que el primer conjunto de canales. El segundo conjunto de canales de audio puede comprender uno o más del primer conjunto de canales de audio. Uno o más del segundo conjunto de canales de audio podrían ser generados sin la utilización de los datos paramétricos estimados. Los datos paramétricos estimados podrían ser, de manera específica, los datos que corresponden con los parámetros de audio espacial y en particular, los parámetros de audio espacial como son normalmente generados por los codificadores convencionales SAC.
[0020] Los datos paramétricos estimados podrían relacionar, de manera directa, una característica específica del primer conjunto de canales de audio con una característica específica del segundo conjunto de canales y/o podrían comprender, por ejemplo, valores de datos que relacionan las características de los distintos canales del segundo conjunto de canales, con lo cual, es indicativo de la manera como puede decodificarse la primera señal a fin de proporcionar el segundo conjunto de canales de audio. Las características podrían ser una serie de medidas de un parámetro único con respecto a distintos intervalos de tiempo. De manera alterna, las características podrían referirse a más de un parámetro único.
[0021] De acuerdo con una característica opcional de la invención, la primera señal no comprende datos paramétricos de audio relacionados con el segundo conjunto de canales.
[0022] La invención permite que los principios de la decodificación de audio espacial sean aplicados a una señal que no comprende datos paramétricos de audio al menos para algunos de los canales de salida. Por lo tanto, la invención podría permitir una calidad mejorada para las señales codificadas sin-SAC. La invención podría permitir una compatibilidad mejorada hacia atrás y en particular, podría permitir una calidad mejorada de audio para las señales decodificadas de sonido envolvente que provienen de las señales de sonido envolvente codificadas de matriz.
[0023] De acuerdo con una característica opcional de la invención, el medio de estimación comprende el medio que determina los primeros datos de parámetro para el primer conjunto de canales de audio y el medio que mapea los primeros datos de parámetro con los datos estimados de parámetro para el segundo conjunto de canales de audio.
[0024] Esto podría permitir una implementación eficiente y una estimación de los datos de parámetro que podrían proporcionar una calidad decodificada de audio particularmente alta. El mapeo podría ser, por ejemplo, a través del empleo de una tabla de búsqueda o mediante la evaluación de una función matemática. De esta manera, existe una relación directa entre los valores estimados de parámetro y los valores específicos de parámetro de los primeros datos de parámetro.
[0025] De acuerdo con una característica opcional de la invención, los primeros datos de parámetro comprenden al menos un valor de diferencia de nivel entre canales por lo menos para dos canales de audio del primer conjunto de señales de audio.
[0026] Esto podría permitir una implementación eficiente y la estimación de los datos de parámetro que pudieran proporcionar una calidad decodificada de audio particularmente alta. En particular, la investigación ha mostrado que el valor de diferencia de nivel entre canales es particularmente conveniente para la estimación de los datos paramétricos asociados SAC a partir de una señal de sonido envolvente codificada de matriz. Los inventores de la presente invención han notado que existe una alta correlación entre la diferencia de nivel entre canales, por ejemplo, de una señal de sonido envolvente codificada de matriz de estéreo y los datos SAC para la señal de sonido envolvente.
[0027] De acuerdo con una característica opcional de la invención, los primeros datos de parámetro comprenden al menos un valor de coeficiente de correlación entre canales al menos para dos canales de audio del primer conjunto de señales de audio.
[0028] Esto podría permitir una implementación eficiente y una estimación de los datos de parámetro que pudiera proporcionar una calidad decodificada de audio particularmente alta. En particular, la investigación ha mostrado que un valor del coeficiente de correlación entre canales es particularmente conveniente para la estimación de los datos paramétricos asociados SAC a partir de una señal de sonido envolvente codificada de matriz. Los inventores de la presente invención han notado que existe una alta correlación entre el coeficiente de correlación entre canales, por ejemplo, de una señal de sonido envolvente codificada de matriz de estéreo y los datos SAC para la señal de sonido envolvente.
[0029] De acuerdo con una característica opcional de la invención, la señal de audio de múltiples canales es una señal de sonido envolvente y los datos estimados de parámetro comprenden por lo menos un parámetro seleccionado a partir del grupo que consiste de: una diferencia de nivel entre canales entre el canal izquierdo-frontal y un canal izquierdo-envolvente del segundo conjunto de canales; una diferencia de nivel entre canales entre un canal derechofrontal y un canal derecho-envolvente del segundo conjunto de canales; un coeficiente de correlación entre canales entre un canal izquierdo-frontal y un canal izquierdo-envolvente del segundo conjunto de canales; un coeficiente de correlación entre canales entre un canal derecho-frontal y un canal derecho-envolvente del segundo conjunto de canales; un coeficiente de predicción para un canal central del segundo conjunto de canales de audio; y una diferencia de nivel entre canales entre un canal central y otro canal (o una combinación de canales) del segundo conjunto de canales.
[0030] Esto podría permitir un rendimiento particularmente alto. De manera específica, estos parámetros son particularmente convenientes para la generación de una señal decodificada de alta calidad a través de un decodificador de audio espacial y normalmente, tienen una alta correlación entre los parámetros de una señal de entrada tal como la de un sistema de sonido envolvente codificado por matriz.
[0031] Al menos un parámetro seleccionado a partir del grupo podría ser generado mediante un mapeo directo del valor de diferencia de nivel entre canales y/o el valor de coeficiente de correlación entre canales al menos para dos canales de audio del primer conjunto de señales de audio al menos con un parámetro.
[0032] De acuerdo con una característica opcional de la invención, el aparato además comprende el medio que genera mosaicos de frecuencia de tiempo; y en donde el medio de estimación es situado para generar los datos paramétricos estimados para los mosaicos de frecuencia de tiempo.
[0033] Esto facilita la operación y/o mejora la calidad. En particular, podría permitir un mapeo facilitado y/o mejorado entre los parámetros extraídos de la primera señal y los datos paramétricos estimados.
[0034] De acuerdo con una característica opcional de la invención, el medio de estimación comprende el medio de mapeo directo de un conjunto por lo menos de una característica de señal del primer conjunto de canales de audio para un mosaico de frecuencia de tiempo en un valor de datos paramétricos para el segundo conjunto de canales de audio.
[0035] Esto podría permitir una implementación eficiente y una estimación de los datos de parámetro que pudiera proporcionar una calidad decodificada de audio particularmente alta. El mapeo podría ser, por ejemplo, a través del empleo de una tabla de búsqueda o mediante la evaluación de una función matemática. De esta manera, es aplicada una relación directa entre el conjunto de características de señal y los valores correspondientes de los datos estimados de parámetro. Las características de señal podrían ser la diferencia de nivel entre canales y/o un coeficiente de correlación entre canales para los dos canales del primer conjunto de canales de audio y éstos podrían mapearse en forma directa, por ejemplo, en los coeficientes de predicción y/o los coeficientes de correlación entre canales y/o las diferencias de nivel entre canales para el segundo conjunto de canales de audio.
[0036] De acuerdo con una característica opcional de la invención, el decodificador de audio espacial es situado para realizar al menos una operación de matriz utilizando los parámetros determinados en respuesta a los datos paramétricos estimados.
[0037] Esto podría permitir un alto rendimiento. En particular, podría permitir una implementación adecuada con una alta calidad de decodificación.
[0038] De acuerdo con una característica opcional de la invención, el decodificador además comprende el medio de extracción de los datos paramétricos de una segunda señal, y el decodificador de audio espacial puede ser operado para descifrar la segunda señal en respuesta a los datos paramétricos extraídos.
[0039] El decodificador podría ser situado para manejar ambas de las señales codificadas SAC y las señales codificadas sin-SAC utilizando el mismo codificador de audio espacial. Para las señales codificadas SAC, los datos extraídos podrían ser utilizados, mientras que para las señales codificadas sin-SAC, podrían ser empleados los datos paramétricos estimados. La invención podría proporcionar un aumento en la aplicabilidad y/o compatibilidad hacia atrás. El aparato podría ser situado para decodificar la primera señal en respuesta a los datos paramétricos extraídos, con lo cual, se permite las correlaciones entre la primera y segunda señal que serán explotadas.
[0040] De acuerdo con una característica opcional de la invención, el decodificador además comprende el medio que selecciona un modo de decodificación en respuesta a una característica de la primera señal.
[0041] El decodificador podría ser situado, por ejemplo, para operar en un primer modo, en donde son estimados los datos paramétricos SAC y en un segundo modo, en donde son extraídos los datos paramétricos SAC de la señal recibida y podrían ser situados para seleccionar entre el primer y el segundo modos en respuesta a si la primera señal comprende o no los datos SAC. De esta manera, puede conseguirse un decodificador altamente flexible con la capacidad de procesar una diversidad de distintos tipos de señal.
[0042] De acuerdo con una característica opcional de la invención, el primer conjunto de canales de audio consiste de dos canales de audio.
[0043] La invención podría permitir la decodificación mejorada de señales de múltiples canales mezcladas hacia abajo con una señal de estéreo.
[0044] De acuerdo con una característica opcional de la invención, la primera señal es una señal de sonido envolvente codificada de matriz.
[0045] De manera particular, la invención podría permitir una decodificación mejorada de las señales de múltiples canales de mezclado descendente con una señal de sonido envolvente codificada de matriz. En particular, los experimentos han mostrado que pueden estimarse datos muy exactos SAC para las señales de sonido envolvente codificadas de matriz en base a los canales de estéreo de la señal.
[0046] De acuerdo con una característica opcional de la invención, el decodificador además comprende una matriz de inversión de matriz-envolvente, y el medio que determina por lo menos el coeficiente de la matriz de inversión de matriz-envolvente en respuesta a los datos paramétricos estimados.
[0047] Esto podría permitir una calidad mejorada de audio decodificado para una señal envolvente codificada en matriz.
[0048] Estos y otros aspectos, características y ventajas de la invención serán aparentes y aclarados con referencia a la(s) modalidad(es) descritas de aquí en adelante.
[0049] Las modalidades de la invención serán descritas, sólo por medio de ejemplo, con referencia las figuras, en las cuales:
La Figura 1 ilustra un sistema de transmisión para la comunicación de una señal de audio de acuerdo con algunas modalidades de la invención;
La Figura 2 ilustra un diagrama de bloque de un codificador común SAC;
La Figura 3 ilustra un ejemplo de un decodificador común SAC;
La Figura 4 ilustra un decodificador de acuerdo con algunas modalidades de la invención;
La Figura 5 ilustra elementos de un decodificador de acuerdo con algunas modalidades de la invención; y
La Figura 6 ilustra un procedimiento de generación de una señal de audio de múltiples canales de acuerdo con algunas modalidades de la invención.
[0050] La siguiente descripción se enfoca en las modalidades de la invención que pueden ser aplicadas en la decodificación de señales de sonido envolvente de matriz de mezclado descendente con señales de estéreo. Sin embargo, será apreciado que la invención no se limita a esta aplicación sino que podría ser aplicada en muchas otras señales.
[0051] La Figura 1 ilustra un sistema de transmisión 100 para la comunicación de una señal de audio de acuerdo con algunas modalidades de la invención. El sistema de transmisión 100 comprende un transmisor 101 que es conectado con un receptor 103 a través de una red 105, la cual podría ser específicamente la Internet.
[0052] En el ejemplo específico, el transmisor 101 es un dispositivo de grabación de señal y el receptor es un dispositivo de reproducción de señal 103 aunque será apreciado que en otras modalidades el transmisor y el receptor podrían ser utilizados en otras aplicaciones y para otros usos. Por ejemplo, el transmisor 101 y/o el receptor 103 podrían ser partes de una funcionalidad de transcodificación y podrían proporcionar, por ejemplo, la interconexión con otras fuentes o destinos de señal.
[0053] En el ejemplo específico en donde una función de grabación de señal sea soportada, el transmisor 101 comprende un digitalizador 107 que recibe una señal analógica que es convertida a una señal digital PCM mediante el muestreo y la conversión de analógica-a-digital. La señal analógica es específicamente una señal de múltiples canales de sonido envolvente 5.1.
[0054] El transmisor 101 es conectado con el codificador 109 de la Figura 1, el cual codifica la señal PCM de acuerdo con un algoritmo de codificación. De manera específica, el codificador es un codificador de matriz que genera una señal de estéreo de mezclado descendente utilizando la operación de matriz de la Ecuación 1. De esta manera, la señal codificada es una señal de sonido envolvente codificada de matriz.
[0055] El codificador 100 es conectado con un transmisor de red 111 que recibe la señal codificada y se interconecta con la Internet 105. El transmisor de red podría enviar la señal codificada al receptor 103 a través de la Internet 105.
[0056] El receptor 103 comprende un receptor de red 113 que se interconecta con la Internet 105 y que es situado para admitir la señal codificada que proviene del transmisor 101.
[0057] El receptor de red 111 es conectado con un decodificador 115. El decodificador 115 recibe la señal codificada y la decodifica de acuerdo con un algoritmo de decodificación.
[0058] En el ejemplo específico en donde una función de reproducción de señal sea soportada, el receptor 103 además comprende un reproductor de señal 117 que recibe la señal decodificada de audio que proviene del decodificador 115 y la presenta al usuario. De manera específica, el reproductor de señal 113 podría comprender un convertidor de digital-aanalógico, amplificadores y altavoces que son requeridos para dar salida a la señal decodificada de audio.
[0059] En la modalidad descrita, el algoritmo de decodificación que se utiliza por el decodificador 115 comprende un elemento de decodificación SAC. Por motivos de claridad, la operación del codificador normal SAC será descrita en primer lugar.
[0060] La Figura 2 ilustra un diagrama de bloque de un codificador común SAC 200. El codificador 200 divide las señales de entrada en mosaicos separados de frecuencia de tiempo por medio de un banco de Filtros de Espejo de Cuadratura (QMF) 201. Estos mosaicos de tiempo/frecuencia son generalmente referidos como "bandas de parámetro".
[0061] Para cada banda de parámetro, un elemento de codificación SAC 203 determina un número de parámetros espaciales que describen las propiedades de la imagen espacial, por ejemplo, las diferencias de nivel entre canales y los coeficientes de correlación cruzada. Además de la extracción de los parámetros, el elemento de codificación SAC 203 también genera una señal de mezclado descendente mono o estéreo a partir de la señal de entrada de múltiples canales. Por medio de los bancos de síntesis QMF 205, estas señales son transferidas al dominio de tiempo. El mezclado descendente resultante es alimentado a un procesador de flujo de bits 207 que genera un flujo de bits que comprende los canales de mezclado descendente y los datos paramétricos generados por el elemento de codificación SAC 203. De preferencia, el mezclado descendente también es codificado antes de su transmisión (utilizando un codificador convencional "central" mono o estéreo), mientras que los flujos de bits del codificador central y los parámetros espaciales se prefiere que sean combinados (multiplexados) en un flujo único de bits de salida.
[0062] En función del modo de operación, esta velocidad de datos de los datos paramétricos puede cubrir un intervalo amplio de velocidades de bits, que comienzan a partir de unos cuantos kBits/s para un audio de múltiples canales de buena calidad hasta decenas de kBits/s para una calidad casi transparente.
[0063] Además, en el caso de un mezclado descendente de estéreo, el usuario tiene la elección de un mezclado descendente convencional de estéreo o de un mezclado descendente que sea compatible con los sistemas envolventes de matriz. En el último caso, el codificador 200 puede generar un mezclado descendente compatible envolvente de matriz utilizando el procedimiento de formación de matriz de la Ecuación 1. En forma alterna, éste podría generar un mezclado descendente compatible envolvente de matriz utilizando una unidad de procesamiento posterior de mezclado descendente que trabaja en base a un mezclado descendente regular de estéreo. En esta configuración, el codificador puede comprender un procesador posterior envolvente de matriz que modifique el mezclado regular descendente de estéreo para hacerlo compatible de sonido envolvente de matriz utilizando los parámetros espaciales extraídos en la etapa de estimación de parámetro. La ventaja de este procedimiento es que el procesamiento envolvente de matriz puede ser invertido en su totalidad por un decodificador que tenga disponibles los parámetros espaciales.
[0064] Un decodificador SAC en principio realiza el proceso inverso del codificador.
[0065] La Figura 3 ilustra un ejemplo de un decodificador común SAC. El decodificador SAC 300 comprende un separador o divisor 301 que recibe el flujo de bits y los divide en la señal de mezclado descendente y los datos paramétricos. De manera subsiguiente, el mezclado descendente decodificado es procesado por un banco de análisis QMF 303 que origina bandas de parámetro que son las mismas que aquellas aplicadas en el codificador SAC 200. Una etapa de síntesis espacial 305 reconstruye la señal de múltiples canales utilizando los datos paramétricos extraídos por el divisor 301. Finalmente, las señales de dominio QMF son transferidas al dominio de tiempo por medio de un banco de síntesis QMF 307 originando las señales finales de salida de múltiples canales.
[0066] De esta manera, en sistemas en donde tanto los codificadores como los decodificadores comprenden la funcionalidad SAC, puede conseguirse una alta calidad de las señales decodificadas de múltiples canales para una velocidad de datos relativamente baja. No obstante, puesto que muchos sistemas ya desplegados y una gran cantidad de material de audio no explotan la funcionalidad SAC, los beneficios son normalmente restringidos a los nuevos sistemas y al material nuevamente codificado de audio.
[0067] En el ejemplo de la Figura 1, el decodificador, 115 comprende la funcionalidad de decodificación SAC que podría utilizarse con los codificadores sin-SAC y el material codificado sin-SAC. De esta manera, el decodificador 115 podría introducir algunas de las ventajas de la SAC sin requerir una nueva codificación o codificadores compatibles SAC y de manera específica, podría proporcionar una calidad significativamente mejorada a la relación de la velocidad de datos para las señales de múltiples canales.
[0068] La Figura 4 ilustra en mayor detalle el decodificador 115 de la Figura 1. El decodificador 115 comprende un receptor 401 que admite una señal que comprende un conjunto de canales de audio. De manera específica, el receptor admite el flujo de bits que comprende los dos canales, los cuales han sido generados a través de la codificación de matriz de la señal de sonido envolvente por el codificador 109. El receptor 401 admite el flujo de bits y genera los dos canales yl, Y2 de la señal de estéreo de mezclado descendente. Se observará que en el ejemplo específico, el codificador 109 es un codificador convencional de matriz para una señal envolvente que genera un flujo de bits que solo comprende los dos canales de mezclado descendente. De esta manera, en el ejemplo el flujo de bits comprende datos paramétricos de audio no espaciales. En otras modalidades, el codificador 109 podría ser, por ejemplo, un codificador SAC que genera una señal de estéreo compatible envolvente de matriz dentro de los datos paramétricos SAC.
[0069] El decodificador 115 además comprende un elemento de decodificación SAC 403 conectado con el receptor
401. El elemento de decodificación SAC 403 descifra los canales de mezclado descendente de estéreo y,, Y2 utilizando las técnicas SAC como se describió con anterioridad. De manera específica, la operación del elemento de decodificación SAC 403 corresponde con la operación descrita para el decodificador SAC 300 de la Figura 3. De esta manera, el elemento de decodificación SAC 403 genera una señal de sonido envolvente de salida que corresponde con la señal envolvente que fue codificada por matriz por el codificador 109.
[0070] Como se describió con anterioridad, los canales de estéreo de mezclado descendente podrían haber sido codificados por medio de un codificador de matriz como se describió en la Ecuación 1. De manera alterna, los canales de mezclado descendente podrían haber sido generados por un codificador SAC 203 que incluye una unidad de procesamiento posterior con el fin de generar un mezclado descendente compatible envolvente de matriz. En ambos casos, el elemento de decodificación SAC 403 podría incluir una unidad de procesamiento previo que invierta las operaciones aplicadas por el codificador para la compatibilidad envolvente de matriz.
[0071] El decodificador 115 además comprende un procesador de estimado 405 que es conectado con el receptor 401 y el elemento de decodificación SAC 403. El procesador de estimado 405 es situado para generar los datos paramétricos estimados que pueden ser utilizados para crear las señales envolventes de salida. De manera específica, el procesador de estimado 405 calcula los datos paramétricos que un codificador SAC pudiera haber generado para los canales de mezclado descendente si la codificación SAC hubiera sido realizada. Por lo tanto, los datos paramétricos estimados relacionan las características de los canales envolventes de salida con las características de los canales recibidos de mezclado descendente puesto que esto proporciona la información de la manera como pueden ser decodificados para generar los canales envolventes de salida.
[0072] En el ejemplo de la Figura 4, el procesador de estimado 405 genera los datos paramétricos estimados, de manera que correspondan con los datos SAC que el elemento de decodificación SAC 403 puede utilizar en forma directa a fin de determinar los canales envolventes de salida.
[0073] De esta manera, el decodificador 115 utiliza los principios de la SAC para la decodificación del material de audio envolvente codificado por matriz. El procesador de estimado 405 utiliza los avisos de señal de la señal de entrada de estéreo recibida para determinar los datos que son empleados por el elemento de decodificación SAC
403. De manera específica, el procesador de estimado 405 calcula los avisos entre canales de la señal recibida de estéreo y mapea esta a los avisos SAC que pueden ser directamente utilizados por el elemento de decodificación SAC 403. De manera específica, esto podría permitir que el elemento de decodificación SAC 403 sea un decodificador convencional SAC, con lo cual se facilita la compatibilidad hacia atrás, reduciendo los requerimientos de diseño y desarrollo y permitiendo la misma funcionalidad que será utilizada para la decodificación de las señales codificadas SAC y las señales codificadas sin-SAC. Por lo tanto, en el ejemplo los parámetros requeridos SAC son generados en el lado del decodificador utilizando los parámetros obtenidos mediante el análisis de los dos canales recibidos de mezclado descendente.
[0074] El procesador de estimado 405 comprende un procesador de análisis 407 que determina uno o más parámetros para la señal de mezclado descendente de estéreo. De manera específica, el procesador de análisis 407 genera los valores de Diferencia de Nivel entre Canales (ILD) y los valores de Coeficiente de Correlación entre Canales (ICC) para los canales de mezclado descendente de estéreo y,, Y2.
[0075] El procesador de análisis 407 es conectado con un procesador de mapeo 409 que mapea los valores ILD e ICC en valores SAC que se relacionan con los canales de salida.
[0076] El procesador de mapeo 409 utiliza, de manera específica, el hecho previamente desconocido y sorprendente de que existe normalmente una correlación estrecha entre los valores ILD e ICC para una señal envolvente codificada de matriz y los parámetros de audio espacial para los canales originales de sonido envolvente.
[0077] El procesador de mapeo 409 simplemente puede utilizar una tabla de búsqueda para determinar los valores de parámetro SAC para los canales envolventes de salida con relación a los canales de mezclado descendente de estéreo y,, y2. Los valores determinados de ILD e ICC o los valores representativos de los mismos, por ejemplo, después del proceso de cuantificación, pueden ser utilizados como la dirección para la búsqueda de tabla. En forma equivalente, el procesador de mapeo 409 puede evaluar una función predeterminada que tenga los valores ILD e ICC como los parámetros de entrada y que proporcione los parámetros requeridos SAC como los parámetros de salida.
[0078] De este modo, el procesador de mapeo 409 puede generar (por ejemplo) los siguientes parámetros SAC para los canales de sonido envolvente de salida:
-
Una diferencia de nivel entre canales entre un canal izquierdo-frontal y un canal izquierdo-envolvente.
-
Una diferencia de nivel entre canales entre un canal derecho-frontal y un canal derecho-envolvente.
-
Un coeficiente de correlación entre canales entre un canal izquierdo-frontal y un canal izquierdo-envolvente.
-
Un coeficiente de correlación entre canales entre un canal derecho-frontal y un canal derecho-envolvente.
-
Uno o más coeficiente(s) de predicción para un canal tal como un canal central.
-
Una diferencia de nivel entre canales entre un canal central y otro canal (o combinación de canales) de 10 canales de sonido envolvente de salida.
[0079] Como un ejemplo específico, el procesador de análisis 407 puede generar un valor ICC y un valor ILD para los canales de mezclado descendente de estéreo yl, Y2. A continuación, estos dos valores son utilizados para generar una dirección única para una tabla de búsqueda. En la dirección específica, los valores paramétricos de SAC que normalmente se presentan para estos valores ILD e ICC han sido almacenados. De esta manera, el procesador de mapeo 409 simplemente recupera los valores almacenados de datos, con lo cual, se obtienen datos paramétricos estimados adecuados. Entonces, estos datos son alimentados al elemento de decodificación SAC 403 en donde son utilizados en el mismo modo que los datos convencionales SAC que son generados por el codificador SAC.
[0080] Será apreciado que los correspondientes valores de parámetro SAC para valores dados ILD e ICC pueden ser determinados en cualquier modo conveniente. Por ejemplo, podrían realizarse simulaciones en donde un gran número de señales sean codificadas tanto por la codificación de matriz como por la codificación SAC. A continuación, los valores ILD e ICC podrían ser derivados para las señales codificadas de matriz y comparados con los datos paramétricos que son generados por el codificador SAC. Los datos podrían ser procesados de manera estadística a fin de determinar los parámetros SAC que sean más probables que se presenten para valores dados ILD e ICC, y posteriormente, pueden ser almacenados en la ubicación adecuada de la tabla de búsqueda. Será apreciado que este análisis sólo es necesario una vez y que la tabla de búsqueda determinada puede ser utilizada por muchos decodificadores y para cualquier señal recibida.
[0081] En su lugar, los experimentos y simulaciones han demostrado que existe una correlación estrecha entre los valores ICC e ILD de una señal de sonido envolvente de mezclado descendente que es codificada de matriz y los valores SAC para una señal de sonido envolvente que es codificada de SAC. En consecuencia, los parámetros SAC podrían ser estimados con una exactitud relativamente alta y puede conseguirse una calidad de audio decodificado que sea significativamente mejorada.
[0082] En el ejemplo de la Figura 4, el procesador de estimado 405 opera en base de los mosaicos de frecuencia de tiempo.
[0083] De manera específica, los canales de mezclado descendente de estéreo y,, y2 primero son procesados a través de un banco de filtros QMF de modulación compleja con el objeto de generar mosaicos individuales de frecuencia de tiempo. Se apreciará que este procesamiento podría ser compartido entre el procesador de estimado 405 y el elemento de decodificación SAC 403 y por ejemplo, podría ser implementado en el elemento de decodificación SAC 403. La generación de los mosaicos de frecuencia de tiempo que incluye una banda de frecuencia para un intervalo de tiempo es bien conocida para la persona experta en la técnica y no será descrita en detalle (un ejemplo puede ser encontrado, por ejemplo, en Breebaart, J., van de Par, S., Kohlrausch, A., and Schuijers, E. (2005) . Parametric coding of stereo audio. Eurasip J. Applied Signal Proc., 9: 1305-1322).
[0084] Los mosaicos de frecuencia de tiempo son formulados mediante el agrupamiento de ciertas bandas de frecuencia y segmentos de tiempo. Normalmente, estos mosaicos de frecuencia de tiempo son relativamente angostos a bajas frecuencias y más anchos en altas frecuencias, de acuerdo con los principios psico-acústicos. Comúnmente, la correspondiente resolución de tiempo se encuentra entre 11 y 50 ms.
[0085] Para cada mosaico generado de frecuencia de tiempo, el procesador de análisis 407 genera los dos parámetros ILD e ICC a partir de los canales de mezclado descendente de estéreo yl, y2. De manera específica, si Y1 [k,b] representara la salida de banco de filtro (de valor complejo) para la señal yl para la salida de filtro q y la muestra de tiempo k, e Y2 [k,b] representara la correspondiente representación de dominio QMF para y2, el
en donde el intervalo de suma para k es realizado a través de las correspondientes muestras de tiempo de dominio QMF del mosaico actual de tiempo/frecuencia, la suma con respecto a q, sería realizada a través de estas salidas del banco de filtro que corresponden con la banda de parámetro b, y (*) denota la conjugación completa.
[0086] En forma similar, con R denotando la parte real, el valor ICC para la banda de parámetro b es dado por:
[0087] Para cada par de valores ICC e ILD, el procesador de mapeo 409 podría realizar entonces una búsqueda de tabla y determinar:
-
Las ILDs entre los correspondientes mosaicos de 5 tiempo-frecuencia de los canales frontal izquierdo Y envolvente izquierdo;
-
Las ILDs entre los correspondientes mosaicos de tiempo-frecuencia de los canales frontal derecho y envolvente 20 derecho;
-
Los ICCs entre los correspondientes mosaicos de tiempo-frecuencia de los canales frontal izquierdo Y envolvente izquierdo;
25 - Los ICCs entre los correspondientes mosaicos de tiempo-frecuencia de los canales frontal derecho y envolvente 15 derecho;
-
Los coeficientes de predicción para generar el canal central a partir del mezclado descendente, y/o
30 - Las ILDs entre el canal central y cualquier otro canal (par).
[0088] De esta manera, el decodificador es alimentado con los datos paramétricos estimados que corresponden con los datos paramétricos SAC que pudieran haber sido producidos por un codificador SAC.
35 [0089] La Figura 5 ilustra en mayor detalle los elementos 25 del elemento de decodificación SAC 403.
[0090] El elemento de decodificación SAC 403 comprende una unidad de matriz de mezclado previo 501 que controla las señales que ingresan en una segunda unidad de matriz de mezclado 503, así como también, las entradas para un conjuntode decorrelacionadores (D1 a Dm) 505. La segunda matriz de mezclado genera las 40 señales de salida en base a las salidas del decorrelacionador y dirige las salidas de la matriz de mezclado previo
501. La operación de una SAC es bien conocida para la persona experta en la técnica y por motivos de claridad y brevedad no será descrita en la presente. Los detalles adicionales podrían ser encontrados, por ejemplo, en Herre et al.: "The referente model architecture for MPEG spatial audio coding". Proc. 118th AES convention, Barcelona, España, 2005.
45 [0091] Los datos paramétricos estimados que son recibidos a partir del procesador de estimado 405 son utilizados para controlar la unidad de matriz de mezclado previo 501 y la segunda unidad de matriz de mezclado 503 como si éstos fueran los datos paramétricos convencionales SAC. De manera específica, la unidad de matriz de mezclado Con
en donde c1 y c2 representan dos de los parámetros espaciales (coeficientes de predicción) generados por el procesador de mapeo 409. Los dos decorrelacionadores D1 y D2 505 son alimentados por las señales 1 y r, de manera respectiva. Finalmente, las señales de salida lf, rf, c, ls y rs, para los canales izquierdo-frontal, derechofrontal, central, izquierdo-envolvente y derecho-envolvente son generadas por medio de la matriz de mezclado
con hxy,z que depende de los parámetros ILD e ICC 25 generados por el procesador de mapeo:
con
[0092] Aquí, ILDX, e ICCX, representan el parámetro ILD e ICC generado por el procesador de mapeo 409 para el 5 par de canales X (frontal izquierdo/envolvente izquierdo, o frontal derecho/envolvente derecho).
[0093] En el caso de un codificador SAC que trabaja en un modo compatible de envolvente de matriz por medio de
un procesador posterior de codificador, el correspondiente procesador previo del lado del decodificador podría ser
incluido en la unidad de matriz de mezclado previo 501. En este caso específico, podría utilizarse una matriz 10 alternativa de mezclado previo, la cual consiste de una combinación de la matriz original de mezclado previo M1 y
con la matriz de inversión de matriz-envolvente Q dada por: en donde qxy,z está en función de los parámetros generados por el procesador de mapeo 409:
con g1=g2=0.577, y las funciones w1 y wr de los parámetros dados por el procesador de mapeo 409:
[0094] Como alternativa, las entradas de M1 y M1' también podrían ser directamente generadas por el procesador de mapeo 409, omitiendo las ecuaciones dadas con anterioridad.
[0095] Será apreciado que aunque la descripción anterior enfocada en una modalidad en donde la señal recibida
10 comprende los datos paramétricos sin-SAC, algunos datos paramétricos podrían ser incluidos en la señal recibida en otras modalidades. Por ejemplo, la señal recibida podría comprender datos paramétricos que se refieren a algunos canales de salida aunque no a otros canales de salida y los parámetros estimados podrían ser utilizados para estos otros canales. Como otro ejemplo, los datos paramétricos estimados podrían ser utilizados para reemplazar los datos paramétricos que han sido corrompidos, por ejemplo, debido a los errores de transmisión. De esta manera, los
15 datos paramétricos estimados podrían ser utilizados para mejorar y complementar otros datos paramétricos recibidos a partir del codificador.
[0096] Además, será apreciado que una de las ventajas de los ejemplos descritos es que el elemento de decodificación SAC 403 puede utilizar una técnica estándar de decodificación SAC. De esta manera, el elemento de
20 decodificación SAC 403 podría ser igualmente aplicado a la decodificación de las señales convencionales SAC recibidas a partir de un codificador SAC.
[0097] De manera específica, el sistema de transmisión 100 de la Figura 1 podría comprender un número de codificadores sin-SAC y un número de codificadores SAC. El decodificador 115 podría modificar su operación de
25 acuerdo con la señal que está siendo recibida. De esta manera, si fuera recibida una señal sin-SAC, la operación podría ser como se describió con anterioridad. Sin embargo, si fuera recibida una señal SAC, los datos paramétricos simplemente podrían ser extraídos y alimentados al elemento de decodificación SAC 403 junto con los canales de mezclado descendente. Por lo tanto, puede conseguirse un decodificador altamente flexible.
30 [0098] La Figura 6 ilustra un procedimiento de generación de una señal de audio de múltiples canales de acuerdo con algunas modalidades de la invención. El procedimiento puede ser aplicado al decodificador 115 de la Figura 4 y será descrito con referencia al mismo.
[0099] El procedimiento inicia en la etapa 601, en donde el receptor 401 admite una primera señal que comprende 35 un primer 10 conjunto de canales de audio.
[0100] La etapa 601 es seguida por la etapa 603, en donde el procesador de estimado 405 genera los datos paramétricos estimados para un segundo conjunto de canales de audio en respuesta a las características del primer conjunto de canales de audio. Los datos paramétricos estimados relacionan las características del segundo conjunto
40 de canales de audio con las características del primer conjunto de canales de audio.
[0101] La etapa 603 es seguida por la etapa 605, en donde el elemento de decodificación SAC 403 descifra la primera señal en respuesta a los datos paramétricos estimados para generar la señal de múltiples canales que comprende el segundo conjunto de canales.
[0102] Será apreciado que la descripción anterior por 25 motivos de claridad ha descrito las modalidades de la invención con referencia a distintas unidades funcionales y procesadores. Sin embargo, será aparente que cualquier distribución adecuada de la funcionalidad entre las distintas unidades funcionales o procesadores podría ser utilizada sin apartarse de la invención. Por ejemplo, la funcionalidad ilustrada que será realizada a través de procesadores o controladores separados podría ser efectuada a través del mismo o los mismos controladores. Por lo tanto, las referencias a las unidades funcionales específicas sólo serán observadas como referencias a los medios adecuados que proporcionan la funcionalidad descrita en lugar de indicar una lógica o estructura física u organización estrictas.
[0103] La invención puede ser implementada en cualquier forma adecuada que incluye hardware, software, firmware
o cualquier combinación de estos. De manera opcional, la invención podría ser implementada, por lo menos parcialmente, como un software de computadora que se ejecuta en uno o más procesadores de datos y/o procesadores de señal digital. Los elementos y componentes de una modalidad de la invención podrían ser física, funcional y lógicamente implementados en cualquier modo conveniente. En lugar que la funcionalidad pudiera ser implementada en una unidad única, ésta podría serlo en una pluralidad de unidades o como parte de otras unidades funcionales. Como tal, la invención podría ser implementada en una unidad única o podría ser distribuida física y funcionalmente entre distintas unidades y procesadores.
[0104] Aunque la presente invención ha sido descrita en conexión con algunas modalidades, no se pretende que sea limitada a la forma específica señalada en la presente. Más bien, el alcance de la presente invención sólo es limitado por las reivindicaciones que la acompañan. Además, aunque una característica podría parecer que será descrita en conexión con las modalidades particulares, una persona experta en la técnica reconocería que varias características de las modalidades descritas podrían ser combinadas de acuerdo con la invención. En las reivindicaciones, el término que comprende no excluye la presencia de otros elementos o etapas.
[0105] Además, aunque son enlistados de manera individual, una pluralidad de medios, elementos o etapas de procedimiento podrían ser implementados por ejemplo, a través de una unidad o procesador único. Asimismo, la inclusión de una característica en una categoría de reivindicaciones no implica una limitación para esta categoría, sino más bien, indica que la característica puede aplicarse por igual a otras características de reivindicaciones, según sea adecuado. Además, las referencias en singular no excluyen una pluralidad. Por lo tanto, las referencias a "un", "una", "primero", "segundo", etc., no impiden una pluralidad.

Claims (20)

  1. REIVINDICACIONES
    1. Un decodificador para generar una señal de audio de canal múltiple, caracterizado porque comprende:
    -
    un medio para recibir (401) una primera señal que comprende un primer conjunto de canales de audio;
    -
    un medio de cálculo (405) para generar datos paramétricos calculados para un segundo conjunto de canales de audio en respuesta a características del primer conjunto de canales de audio; los datos paramétricos calculados relacionan características del segundo conjunto de canales de audio con características del primer conjunto de canales de audio; y
    -
    un decodificador de audio espacial (403) para decodificar la primera señal en respuesta a los datos paramétricos calculados para generar una señal de audio de canal múltiple que comprende el segundo conjunto de canales.
  2. 2.
    El decodificador de conformidad con la reivindicación 1, en el que la primera señal no comprende datos de audio paramétricos en relación al segundo conjunto de canales.
  3. 3.
    El decodificador de conformidad con la reivindicación 1, en el que el medio de cálculo (405) comprende un medio
    (407) para determinar primeros datos de parámetro para el primer conjunto de canales de audio y un medio (409) para elaborar un mapa de los primeros datos de parámetro respecto a los datos de parámetro calculados para el segundo conjunto de canales de audio.
  4. 4.
    El decodificador de conformidad con la reivindicación 3, en el que los primeros datos de parámetro comprenden por lo menos un valor de diferencia de nivel entre canales para por lo menos dos canales de audio del primer conjunto de señales de audio.
  5. 5.
    El decodificador de conformidad con la reivindicación 3, en el que los primeros datos de parámetro comprenden por lo menos un valor de coeficiente de correlación entre canales para por lo menos dos canales de audio del primer conjunto de señales de audio.
  6. 6.
    El decodificador de conformidad con la reivindicación 1, en el que la señal de audio de canal múltiple es una señal de sonido envolvente y los datos de parámetro calculados comprende por lo menos un parámetro que se selecciona del grupo que consiste de:
    -
    diferencia de nivel entre canales, entre el canal frontal izquierdo y el canal envolvente izquierdo del segundo conjunto de canales;
    -
    una diferencia de nivel entre canales entre el canal frontal derecho y el envolvente derecho del segundo conjunto de canales;
    -
    un coeficiente de correlación entre canales entre el canal frontal izquierdo y el envolvente izquierdo del segundo conjunto de canales;
    -
    un coeficiente de correlación entre canales entre el canal frontal derecho y el envolvente derecho del segundo conjunto de canales;
    -
    un coeficiente de predicción para un canal central del segundo conjunto de canales de audio;
    -
    una diferencia de nivel entre canales entre un canal central y otro canal del segundo conjunto de canales.
  7. 7.
    El decodificador de conformidad con la reivindicación 1, que comprende además un medio para generar mosaicos de frecuencia de tiempo y en donde el medio de cálculo (405) está distribuido para generar los datos paramétricos calculados para los mosaicos de frecuencia de tiempo.
  8. 8.
    El decodificador de conformidad con la reivindicación 7, en el que el medio de cálculo comprende un medio para elaborar un mapa directamente de un conjunto de por lo menos una característica de señal del primer conjunto de canales de audio para un mosaico de frecuencia de tiempo a un valor correspondiente de datos paramétricos para el segundo conjunto de canales de audio.
  9. 9.
    El decodificador de conformidad con la reivindicación 1, en el que el decodificador de audio espacial está distribuido para realizar por lo menos una operación de matriz utilizando parámetros determinados en respuesta a los datos paramétricos calculados.
  10. 10.
    El decodificador de conformidad con la reivindicación 1, que comprende además un medio para extraer datos paramétricos para una segunda señal, y en donde el decodificador de audio espacial (403) es operable para decodificar la segunda señal en respuesta a los datos paramétricos extraídos.
  11. 11.
    El decodificador de conformidad con la reivindicación 1, que comprende además un medio para seleccionar un modo de decodificación en respuesta a una característica de la primera señal.
  12. 12.
    El decodificador de conformidad con la reivindicación 1, en el que el primer conjunto de canales de audio consiste de dos canales de audio.
  13. 13.
    El decodificador de conformidad con la reivindicación 12, en el que la primera señal es una señal de sonido envolvente codificada de matriz.
  14. 14.
    El decodificador de conformidad con la reivindicación 13, que comprende además una matriz de inversión de envolvente de matriz y un medio para determinar por lo menos un coeficiente de la matriz de inversión de envolvente de matriz en respuesta a los datos paramétricos calculados.
  15. 15.
    Un procedimiento para generar una señal de audio de canal múltiple, que comprende:
    -
    recibir (601) una primera señal que comprende un primer conjunto de canales de audio;
    -
    generar (603) datos paramétricos calculados para un segundo conjunto de canales de audio en respuesta a características del primer conjunto de canales de audio; los datos paramétricos calculados relacionan características del segundo conjunto de canales de audio con las características del primer conjunto de canales de audio; y
    -
    decodificar (605) la primera señal en respuesta a los datos paramétricos calculados empleando un descodificador de audio espacial para generar una señal de audio de canal múltiple que comprende el segundo conjunto de canales.
  16. 16.
    Producto de programa de ordenador para realizar el procedimiento según la reivindicación 15.
  17. 17.
    Un receptor para generar una señal de audio de canal múltiple, que comprende el decodificador de conformidad con la reivindicación 1.
  18. 18.
    Un sistema de transmisión, que incluye:
    -
    un codificador para generar una primera señal que comprende un primer conjunto de canales de audio al codificar una señal de canal múltiple;
    -
    un transmisor para transmitir la primera señal; y
    -
    un decodificador de conformidad con la reivindicación 1.
  19. 19. Un procedimiento para transmitir y recibir una señal de audio, que comprende:
    -
    generar una primera señal que comprende un primer conjunto de canales de audio al codificar una señal de canal múltiple;
    -
    transmitir la primera señal;
    -
    recibir (401) la primera señal;
    -
    generar datos paramétricos calculados para un segundo conjunto de canales de audio en respuesta a características del primer conjunto de canales de audio; los datos paramétricos calculados relacionan características del segundo conjunto de canales de audio con características del primer conjunto de canales de audio; y
    -
    decodificar la primera señal en respuesta a los datos paramétricos calculados empleando un descodificador de audio espacial para generar una señal de audio de canal múltiple decodificada que comprende el segundo conjunto de canales.
  20. 20. Un dispositivo de reproducción de audio (103) que comprende un decodificador (115) de conformidad con la reivindicación 1.
ES06780055T 2005-07-19 2006-07-12 Generación de señales de audio de multiples canales Active ES2433316T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP05106612 2005-07-19
EP05106612 2005-07-19
PCT/IB2006/052368 WO2007010451A1 (en) 2005-07-19 2006-07-12 Generation of multi-channel audio signals

Publications (1)

Publication Number Publication Date
ES2433316T3 true ES2433316T3 (es) 2013-12-10

Family

ID=37398669

Family Applications (1)

Application Number Title Priority Date Filing Date
ES06780055T Active ES2433316T3 (es) 2005-07-19 2006-07-12 Generación de señales de audio de multiples canales

Country Status (10)

Country Link
US (1) US8160888B2 (es)
EP (1) EP1905006B1 (es)
JP (1) JP5171622B2 (es)
KR (1) KR101356586B1 (es)
CN (1) CN101248483B (es)
BR (1) BRPI0613734B1 (es)
ES (1) ES2433316T3 (es)
PL (1) PL1905006T3 (es)
RU (1) RU2417458C2 (es)
WO (1) WO2007010451A1 (es)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
CN101484936B (zh) * 2006-03-29 2012-02-15 皇家飞利浦电子股份有限公司 音频解码
BR122020009727B1 (pt) 2008-05-23 2021-04-06 Koninklijke Philips N.V. Método
KR101230691B1 (ko) * 2008-07-10 2013-02-07 한국전자통신연구원 공간정보 기반의 다객체 오디오 부호화에서의 오디오 객체 편집 방법 및 그 장치
US8023660B2 (en) 2008-09-11 2011-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
MX2011002626A (es) * 2008-09-11 2011-04-07 Fraunhofer Ges Forschung Aparato, metodo y programa de computadora para proveer un conjunto de pistas espaciales en base a una señal de microfono y aparato para proveer una señal de audio de dos canales y un conjunto de pistas especiales.
CN101673545B (zh) * 2008-09-12 2011-11-16 华为技术有限公司 一种编解码方法及装置
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
US20110123055A1 (en) * 2009-11-24 2011-05-26 Sharp Laboratories Of America, Inc. Multi-channel on-display spatial audio system
KR101756838B1 (ko) * 2010-10-13 2017-07-11 삼성전자주식회사 다채널 오디오 신호를 다운 믹스하는 방법 및 장치
SG185835A1 (en) * 2011-05-11 2012-12-28 Creative Tech Ltd A speaker for reproducing surround sound
JP5984955B2 (ja) * 2011-11-23 2016-09-06 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 無線ドッキングシステムを使用するオーディオシステムのためのミキサーの構成及び制御のための方法及び装置
US9466301B2 (en) * 2012-11-07 2016-10-11 Kenneth John Lannes System and method for linear frequency translation, frequency compression and user selectable response time
US20140129236A1 (en) * 2012-11-07 2014-05-08 Kenneth John Lannes System and method for linear frequency translation, frequency compression and user selectable response time
CN105594227B (zh) * 2013-07-30 2018-01-12 Dts(英属维尔京群岛)有限公司 利用恒定功率成对平移的矩阵解码器
TWI713018B (zh) 2013-09-12 2020-12-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
CN110634494B (zh) * 2013-09-12 2023-09-01 杜比国际公司 多声道音频内容的编码
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
JP6235725B2 (ja) * 2014-01-13 2017-11-22 ノキア テクノロジーズ オサケユイチア マルチ・チャンネル・オーディオ信号分類器
EP3611727B1 (en) 2015-03-03 2022-05-04 Dolby Laboratories Licensing Corporation Enhancement of spatial audio signals by modulated decorrelation
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
CN113055789B (zh) * 2021-02-09 2023-03-24 安克创新科技股份有限公司 单声道音箱、在单声道音箱中增加环绕效果的方法及系统
CN113438595B (zh) * 2021-06-24 2022-03-18 深圳市叡扬声学设计研发有限公司 音频处理系统

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6697491B1 (en) * 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
US6131084A (en) * 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
JP4478220B2 (ja) * 1997-05-29 2010-06-09 ソニー株式会社 音場補正回路
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
US6823018B1 (en) * 1999-07-28 2004-11-23 At&T Corp. Multiple description coding communication system
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7451006B2 (en) 2001-05-07 2008-11-11 Harman International Industries, Incorporated Sound processing system using distortion limiting techniques
US8340302B2 (en) * 2002-04-22 2012-12-25 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
WO2005031704A1 (en) * 2003-09-29 2005-04-07 Koninklijke Philips Electronics N.V. Encoding audio signals
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
KR101106026B1 (ko) 2003-10-30 2012-01-17 돌비 인터네셔널 에이비 오디오 신호 인코딩 또는 디코딩
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
ATE421845T1 (de) * 2005-04-15 2009-02-15 Dolby Sweden Ab Zeitliche hüllkurvenformgebung von entkorrelierten signalen
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding

Also Published As

Publication number Publication date
EP1905006A1 (en) 2008-04-02
CN101248483B (zh) 2011-11-23
KR20080033993A (ko) 2008-04-17
EP1905006B1 (en) 2013-09-04
BRPI0613734B1 (pt) 2019-10-22
PL1905006T3 (pl) 2014-02-28
CN101248483A (zh) 2008-08-20
RU2008106223A (ru) 2009-08-27
US8160888B2 (en) 2012-04-17
RU2417458C2 (ru) 2011-04-27
US20080201153A1 (en) 2008-08-21
WO2007010451A1 (en) 2007-01-25
JP2009501957A (ja) 2009-01-22
JP5171622B2 (ja) 2013-03-27
KR101356586B1 (ko) 2014-02-11

Similar Documents

Publication Publication Date Title
ES2433316T3 (es) Generación de señales de audio de multiples canales
US20200335115A1 (en) Audio encoding and decoding
TWI314840B (en) Multi-channel hierarchical audio coding with compact side-information
ES2461601T3 (es) Procedimiento y aparato para generar una señal de audio binaural
TWI314024B (en) Enhanced method for signal shaping in multi-channel audio reconstruction
RU2409911C2 (ru) Декодирование бинауральных аудиосигналов
KR101010464B1 (ko) 멀티 채널 신호의 파라메트릭 표현으로부터 공간적 다운믹스 신호의 생성
ES2378734T3 (es) Codificación mejorada y representación de parámetros de codificación de objetos de mezcla descendente multicanal
ES2609449T3 (es) Decodificación de audio
JP4944902B2 (ja) バイノーラルオーディオ信号の復号制御
NO345265B1 (no) Kompatibel flerkanal-koding/dekoding
JP2008527431A (ja) 空間音声のパラメトリック符号化のためのコンパクトなサイド情報
TW201034005A (en) Apparatus, method and computer program for upmixing a downmix audio signal
MX2008010631A (es) Codificacion y decodificacion de audio
BRPI0518507B1 (pt) Informações auxiliares compactas para a codificação paramétrica de áudio espacial