ES2398573T3 - Número reducido de decodificación de canales - Google Patents

Número reducido de decodificación de canales Download PDF

Info

Publication number
ES2398573T3
ES2398573T3 ES06791592T ES06791592T ES2398573T3 ES 2398573 T3 ES2398573 T3 ES 2398573T3 ES 06791592 T ES06791592 T ES 06791592T ES 06791592 T ES06791592 T ES 06791592T ES 2398573 T3 ES2398573 T3 ES 2398573T3
Authority
ES
Spain
Prior art keywords
parameter
channel
channels
signal
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES06791592T
Other languages
English (en)
Inventor
Lars Villemoes
Kristofer Kjoerling
Jeroen Breebaart
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Dolby International AB
Dolby Sweden AB
Original Assignee
Dolby International AB
Koninklijke Philips Electronics NV
Dolby Sweden AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB, Koninklijke Philips Electronics NV, Dolby Sweden AB filed Critical Dolby International AB
Application granted granted Critical
Publication of ES2398573T3 publication Critical patent/ES2398573T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/006Systems employing more than two channels, e.g. quadraphonic in which a plurality of audio signals are transformed in a combination of audio signals and modulated signals, e.g. CD-4 systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

Calculador de parámetros para derivar los parámetros de conversión a la alza (508, 510) para convertir a la alza una señal convertida a la baja (522) en una representación estéreo (524) de una señal multicanal con más canales que la señal convertida a la baja (522) y menos canales que la señal multicanal, caracterizando la representación estéreo (524) una conversión a la baja del lado izquierdo y una conversión a la baja del lado derecho (522) de la señal multicanal, teniendo la señal convertida a la baja los parámetros multicanal (504, 506) asociados a esta que describen las propiedades espaciales de la señal multicanal, en la que la señal multicanal incluye los canales no incluidos en la representación estéreo (524) y los parámetros multicanal incluyen la información sobre los canales no incluidos en la representación estéreo (524), comprendiendo el calculador de parámetros: un re-calculador de parámetro (502) para derivar los parámetros de conversión a la alza (508, 510) que incluyen un parámetro CLD (508) y un parámetro ICC (510) a partir de los parámetros multicanal (504, 506) usando los parámetros con la información sobre los canales no incluidos en la representación estéreo, teniendo el parámetro CLD (508) información sobre la energía para el canal izquierdo y el canal derecho de la representación estéreo y el parámetro ICC (510) con la información sobre una correlación entre el canal izquierdo y derecho.

Description

Número reducido de decodificación de canales.
Campo de la Invención
[0001] La presente invención se refiere a la decodificación de señales de audio y en particular a la decodificación de una conversión paramétrica a la baja de canales múltiples, o multicanal, de una señal multicanal original, a un número menor de canales que el número de canales de la señal multicanal original.
Antecedentes de la Invención
[0002] El desarrollo reciente de la codificación de audio ha hecho posible la habilidad de recrear una representación de canales múltiples, o multicanal, de una señal de audio en base a una señal estéreo (o mono) y los datos de control correspondientes. Estos procedimientos difieren de manera sustancial de las soluciones más antiguas basadas en matrices, tales como Dolby Prologic, puesto que los datos de control adicionales se transmiten para controlar la recreación, referida también como la conversión a la alza, de los canales envolventes en base a los canales mono o estéreo transmitidos.
[0003] De este modo, tal decodificador paramétrico de audio multicanal, por ejemplo MPEG Envolvente, reconstruye N canales en base a M canales transmitidos, donde N > M, y en base a los datos de control adicionales. Los datos de control adicionales representan una tasa de datos significativamente menor que la transmisión de todos los N canales, haciendo la codificación muy eficiente, mientras que, al mismo tiempo, asegura la compatibilidad con ambos, los dispositivos de M canales y los dispositivos de N canales.
[0004] Estos procedimientos de codificación paramétrica envolvente usualmente incluyen una parametrización de la señal envolvente en base a la Diferencia de Intensidad Entre Canales (IID, por sus siglas en inglés) y a la Coherencia Entre Canales (ICC, por sus siglas en inglés). Estos parámetros describen relaciones de energía y correlación entre pares de canales en el proceso de conversión a la alza. Parámetros de adicionales, usados también en el arte previo, incluyen a los parámetros de predicción usados para predecir los canales intermedios o de salida durante el procedimiento de conversión a la alza.
[0005] Dos ejemplos famosos de tal codificación multicanal son la codificación BCC y el MPEG envolvente. En la codificación BCC, un número de canales de audio de entrada se convierten a una representación espectral usando una transformación basada en la Transformada Discreta de Fourier (DFT, por sus siglas en inglés) con ventanas superpuestas. El espectro uniforme resultante es dividido entonces en particiones no superpuestas. Cada partición tiene un ancho de banda proporcional al ancho de banda rectangular equivalente (ERB, por sus siglas en inglés). Entonces, los parámetros espaciales llamados Diferencia de Nivel Entre Canales (ICLD, por sus siglas en inglés) y Diferencia de Tiempo Entre Canales (ICTD, por sus siglas en inglés) son estimados para cada partición. El parámetro ICLD describe un nivel de diferencia entre dos canales y el parámetro ICTD describe la diferencia de tiempo (cambio de fase) entre dos señales de canales diferentes. Las diferencias de nivel y las diferencias de tiempo se dan para cada canal con respecto a un canal común de referencia. Después de la derivación de estos parámetros, los parámetros son cuantificados y codificados para la transmisión.
[0006] Los parámetros individuales son estimados con respecto al canal único de referencia en la codificación BCC. En otros sistemas paramétricos de codificación de envolvente, por ejemplo en el MPEG envolvente, se emplea una parametrización con estructura de árbol. Esto significa que los parámetros ya no son estimados con respecto a un canal común único de referencia, sino con diferentes canales de referencia que pueden ser aún una combinación de canales de la señal multicanal original. Por ejemplo, teniendo una señal de 5.1 canales, los parámetros pueden ser estimados entre una combinación de los canales frontales y entre una combinación de los canales posteriores.
[0007] Por supuesto, la compatibilidad hacia atrás con los estándares de audio establecidos actualmente es altamente deseable también para los esquemas de codificación paramétrica. Por ejemplo, teniendo una señal convertida en mono a la baja, es deseable que también se proporcione una posibilidad de crear una señal de reproducción estéreo con alta fidelidad. Esto significa que una señal monofónica convertida a la baja tiene que ser convertida a la alza en una señal estéreo, haciendo uso de los parámetros adicionales transmitidos de la mejor manera posible.
[0008] Un problema común en la codificación multicanal es la preservación de la energía en la conversión a al alza, ya que la percepción humana de la posición espacial de una fuente sonora es dominada por la intensidad sonora de la señal, es decir, por la energía contenida dentro de la señal. Por lo tanto, debe tenerse un cuidad extremo en la reproducción de la señal para atribuirle la intensidad sonora correcta a cada canal reconstruido, de tal modo que se evite la introducción de artefactos que disminuyan grandemente la percepción de la calidad de la señal reconstruida. Ya que durante la conversión a la baja, las amplitudes de las señales son comúnmente sumadas, la posibilidad de interferencia aumenta, siendo descrita por el parámetro de correlación o coherencia.
[0009] Cuando se trata de la reconstrucción de un número reducido de canales (un número de canales menor que el número original de canales de la señal multicanal), los esquemas como el BCC son de manejo simple, puesto que cada parámetro es transmitido con respecto al mismo canal único de referencia. Por lo tanto, teniendo conocimiento sobre el canal de referencia, puede derivarse fácilmente el nivel más relevante de información (medida absoluta de energía) para cada canal necesitado para la conversión a al alza. De este modo, puede reconstruirse un número reducido de canales sin la necesidad de reconstruir la señal multicanal completa en principio. Así, el cómputo de la energía para las energías de la señal multicanal es más sencillo en la BCC al usar variables únicas en lugar de los productos de las variables, pero esto es solamente un primer paso. Cuando se habla de la derivación de energías y correlaciones de un número reducido de canales, que deben estar tan cerca como sea posible a las conversiones parciales a la baja de las señales multicanal originales, el nivel de dificultad entre el MPEG Envolvente y la BCC es comparable.
[0010] En contraste con esto, una estructura basada en árbol, como el MPEG envolvente, utiliza una parametrización en la que la información relevante para cada canal individual no está contenida en un parámetro único. Por consiguiente, en el arte previo, la reconstrucción de un número reducido de canales requiere de la reconstrucción de la señal multicanal seguida de una conversión a la baja en la cantidad reducida de canales para no violar el requerimiento de preservación de la energía. Esto tiene la obvia desventaja de una complejidad computacional extremadamente alta.
[0011] La solicitud de patente internacional WO 2005/101370 A1 describe un enfoque particular de codificación multicanal de datos en un solo canal monofónico y en información lateral asociada, que tiene información sobre las propiedades espaciales de la señal multicanal original. Cuando se transmiten tanto el canal de downmix y la información lateral, un descodificador adecuado es capaz de reconstruir una aproximación de la señal multicanal original que había sido la base para la generación de la mezcla downmix y los parámetros.
[0012] La parametrización se elige de manera que las combinaciones específicas de canal de los canales originales pueden ser reproducidas sin la utilización de todos los parámetros de transmisión, de modo que la complejidad computacional en la reconstrucción puede ser reducida cuando, por ejemplo, sólo deben reconstruir los canales delanteros (canales izquierdo, central y derecho) de una señal de 5.1 canales.
Breve Descripción de la Invención
[0013] Es el objetivo de la presente invención proporcionar un concepto para obtener un número reducido de canales a partir de una señal paramétrica multicanal de manera más eficiente.
[0014] En conformidad con un primer aspecto de la presente invención, este objetivo es logrado por medio de un calculador de parámetro para derivar los parámetros de la conversión a la alza según la reivindicación 1.
En conformidad con un segundo aspecto de la presente invención, este objetivo es logrado por medio de un reconstructor de canal según la reivindicación 16.
[0015] En conformidad con un tercer aspecto de la presente invención, este objetivo es logrado por medio de un procedimiento para generar los parámetros de conversión a la alza según la reivindicación 17. En conformidad con un cuarto aspecto de la presente invención, este objetivo es logrado por un receptor de audio o un reproductor de audio según la reivindicación 18.
[0016] En conformidad con un quinto aspecto de la presente invención, este objetivo es logrado por medio de un procedimiento de recepción o reproducción de audio según la reivindicación 19.
[0017] La presente invención se basa en encontrar que una representación de canal intermedio de una señal multicanal puede ser reconstruida de manera altamente eficiente y con alta fidelidad cuando los parámetros de conversión a la alza, para convertir a la alza una señal transmitida convertida a la baja en la representación de canal intermedio, son derivados de modo que permiten la conversión a la alza usando los mismos algoritmos de conversión a la alza que aquellos de la reconstrucción multicanal. Esto puede ser logrado cuando un re-calculador de parámetro se emplea para derivar los parámetros de conversión a la alza tomando en cuenta también a los parámetros con la información sobre los canales no incluidos en la representación de canal intermedio.
[0018] En una modalidad de la presente invención, un decodificador es capaz de reconstruir una señal estéreo de salida a partir de una conversión paramétrica a la baja de una señal multicanal de cinco canales, incluyendo la conversión paramétrica a la baja una señal monofónica convertida a la baja y los parámetros multicanal asociados. En conformidad con la invención, los parámetros espaciales son combinados para derivar los parámetros de conversión a la alza para la conversión a la alza de una señal estéreo, en la cual la combinación también toma en cuenta los parámetros multicanal no asociados con el canal izquierdo-frontal o el canal derecho-frontal. De este modo, las energías absolutas para los canales estero convertidos a la alza pueden ser derivadas y una medida de coherencia entre el cana derecho e izquierdo puede ser derivada permitiendo una reconstrucción estéreo de alta fidelidad de la señal multicanal. Además, son derivados un parámetro ICC y un parámetro CLD, permitiendo que una conversión a la alza utilice algoritmos e implementaciones ya existentes. Empleando los parámetros de los canales no asociados a los canales estéreo reconstruidos se permite la preservación de la energía dentro de la señal con mayor precisión. Esto es de gran importancia, ya que las variaciones no controladas de la intensidad sonora perturban mucho la calidad de la señal reproducida.
[0019] Generalmente, la aplicación del concepto inventivo permite una reconstrucción de una conversión estéreo a la alza a partir de una conversión mono a la baja de una señal multicanal, sin la necesidad de una reconstrucción total intermedia de la señal multicanal, como en los procedimientos del arte previo. Evidentemente, la complejidad computacional del lado del decodificador puede de este modo ser disminuida de manera importante. También, usando los parámetros multicanal asociados a los canales no incluidos en la conversión a la alza (es decir, el canal izquierdo frontal y el cana derecho frontal), se permite una reconstrucción que no introduce ningún artefacto adicional o variaciones de intensidad sonora, sino que en lugar de esto preserva perfectamente la energía de la señal. Para ser más específicos, la relación de la energía entre los canales izquierdo y derecho reconstruidos se calcula a partir de numerosos parámetros multicanal disponibles, tomando también en consideración los parámetros multicanal no asociados con los canales izquierdo frontal y derecho frontal. Evidentemente, la relación de la intensidad sonora entre los canales reconstruidos (convertidos a la alza) izquierdo y derecho es dominante con respecto a la calidad de la percepción del audio de la señal estéreo reconstruida. Sin el uso del concepto inventivo, una reconstrucción de canales con la relación de energía precisamente correcta no es posible en las estructuras basadas en árbol discutidas en este documento.
[0020] Por lo tanto, la implementación del concepto inventivo permite una reproducción estéreo de alta calidad de una conversión a la baja de una señal multicanal, basada en los parámetros multicanal, que no son derivados para una reproducción precisa de una señal estéreo.
[0021] Debe hacerse notar que el concepto inventivo también puede ser utilizado cuando la cantidad de canales reproducidos es diferente a dos, por ejemplo, cuando un canal central debe ser también reconstruido con alta fidelidad, como en el caso de algunos ambientes de reproducción.
[0022] Dentro de lo que sigue, se dará una revisión más detallada de los esquemas de codificación multicanal del arte previo (particularmente de las estructuras basadas en árbol) para subrayar el alto beneficio del concepto inventivo.
Breve Descripción de las Figuras
[0023] Las modalidades preferidas de la presente invención son descritas de manera subsecuente al referirse a las figuras indicadas, en la cuales:
la Figura 1 muestra los ejemplos de las parametrizaciones basadas en árbol;
la Figura 2 muestra los ejemplos de los esquemas de decodificación de estructura de árbol;
la Figura 3 muestra un ejemplo de un codificador multicanal del arte previo;
la Figura 4 muestra los ejemplos de los decodificadores del arte previo;
la Figura 5 muestra un ejemplo de la reconstrucción estéreo del arte previo de una señal multicanal convertida a la baja;
la Figura 6 muestra un diagrama a bloques de un ejemplo de un calculador de parámetro inventivo;
la Figura 7 muestra un ejemplo de un reconstructor de canal inventivo; y
la Figura 8 muestra un ejemplo de un receptor o reproductor de audio inventivo.
Descripción Detallada de realizaciones preferidas
[0024] A continuación será descrito el concepto inventivo, principalmente con respecto a la codificación MPEG, pero siendo aplicable también a otros esquemas basados en la codificación paramétrica de las señales multicanal. Esto es, que las modalidades descritas como sigue son meramente ilustrativas para los principios de la presente invención, para un número reducido de decodificación de canales para los sistemas multicanal de estructura de árbol. Se entiende que las modificaciones y variaciones de las modalidades y los detalles descritos aquí serán aparentes para otros con habilidad en el arte. Por lo tanto, se intenta que el límite sea solo el enfoque de las reivindicaciones inminentes de la patente y no los detalles específicos presentados sólo a manera de descripción y explicación de las modalidades de este texto.
[0025] Como se menciona anteriormente, en algunos sistemas de codificación paramétrica envolvente, por ejemplo el MPEG Envolvente, se emplea una parametrización de estructura de árbol. Tal parametrización es diagramada en las Figuras 1 y 2.
[0026] La Figura 1 muestra dos maneras de parametrizar un escenario estándar de audio de 5.1 canales, con un canal izquierdo frontal 2, un canal central 3, un canal derecho frontal 4, un canal izquierdo envolvente 5 y un canal derecho envolvente 6. Opcionalmente, también puede presentarse un canal de mejoramiento de baja frecuencia 7 (LFE, por sus siglas en inglés).
[0027] Generalmente, los canales individuales, o pares de canales se caracterizan respecto el uno del otro por los parámetros multicanal, de tal modo, por ejemplo, por un parámetro de correlación ICC y un parámetro de nivel CLD. Las parametrizaciones posibles serán explicadas brevemente en el siguiente párrafo, los esquemas resultantes de decodificación de estructura de árbol son entonces ilustrados en la Figura 2.
[0028] En el ejemplo mostrado en el lado izquierdo de la Figura 1 (parametrización 5-1-51), la señal multicanal se caracteriza por los parámetros CLD e ICC que describen la relación entre el canal izquierdo envolvente 5 y el canal derecho envolvente 6, el canal izquierdo frontal 2 y el canal derecho frontal 4, y entre el canal central 3 y el canal de mejoramiento de baja frecuencia 7. Sin embargo, como toda la configuración debe ser convertida a la baja en un canal mono único, para una descripción completa del grupo de canales, se requieren parámetros adicionales. Por lo tanto, se emplean los parámetros adicionales (CLD1, ICC1), relacionando una combinación del altavoz LFE 7 y el altavoz central 3 con una combinación del canal izquierdo frontal 2 y el canal derecho frontal 4. Adicionalmente, se requiere un grupo adicional de parámetros (CLD0, ICC0), estos parámetros describen una relación entre la combinación de los canales envolventes 5 y 6 con el resto de los canales de la señal multicanal.
[0029] En la parametrización del lado derecho (parametrización 5-1-52) se usan los parámetros, relacionando el canal izquierdo frontal 2 y el canal izquierdo envolvente 5, el canal derecho frontal 4 y el canal derecho envolvente 6, y el canal central 3 y el canal de mejoramiento de baja frecuencia 7. Los parámetros adicionales (CLD1 e ICC1) describen una combinación de los canales izquierdos 2 y 5, con respecto a la combinación de los canales derechos 4 y 6. Un grupo adicional de parámetros (CLD0 e ICC0) describen la relación de una combinación del canal central 3 y el canal LFE 7 con respecto a una combinación de los canales restantes.
[0030] La Figura 2 muestra los conceptos de codificación que soportan a las diferentes parametrizaciones de la Figura
1. Del lado del decodificador, llamado OTT (por sus siglas en inglés, Uno A Dos), se emplean módulos en una estructura semejante al árbol. Cada módulo OTT convierte a la alza una señal mono en dos señales de salida. Cuando se decodifican, los parámetros para los bloques OTT tienen que ser aplicados en el orden inverso de la codificación. Por consiguiente, en la estructura de árbol 5-1-51, el módulo OTT 20, que recibe la señal convertida a la baja 22 (M) es operativo para utilizar los parámetros CLD0 e ICC0 para derivar dos canales, siendo uno una combinación del canal izquierdo envolvente 5 y el canal derecho envolvente 6, y el otro canal siendo todavía una combinación de los canales restantes de la señal multicanal.
[0031] En conformidad, el módulo OTT 24 deriva el primer canal, usando CLD1 e ICC1, siendo un canal combinado del canal central 3 y el canal de baja frecuencia 7, y un segundo canal siendo una combinación del canal izquierdo frontal 2 y el canal derecho frontal 4. Del mismo modo, el módulo OTT 26 deriva el canal izquierdo envolvente 5 y el canal derecho envolvente 6, usando CLD2 e ICC2. El módulo OTT 27 deriva el canal central 3 y el canal de baja frecuencia 7, usando CLD4, y el módulo OTT 28 deriva el canal izquierdo frontal 2 y el canal derecho frontal 4, usando CLD3 e ICC3. Finalmente, una reconstrucción de todo el grupo de canales 30 se deriva a partir de un canal único monofónico convertido a la baja 22. Para la estructura de árbol 5-1-52, el esquema general del módulo OTT es equivalente a la estructura de árbol 5-1-51. Sin embargo, los módulos OTT por sí solos derivan diferentes combinaciones de canales, correspondiendo las combinaciones de canales con la parametrización marcada en la Figura 1 para el caso 5-1-52.
[0032] Se torna evidente a partir de las Figuras 1 y 2 que la estructura de árbol de las diferentes parametrizaciones es solamente una visualización de la parametrización utilizada. Adicionalmente, es más importante notar que los parámetros individuales son parámetros que describen una relación entre los canales diferentes en contraste con, por ejemplo, el esquema de codificación BCC, en el cual se derivan parámetros similares con respecto a un canal único de referencia.
[0033] Por consiguiente, en la parametrización mostrada, los canales individuales no pueden ser derivados simplemente al emplear los parámetros asociados a los bloques OTT en la visualización, sino que algunos o todos los parámetros remanentes tienen que ser tomados en cuenta de manera adicional.
[0034] La estructura de árbol de la parametrización es solamente una visualización del flujo o proceso actual de la señal, mostrada en la Figura 3, ilustrando la conversión a la alza a partir de un bajo número de canales transmitidos, lograda por medio de la multiplicación de matrices. La Figura 3 muestra la decodificación en base a un canal recibido convertido a la baja 40. El canal convertido a la baja 40 es enviado como entrada hacia un bloque de conversión a la alza 42, derivando la señal multicanal reconstruida 44, en la cual la composición de canales difiere entre las parametrizaciones usadas. Sin embargo, los elementos matriciales de la matiz, empleados por el bloque de reconstrucción 42, son derivados directamente de la estructura de árbol. El bloque de reconstrucción 42 puede ser descompuesto adicionalmente en una matriz previa al des-correlacionador 46, solamente con propósitos ilustrativos, derivando señales adicionales des-correlacionadas a partir del canal 40 transmitido. Estas son entonces enviadas como entrada hacia una matriz de conversión 48 que deriva las señales multicanal 44 al convertir los canales de entrada individuales.
[0035] Como se muestra en la Figura 4, un acercamiento directo para reducir el número de canales reconstruidos sería
simplemente “podar” el árbol de los bloques uno a dos. La Figura 4 muestra una poda posible de los árboles en las
líneas punteadas, omitiendo la poda los módulos OTT del lado derecho del árbol durante la reconstrucción, reduciendo así la cantidad de canales de salida. Sin embargo, usando las parametrizaciones del arte previo, mostradas en las Figuras 1 y 2, introducidas debido a que estas ofrecen la codificación de baja tasa de bits con la calidad más alta posible, la simple poda no es posible para obtener una salida estéreo que represente una conversión a la baja de lado izquierdo y una conversión a la baja de lado derecho de la señal multicanal original de manera apropiada. La Figura 5 muestra un acercamiento del arte previo para crear una salida estéreo a partir de las señales descritas anteriormente, utilizando el obvio acercamiento de reconstruir primero la señal multicanal de manera completa antes de convertir a la baja la señal de manera secuencial en la representación estéreo, usando un convertidor a la baja 60 adicional. Evidentemente, esto tiene muchas desventajas, tales como una alta complejidad y una calidad inferior de sonido.
[0036] Una solución al problema antes mencionado, de la obtención de la salida estéreo a partir de una conversión mono a la baja y los parámetros de envolvente paramétrica en una parametrización que no soporta de manera natural la
“poda” hacia una salida estéreo, será derivado a continuación para el caso general. Esto es seguido por dos
modalidades específicas que muestran el uso del concepto inventivo en las parametrizaciones descritas anteriormente. De este modo, son provistas soluciones al problema de la obtención de la salida estéreo a partir de una conversión mono a la baja y de los parámetros de envolvente paramétrica en una parametrización que no soporta la “poda” hacia una salida estéreo.
[0037] El acercamiento general del re-cálculo del parámetro será visto más adelante. En particular, se aplica al caso del cómputo de los parámetros de salida estéreo a partir de un número arbitrario de N canales de audio multicanal. Se asume de manera adicional que la señal de audio se describe por una representación sub-banda, derivada al usar un banco de filtros que podría ser valuado de forma real o modulado de forma compleja.
[0038] Dejemos que todas las señales sean consideradas como vectores finitos de muestras de sub-banda que corresponden a un cuadro de tiempo-frecuencia, definido por los parámetros espaciales, y dejemos que las muestras de sub-banda de una señal de audio multicanal reconstruida y se formen a partir de muestras de sub-banda de los canales de audio m1, m2, K, mM y las muestra de sub-banda des-correlacionadas de los canales de audio d1, d2, K, dD, en conformidad con una operación matricial de conversión a la alza
y = Rx, donde
[0039] Siendo consideradas todas las señales como vectores seguidos. La matriz R es de tamaño N x (M + D) y representa el efecto combinado de las matrices M1 y M2 de la Figura 3 y el bloque de conversión a la alza 42 de tal modo. Un procedimiento general para lograr una energía y parámetros de correlación apropiados de una versión convertida a la baja a ND canales de las muestras de sub-banda de la señal de audio multicanal original es formar la matriz de covarianza de la conversión virtual a la baja definida por una matriz D de conversión a la baja ND x N,
yD = Dy .
[0040] Esta matriz de covarianza puede ser computada por la multiplicación con el conjugado complejo transpuesto, que es
yDy*D = Dyy*D* = DRxx*R*D* ,
donde la matriz interna de covarianza xx* es a menudo conocida a partir de las propiedades de los descorrelacionadores y los parámetros transmitidos.
[0041] Un caso especial importante, donde esto se mantiene verdadero, es para M = 1, y frecuentemente esta matriz interna de covarianza es de hecho entonces igual a la matriz identidad de tamaño M + D. Como consecuencia, para una salida estéreo donde ND = 2, los parámetros CLD e ICC pueden ser leídos a partir de
en el sentido de que
[0042] Nótese aquí, y a continuación, que la siguiente notación es aplicada. Para los vectores complejos x, y , el producto interno complejo y la norma cuadrada se define por
donde el asterisco denota la conjugación compleja.
[0043] Subsecuentemente, dos modalidades de la presente invención deben ser derivadas para las diferentes parametrizaciones (5-1-51 y 5-1-52) mostradas en las Figuras 1 y 2. En las modalidades de la presente invención, se enseña que, para entregar como salida las señales en base a una conversión mono a la baja y los parámetros correspondientes de MPEG envolvente (parámetros multicanal), los parámetros de conversión a la alza necesitan ser re-calculados como un grupo único de parámetros CLD e ICC que pueden ser usados para convertir directamente a la alza una señal estéreo a partir de la señal mono.
[0044] Adicionalmente, se asume que el procesamiento de los canales individuales de audio se realiza a manera de cuadros inteligentes, es decir, en porciones discretas de tiempo. De este modo, cuando se habla de potencias o
energías contenidas dentro de un canal, el término “potencia” o “energía” debe entenderse como la energía de la
potencia contenida dentro de un cuadro de un canal específico.
[0045] Generalmente, los parámetros como, por ejemplo, CLD e ICC también son válidos para un solo cuadro. Teniendo un cuadro con k muestras de valor ai, la energía E dentro del cuadro puede ser, por ejemplo, representada por la suma de los cuadrados de los valores de la muestra de sub-banda dentro del cuadro:
[0046] Las diferencias de nivel de canal (CLD, por sus siglas en inglés), transmitidas y usadas para el cálculo de los parámetros de conversión a la alza para convertir a la alza la señal M convertida a la baja, en una representación de anal intermedio (estéreo) de la señal multicanal, son definidas de la siguiente manera:
Donde L0 y R0 denotan la energía de las señales en cuestión, dentro del cuadro para el cual debe ser derivado el parámetro CLD.
[0047] Por lo tanto, para el caso 5-1-51, los cuatro parámetros CLD, CLDX, X = 0,1,2,3, pueden ser usados para obtener energías normalizadas de canal por la energía del canal mono convertido a la baja m.
[0049] La meta final es derivar canales estéreo óptimos l0 y r0, en el sentido de que se encuentra la estimación apropiada de las energías normalizadas y la correlación de los canales estéreo (representación de canal intermedio), formada por
donde el peso central de conversión a la baja es q = 1/√2. Las energías computadas a partir de esta suposición resultan ser
[0050] Refleja ser lo más benéfico para suponer que ambos, el canal izquierdo combinado l y el canal derecho combinado r, no están correlacionados con el canal central c, en lugar de intentar la incorporación de la información y la correlación transportada por los parámetros ICCl,mX, X = 0,1. Por lo tanto, las energías normalizadas de los canales estéreo de salida son estimadas como
[0051] Habiendo derivado las energías de los canales de salida el parámetro CLD deseado puede ser computado fácilmente usando la definición del parámetro CLD dado anteriormente.
[0052] En conformidad con el concepto inventivo, un parámetro ICC es derivado para permitir una conversión estéreo a la alza. La correlación entre los dos canales de salida se define por la siguiente expresión:
[0053] Un grupo atractivo de suposiciones simplificadoras se encuentra aquí de nuevo, de modo que el canal izquierdo combinado l y el canal derecho combinado r no están correlacionados con el canal central c, y además, de modo que los canales envolventes no están correlacionados con los canales frontales. Estas suposiciones pueden ser expresadas como
[0054] El estimado resultante para p depende de los dos parámetros ICC, ICCX, X = 2,3, que describen las correlaciones normalizadas izquierda/derecha
[0055] que puede ser escrito como
[0056] De este modo, el valor final de correlación depende de varios parámetros de la parametrización multicanal, permitiendo la reconstrucción de alta fidelidad de la señal. El parámetro ICC es derivado finalmente usando la siguiente fórmula:
[0057] En conformidad con el concepto inventivo, la distribución de energía entre los canales reconstruidos es reconstruida con una alta precisión. Sin embargo, un escalamiento global de energía aplicado a ambos canales puede ser necesario de manera global, para asegurar la preservación de la energía total. Como la distribución relativa de la energía entre los canales es vital para la percepción espacial de la señal reconstruida, el escalamiento global puede deteriorar la calidad perceptual de la señal reconstruida. Debe hacerse énfasis en que el escalamiento global es solamente global dentro de un cuadro de tiempo-frecuencia definido en un parámetro de manera local en el escalamiento de los cuadros de parámetro. En otras palabras, las dos ganancias, de frecuencia y tiempo, serán aplicadas, lo cual resulta en artefactos de coloración del espectro y modulación del tiempo. Un factor de ajuste de ganancia para el escalamiento global es necesario para asegurar que el proceso de conversión estéreo a la alza está preservando la energía del canal mono convertido a la baja m.
[0058] Sin embargo, este factor se define por g = √L0 + R0, lo cual resulta en g = 1, para la configuración 5-1-51, puesto que L0+ R0 = Lf + Rf + C + Ls + Rs = 1.
[0059] Como una modalidad adicional, la aplicación del concepto inventivo a la estructura de árbol 5-1-52 será descrita en los siguientes párrafos. Para la creación de una señal estéreo de alta fidelidad, los dos primeros grupos de parámetros CLD e ICC, que corresponden a las ramas superiores del árbol, son relevantes.
[0060] Los dos parámetros CLD, CLDX para X = 0,1, son usados primeramente para obtener energías normalizadas de canal de los canales izquierdo y derecho combinados y el canal central
donde las ganancias de canal se definen por [0061] La meta es derivar las energías y la correlación de los canales convertidos a la baja
donde el peso del canal central es de q = 1/√2. El cómputo de las energías a partir de esta suposición resulta ser
[0062] Una suposición benéfica aquí es que ambos ICC, entre los canales l y c y entre los canales r y c, es la misma que es dada por ICC0 entre los canales l + r y c. Esta suposición resulta en el estimado
con los estimados de las energías normalizadas que se vuelven
[0063] Como en la modalidad anterior, teniendo los valores de energía L0 y R0, el parámetro CLD deseado puede ser derivado:
[0064] La derivación de la correlación y finalmente del parámetro ICC comienza a partir de la definición general del valor de correlación:
Toda la información necesaria está disponible a partir de los parámetros de la estructura de árbol 5-1-52, puesto que
[0066] Los resultados finales pueden escribirse como
[0067] El factor de ajuste requerido de ganancia g es definido por
[0068] Puede notarse que los parámetros CLD e ICC generados pueden ser cuantificados adicionalmente para permitir el uso de tablas de localización en el decodificador para la creación de la matriz de conversión a la alza, en lugar de realizar los cálculos complejos. Esto incrementa adicionalmente la eficiencia del proceso de conversión a la alza.
[0069] Generalmente, la conversión a la alza es posible usando módulos OTT ya existentes. Esto tiene la ventaja de que el concepto inventivo puede ser implementado de manera sencilla en escenarios ya existentes de decodificación.
[0070] Generalmente, la matriz de conversión a la alza puede ser descrita como: donde
y donde:
[0071] Por lo tanto, teniendo derivados de manera inventiva los parámetros CLD e ICC, la conversión estéreo a la alza de una conversión a la baja transmitida puede ser realizada con una alta fidelidad usando módulos estándar de conversión a la alza.
En una modalidad adicional de la presente invención, un reconstructor inventivo de canal incluye un calculador de parámetro para derivar parámetros de conversión a la alza y un convertidor a la alza para derivar una representación de canal intermedio empleando los parámetros de conversión a la alza y una señal transmitida convertida a la baja.
[0072] El concepto inventivo es subrayado de nuevo en la Figura 6, mostrando un calculador inventivo de parámetro 502, que recibe varios parámetros ICC 504 y varios parámetros CLD 506. En conformidad con una modalidad de la presente invención, el calculador de parámetro inventivo 502 deriva un único parámetro CLD 508 y un único parámetro ICC 510 para la recreación de una señal estéreo, usando también los parámetros multicanal (ICC y CLD) con información sobre los canales no incluidos o relacionados con los canales de la conversión estéreo a la alza.
[0073] Debe hacerse notar que el concepto inventivo puede ser adaptado fácilmente a los escenarios con una conversión a la alza que incluyen más de dos canales. La conversión a la alza se da en el sentido definido de manera general como una representación de canal intermedio de la señal multicanal, en la que la representación de canal intermedio tiene más canales que la señal convertida a la baja y menos canales que la señal multicanal. Un escenario común es una configuración en la cual se reconstruye un canal central adicional.
[0074] La aplicación del concepto inventivo es subrayado otra vez en la Figura 7, mostrando el calculador inventivo de parámetro 502 y un bloque OTT 1 a 2 520. El bloque OTT 520 recibe como entrada la señal mono transmitida 522, como ya se detallo en la Figura 6. El calculador inventivo de parámetro 502 recibe varios valores ICC 504 y varios valores CLD 506 para derivar un parámetro CLD 508 único y un parámetro ICC 510 único.
[0075] Los parámetros CLD e ICC únicos, 508 y 510, son enviado como entrada al módulo OTT 520, para guiar la conversión a la alza de la señal monofónica convertida a la baja 522. De este modo, en la salida del módulo OTT 520, una señal estéreo 524 puede ser provista como una representación de canal intermedio de la señal multicanal.
[0076] La Figura 8 muestra un receptor o reproductor de audio 600 inventivo, con un decodificador de audio 601 inventivo, una entrada de flujo de bits 602, y una salida de audio 604.
[0077] Un flujo de bits puede ser la entrada en la entrada 602 del receptor/reproductor de audio 600 inventivo. El decodificador 601 decodifica entonces el flujo de bits y la señal decodificada es enviada como salida o reproducida en la salida 604 del reproductor/receptor de audio 600 inventivo.
[0078] Aunque el concepto inventivo ha sido subrayado principalmente con respecto a la codificación MPEG Envolvente, no está limitad por ningún medio a la aplicación del escenario de codificación paramétrica especifico. Debido a la alta flexibilidad del concepto inventivo, puede ser aplicado sencillamente a otros esquemas de codificación, así como también a, por ejemplo, configuraciones de canales 7.1 o 7.2 o esquemas BCC.
[0079] Aunque las modalidades de la presente invención, que se refieren a la codificación MPEG, introducen algunas suposiciones simplificadoras para la generación del parámetro CLD e ICC común, esto no es imperativo. También es posible por supuesto no introducir aquellas simplificaciones.
[0080] Dependiendo de ciertos requerimientos de implementación de los procedimientos inventivos, los procedimientos
5 inventivos pueden ser implementados en hardware o software. La implementación puede llevarse a cabo usando un medio de almacenamiento digital, particularmente en disco, DVD o CD con señales de control legibles de manera electrónica almacenadas en este, las cuales cooperan con un sistema de computación programable de modo que los procedimientos inventivos sean realizados. Generalmente, la presente invención es, por lo tanto, un producto programable por computadora con un código de programa almacenado en una portadora legible por una máquina,
10 siendo el código de programa operativo para realizar los procedimientos inventivos cuando el producto del programa computacional se ejecuta en una computadora. En otras palabras, los procedimientos inventivos son, por consiguiente, un programa de computadora con un código de programa para llevar a cabo por lo menos uno de los procedimientos inventivos cuando el programa de computadora se ejecuta en una computadora.
[0081] Mientras lo anterior ha sido descrito y mostrado de manera particular con relación a las modalidades particulares
15 de esto, será entendido por aquellos con habilidad en el arte que varios otros cambios en la forma y detalles pueden ser hechos sin alejarse del espíritu y enfoque de este. Se entiende que varios cambios pueden ser hechos en la adaptación de las diferentes modalidades sin alejarse de los conceptos más amplios aquí descritos y comprendidos por las siguientes reivindicaciones.

Claims (21)

  1. REIVINDICACIONES
    1. Calculador de parámetros para derivar los parámetros de conversión a la alza (508, 510) para convertir a la alza una señal convertida a la baja (522) en una representación estéreo (524) de una señal multicanal con más canales que la señal convertida a la baja (522) y menos canales que la señal multicanal, caracterizando la representación estéreo (524) una conversión a la baja del lado izquierdo y una conversión a la baja del lado derecho (522) de la señal multicanal, teniendo la señal convertida a la baja los parámetros multicanal (504, 506) asociados a esta que describen las propiedades espaciales de la señal multicanal, en la que la señal multicanal incluye los canales no incluidos en la representación estéreo (524) y los parámetros multicanal incluyen la información sobre los canales no incluidos en la representación estéreo (524), comprendiendo el calculador de parámetros:
    un re-calculador de parámetro (502) para derivar los parámetros de conversión a la alza (508, 510) que incluyen un parámetro CLD (508) y un parámetro ICC (510) a partir de los parámetros multicanal (504, 506) usando los parámetros con la información sobre los canales no incluidos en la representación estéreo, teniendo el parámetro CLD (508) información sobre la energía para el canal izquierdo y el canal derecho de la representación estéreo y el parámetro ICC
    (510) con la información sobre una correlación entre el canal izquierdo y derecho.
  2. 2.
    El calculador de parámetro según la reivindicación 1, en el que el re-calculador de parámetro (502) se adapta al uso de parámetros multicanal (504, 506) que describen las propiedades de la señal de un canal o una combinación de canales de la señal multicanal con respecto a otro canal u otra combinación de canales de la señal multicanal.
  3. 3.
    El calculador de parámetro según la reivindicación 2, en el que el re-calculador de parámetro (502) es operativo para derivar los parámetros de conversión a la alza (508, 510) que describen las mismas propiedades de la señal de los canales de la representación intermedia de canal como los parámetros multicanal (504, 506).
  4. 4.
    El calculador de parámetro según la reivindicación 1, en el que el re-calculador de parámetro (502) se adapta al uso de los parámetros de correlación (ICC) (504) con la información sobre una correlación y los parámetros de nivel (CLD)
    (506) con la información de la energía para un canal o una combinación de canales de la señal multicanal con respecto a otro canal u otra combinación de canales de una señal multicanal.
  5. 5.
    El calculador de parámetro según la reivindicación 4, en el que se adapta al uso de parámetros multicanal para una señal multicanal que incluye un canal izquierdo frontal (LF, por sus siglas en inglés) (2), izquierdo envolvente (LS, por sus siglas en inglés) (5), derecho frontal (RF, por sus siglas en inglés) (4), derecho envolvente (RS, por sus siglas en inglés) (6) y central (C) (3).
  6. 6.
    El calculador de parámetro según la reivindicación 5, en el que el re-calculador de parámetro (502) es operativo para derivar el parámetro CLD (508), usando:
    un primer parámetro CLD (CLD0) con información de la energía para una combinación del canal LS (5) y RS (6) y una combinación de los canales restantes de la señal multicanal;
    un segundo parámetro (CLD1) con información de la energía para una combinación del canal LF (2) y RF (4) y el canal central (C) (3);
    un tercer parámetro (CLD2) con información de la energía para el canal LS (5) y RS (6); y
    un cuarto parámetro CLD (CLD3) con información de la energía para el canal LF (2) y RF (4).
  7. 7. El calculador de parámetro según la reivindicación 6, en el que el re-calculador de parámetro (502) es operativo para derivar el parámetro CLD en conformidad con la siguiente fórmula:
    en la cual L0 y R0 son las energías normalizadas de los canales estéreo de salida L y R (524) derivados por
    En los que las energías de las señales multicanal se derivan de los parámetros CLD de la siguiente manera:
  8. 8. El calculador de parámetro según la reivindicación 5, en el que el re-calculador de parámetro (502) es operativo para
    derivar el parámetro ICC (510) usando: un primer parámetro CLD (CLD0) con información de la energía para una combinación del canal LS (5) y RS (6) y una combinación de los canales restantes de la señal multicanal:
    un segundo parámetro (CLD1) con información de la energía para una combinación del canal LF (2) y RF (4) y el canal central (C) (3): un tercer parámetro (CLD2) con información de la energía para el canal LS (5) y RS (6); y un cuarto parámetro CLD (CLD3) con información de la energía para el canal LF (2) y RF (4); un primer parámetro ICC (ICC2) con información de la correlación entre el canal LS (5) y RS (6); y un segundo parámetro ICC (ICC3) con información sobre la correlación entre el canal LF (2) y RF (4).
  9. 9.
    El calculador de parámetro según la reivindicación 8, en el que el parámetro ICC (510) se deriva en conformidad con la siguiente fórmula:
  10. 10.
    El calculador de parámetro según la reivindicación 5, en el que el re-calculador de parámetro es operativo para derivar el parámetro CLD (508), usando:
    un primer parámetro CLD (CLD0) con información de la energía del canal central (C) (3) y una combinación de otros canales de la señal multicanal;
    un segundo parámetro CLD (CLD1) con información de la energía para una combinación del canal LF (2) y LS (5) y una combinación del canal RF (4) y RS (6);
    un parámetro ICC (ICC0) con información de la correlación entre el canal central (C) (3) y una combinación de otros canales de la señal multicanal.
  11. 11. El calculador de parámetro según la reivindicación 10, en el que el parámetro CLD (508) se deriva de la siguiente fórmula:
    en la cual L0 y R0 son las energías normalizadas de los canales estéreo de salida L y R derivados por
    donde
  12. 12. El calculador de parámetro según la reivindicación 5, en el que el re-calculador de parámetro (502) es operativo para derivar el parámetro ICC (510) usando:
    un primer parámetro CLD (CLD0) con información de la energía del canal central (C) (3) y una combinación de otros canales de la señal multicanal;
    un segundo parámetro CLD (CLD1) con información de la energía para una combinación del canal LF (2) y LS (5) y una combinación del canal RF (4) y RS (6);
    un primer parámetro ICC (ICC0) con información de la correlación entre el canal central (C) (3) y una combinación de otros canales de la señal multicanal; y
    un segundo parámetro ICC (ICC1) con información de la correlación entre una combinación del canal LF (2) y LS (5) y una combinación del canal RF (4) y RS (6).
  13. 13. El calculador de parámetro según la reivindicación 5, en el que el re-calculador de parámetro (502) es operativo para derivar el valor ICC utilizando la siguiente fórmula:
    donde la medida p de correlación es derivada como
    y
  14. 14.
    El calculador de parámetro según la reivindicación 5, en el que el re-calculador de parámetro (502) es operativo para usar los parámetros multicanal (504, 506) que describen una representación de sub-banda de la señal multicanal.
  15. 15.
    El calculador de parámetro según la reivindicación 1, en el que el re-calculador de parámetro (502) es operativo para usar parámetros multicanal valuado complejos (504, 506).
  16. 16.
    El reconstructor de canal con un reconstructor de parámetro, en el que incluye:
    un calculador de parámetro según la reivindicación 7; y
    un convertidor a la alza (520) para derivar la representación estéreo (524) usando los parámetros de conversión a la alza (508, 510) y la señal convertida a la baja (522).
  17. 17. Procedimiento para generar los parámetros de conversión a la alza (508, 510) para convertir a la alza una señal convertida a la baja (522) en una representación estéreo (524) de una señal multicanal con más canales que la señal convertida a la baja y menos canales que la señal multicanal, caracterizando la representación estéreo una conversión a la baja del lado izquierdo y una conversión a la baja del lado derecho de la señal multicanal, teniendo la señal convertida a la baja los parámetros multicanal (504, 506) asociados a esta que describen las propiedades espaciales de la señal multicanal, en la que la señal multicanal incluye los canales no incluidos en la representación estéreo y en la que los parámetros multicanal (504, 506) incluyen la información sobre los canales no incluidos en la representación estéreo; caracterizado el procedimiento porque incluye:
    derivar los parámetros de conversión a la alza (508, 510) incluyendo un parámetro CLD (508) y una parámetro ICC
    (510) a partir de los parámetros multicanal usando los parámetros con información sobre los canales no incluidos en la representación estéreo (524), el parámetro CLD (508) con información de la energía para el canal izquierdo y el derecho de la representación estéreo y el parámetro ICC (519) con información sobre una correlación entre el canal izquierdo y derecho.
  18. 18. El receptor o reproductor de audio (600), teniendo el receptor o reproductor de audio un calculador de parámetro
    (601) Según la reivindicación 1.
  19. 19.
    Procedimiento para recibir o reproducir audio, teniendo el procedimiento un procedimiento para generar parámetros de conversión a la alza según la reivindicación 17.
  20. 20.
    Programa de computadora con un código de programa para realizar, al ejecutarse en una computadora, un procedimiento para generar los parámetros de conversión a la alza según la reivindicación 17.
  21. 21.
    Programa computacional con un código de programa para realizar, al ejecutarse en una computadora, un procedimiento para recibir o reproducir audio, según la reivindicación 19.
ES06791592T 2006-03-29 2006-08-18 Número reducido de decodificación de canales Active ES2398573T3 (es)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
SE0600713 2006-03-29
SE0600713 2006-03-29
US78891106P 2006-04-03 2006-04-03
US788911P 2006-04-03
US464149 2006-08-11
US11/464,149 US7965848B2 (en) 2006-03-29 2006-08-11 Reduced number of channels decoding
PCT/EP2006/008175 WO2007110102A1 (en) 2006-03-29 2006-08-18 Reduced number of channels decoding

Publications (1)

Publication Number Publication Date
ES2398573T3 true ES2398573T3 (es) 2013-03-20

Family

ID=37450828

Family Applications (1)

Application Number Title Priority Date Filing Date
ES06791592T Active ES2398573T3 (es) 2006-03-29 2006-08-18 Número reducido de decodificación de canales

Country Status (11)

Country Link
US (1) US7965848B2 (es)
EP (1) EP1999744B1 (es)
JP (1) JP5158814B2 (es)
KR (1) KR101002835B1 (es)
CN (1) CN101410890B (es)
BR (1) BRPI0621530B1 (es)
ES (1) ES2398573T3 (es)
HK (1) HK1122127A1 (es)
PL (1) PL1999744T3 (es)
TW (1) TWI339836B (es)
WO (1) WO2007110102A1 (es)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE527654T1 (de) 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
WO2007032648A1 (en) * 2005-09-14 2007-03-22 Lg Electronics Inc. Method and apparatus for decoding an audio signal
KR101218776B1 (ko) 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US9088855B2 (en) * 2006-05-17 2015-07-21 Creative Technology Ltd Vector-space methods for primary-ambient decomposition of stereo audio signals
WO2008046530A2 (en) * 2006-10-16 2008-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
DE602007013415D1 (de) * 2006-10-16 2011-05-05 Dolby Sweden Ab Erweiterte codierung und parameterrepräsentation einer mehrkanaligen heruntergemischten objektcodierung
DE102006050068B4 (de) * 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
US8352249B2 (en) * 2007-11-01 2013-01-08 Panasonic Corporation Encoding device, decoding device, and method thereof
WO2009086174A1 (en) 2007-12-21 2009-07-09 Srs Labs, Inc. System for adjusting perceived loudness of audio signals
KR101614160B1 (ko) * 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
US8705749B2 (en) * 2008-08-14 2014-04-22 Dolby Laboratories Licensing Corporation Audio signal transformatting
EP2211335A1 (en) 2009-01-21 2010-07-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
KR20110022251A (ko) * 2009-08-27 2011-03-07 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
KR101692394B1 (ko) * 2009-08-27 2017-01-04 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
TWI433137B (zh) 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
TWI413110B (zh) * 2009-10-06 2013-10-21 Dolby Int Ab 以選擇性通道解碼的有效多通道信號處理
KR101641685B1 (ko) 2010-03-29 2016-07-22 삼성전자주식회사 멀티채널 오디오의 다운믹스 방법 및 장치
FR2966634A1 (fr) * 2010-10-22 2012-04-27 France Telecom Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
WO2013120510A1 (en) 2012-02-14 2013-08-22 Huawei Technologies Co., Ltd. A method and apparatus for performing an adaptive down- and up-mixing of a multi-channel audio signal
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
EP3005353B1 (en) 2013-05-24 2017-08-16 Dolby International AB Efficient coding of audio scenes comprising audio objects
KR20230011480A (ko) 2013-10-21 2023-01-20 돌비 인터네셔널 에이비 오디오 신호들의 파라메트릭 재구성
KR101805327B1 (ko) * 2013-10-21 2017-12-05 돌비 인터네셔널 에이비 오디오 신호들의 파라메트릭 재구성을 위한 역상관기 구조
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
US9866986B2 (en) 2014-01-24 2018-01-09 Sony Corporation Audio speaker system with virtual music performance
TWI587286B (zh) 2014-10-31 2017-06-11 杜比國際公司 音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體
KR20160101692A (ko) 2015-02-17 2016-08-25 한국전자통신연구원 다채널 신호 처리 방법 및 상기 방법을 수행하는 다채널 신호 처리 장치
WO2016133366A1 (ko) * 2015-02-17 2016-08-25 한국전자통신연구원 다채널 신호 처리 방법 및 상기 방법을 수행하는 다채널 신호 처리 장치
US9826332B2 (en) * 2016-02-09 2017-11-21 Sony Corporation Centralized wireless speaker system
US9924291B2 (en) 2016-02-16 2018-03-20 Sony Corporation Distributed wireless speaker system
US9826330B2 (en) 2016-03-14 2017-11-21 Sony Corporation Gimbal-mounted linear ultrasonic speaker assembly
US9794724B1 (en) 2016-07-20 2017-10-17 Sony Corporation Ultrasonic speaker assembly using variable carrier frequency to establish third dimension sound locating
US9924286B1 (en) 2016-10-20 2018-03-20 Sony Corporation Networked speaker system with LED-based wireless communication and personal identifier
US9854362B1 (en) 2016-10-20 2017-12-26 Sony Corporation Networked speaker system with LED-based wireless communication and object detection
US10075791B2 (en) 2016-10-20 2018-09-11 Sony Corporation Networked speaker system with LED-based wireless communication and room mapping
CN108665902B (zh) 2017-03-31 2020-12-01 华为技术有限公司 多声道信号的编解码方法和编解码器
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
GB201718341D0 (en) 2017-11-06 2017-12-20 Nokia Technologies Oy Determination of targeted spatial audio parameters and associated spatial audio playback
GB2572650A (en) * 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
GB2574239A (en) 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
US12010493B1 (en) * 2019-11-13 2024-06-11 EmbodyVR, Inc. Visualizing spatial audio
US11443737B2 (en) 2020-01-14 2022-09-13 Sony Corporation Audio video translation into multiple languages for respective listeners
EP4243015A4 (en) 2021-01-27 2024-04-17 Samsung Electronics Co., Ltd. AUDIO PROCESSING APPARATUS AND METHOD
WO2022164229A1 (ko) * 2021-01-27 2022-08-04 삼성전자 주식회사 오디오 처리 장치 및 방법
US20240274137A1 (en) * 2021-06-10 2024-08-15 Nokia Technologies Oy Parametric spatial audio rendering

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
JP2002175097A (ja) * 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
DE60326782D1 (de) * 2002-04-22 2009-04-30 Koninkl Philips Electronics Nv Dekodiervorrichtung mit Dekorreliereinheit
DE60327039D1 (de) 2002-07-19 2009-05-20 Nec Corp Audiodekodierungseinrichtung, dekodierungsverfahren und programm
CN1672464B (zh) 2002-08-07 2010-07-28 杜比实验室特许公司 音频声道空间转换
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
JP4988716B2 (ja) * 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
JP5108767B2 (ja) * 2005-08-30 2012-12-26 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
KR101562379B1 (ko) * 2005-09-13 2015-10-22 코닌클리케 필립스 엔.브이. 공간 디코더 유닛 및 한 쌍의 바이노럴 출력 채널들을 생성하기 위한 방법
WO2007032648A1 (en) * 2005-09-14 2007-03-22 Lg Electronics Inc. Method and apparatus for decoding an audio signal
EP1964442B1 (en) * 2005-12-20 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for synthesizing three output channels using two input channels
WO2007080212A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Controlling the decoding of binaural audio signals

Also Published As

Publication number Publication date
CN101410890B (zh) 2012-01-25
US7965848B2 (en) 2011-06-21
EP1999744A1 (en) 2008-12-10
JP2009530672A (ja) 2009-08-27
KR20080103094A (ko) 2008-11-26
WO2007110102A1 (en) 2007-10-04
JP5158814B2 (ja) 2013-03-06
EP1999744B1 (en) 2012-11-28
TWI339836B (en) 2011-04-01
BRPI0621530A2 (pt) 2011-12-13
CN101410890A (zh) 2009-04-15
TW200737127A (en) 2007-10-01
US20070233293A1 (en) 2007-10-04
BRPI0621530B1 (pt) 2019-11-12
KR101002835B1 (ko) 2010-12-21
PL1999744T3 (pl) 2013-04-30
HK1122127A1 (en) 2009-05-08

Similar Documents

Publication Publication Date Title
ES2398573T3 (es) Número reducido de decodificación de canales
ES2362920T3 (es) Método mejorado para la conformación de señales en reconstrucción de audio multicanal.
EP3074969B1 (en) Multiplet-based matrix mixing for high-channel count multichannel audio
ES2959970T3 (es) Codificador de audio para la codificación de una señal de múltiples canales y un decodificador de audio para la decodificación de una señal de audio codificada
ES2378734T3 (es) Codificación mejorada y representación de parámetros de codificación de objetos de mezcla descendente multicanal
ES2313646T3 (es) Codificacion y descodificacion de audio.
ES2278348T3 (es) Codificacion/decodificacion multicanal compatible.
ES2952871T3 (es) Concepto para puentear el espacio entre codificación parámetrica de audio multicanal y codificación multicanal envolvente matricial
JP5698189B2 (ja) オーディオ符号化
ES2682073T3 (es) Codificación conjunta paramétrica de fuentes de audio
ES2544946T3 (es) Decodificación de señal de audio multicanal usando señales de-correlacionadas
ES2609449T3 (es) Decodificación de audio
ES2636808T3 (es) Codificación de escenas de audio
JP2011059711A (ja) オーディオエンコード及びデコード
US10163446B2 (en) Audio encoder and decoder
ES2748939T3 (es) Codificador y descodificador de audio
ES2624668T3 (es) Codificación y descodificación de objetos de audio
RU2406262C2 (ru) Декодирование уменьшенного количества каналов
MX2008012280A (es) Numero reducido de decodificacion de canales.
BR112017006278B1 (pt) Método para aprimorar o diálogo num decodificador em um sistema de áudio e decodificador