ES2376889T3 - Generación de mezclas descendentes espaciales a partir de representaciones paramétricas de señales multicanal - Google Patents

Generación de mezclas descendentes espaciales a partir de representaciones paramétricas de señales multicanal Download PDF

Info

Publication number
ES2376889T3
ES2376889T3 ES06777145T ES06777145T ES2376889T3 ES 2376889 T3 ES2376889 T3 ES 2376889T3 ES 06777145 T ES06777145 T ES 06777145T ES 06777145 T ES06777145 T ES 06777145T ES 2376889 T3 ES2376889 T3 ES 2376889T3
Authority
ES
Spain
Prior art keywords
channel
signal
head
channels
derive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES06777145T
Other languages
English (en)
Inventor
Lars Villemoes
Kristofer KJÖRLING
Jeroen Breebaart
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Dolby International AB
Dolby Sweden AB
Original Assignee
Dolby International AB
Koninklijke Philips Electronics NV
Dolby Sweden AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB, Koninklijke Philips Electronics NV, Dolby Sweden AB filed Critical Dolby International AB
Application granted granted Critical
Publication of ES2376889T3 publication Critical patent/ES2376889T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S3/004For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution

Abstract

Descodificador para derivar una señal (314) de mezcla descendente de auriculares utilizando una representación de una mezcla descendente de una señal (312) multicanal y utilizando un parámetro (306) de nivel que tiene información sobre una relación de nivel entre dos canales de la señal multicanal y utilizando funciones (308) de transferencia relacionadas con la cabeza relacionadas con los dos canales de la señal multicanal, en el que un primer canal de los dos canales es un canal frontal del lateral izquierdo o derecho de la señal multicanal y un segundo canal de los dos canales es un canal trasero del mismo lateral, que comprende: un calculador (302) de filtro para derivar una función (310) de transferencia relacionada con la cabeza modificada H (X ) Y mediante la ponderación de la función de transferencia relacionada con la cabeza H (Xf ) Y del canal frontal y la función de transferencia relacionada con la cabeza H (Xs) 10 Y del canal trasero utilizando el parámetro (306) de nivel, de tal manera que la función (310) de transferencia relacionada con la cabeza modificada H (X ) Y se influye más por la función (308) de transferencia relacionada con la cabeza de un canal que tiene un nivel más alto que por la función (308) de transferencia relacionada con la cabeza de un canal que tiene un nivel más bajo utilizando la siguiente combinación lineal compleja: donde es un parámetro de fase, y son factores de ponderación derivados utilizando el parámetro (306) de nivel y es un factor de ganancia común derivado utilizando el parámetro (306) de nivel; y un sintetizador (304) para derivar la señal (314) de mezcla descendente de auriculares utilizando la función (310) de transferencia relacionada con la cabeza modificada y la representación de la señal (312) de mezcla descendente.

Description

Generación de mezclas descendentes espaciales a partir de representaciones paramétricas de señales multicanal.
Campo de la Invención
La presente invención se refiere a la descodificación de señales de audio multicanal codificadas basadas en una representación multicanal paramétrica y en particular a la generación de mezclas descendentes de 2 canales que proporcionan una experiencia de escucha espacial, tal como por ejemplo una mezcla descendente compatible con auriculares o una mezcla descendente espacial para instalaciones de dos altavoces.
Antecedentes de la Invención
El desarrollo reciente en la codificación de audio ha hecho disponible la capacidad de recrear una representación multicanal de una señal de audio basada en una señal estéreo (o mono) y datos de control correspondientes. Estos métodos difieren sustancialmente de las soluciones basadas en matriz más antiguas tales como Dolby Prologic, puesto que se transmiten los datos de control adicionales para controlar la recreación, también denominada como mezcla ascendente, de los canales envolventes basados en los canales mono o estéreo transmitidos.
De ahí, un descodificador de audio multicanal paramétrico de este tipo, por ejemplo MPEG Surround, reconstruye N canales basándose en M canales transmitidos, donde N > M, y los datos de control adicionales. Los datos de control adicionales representan una velocidad de datos más baja significativa que la transmisión de todos los N canales, haciendo que la codificación sea muy eficiente a la vez que se asegura la compatibilidad tanto con los dispositivos de M canales como dispositivos de N canales.
Estos métodos de codificación envolventes paramétricos comprenden normalmente una parametrización de la señal envolvente basada en IID (Inter channel Intensity Difference- Diferencia de Intensidad Intercanal) o CLD (Channel Level Difference- Diferencia de Nivel de Canal) e ICC (Inter Channel Coherence- Coherencia Intercanal). Estos parámetros describen relaciones y correlaciones de potencia entre pares de canales en el proceso de mezcla ascendente. Parámetros adicionales también utilizados en la técnica anterior comprenden parámetros de predicción utilizados para predecir canales intermedios o de salida durante el procedimiento de mezcla ascendente.
Otros desarrollos en la reproducción de contenido de audio multicanal han proporcionado medios para obtener una impresión de escucha espacial utilizando auriculares estereofónicos. Para obtener una experiencia de escucha espacial utilizando solamente los dos altavoces de los auriculares, se mezclan de manera descendente las señales multicanal a señales estéreo utilizando HRTF (Head-related transfer functions- funciones de transferencia relacionados con la cabeza), destinadas a tener en cuenta las características de transmisión extremadamente complejas de la cabeza humana para proporcionar la experiencia de escucha espacial.
Otro enfoque relacionado es usar un ambiente de reproducción de 2 canales convencional y filtrar los canales de una señal de audio multicanal con filtros apropiados para obtener la experiencia de escucha cercana a aquella de la reproducción con el número original de altavoces. El procesamiento de las señales es similar al caso de la reproducción de auriculares para crear una “mezcla descendente estéreo espacial” apropiada que tiene las propiedades deseadas. En contraste con el caso de auriculares, la señal de ambos altavoces llega directamente a ambos oídos de un oyente, provocando “efectos de diafonía” indeseables. Ya que esto se tiene que tener en cuenta para la calidad de reproducción óptima, los filtros utilizados para el tratamiento de señales comúnmente se denominan filtros de cancelación de diafonía. En general, el objetivo de esta técnica es extender el intervalo posible de fuentes de sonido al exterior de la base de altavoz estéreo mediante la cancelación de diafonía inherente utilizando filtros de cancelación de diafonía complejos.
Debido a la filtración compleja, los filtros HRTF son muy largos, es decir, pueden comprender varios cientos de derivaciones de filtro cada uno. Por la misma razón, es difícilmente posible encontrar una parametrización de los filtros que trabaje lo suficientemente bien para no degradar la calidad de percepción cuando se utilizan en lugar del filtro real.
Así, por una parte, representaciones paramétricas de ahorro de bits de señales multicanal existen que permiten un transporte eficiente de una señal multicanal codificada. Por otra parte, se conocen maneras elegantes de crear una experiencia de escucha espacial para una señal multicanal cuando se usan auriculares estereofónicos o altavoces estereofónicos solamente. Sin embargo, estos requieren el número completo de canales de la señal multicanal como entrada para la aplicación de las funciones de transferencia relacionadas con la cabeza que crean la señal de mezcla descendente de auriculares. Así, o bien se tiene que transmitir el conjunto completo de señales multicanal o bien se tiene que reconstruir por completo una representación paramétrica antes de aplicar las funciones de transferencia relacionadas con la cabeza o los filtros de cancelación de diafonía, y así o bien el ancho de banda de transmisión o bien la complejidad de cálculo es inaceptablemente alta.
La solicitud estadounidense US 2006/004274 se refiere a la generación de una señal de sonido mediante la aplicación de dos funciones de transferencia relacionadas con la cabeza a una señal de sonido monofónica transmitida. Se deriva cada una de las funciones de transferencia relacionadas con la cabeza añadiendo dos funciones de transferencia relacionadas con la cabeza adicionales.
La solicitud internacional WO2006/008683 describe un método y un dispositivo para procesar una señal estéreo obtenida de un codificador que codifica señales de audio de n canales en parámetros espaciales y una mezcla descendente estéreo.
En Faller C et al.: “Binaural Cue Coding – Part II: Schemes and Applications”, se introduce un esquema de codificación destinado a transmitir múltiples canales de una manera eficiente con respecto a la velocidad de bits.
La solicitud estadounidense US 2003/0035553 se refiere a la codificación perceptiva compatible inversa de indicaciones espaciales para convertir dos señales de audio o más en una señal de audio combinada que se incrusta con dos conjuntos o más de un parámetro o más de escenas auditivas, en la que cada conjunto de parámetros de escena auditiva (por ejemplo, una o más indicaciones espaciales tal como ILD, ITD o funciones de transferencia relacionadas con la cabeza) corresponde a una banda de frecuencia diferente en la señal de audio combinada.
Sumario de la Invención
Es un objeto de la presente invención proporcionar un concepto que permita una reconstrucción más eficiente de una señal de dos canales que proporcione una experiencia de escucha espacial utilizando representaciones paramétricas de señales multicanal.
De acuerdo con un primer aspecto de la presente invención, se logra este objeto por un descodificador según la reivindicación 1 ó 19.
De acuerdo con un segundo aspecto de la presente invención, se logra este objeto por un descodificador binaural según la reivindicación 18.
De acuerdo con un tercer aspecto de la presente invención, se logra este objeto mediante un método de derivar una señal de mezcla descendente de auriculares según la reivindicación 20.
De acuerdo con un cuarto aspecto de la presente invención, se logra este objeto por un receptor o reproductor de audio según la reivindicación 21.
De acuerdo con un quinto aspecto de la presente invención, se logra este objeto por un método de recibir o reproducir audio según la reivindicación 22..
De acuerdo con un sexto aspecto de la presente invención, se logra este objeto por un programa informático según la reivindicación 23.
La presente invención se basa en el descubrimiento de que una señal de mezcla descendente de auriculares puede derivarse de una mezcla descendente paramétrica de una señal multicanal cuando se usa un calculador de filtro para derivar HRTF (funciones de transferencia relacionadas con la cabeza) modificadas a partir de HRTF originales de la señal multicanal y cuando el convertidor de filtro utiliza un parámetro de nivel que tiene información sobre una relación de nivel entre dos canales de la señal multicanal, de tal manera que las HRTF modificadas se influyen más por la HRTF de un canal que tiene un nivel más alto que por la HRTF de un canal que tiene un nivel más bajo. Se derivan las HRTF modificadas durante el proceso de descodificación teniendo en cuenta la intensidad relativa de los canales asociados con las HRTF. Las HRTF originales se modifican de tal manera que una señal de mezcla descendente de una representación paramétrica de una señal multicanal puede utilizarse directamente para sintetizar la señal de mezcla descendente de auriculares sin la necesidad de una reconstrucción multicanal paramétrica completa de la señal de mezcla descendente paramétrica.
En una realización de la presente invención, se utiliza un descodificador de la invención que implementa una reconstrucción multicanal paramétrica así como una reconstrucción binaural de la invención de una mezcla descendente paramétrica transmitida de una señal multicanal original. De acuerdo con la presente invención, no se requiere una reconstrucción completa de la señal multicanal antes de la mezcla descendente binaural, lo cual tiene la mayor ventaja obvia de una complejidad de cálculo fuertemente reducida. Esto permite, por ejemplo, que dispositivos móviles que sólo tienen reservas de energía limitadas prolonguen la duración de reproducción significativamente. Una ventaja adicional es que el mismo dispositivo puede servir como proveedor para señales multicanal completas (por ejemplo, señales 5,1, 7,1, 7,2) así como para la mezcla descendente binaural de la señal que tiene una experiencia de escucha espacial aún cuando se utilizan auriculares de sólo dos altavoces. Esto podría, por ejemplo, ser extremadamente ventajoso en configuraciones de entretenimiento en casa.
En una realización adicional de la presente invención, se utiliza un calculador de filtro para derivar las HRTF modificadas no sólo operativas para combinar las HRTF de los dos canales al aplicar factores de ponderación individuales a la HRTF, sino al introducir factores de fase adicionales para cada HTRF a combinar. La introducción del factor de fase tiene la ventaja de obtener una compensación de retardo de los dos filtros antes de su superposición o combinación. Esto conduce a una respuesta combinada que modela un tiempo de retardo principal correspondiente a una posición intermedia entre los altavoces frontal y trasero.
Una segunda ventaja es que un factor de ganancia, que tiene que aplicarse durante la combinación de los filtros para asegurar la conservación de energía, es mucho más estable con respecto a su comportamiento con frecuencia que sin la introducción del factor de fase. Esto es particularmente relevante para el concepto de la invención, ya que de acuerdo con una realización de la presente invención se procesa una representación de una mezcla descendente de una señal multicanal dentro de un dominio de banco de filtros para derivar la señal de mezcla descendente de auriculares. Como tal, hay que procesar individualmente diferentes bandas de frecuencia de la representación de la señal de mezcla descendente y por lo tanto, un comportamiento uniforme de las funciones de ganancia aplicadas individualmente es vital.
En una realización adicional de la presente invención, se convierten las funciones de transferencia relacionadas con la cabeza a filtros de subbanda para los dominios de subbanda de tal manera que el número total de las HRTF modificadas utilizadas en el dominio de subbanda es menor que el número total de HRTF originales. Esto tiene la ventaja evidente de que la complejidad de cálculo para derivar las señales de mezcla descendente de auriculares aún se disminuye en comparación con la mezcla descendente utilizando filtros de HRTF estándar.
La implementación del concepto de la invención permite el uso de HTRF extremadamente largas y así permite la reconstrucción de señales de mezcla descendente de auriculares en base a una representación de una mezcla descendente paramétrica de una señal multicanal con una calidad de percepción excelente.
Además, el uso del concepto de la invención en filtros de cancelación de diafonía permite la generación de una mezcla descendente estéreo espacial a utilizarse con una instalación de dos altavoces estándar en base a una representación de una mezcla descendente paramétrica de una señal multicanal con una calidad de percepción excelente.
Una gran ventaja adicional del concepto de descodificación de la invención es que puede utilizarse un solo descodificador binaural de la invención que implementa el concepto de la invención para derivar una mezcla descendente binaural así como una reconstrucción multicanal de una mezcla descendente transmitida teniendo en cuenta los parámetros espaciales transmitidos adicionalmente.
En una realización de la presente invención, un descodificador binaural de la invención tiene un banco de filtros de análisis para derivar la representación de la mezcla descendente de la señal multicanal en un dominio de subbanda y un descodificador de la invención que implementa el cálculo de las HRTF modificadas. El descodificador comprende además un banco de filtros de síntesis para finalmente derivar una representación de dominio de tiempo de una señal de mezcla descendente de auriculares, que está preparada para reproducirse mediante cualquier equipo de reproducción de audio convencional.
Se explican en más detalle en los siguientes párrafos unos esquemas de descodificación multicanal paramétricos y unos esquemas de descodificación binaurales con referencia a las figuras adjuntas para bosquejar más claramente las mayores ventajas del concepto de la invención.
La mayoría de las realizaciones de la presente invención detalladas a continuación describen el concepto de la invención utilizando las HRTF. Tal como se ha indicado anteriormente, el procesamiento de HTRF es similar al uso de filtros de cancelación de diafonía. Por lo tanto, debe entenderse que todas las realizaciones se refieren al procesamiento de HTRF, así como a filtros de cancelación de diafonía. Es decir, podrían sustituirse todos los filtros de HRTF por filtros de cancelación de diafonía a continuación para aplicar el concepto de la invención al uso de filtros de cancelación de diafonía.
Breve Descripción de las Figuras
A continuación se describen unas realizaciones preferidas de la presente invención con referencia a las figuras adjuntas, en las que:
la figura 1 muestra una síntesis binaural convencional utilizando unas HRTF;
la figura 1b muestra el uso convencional de filtros de cancelación de diafonía;
la figura 2 muestra un ejemplo de un codificador espacial multicanal;
la figura 3 muestra un ejemplo de descodificadores espaciales/binaurales de la técnica anterior;
la figura 4 muestra un ejemplo de un codificador multicanal paramétrico;
la figura 5 muestra un ejemplo de un descodificador multicanal paramétrico;
la figura 6 muestra un ejemplo de un descodificador de la invención;
la figura 7 muestra un diagrama de bloques que ilustra el concepto de transformar filtros al dominio de subbanda;
la figura 8 muestra un ejemplo de un descodificador de la invención; la figura 9 muestra un ejemplo adicional de un descodificador de la invención; y
la figura 10 muestra un ejemplo de un receptor o reproductor de audio de la invención.
Descripción Detallada de Realizaciones Preferidas
Las realizaciones que se describen a continuación son solamente ilustrativas para los principios de la presente invención para la descodificación binaural de señales multicanal mediante el filtrado de HRTF modificada. Se comprenderá que las modificaciones y variaciones de las disposiciones y los detalles descritos en la presente serán evidentes para otros expertos en la materia. Por lo tanto, se propone limitarse únicamente por el alcance de las reivindicaciones de patente pendientes y no por los detalles específicos presentados a modo de descripción y explicación de las realizaciones de la presente.
Con el fin de mejor describir los elementos y ventajas de la presente invención, a continuación se proporciona una descripción más elaborada de la técnica anterior.
Un algoritmo de síntesis binaural convencional se describe en la figura 1. Se filtra un conjunto de canales 10a, 10b, 10c, 10d y 10e de entrada (frontal izquierdo (LF), frontal derecho (RF), envolvente izquierdo (LS), envolvente derecho (RS) y central (C)) por un conjunto de HRTF 12a a 12j. Cada señal de entrada se divide en dos señales (un componente izquierdo “L” y un componente derecho “R”), donde posteriormente se filtra cada uno de estos componentes de señal por una HRTF correspondiente a la posición de sonido deseada. Finalmente, se suman todas las señales de oído izquierdo por un sumador 14a para generar la señal L de salida binaural izquierda y se suman las señales de oído derecho por un sumador 14b para generar la señal R de salida binaural derecha. Puede observarse que la convolución de HRTF puede realizarse principalmente en el dominio de tiempo, pero frecuentemente se prefiere que se realice el filtrado en el dominio de frecuencia debido a la eficiencia de cálculo incrementada. Esto significa que la suma mostrada en la figura 1 se realiza también en el dominio de frecuencia y además se requiere una transformación posterior a un dominio de tiempo.
La figura 1b ilustra el procesamiento de cancelación de diafonía destinado a obtener una impresión de escucha espacial utilizando sólo dos altavoces de un ambiente de reproducción estéreo estándar.
El objetivo es la reproducción de una señal multicanal mediante un sistema de reproducción estéreo que tiene sólo dos altavoces 16a y 16b, de tal manera que el oyente 18 tiene una experiencia de escucha espacial. Una diferencia principal con respecto a la reproducción con auriculares es que las señales de ambos altavoces 16a y 16b llegan directamente a ambos oídos del oyente 18. Por lo tanto, es necesario adicionalmente tener en cuenta las señales indicadas por las líneas discontinuas (diafonía).
Para facilitar la explicación, se ilustra en la figura 1b una señal de una entrada de sólo 3 canales que tiene 3 fuentes 20a a 20c. Resulta evidente que el escenario puede en principio extenderse a un número arbitrario de canales.
Para derivar la señal estéreo a reproducirse, se procesa cada fuente de entrada por 2 de los filtros 21a a 21f de cancelación de diafonía, un filtro para cada canal de la señal de reproducción. Finalmente, se suman todas las señales filtradas para el canal 16a de reproducción izquierdo y el canal 16b de reproducción derecho para la reproducción. Es evidente que los filtros de cancelación de diafonía en general serán diferentes para cada fuente 20a y 20b (dependiendo de su posición percibida deseada) y que podrían además hasta depender del oyente.
Debido a la alta flexibilidad del concepto de la invención, uno se beneficia de la alta flexibilidad en el diseño y aplicación de los filtros de cancelación de diafonía de tal manera que los filtros pueden optimizarse para cada aplicación o dispositivo de reproducción individualmente. Una ventaja adicional es que el método es extremadamente eficiente desde el punto de vista de cálculo, puesto que sólo se requieren dos bancos de filtros de síntesis.
Se muestra en la figura 2 un esquema principal de un codificador de audio espacial. En tal escenario de codificación básico, un descodificador 40 de audio espacial comprende un codificador 42 espacial, un codificador 44 de mezcla descendente y un multiplexor 46.
Se analiza una señal 50 de entrada multicanal por el codificador 42 espacial, extrayendo los parámetros espaciales que describen las propiedades espaciales de la señal de entrada multicanal que tienes que transmitirse al lado del descodificador. La señal mezclada de forma descendente generada por el codificador 42 espacial puede ser, por ejemplo, una señal monofónica o estéreo, dependiendo de diferentes escenarios de codificación. A continuación el codificador 44 de mezcla descendente puede codificar la señal de mezcla descendente monofónica o estéreo utilizando cualquier esquema de codificación de audio mono o estéreo convencional. El multiplexor 46 crea un flujo de bits de salida al combinar los parámetros espaciales y la señal de mezcla descendente codificada al flujo de bits de salida.
La figura 3 muestra una posible combinación directa de un descodificador multicanal correspondiente al codificador de la figura 2 y un método de síntesis binaural tal como se muestra, por ejemplo, en la figura 1. Como se puede observar, el enfoque de la técnica anterior de combinar las características es simple y directo. La instalación comprende un desmultiplexor 60, un descodificador 62 de mezcla descendente, un descodificador 64 espacial y un sintetizador 66 binaural. Se desmultiplexa un flujo 68 de bits de entrada, dando como resultado unos parámetros 70 espaciales y un flujo de bits de señal de mezcla descendente. Este último flujo de bits de señal de mezcla descendente se descodifica por el descodificador 62 de mezcla descendente utilizando un descodificador mono o estéreo convencional. Se introduce la mezcla descendente descodificada, junto con los parámetros 70 ,espaciales, al descodificador 64 espacial que genera una señal 72 de salida multicanal que tiene las propiedades espaciales indicadas por los parámetros 70 espaciales. El tener una señal 72 multicanal completamente reconstruida, el enfoque de simplemente agregar un sintetizador 66 binaural para implementar el concepto de síntesis binaural de la figura 1 es directo. Por lo tanto, se utiliza la señal 72 de salida multicanal como entrada para el sintetizador 66 binaural que procesa la señal de salida multicanal para derivar la señal 74 de salida binaural resultante. El enfoque que se muestra en la figura 3 tiene por lo menos tres desventajas: es necesario calcular una representación de señal multicanal completa como una etapa intermedia, seguida por la convolución de HRTF y mezcla descendente en la síntesis binaural. Aunque la convolución de HRTF debe realizarse por cada canal dado que cada canal de audio puede tener una posición espacial diferente, esta es una situación indeseable desde el punto de vista de la complejidad. Así, la complejidad de cálculo es alta y se desperdicia energía.
El descodificador espacial opera en un dominio de banco de filtros (QMF). Por otra parte, normalmente se aplica la convolución de HRTF en el dominio de FFT. Por lo tanto, es necesaria una cascada de un banco de filtros de síntesis de QMF multicanal, una transformada de DFT multicanal y una transformada de DFT inversa estéreo, dando como resultado un sistema con altas demandas de cálculo.
Serán audibles y posiblemente realzados en la salida binaural (estéreo) unos artefactos de codificación creados por el descodificador espacial para crear una reconstrucción multicanal.
Se proporciona una descripción aún más detallada de la codificación y descodificación multicanal en las figuras 4 y 5.
El codificador 100 espacial mostrado en la figura 4 comprende un primer OTT (codificador 1 a 2) 102a, un segundo OTT 102b y un bloque 104 de TTT (codificador de 3 a 2). Se procesa una señal 106 de entrada multicanal que consiste en canales LF, LS, C, RF, RS (frontal izquierdo, envolvente izquierdo, central, frontal derecho y envolvente derecho) por el codificador 100 espacial. Los bloques de OTT reciben dos canales de audio de entrada cada uno y derivan un canal de salida de audio monofónico individual y parámetros espaciales asociados, teniendo los parámetros información sobre las propiedades espaciales de los canales originales entre sí o con respecto al canal de salida (por ejemplo parámetros CLD, ICC). Se procesan en el codificador 100 los canales de LF y LS por el codificador 102a de OTT y se procesan los canales de RF y RS por el codificador 102b de OTT. Se generan dos señales, L y R, una que sólo tiene información sobre el lateral izquierdo y la otra que sólo tiene información sobre el lateral derecho. Se procesan adicionalmente las señales L, R y C por el codificador 104 de TTT, generando una mezcla descendente estéreo y parámetros adicionales.
Los parámetros resultantes del codificador de TTT normalmente consisten en un par de coeficientes de predicción para cada banda de parámetros, o un par de diferencia de nivel para describir las relaciones de energía de las tres señales de entrada. Los parámetros de los codificadores de “OTT” consisten en diferencias de nivel y valores de coherencia o de correlación cruzada entre las señales de entrada para cada banda de frecuencia.
Puede observarse que aunque el dibujo esquemático del codificador 100 espacial apunta a un procesamiento secuencial de los canales individuales de la señal de mezcla descendente durante la codificación, también es posible implementar el proceso de mezcla descendente completo del codificador 100 dentro de una sola operación de matriz.
La figura 5 muestra un descodificador espacial correspondiente, que recibe como entrada las señales de mezcla descendente, tal como se proporcionan por el codificador de la figura 4 y los parámetros espaciales correspondientes.
El descodificador 120 espacial comprende un descodificador 122 de 2 a 3 y descodificadores 124a a 124c de 1 a 2. Se introducen las señales L0 yR0 de mezcla descendente al descodificador 122 de 2 a 3 que recrea un central C canal, un canal R derecho y un canal L izquierdo. Estos tres canales se procesan adicionalmente por los descodificadores 124a a 124c de OTT produciendo seis canales de salida. Puede observarse que la derivación de un canal de mejora de baja frecuencia LFE no es determinante y puede omitirse de tal manera que un solo codificador de OTT puede conservarse dentro del descodificador 120 envolvente mostrado en la figura 5.
De acuerdo con una realización de la presente invención, se aplica el concepto de la invención en un descodificador tal como se muestra en la figura 6. El descodificador 200 de la invención comprende un descodificador 104 de 2 a 3 y seis filtros 106a a 106f de HRTF. Se procesa una señal (L0, R0) de entrada estéreo por el descodificador 104 de TTT, derivando tres señales L, C y R. Puede observarse que se supone que se alimenta la señal de entrada estéreo dentro de un dominio de subbanda, puesto que codificador de TTT puede ser el mismo codificador que se muestra en la figura 5 y de ahí adaptado para ser operativo en señales de subbanda. Se someten las señales L, R y C a un procesamiento de parámetros de HRTF por los filtros 106a a 106f de HRTF.
Se suman los 6 canales resultantes para generar el par (Lb, Rb) de salida binaural estéreo.
Puede describirse el descodificador 106 de TTT como la siguiente operación de matriz:
[L][m11 m12 ] [j[j[L0 ]
R= m21 m22 [j,
[j[j
R
0 [Cj[mmj
31 32
con entradas mxy de matriz dependientes de los parámetros espaciales. La relación de los parámetros espaciales y las entradas de matriz es idéntica a aquellas relaciones, como en el descodificador envolvente de MPEG de multicanal de
5.1. Se divide cada una de las tres señales L, R y C resultantes en dos y se procesan con parámetros de HRTF correspondientes a la posición deseada (percibida) de estas fuentes de sonido. Para el canal central (C), pueden aplicarse directamente los parámetros espaciales de la posición de la fuente de sonido, dando como resultado dos señales de salida para el centro, LB(C) y RB(C):
[LC() [ ()]
] HC
B = LC.
[j[ j
RC() ()
HC
B R
Para el canal izquierdo (L), se combinan los parámetros de HRTF de los canales frontal izquierdo y envolvente izquierdo en un solo conjunto de parámetros de HRTF, utilizando los pesos wlf y wrf. Los parámetros de HTRF “combinados” resultantes simulan el efecto de los canales tanto frontales como envolventes en un sentido estadístico. Se utilizan las siguientes ecuaciones para generar el par (LB, RB) de salida binaural para el canal izquierdo:
[L(L)][H(L)]
[B j=[L jL,
RB(L) HR(L)
Se obtiene de manera similar la salida binaural para el canal derecho de acuerdo con:
[LB(R)][HL(R)]
[j=[jR,
RB(R) HR(R)
Dadas las definiciones anteriores de (), RC, (), RL, () (), pueden derivarse las
LC() LL() LRy RR
BBBBBB
señales de Ly Rcompletas a partir de una sola matriz de 2 x 2 dada la señal de entrada estéreo:
BB
[LB][h11 h12][L0 ] [j=[j[j,
R hhR
B 21 22 0
con
h= mH(L)+ mH(R)+ mH(C),
11 11 L 21 L 31 L
h= mH(L)+ mH(R)+ mH(C),
12 12 L 22 L 32 L
h= mH(L)+ mH(R)+ mH(C),
21 11 R 21 R 31 R
h= mH(L)+ mH(R)+ mH(C).
22 12 R 22 R 32 R
En lo anterior, se supuso que los elementos () YLRy X= LRHYXpara =0,0,,C, eran escalares complejos. Sin
embargo, la presente invención enseña cómo extender el enfoque de un descodificador binaural de matriz de 2 por 2 para manejar filtros de HRTF de longitud arbitraria. Para conseguir esto, la presente invención comprende las siguientes etapas:
Transformar las respuestas de filtro de HRTF a un dominio de banco de filtros;
Extraer la diferencia de retardo global o la diferencia de fase de pares de filtros de HRTF;
Modificar las respuestas del par de filtros de HRTF como función de los parámetros CLD
Ajustar la ganancia.
Esto se consigue al reemplazar las seis ganancias Y () complejas para =R y X = LRC con seis
HXYL0,0 ,,
filtros. Se derivan estos filtros de los diez filtros Y () para =R y X ,, ,, , que describen
HXYL0, 0= Lf LsRf RsC
las respuestas de filtro de HRTF dadas en el dominio de QMF. Pueden obtenerse estas representaciones de QMF de acuerdo con el método descrito en uno de los párrafos a continuación.
En otras palabras, la presente invención enseña un concepto para derivar HRTF modificadas al modificar los filtros de canal envolvente del extremo frontal utilizando una combinación lineal compleja de acuerdo con
() = gw exp( � jw2)H (Xf )+ gw exp( jw2)H (
HX ¢¢ Xs ).
Y f XY sY s XY fY
Como se puede ver de la fórmula anterior, la derivación de las HRTF modificadas es una superposición ponderada de las HRTF originales, aplicando adicionalmente factores de fase. Los pesos ws, wf dependen de los parámetros CLD destinados a utilizarse por los descodificadores 124a y 124b de OTT de la figura 5.
Los pesos wlf y wls dependen del parámetro CLD del bloque de “OTT” para Lf y Ls:
CLD1 /10
2 10
= 1,
wlf CLD /10
1+10
wls = CLD /10 .
1+10
Los pesos wrf y wrs dependen del parámetro CLD del bloque de “OTT” para Rf y Rs:
CLD1 /10
2 10
= 1,
wrf CLD /10
1+10
w = .
rsCLD1 /10
1+10
Puede derivarse el parámetro de fase ¢XY de la diferencia de tiempo de retardo principal TXY entre los filtros de HRTF frontal y trasero y el índice de subbanda n del banco QMF:
(n + 12)
¢= T
XY XY
64 .
El papel de este parámetro de fase en la modificación de filtros es doble. En primer lugar, realiza una compensación de retardo de los dos filtros antes de la superposición, lo que conduce a una respuesta combinada que modela un tiempo de retardo principal correspondiente a una posición fuente entre los altavoces frontal y trasero. En segundo lugar, hace que el factor de compensación de ganancia g necesario sea mucho más estable y que varíe lentamente sobre la
frecuencia que en el caso de una superposición simple con ¢XY= 0.
Se determina el factor de ganancia g por la regla de potencia de adición incoherente,
22 222
() = wP (Xf ) + wP (
PX Xs )
Y fY sY
,
donde
222 222
()=g � () +wP Xs +w wP ( )() �
PX wPXf ()2 XfP Xs P
Y fY sY fsYY XY
y PXY es el valor real de la correlación cruzada compleja normalizada entre los filtros
exp(jXf Y ()
¢XY )()H HXs
Y y.
Para las ecuaciones anteriores, P denota un parámetro que describe un nivel promedio por banda de frecuencia para la respuesta de impulso del filtro especificado por los índices. Esta intensidad media es por supuesto se deriva una vez conocida la función de respuesta de filtro.
En el caso de una superposición simple con ¢XY =0, el valor de PXY varía de manera errática y oscilatoria como función de la frecuencia, lo que conduce a la necesidad de un ajuste de ganancia extenso. En una implementación práctica, es necesario limitar el valor de la ganancia g y no puede evitarse una coloración espectral restante de la señal.
En contraste, el uso de modificación con una compensación de fase a base de retardo tal como se enseña por la
presente invención conduce a un comportamiento uniforme de PXY como función de la frecuencia. Este valor es frecuentemente aún cercano a uno para pares de filtro derivados de HRTF naturales puesto que difieren principalmente en retardo y amplitud y el propósito del parámetro de fase es tener en cuenta la diferencia de fase en el dominio de banco de filtros de QMF.
Una elección ventajosa alternativa del parámetro de fase ¢XY enseñado por la presente invención se da por el ángulo de fase de la correlación cruzada compleja normalizada entre los filtros
HXfY ()Y ()
HXs
y ,
y el desenvolvimiento de los valores de fase con técnicas de desenvoltura estándar como función del índice de
subbanda n del banco de QMF. Esta elección tiene la consecuencia de que PXY nunca es negativo y de ahí la
ganancia de compensación g satisface 1/ 2 g
��1 para todas las subbandas. Además esta elección de parámetro de fase permite la modificación de los filtros de canal frontal y envolvente en situaciones en las que una
diferencia de tiempo de retardo principal TXY no está disponible.
Para la realización de la presente invención tal como se describe anteriormente, se enseña transformar exactamente las HRTF en una representación eficiente de los filtros de HRTF dentro del dominio de QMF.
La figura 7 ilustra un dibujo principal del concepto para transformar exactamente filtros de tiempo-dominio en filtros dentro del dominio de subbanda que tienen el mismo efecto neto sobre una señal reconstruida. La figura 7 muestra un banco 300 de análisis complejo, un banco 302 de síntesis correspondientes al banco 300 de análisis, un convertidor 304 de filtro y un filtro 306 de subbanda.
Se proporciona una señal 310 de entrada para la cual se conoce un filtro 312 que tiene propiedades deseadas. El objetivo de la implementación del convertidor 304 de filtro es que la señal 314 de salida tenga las mismas características después del análisis por el banco 300 de filtros de análisis, el filtrado 306 y síntesis 302 de subbanda posterior como hubiese tenido cuando se filtra por el filtro 312 en el dominio de tiempo. La tarea de proporcionar un número de filtros de subbanda correspondientes a número de subbandas utilizadas se satisface por el convertidor 304 de filtro.
La siguiente descripción resume un método para implementar un filtro h()( de FIR dado en el dominio de subbanda de QMF complejo. Se muestra el principio de funcionamiento en la figura 7.
Aquí, el filtrado de subbanda es simplemente la aplicación de un filtro de FIR de valor complejo para cada subbanda,
n =� ,,
0,1.L 1 para transformar los índices cn originales a sus contrapartes dn filtradas de acuerdo con la siguiente
fórmula:
()=�Lg () ( k
dk lc l)
n nn l
.
Obsérvese que esto se distingue de métodos bien conocidos desarrollados para tomar muestras críticamente de bancos de filtros puesto que aquellos métodos requieren el filtrado en multibanda con respuestas más largas. El componente clave es el convertidor de filtro, que convierte cualquier filtro de FIR de dominio de tiempo en los filtros de dominio de subbanda complejos. Puesto que se sobremuestrea el dominio de subbanda de QMF complejo, no hay ningún conjunto canónico de filtros de subbanda para un filtro de dominio de tiempo dado. Diferentes filtros de subbanda pueden tener el mismo efecto neto de la señal de dominio de tiempo. Lo que se describirá en la presente es una solución aproximada particularmente atractiva que se obtiene al restringir el convertidor de filtro para ser un banco de análisis complejo similar al QMF.
Suponiendo que el prototipo de convertidor de filtro es de longitud , se transforma un filtro de FIR de derivación de
64KK +� K1 K = 3
H HQQ
real en un conjunto de 64 filtros de subbanda de derivación complejos. Para , se transforma un filtro de FIR de 1024 derivaciones en un filtrado en subbandas de de 18 derivaciones con una calidad de aproximación de 50 dB.
Se calculan las derivaciones de filtro de subbanda a partir de la fórmula
� 1 �
n() =L h((+ )()exp in +2 (
gk kLq ( (=� L ,
q()(
donde es el filtro de prototipo de FIR derivado del filtro de prototipo de QMF. Como se puede observar, este es
h()(
solo un análisis de banco de filtros complejo del filtro dado.
En lo siguiente, se resumirá el concepto de la invención para una realización adicional de la presente invención, en la que está disponible una representación paramétrica multicanal para una señal multicanal que tiene cinco canales. Nótese que en esta realización particular de la presente invención, se modifican los diez filtros VY,X de HRTF originales (tal como, por ejemplo, dado por una representación de QMF de los filtros 12a a 12j de la figura 1), a seis filtros hv,x para Y = L,R y X = L,R,C.
=,X ,,,,
YLR= FL BL FR BRC
Los diez filtros VY,X para y describen las respuestas de filtro de HRTF dadas en un dominio de QMF híbrido.
La combinación de los filtros de canales frontal y envolvente se realiza con una combinación lineal compleja de acuerdo con
h = vLC
LC,,
h = vRC
RC,, L 2 L 2
h , =� gLL, C FL exp j¢FL BL C BL v , + gL L , C BL exp j¢ , C v
, LFL FLBL FL ,
LL LBL
L 2 L 2
h , =� gL R , C FR exp j¢FR BR C BR v , + gL R , CBR exp j¢ , C v
, LFR FRBR FR ,
LR LBR
R 2 R 2
h , =� gR L , C FL exp j¢FL BL C BL v , + gR L , C BL exp j¢ , C v
, R FL FLBL FL ,
RL RBL R 2 R 2
h , =� gR R , C FR exp j¢FR BR C BR v , + gR R , C BR exp j¢ , C v
, RFR FRBR FR ,
RR RBR
g ,g ,g ,g
LL,, RL ,
LR , RR
Se determinan los factores de ganancia por
1/2 222
�C CFB +C �
FX YX , BX
g =
, 22
YX C CFB 2 +C +2CC CFB ICCFB¢
YX YX ,
FX , BX FXBX , YX
CFB ICCFB¢
YX,, ,
Se definen los parámetros YX y los parámetros de fases ¢ de la siguiente manera:
Se define un cociente promedio de nivel frontal/trasero por banda híbrida para los filtros de HRTF para
YLR=,X = LR
,
y por
1/2
Lq 1
v , ()l
L
YFX k
l =0
CFB =
,
YXk Lq 1
v , ()l
L
YBX
k l =0
.
LL RR Y=L,RX=L,R
5 Además, entonces se definen los parámetros de fase ¢,¢ ,¢ ,¢ para y por
FL,BL FR,BR FL,BL FR,BR
CIC YX = CIC YX
exp j ¢Y ,
, ,
FX BX
k k k ,
,
CICYX
donde se definen las correlaciones cruzadas complejas k por
L 1
q
L v , ()lv , � () l
YFX YBX
10 kk
l=0
CIC YX =
, 1/2 1/2
kL 1 L 1
q
q
2 L
v , ()l v , ()l
L
YFX Y BX k k
l=0 l=0
.
Se aplica una desenvoltura de fase a los parámetros de fase a lo largo del índice de subbanda k , de tal manera que el k +1 k = 0,1, .
valor absoluto del incremento de fase de la subbanda k a la subbanda es menor o igual a para .
15 En casos en los que hay dos elecciones, ± , para el incremento, se elige el signo de incremento para una medición de
]
fase en el intervalo ,]. Finalmente, se definen las correlaciones cruzadas compensadas en fase normalizadas Y=L,RX=L,R
para y por
¢
ICCFB YX = CIC YX
, ,
kk
.
20 Nótese que en el caso en el que se realiza el procesamiento multicanal dentro de un dominio de subbanda híbrido, es decir, en un dominio en el que las subbandas se descomponen adicionalmente en diferentes bandas de frecuencia, podría, por ejemplo, realizarse un mapeo de las respuestas de HRTF a los filtros de banda híbridos de la siguiente manera:
Como en el caso sin un banco de filtros híbrido, se convierten las diez respuestas de impulso de HRTF dadas de la
,, , =,
X , YLR= FL BL FR BRC
25 fuente al objetivo en filtros de subbanda de QMF de acuerdo con el método
,
vˆYX
resumido anteriormente. El resultado son diez filtros de subbanda con componentes
vˆ, ()l
YX m
l =� 0,1, .,L 1
m = 0,1, .,63 q
para la subbanda de QMF y la ranura de tiempo de QMF . Sea el mapeo de índice a
= ()
mQk
30 partir de la banda híbrida k a la banda QMF m denotada por .
,
vYX
Entonces se definen los filtros de HRTF en dominio de banda híbrido por
vk ()l = vˆYX ()() l
YX,, Qk
.
Para la realización específica descrita en los párrafos anteriores, puede implementarse la conversión de filtro de los
h()(Nh
35 filtros de HRTF a dominios de QMF de la siguiente manera, dado un filtro de FIR de longitud a transferirse al dominio de subbanda de QMF complejo:
m()
El filtrado en subbanda consiste de la aplicación individual de un filtro de FIR de valor complejo hl para cada m= 0,1,.,63
subbanda de QMF, . El componente clave es el convertidor de filtro, que convierte el filtro de FIR de
h()(m()
dominio de tiempo dado en los filtros de dominio de subbanda complejos hl. El convertidor de filtro es un q()
(
banco de análisis complejo similar al banco de análisis de QMF. Su filtro prototipo es de longitud 192. Se define una extensión con ceros del filtro de FIR de dominio de tiempo por
L Kq = h+2 Kh = Nh/64]j
Entonces se dan los filtros de dominio de subbanda de longitud donde para
m= 0,1,.,63 y l= 0,1,.,Kh+1
por
m() L (+ 64(l 2) ( )exp jm 12
hl= q(+ (( 95) (=0 64 .
Aunque se ha detallado el concepto de la invención con respecto a una señal de mezcla descendente que tiene dos canales, es decir, una señal estéreo transmitida, la aplicación del concepto de la invención no se limita de ninguna manera a un escenario que tenga una señal de mezcla descendente estéreo.
En resumen, la presente invención se refiere al problema de utilizar filtros de cancelación de diafonía o filtros de HTRF largos para la producción binaural de señales multicanal paramétricas. La invención enseña nuevas maneras para extender el enfoque de HTRF paramétricas a la longitud arbitraria de filtros de HTRF.
La presente invención comprende las siguientes características:
-
Multiplicar la señal de mezcla descendente estéreo por una matriz de 2 x 2 en la que cada elemento de matriz es un filtro de FIR o un longitud arbitraria (tal como se da por el filtro de HRTF);
-
Derivar los filtros en la matriz de 2 x 2 mediante la modificación de los filtros de HRTF originales en base a los parámetros multicanal transmitidos;
-
Calcular la modificación de los filtros de HRTF de tal manera que se obtiene la envolvente espectral y la energía global correctas.
La figura 8 muestra un ejemplo para un descodificador 300 de la invención para derivar una señal de mezcla descendente de auriculares. El descodificador comprende un calculador 302 de filtro y un sintetizador 304. El calculador de filtro recibe como primera entrada parámetros 306 de nivel y como segunda entrada HTRF (funciones de transferencia relacionadas con la cabeza) 308 para derivar HRTF codificadas 310 que tienen el mismo efecto neto sobre una señal cuando se aplican a la señal en el dominio de subbanda que las funciones 308 de transferencia relacionadas con la cabeza aplicadas en el dominio de tiempo. Las HRTF 310 modificadas sirven como primera entrada al sintetizador 304 que recibe como segunda entrada una representación de una señal 312 de mezcla descendente dentro de un dominio de subbanda. Se deriva la representación de la señal 312 de mezcla descendente por un codificador multicanal parámetro y destinado a utilizarse como base para la reconstrucción de una señal multicanal completa por un descodificador multicanal. De esta forma el sintetizador 404 es capaz de derivar una señal 314 de mezcla descendente de auriculares utilizando las HRTF 310 modificadas y la representación de la señal 312 de mezcla descendente.
Puede notarse que podrían proporcionarse las HRTF en cualquier representación paramétrica posible, por ejemplo como la función de transferencia asociada al filtro, como la respuesta de impulso del filtro o como una serie de coeficientes de derivación para un filtro de FIR.
Los ejemplos anteriores suponen que la representación de la señal de mezcla descendente ya está suministrada como una representación de un banco de filtros, es decir, como muestras derivadas por un banco de filtros. Sin embargo, en aplicaciones prácticas, normalmente se suministra y se transmite una señal de mezcla descendente de dominio de tiempo para permitir también una reproducción directa de la señal presentada en entornos de reproducción simples. Por lo tanto, en la figura 9, en una realización adicional de la presente invención, en la que un descodificador 400 compatible binaural comprende un banco 402 de filtros de análisis y un banco 404 de filtros de síntesis y un descodificador de la invención que podría ser por ejemplo el descodificador 300 de la figura 8. Las funcionalidades del descodificador y sus descripciones son aplicables en la figura 9 así como en la figura 8 y se omitirá la descripción del descodificador 300 en el siguiente párrafo.
El banco 402 de filtros de análisis recibe una mezcla descendente de una señal 406 multicanal tal como se crea por un codificador multicanal paramétrico. El banco 402 de filtros de análisis deriva la representación del banco de filtros de la señal 406 de mezcla descendente recibida que entonces se introduce en el descodificador 300 que deriva una señal 408 de mezcla descendente de auriculares, todavía dentro del dominio de banco de filtros. Es decir, se representa la mezcla descendente por una multitud de muestras o coeficientes dentro de las bandas de frecuencia introducidas por el banco 402 de filtros de análisis. Por lo tanto, para proporcionar una señal 410 de mezcla descendente de auriculares final en el dominio de tiempo, se introduce la señal 408 de mezcla descendente de auriculares en el banco 404 de filtros de síntesis que deriva la señal 410 de mezcla descendente de auriculares, que está preparada para reproducirse por el equipo de reproducción estéreo.
La figura 10 muestra un receptor o reproductor 500 de audio de la invención que tiene un descodificador 501 de audio de la invención, una entrada 502 de flujo de bits y una salida 504 de audio.
Puede introducirse un flujo de bits en la entrada 502 del receptor/reproductor 500 de audio de la invención. Entonces se descodifica el flujo de bits por el descodificador 501 y se emite o se reproduce la señal decodificada en la salida 504 del receptor/reproductor 500 de audio de la invención.
Aunque se han derivado algunos ejemplos en los párrafos precedentes para implementar el concepto de la invención que depende de una mezcla descendente estéreo transmitida, puede aplicarse también el concepto de la invención en configuraciones basadas en un solo canal de mezcla descendente monofónico o en más de dos canales de mezcla descendentes.
Se proporciona en la descripción de la presente invención una implementación particular de la transferencia de funciones de transferencia relacionadas con la cabeza en el dominio de subbanda. Sin embargo, podrían utilizarse también otras técnicas de derivar los filtros de subbanda sin limitar el concepto de la invención.
Pueden derivarse también los factores de fase introducidos en la derivación de las HRTF modificadas por otros cálculos distintos a los presentados anteriormente.
Aunque se muestra el concepto de la invención en particular para los filtros de HRTF y de cancelación de diafonía, puede utilizarse para otros filtros definidos para uno o más canales individuales de una señal multicanal para permitir una generación eficiente desde el punto de vista de cálculo de una señal de reproducción estéreo de alta calidad. Además los filtros no sólo se limitan a filtros destinados para modelar un entorno de escucha. Pueden utilizarse incluso los filtros que agregan componentes “artificiales” a una señal, tal como por ejemplo reverberación u otros filtros de distorsión.
Dependiendo de ciertos requerimientos de implementación de los métodos de la invención, pueden implementarse los métodos de la invención en hardware o en software. Puede realizarse la implementación utilizando un medio de almacenamiento digital, en particular un disco, DVD o un CD que tiene almacenadas en el mismo señales de control que pueden leerse electrónicamente, que cooperan con un sistema informático programable de tal manera que se realizan los métodos de la invención. En general, por lo tanto, la presente invención es un producto de programa de un programa informático con un código de programa almacenado en un portador que puede leerse por la máquina, siendo operativo el código de programa para realizar los métodos de la invención cuando el producto de programa informático se ejecuta en un ordenador. En otras palabras, los métodos de la invención son por lo tanto un programa informático que tiene un código de programa para realizar al menos uno de los métodos de la invención cuando el programa informático se ejecuta en un ordenador.
Mientras que lo anterior se ha mostrado y descrito en particular con referencia a realizaciones particulares de la misma, los expertos en la técnica entenderán que pueden realizarse varios cambios de forma y detalle.

Claims (24)

  1. REIVINDICACIONES
    1. Descodificador para derivar una señal (314) de mezcla descendente de auriculares utilizando una representación de una mezcla descendente de una señal (312) multicanal y utilizando un parámetro (306) de nivel que tiene información sobre una relación de nivel entre dos canales de la señal multicanal y utilizando funciones (308) de transferencia relacionadas con la cabeza relacionadas con los dos canales de la señal multicanal, en el que un primer canal de los dos canales es un canal frontal del lateral izquierdo o derecho de la señal multicanal y un segundo canal de los dos canales es un canal trasero del mismo lateral, que comprende:
    un calculador (302) de filtro para derivar una función (310) de transferencia relacionada con la cabeza modificada
    HY(X ) mediante la ponderación de la función de transferencia relacionada con la cabeza HY(Xf ) del canal frontal
    y la función de transferencia relacionada con la cabeza HY(Xs) del canal trasero utilizando el parámetro (306) de
    nivel, de tal manera que la función (310) de transferencia relacionada con la cabeza modificada HY(X ) se influye más por la función (308) de transferencia relacionada con la cabeza de un canal que tiene un nivel más alto que por la función (308) de transferencia relacionada con la cabeza de un canal que tiene un nivel más bajo utilizando la siguiente combinación lineal compleja:
    () =� gw exp( jw2)H (Xf )+ gw exp( jw2)H (
    HX ¢¢ Xs )
    Y f XY sY s XY fY
    ,
    donde es un parámetro de fase, y son factores de ponderación derivados utilizando el parámetro (306) de nivel y es un factor de ganancia común derivado utilizando el parámetro (306) de nivel; y
    un sintetizador (304) para derivar la señal (314) de mezcla descendente de auriculares utilizando la función (310) de transferencia relacionada con la cabeza modificada y la representación de la señal (312) de mezcla descendente.
  2. 2.
    Descodificador según la reivindicación 1, en el que el calculador (302) de filtro es operativo de tal manera que el número de funciones (310) de transferencia relacionadas con la cabeza modificadas derivadas es menor que el número de funciones (308) de transferencia relacionadas con la cabeza asociadas de los dos canales
  3. 3.
    Descodificador según la reivindicación 1, en el que el calculador (302) de filtro es operativo para derivar una función (310) de transferencia relacionada con la cabeza modificada adaptada para aplicarse a una representación de banco de filtros de la señal de mezcla descendente.
  4. 4.
    Descodificador según la reivindicación 1, adaptado para utilizar una representación de la señal de mezcla descendente derivada en un dominio de banco de filtros.
  5. 5.
    Descodificador según la reivindicación 1, en el que el calculador (302) de filtro es operativo para derivar la función (310) de transferencia relacionada con la cabeza modificada utilizando funciones (308) de transferencia relacionadas con la cabeza caracterizadas por más de tres parámetros.
  6. 6.
    Descodificador según la reivindicación 1, en el que el calculador (302) de filtro es operativo para derivar los factores de ponderación para las funciones (308) de transferencia relacionadas con la cabeza de los dos canales utilizando el mismo parámetro (306) de nivel.
  7. 7.
    Descodificador según la reivindicación 6, en el que el calculador (302) de filtro es operativo para derivar un primer factor de ponderación wf para un primer canal f y un segundo factor de ponderación ws para un segundo canal s utilizando el parámetro de nivel CLDl de acuerdo con las siguientes formulas:
    CLD1 /10
    2 10
    wf = ,
    CLD1 /10
    1+10
    w = .
    sCLD1 /10
    1+10
  8. 8.
    Descodificador según la reivindicación 1, en el que el calculador (302) de filtro es operativo para derivar la función (310) de transferencia relacionada con la cabeza modificada aplicando un factor de ganancia común g a la función (308) de transferencia relacionada con la cabeza de los dos canales de tal manera que se ahorra energía al derivar las funciones (310) de transferencia relacionadas con la cabeza modificadas.
  9. 9.
    Descodificador según la reivindicación 8, en el que el factor de ganancia común está dentro del intervalo de
    [1/ 2,1].
  10. 10.
    Descodificador según la reivindicación 1, en el que el calculador (302) de filtro es operativo para derivar el parámetro de fase utilizando un tiempo de retardo entre respuestas de impulso de funciones (308) de transferencia relacionadas con la cabeza de los dos canales.
  11. 11.
    Descodificador según la reivindicación 10, en el que el calculador (302) de filtro es operativo en un dominio de banco de filtros que tiene n bandas de frecuencia y para derivar parámetros de fase individuales para cada banda de frecuencia utilizando el tiempo de retardo.
  12. 12.
    Descodificador según la reivindicación 10, en el que el calculador (302) de filtro es operativo en un dominio de banco de filtros que tiene más de dos bandas de frecuencia y para derivar parámetros de fase individuales para cada banda de frecuencia utilizando el tiempo de retardo de acuerdo con la siguiente fórmula:
    (n + 1)
    ¢= 2 T
    XY XY
  13. 64 .
  14. 13.
    Descodificador según la reivindicación 1, en el que el calculador (302) de filtro es operativo para derivar el parámetro de fase utilizando el ángulo de fase de la correlación cruzada compleja normalizada entre las respuestas de impulso de las funciones (308) de transferencia relacionadas con la cabeza del primer y del segundo canal.
  15. 14.
    Descodificador según la reivindicación 1, adaptado para utilizar una representación de una señal (312) de mezcla descendente que tiene un canal izquierdo y un canal derecho derivados de una señal multicanal que tiene un canal frontal izquierdo, un canal envolvente izquierdo, un canal frontal derecho, un canal envolvente derecho y un canal central.
  16. 15.
    Descodificador según la reivindicación 1, en el que el sintetizador es operativo para derivar canales de la señal
    (314) de mezcla descendente de auriculares aplicando una combinación lineal de las funciones (310) de transferencia relacionadas con la cabeza modificadas a la representación de la mezcla (312) descendente de la señal multicanal.
  17. 16.
    Descodificador según la reivindicación 15, en el que el sintetizador es operativo para utilizar coeficientes para la combinación lineal de las funciones (310) de transferencia relacionadas con la cabeza modificadas dependiendo del parámetro (306) de nivel.
  18. 17.
    Descodificador según la reivindicación 15, en el que el sintetizador (304) es operativo para utilizar coeficientes para la combinación lineal dependiendo de parámetros multicanal adicionales relacionados con propiedades espaciales adicionales de la señal multicanal.
  19. 18.
    Descodificador binaural, que comprende:
    un descodificador de acuerdo con la reivindicación 1;
    un banco (300) de filtros de análisis para derivar la representación de la mezcla descendente de la señal (312) multicanal mediante el filtrado en subbanda de la mezcla descendente de la señal multicanal; y
    un banco (302) de filtros de síntesis para derivar una señal de auriculares de dominio de tiempo mediante la síntesis de la señal (314) de mezcla descendente de auriculares.
  20. 19. Descodificador para derivar una señal de mezcla descendente estéreo espacial utilizando una representación de una mezcla descendente de una señal (312) multicanal y utilizando un parámetro (306) de nivel que tiene información sobre una relación de nivel entre dos canales de la señal multicanal y utilizando filtros de cancelación de diafonía relacionados con los dos canales de la señal multicanal, en el que un primer canal de los dos canales es un canal frontal del lateral izquierdo o derecho de la señal multicanal y un segundo canal de los dos canales es un canal trasero del mismo lateral, que comprende:
    un calculador (302) de filtro para derivar un filtro de cancelación de diafonía modificado HY(X ) mediante la
    ponderación de la función de transferencia relacionada con la cabeza HY(Xf ) del canal frontal y la función de
    transferencia relacionada con la cabeza HY(Xs) del canal trasero de los dos canales utilizando el parámetro (306) de
    nivel, de tal manera que el filtro de cancelación de diafonía modificado HY(X ) se influye más por el filtro de cancelación de diafonía de un canal que tiene un nivel más alto que por el filtro de cancelación de diafonía de un canal que tiene un nivel más bajo utilizando la siguiente combinación lineal compleja:
    () =� gw exp( jw2)H (Xf )+ gw exp( jw2)H (
    HX ¢¢ Xs )
    Y f XY sY s XY fY
    ,
    wwf
    donde �XY es un parámetro de fase, s y son factores de ponderación derivados utilizando el parámetro (306)
    de nivel y g es un factor de ganancia común derivado utilizando el parámetro (306) de nivel; y
    un sintetizador (304) para derivar la señal de mezcla descendente estéreo espacial utilizando los filtros de cancelación de diafonía modificados y la representación de la señal (312) de mezcla descendente.
  21. 20. Método de derivar una señal (314) de mezcla descendente de auriculares utilizando una representación de una mezcla descendente de una señal (312) multicanal y utilizando un parámetro (306) de nivel que tiene información sobre una relación de nivel entre dos canales de la señal multicanal y utilizando funciones (308) de transferencia relacionadas con la cabeza relacionadas con los dos canales de la señal multicanal, en el que un primer canal de los dos canales es un canal frontal del lateral izquierdo o derecho de la señal multicanal y un segundo canal de los dos canales es un canal trasero del mismo lateral, comprendiendo el método:
    derivar, utilizando el parámetro (306) de nivel, una función (310) de transferencia relacionada con la cabeza modificada
    HY(X ) mediante la ponderación de la función de transferencia relacionada con la cabeza HY(Xf ) del canal frontal
    y la función de transferencia relacionada con la cabeza HY(Xs) del canal trasero utilizando el parámetro (306) de
    nivel, de tal manera que la función de transferencia relacionada con la cabeza modificada HY(X ) se influye más por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más alto que por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más bajo utilizando la siguiente combinación lineal compleja:
    () =� gw exp( jw2)H (Xf )+ gw exp( jw2)H (
    HX ¢¢ Xs )
    Y f XY sY s XY fY
    ,
    donde es un parámetro de fase, y son factores de ponderación derivados utilizando el parámetro (306) de nivel y es un factor de ganancia común derivado utilizando el parámetro (306) de nivel; y derivar la señal (314) de mezcla descendente de auriculares utilizando las funciones (310) de transferencia relacionadas con la cabeza modificadas y la representación de la señal de mezcla descendente.
  22. 21.
    Receptor o reproductor de audio que tiene un descodificador para derivar una señal (314) de mezcla descendente de auriculares según las reivindicaciones 1 a 17.
  23. 22.
    Método de recibir o reproducir audio, teniendo el método un método para derivar una señal (314) de mezcla descendente de auriculares según la reivindicación 20.
  24. 23.
    Programa informático que tiene un código de programa para realizar, cuando se ejecuta en un ordenador, uno de los métodos de las reivindicaciones 20 ó 22.
ES06777145T 2006-03-24 2006-09-01 Generación de mezclas descendentes espaciales a partir de representaciones paramétricas de señales multicanal Active ES2376889T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
SE0600674 2006-03-24
SE0600674 2006-03-24
US74455506P 2006-04-10 2006-04-10
US744555P 2006-04-10
PCT/EP2006/008566 WO2007110103A1 (en) 2006-03-24 2006-09-01 Generation of spatial downmixes from parametric representations of multi channel signals

Publications (1)

Publication Number Publication Date
ES2376889T3 true ES2376889T3 (es) 2012-03-20

Family

ID=40538857

Family Applications (1)

Application Number Title Priority Date Filing Date
ES06777145T Active ES2376889T3 (es) 2006-03-24 2006-09-01 Generación de mezclas descendentes espaciales a partir de representaciones paramétricas de señales multicanal

Country Status (11)

Country Link
US (1) US8175280B2 (es)
EP (1) EP1999999B1 (es)
JP (1) JP4606507B2 (es)
KR (1) KR101010464B1 (es)
CN (1) CN101406074B (es)
AT (1) ATE532350T1 (es)
BR (1) BRPI0621485B1 (es)
ES (1) ES2376889T3 (es)
PL (1) PL1999999T3 (es)
RU (1) RU2407226C2 (es)
WO (1) WO2007110103A1 (es)

Families Citing this family (76)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7644282B2 (en) 1998-05-28 2010-01-05 Verance Corporation Pre-processed information embedding system
US6737957B1 (en) 2000-02-16 2004-05-18 Verance Corporation Remote control signaling using audio watermarks
ES2507642T3 (es) 2002-10-15 2014-10-15 Verance Corporation Sistema de supervisión de medios, de gestión y de información
US7369677B2 (en) * 2005-04-26 2008-05-06 Verance Corporation System reactions to the detection of embedded watermarks in a digital host content
US20060239501A1 (en) 2005-04-26 2006-10-26 Verance Corporation Security enhancements of digital watermarks for multi-media content
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
EP1905002B1 (en) 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
US8020004B2 (en) 2005-07-01 2011-09-13 Verance Corporation Forensic marking using a common customization function
US8781967B2 (en) 2005-07-07 2014-07-15 Verance Corporation Watermarking in an encrypted domain
CN101156065B (zh) * 2005-07-11 2010-09-29 松下电器产业株式会社 超声波探伤方法和超声波探伤装置
EP1927264B1 (en) * 2005-09-13 2016-07-20 Koninklijke Philips N.V. Method of and device for generating and processing parameters representing hrtfs
JP4787331B2 (ja) * 2006-01-19 2011-10-05 エルジー エレクトロニクス インコーポレイティド メディア信号の処理方法及び装置
CA2637722C (en) * 2006-02-07 2012-06-05 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
PL2068307T3 (pl) * 2006-10-16 2012-07-31 Dolby Int Ab Udoskonalony sposób kodowania i odtwarzania parametrów w wielokanałowym kodowaniu obiektów poddanych procesowi downmiksu
GB2453117B (en) * 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
KR101406531B1 (ko) * 2007-10-24 2014-06-13 삼성전자주식회사 스테레오 오디오 신호로부터 바이노럴 비트를 발생시키는 장치 및 방법
JP2009128559A (ja) * 2007-11-22 2009-06-11 Casio Comput Co Ltd 残響効果付加装置
US9445213B2 (en) * 2008-06-10 2016-09-13 Qualcomm Incorporated Systems and methods for providing surround sound using speakers and headphones
US8259938B2 (en) 2008-06-24 2012-09-04 Verance Corporation Efficient and secure forensic marking in compressed
CN103561378B (zh) * 2008-07-31 2015-12-23 弗劳恩霍夫应用研究促进协会 双耳信号的信号生成
UA101542C2 (ru) 2008-12-15 2013-04-10 Долби Лабораторис Лайсензин Корпорейшн Виртуализатор окружающего звука с динамическим сжатием диапазона и способ
KR101342425B1 (ko) 2008-12-19 2013-12-17 돌비 인터네셔널 에이비 다중-채널의 다운믹싱된 오디오 입력 신호에 리버브를 적용하기 위한 방법 및 다중-채널의 다운믹싱된 오디오 입력 신호에 리버브를 적용하도록 구성된 리버브레이터
WO2010073187A1 (en) * 2008-12-22 2010-07-01 Koninklijke Philips Electronics N.V. Generating an output signal by send effect processing
TWI404050B (zh) * 2009-06-08 2013-08-01 Mstar Semiconductor Inc 多聲道音頻信號解碼方法與裝置
JP2011066868A (ja) * 2009-08-18 2011-03-31 Victor Co Of Japan Ltd オーディオ信号符号化方法、符号化装置、復号化方法及び復号化装置
CN102157149B (zh) 2010-02-12 2012-08-08 华为技术有限公司 立体声信号下混方法、编解码装置和编解码系统
TWI443646B (zh) * 2010-02-18 2014-07-01 Dolby Lab Licensing Corp 音訊解碼器及使用有效降混之解碼方法
KR20110116079A (ko) 2010-04-17 2011-10-25 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
US8838977B2 (en) 2010-09-16 2014-09-16 Verance Corporation Watermark extraction and content screening in a networked environment
TWI573131B (zh) * 2011-03-16 2017-03-01 Dts股份有限公司 用以編碼或解碼音訊聲軌之方法、音訊編碼處理器及音訊解碼處理器
US8923548B2 (en) 2011-11-03 2014-12-30 Verance Corporation Extraction of embedded watermarks from a host content using a plurality of tentative watermarks
US8682026B2 (en) 2011-11-03 2014-03-25 Verance Corporation Efficient extraction of embedded watermarks in the presence of host content distortions
US8533481B2 (en) 2011-11-03 2013-09-10 Verance Corporation Extraction of embedded watermarks from a host content based on extrapolation techniques
US8615104B2 (en) 2011-11-03 2013-12-24 Verance Corporation Watermark extraction based on tentative watermarks
US8745403B2 (en) 2011-11-23 2014-06-03 Verance Corporation Enhanced content management based on watermark extraction records
US9547753B2 (en) 2011-12-13 2017-01-17 Verance Corporation Coordinated watermarking
US9323902B2 (en) 2011-12-13 2016-04-26 Verance Corporation Conditional access using embedded watermarks
US10321252B2 (en) 2012-02-13 2019-06-11 Axd Technologies, Llc Transaural synthesis method for sound spatialization
FR2986932B1 (fr) * 2012-02-13 2014-03-07 Franck Rosset Procede de synthese transaurale pour la spatialisation sonore
US9602927B2 (en) * 2012-02-13 2017-03-21 Conexant Systems, Inc. Speaker and room virtualization using headphones
US9571606B2 (en) 2012-08-31 2017-02-14 Verance Corporation Social media viewing system
US9106964B2 (en) 2012-09-13 2015-08-11 Verance Corporation Enhanced content distribution using advertisements
US8726304B2 (en) 2012-09-13 2014-05-13 Verance Corporation Time varying evaluation of multimedia content
US8869222B2 (en) 2012-09-13 2014-10-21 Verance Corporation Second screen content
JP6179122B2 (ja) * 2013-02-20 2017-08-16 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
US9191516B2 (en) * 2013-02-20 2015-11-17 Qualcomm Incorporated Teleconferencing using steganographically-embedded audio data
US9093064B2 (en) 2013-03-11 2015-07-28 The Nielsen Company (Us), Llc Down-mixing compensation for audio watermarking
US9262794B2 (en) 2013-03-14 2016-02-16 Verance Corporation Transactional video marking system
CN110010140B (zh) * 2013-04-05 2023-04-18 杜比国际公司 立体声音频编码器和解码器
WO2014171791A1 (ko) 2013-04-19 2014-10-23 한국전자통신연구원 다채널 오디오 신호 처리 장치 및 방법
MY178342A (en) 2013-05-24 2020-10-08 Dolby Int Ab Coding of audio scenes
CN105229731B (zh) 2013-05-24 2017-03-15 杜比国际公司 根据下混的音频场景的重构
EP2830336A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Renderer controlled spatial upmix
US9251549B2 (en) 2013-07-23 2016-02-02 Verance Corporation Watermark extractor enhancements based on payload ranking
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
US9208334B2 (en) 2013-10-25 2015-12-08 Verance Corporation Content management using multiple abstraction layers
CN104681034A (zh) 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
JP6508539B2 (ja) * 2014-03-12 2019-05-08 ソニー株式会社 音場収音装置および方法、音場再生装置および方法、並びにプログラム
CN106170988A (zh) 2014-03-13 2016-11-30 凡瑞斯公司 使用嵌入式代码的交互式内容获取
US9779739B2 (en) 2014-03-20 2017-10-03 Dts, Inc. Residual encoding in an object-based audio system
CN104954020B (zh) * 2014-03-28 2018-07-24 意法半导体股份有限公司 多通道换能器设备和其操作方法
US10037202B2 (en) 2014-06-03 2018-07-31 Microsoft Technology Licensing, Llc Techniques to isolating a portion of an online computing service
US9510125B2 (en) * 2014-06-20 2016-11-29 Microsoft Technology Licensing, Llc Parametric wave field coding for real-time sound propagation for dynamic sources
CN108141685B (zh) 2015-08-25 2021-03-02 杜比国际公司 使用呈现变换参数的音频编码和解码
BR112018014632B1 (pt) * 2016-01-18 2020-12-29 Boomcloud 360, Inc. método para produzir dois canais de áudio e sistema
US10225657B2 (en) 2016-01-18 2019-03-05 Boomcloud 360, Inc. Subband spatial and crosstalk cancellation for audio reproduction
CN108632714B (zh) * 2017-03-23 2020-09-01 展讯通信(上海)有限公司 扬声器的声音处理方法、装置及移动终端
FR3065137B1 (fr) * 2017-04-07 2020-02-28 Axd Technologies, Llc Procede de spatialisation sonore
CN108156575B (zh) * 2017-12-26 2019-09-27 广州酷狗计算机科技有限公司 音频信号的处理方法、装置及终端
US10764704B2 (en) * 2018-03-22 2020-09-01 Boomcloud 360, Inc. Multi-channel subband spatial processing for loudspeakers
US10602298B2 (en) 2018-05-15 2020-03-24 Microsoft Technology Licensing, Llc Directional propagation
US10798515B2 (en) 2019-01-30 2020-10-06 Facebook Technologies, Llc Compensating for effects of headset on head related transfer functions
US10932081B1 (en) 2019-08-22 2021-02-23 Microsoft Technology Licensing, Llc Bidirectional propagation of sound
US10841728B1 (en) 2019-10-10 2020-11-17 Boomcloud 360, Inc. Multi-channel crosstalk processing
JP7396459B2 (ja) * 2020-03-09 2023-12-12 日本電信電話株式会社 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2138077T3 (es) 1993-05-05 2000-01-01 Koninkl Philips Electronics Nv Sistema de transmision que comprende al menos un codificador.
US6198827B1 (en) 1995-12-26 2001-03-06 Rocktron Corporation 5-2-5 Matrix system
US5771295A (en) 1995-12-26 1998-06-23 Rocktron Corporation 5-2-5 matrix system
WO1997033391A1 (de) 1996-03-07 1997-09-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codierverfahren zur einbringung eines nicht hörbaren datensignals in ein audiosignal, decodierverfahren, codierer udn decodierer
DE19640825C2 (de) 1996-03-07 1998-07-23 Fraunhofer Ges Forschung Codierer zur Einbringung eines nicht hörbaren Datensignals in ein Audiosignal und Decodierer zum decodieren eines nicht hörbar in einem Audiosignal enthaltenen Datensignals
US6711266B1 (en) 1997-02-07 2004-03-23 Bose Corporation Surround sound channel encoding and decoding
TW429700B (en) 1997-02-26 2001-04-11 Sony Corp Information encoding method and apparatus, information decoding method and apparatus and information recording medium
DE19947877C2 (de) 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
US6725372B1 (en) 1999-12-02 2004-04-20 Verizon Laboratories Inc. Digital watermarking
JP3507743B2 (ja) 1999-12-22 2004-03-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 圧縮オーディオデータへの電子透かし方法およびそのシステム
US7136418B2 (en) 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
DE10129239C1 (de) 2001-06-18 2002-10-31 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal
US7243060B2 (en) 2002-04-02 2007-07-10 University Of Washington Single channel sound separation
AU2003216669A1 (en) 2002-05-10 2003-11-11 Koninklijke Philips Electronics N.V. Watermark embedding and retrieval
ES2328922T3 (es) 2002-09-23 2009-11-19 Koninklijke Philips Electronics N.V. Generacion de una señal de sonido.
JP2005352396A (ja) * 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd 音響信号符号化装置および音響信号復号装置
WO2006008683A1 (en) * 2004-07-14 2006-01-26 Koninklijke Philips Electronics N.V. Method, device, encoder apparatus, decoder apparatus and audio system

Also Published As

Publication number Publication date
US8175280B2 (en) 2012-05-08
ATE532350T1 (de) 2011-11-15
BRPI0621485A2 (pt) 2011-12-13
RU2407226C2 (ru) 2010-12-20
EP1999999A1 (en) 2008-12-10
JP2009531886A (ja) 2009-09-03
RU2008142141A (ru) 2010-04-27
WO2007110103A1 (en) 2007-10-04
BRPI0621485B1 (pt) 2020-01-14
CN101406074A (zh) 2009-04-08
US20070223708A1 (en) 2007-09-27
PL1999999T3 (pl) 2012-07-31
CN101406074B (zh) 2012-07-18
JP4606507B2 (ja) 2011-01-05
KR101010464B1 (ko) 2011-01-21
KR20080107433A (ko) 2008-12-10
EP1999999B1 (en) 2011-11-02

Similar Documents

Publication Publication Date Title
ES2376889T3 (es) Generación de mezclas descendentes espaciales a partir de representaciones paramétricas de señales multicanal
US20200335115A1 (en) Audio encoding and decoding
US8577686B2 (en) Method and apparatus for decoding an audio signal
ES2461601T3 (es) Procedimiento y aparato para generar una señal de audio binaural
JP4589962B2 (ja) レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
EP1927266B1 (en) Audio coding
JP5191886B2 (ja) サイド情報を有するチャンネルの再構成
US9595267B2 (en) Method and apparatus for decoding an audio signal
US10102863B2 (en) Encoder and encoding method for multi-channel signal, and decoder and decoding method for multi-channel signal
MX2008011994A (es) Generacion de mezclas descendentes espaciales a partir de representaciones parametricas de señales de multicanal.
MX2008010631A (es) Codificacion y decodificacion de audio