MX2008011994A - Generacion de mezclas descendentes espaciales a partir de representaciones parametricas de señales de multicanal. - Google Patents

Generacion de mezclas descendentes espaciales a partir de representaciones parametricas de señales de multicanal.

Info

Publication number
MX2008011994A
MX2008011994A MX2008011994A MX2008011994A MX2008011994A MX 2008011994 A MX2008011994 A MX 2008011994A MX 2008011994 A MX2008011994 A MX 2008011994A MX 2008011994 A MX2008011994 A MX 2008011994A MX 2008011994 A MX2008011994 A MX 2008011994A
Authority
MX
Mexico
Prior art keywords
head
signal
channel
channels
transfer functions
Prior art date
Application number
MX2008011994A
Other languages
English (en)
Inventor
Kristofer Kjoerling
Jeroen Breebaart
Lars Villemoes
Original Assignee
Dolby Sweden Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Sweden Ab filed Critical Dolby Sweden Ab
Priority claimed from PCT/EP2006/008566 external-priority patent/WO2007110103A1/en
Publication of MX2008011994A publication Critical patent/MX2008011994A/es

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S3/004For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

Se describe una señal de mezcla descendente de audífonos (314) que puede ser derivada eficientemente de una mezcla descendente paramétrica de una señal de multicanal (312), cuando HTRF (funciones de transferencia relacionadas con la cabeza) modificadas (310) son derivados de HTRF (308) de una señal de multicanal utilizando un parámetro de nivel (306) que tiene información en cuanto a una relación de nivel entre dos canales de las señales de multicanal, de tal manera que una HRTF modificada (310) es influenciada más fuerte por la HRFT (308) de un canal que tiene un nivel más alto que por la HRTF (308) de un canal que tiene un nivel más bajo. HRTF modificadas (310) son derivadas dentro de proceso de descodificación tomando en cuenta la fuerza relativa de los canales asociados con los HRTF (308). Las HRTF (308) son así modificadas, de tal manera que una señal de mezcla descendente (314) de una representación paramétrica de una señal de multicanal puede ser usada directamente para sintetizar la señal de mezcla descendente de audífonos (314) sin la necesidad de una reconstrucción de multicanal paramétrica plena intermedia de la mezcla descendente paramétrica.

Description

GENERACION DE MEZCLAS DESCENDENTES ESPACIALES A PARTIR DE REPRESENTACIONES PARAMETRICAS DE SEÑALES DE MULTICANAL CAMPO DE LA INVENCION La presente invención es concerniente la descodificación de señales de audio de multicanal codificadas basadas en una representación de multicanal paramétrica y en particular con la generación de mezclas de 2 canales que proporcionan una experiencia de escucha espacial como por ejemplo una mezcla compatible con audífonos o una mezcla espacial para instalaciones de dos altavoces.
ANTECEDENTES DE LA INVENCION El desarrollo reciente la codificación de audio ha hecho disponible la habilidad de recrear una representación de multicanal de una señal de audio basada en una señal estero (o mono) y datos de control correspondientes. Estos métodos difieren sustancialmente de las soluciones a base de matriz más antiguas tales como Dolby Prologic, puesto que los datos de control adicionales son transmitidos para controlar la recreación, también denominada como mezcla ascendente, de los canales envolventes basados en los canales mono o estéreo transmitidos . De aqui, tal descodificador de audio de multicanal paramétrico, por ejemplo MPEG Surround, reconstruye N canales basado en base M canales transmitidos, en donde N > M y los datos de control adicionales. Los datos de control adicionales representan una velocidad de datos más baja significativa que la transmisión de todos los canales de N, haciendo la codificación muy eficiente en tanto que al mismo tiempo se asegura la compatibilidad tanto con los dispositivos de canal M como dispositivos de canal N. Estos métodos de codificación envolventes paramétricos comprenden usualmente una parametrización de la señal envolvente en base a IID (Diferencia de Intensidad de Inter-canal) o CLD (Diferencia de Nivel de Canal) e ICC (Coherencia de Inter-Canal) . Estos parámetros describen proporciones y correlaciones de potencia, entre pares de canales en el proceso de mezcla ascendente. Parámetros adicionales también usados en el arte previo comprenden parámetros de predicción usados para predecir canales intermedios o de salida durante el procedimiento de mezcla ascendente . Otros desarrollos en la reproducción de contenido de audio de multicanal han proporcionado medios para obtener una impresión de escucha espacial utilizando audífonos estereofónicos . Para obtener una experiencia de escucha espacial utilizando solamente los dos altavoces de los audífonos, las señales de multicanal son mezcladas descendentemente a señales estéreo utilizando HRTF (funciones de transferencia relacionados con la cabeza) , diseñados para tomar en cuenta las características de transmisión extremadamente complejas de la cabeza humana para proporcionar la experiencia de escucha espacial . Otro procedimiento relacionado es usar un ambiente de reproducción de 2 canales convencional y filtrar los canales de una señal de audio de multicanal con filtros apropiados para obtener la experiencia de escucha cercana a aquella de la reproducción con el número original de altavoces. El procesamiento de las señales es similar como en el caso de reproducción de audífonos para crear una "mezcla descendente estéreo espacial" apropiada que tiene las propiedades deseadas. Contrario al caso de audífonos, la señal de ambos altavoces llega directamente a ambos oídos del escucha, provocando "efectos de diafonía" indeseables. Ya que esto tiene que ser tomado en cuenta para la calidad de reproducción óptima, los filtros usados para el tratamiento de señales son llamados comúnmente filtros de alteración de diafonía. En general, el objetivo de esta técnica es extender al intervalo posible de fuente de sonido al exterior de la base de altavoz estéreo mediante la cancelación de diafonía inherente utilizando filtros de cancelación de diafonía complejos. Debido a la filtración compleja, los filtros HRTF son muy largos, esto es, pueden comprender varios cientos de derivaciones de filtro cada uno. Por la misma razón, es difícilmente posible encontrar una parametrización de los filtros que trabaje lo suficientemente bien para degradar la calidad perceptual cuando son usados en lugar del filtro real. Así, por una parte, representaciones paramétrica de ahorro de bits de señales de multicanal existen que permiten el transporte eficiente de una señal de multicanal codificada. Por otra parte, maneras elegantes de crear una experiencia de escucha espacial para una señal de multicanal cuando se usan audífonos estereofónicos o altavoces estereofónicos solamente son conocidos. Sin embargo, estos se requieren el pleno número de canales de a señal de multicanal como entrada para la aplicación de las funciones de transferencia almacenadas en la cabeza que crean la señal de mezcla descendente de audífonos. Así, ya sea el pleno conjunto de señales de multicanal tienen que ser transmitidas o una representación paramétrica tiene que ser reconstruida plenamente antes de la aplicación de las funciones de referencia relacionadas con la cabeza o los filtros de cancelación de diafonía y así ya sea el ancho de banda de transmisión o la complejidad de cómputo es inaceptablemente alta.
BREVE DESCRIPCION DE LA INVENCION Es un objeto de la presente invención proporcionar un concepto que permita la reconstrucción más eficiente de una señal de dos canales que proporcione una experiencia de escucha espacial utilizando representaciones paramétricas de señales de multicanal . De acuerdo con un primer aspecto de la presente invención, este objeto es obtenido por un descodificador para derivar una señal de mezcla descendente de audífonos utilizando una representación de una mezcla descendente de una señal de multicanal y utilizando un parámetro de nivel que tiene información en cuanto a una relación de nivel entre dos canales de la señal de multicanal y utilizando funciones de transferencia relacionados con la cabeza relacionada con los dos canales de la señal de multicanal, que comprende: un calculador de filtro para derivar funciones de transferencia relacionadas con la cabeza modificadas al ponderar las funciones de transferencia relacionadas con la cabeza de los dos canales utilizando el parámetro de nivel, de tal manera que una función de transferencia relacionada con la cabeza modificada es influenciada más fuerte por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más alto que por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más bajo y un sintetizador para derivar la señal de mezcla descendente de audífonos utilizando las funciones de transferencia relacionadas con la cabeza modificadas y la representación de la señal de mezcla descendente. De acuerdo con un segundo aspecto de la presente invención, este objeto es obtenido por un descodificador binaural, que comprende: un descodificador para derivar una señal de mezcla descendente de audífonos utilizando una representación de una mezcla descendente de una señal de multicanal, y utilizando un parámetro de nivel que tiene información en cuando a una relación de nivel entre dos canales de la señal de multicanal y utilizando funciones de transferencia relacionadas con la cabeza relacionadas con los dos canales de la señal de multicanal, que comprende: un calculador de filtro para derivar funciones de transferencia relacionados con la cabeza modificada al ponderar las funciones de transferencia relacionadas con la cabeza de los dos canales utilizando el parámetro de nivel, de tal manera que una función de transferencia relacionada con la cabeza modificada es influenciada más fuente por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más alto que por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más bajo y un sintetizador para derivar la señal de mezcla descendente de audífonos utilizando las funciones de transferencia relacionadas con la cabeza modificadas y la representación de la señal de mezcla descendente; un banco de filtro de análisis para derivar la representación de la mezcla descendente de la señal de multicanal mediante filtración de sub-bandas de la mezcla ascendente de la señal de multicanal y un banco de filtros de síntesis para derivar una señal de audífonos de dominio de tiempo al sintetizar la señal de mezcla descendente de audífono. De acuerdo con un tercer aspecto de la presente invención, este objeto es obtenido mediante el método para derivar una señal de mezcla descendente de audífonos utilizando una representación de una mezcla descendente de una señal de multicanal y utilizando un parámetro de nivel que tiene información en cuanto a una relación de nivel entre dos canales de la señal de multicanal y utilizando funciones de transferencia relacionadas con la cabeza relacionadas con los dos canales de la señal de multicanal, el método comprende: derivar, utilizando el parámetro de nivel, funciones de transferencia relacionadas con la cabeza modificadas al ponderar las funciones de transferencia relacionadas con la cabeza de los dos canales, de tal manera que una función de transferencia relacionada con la cabeza modificada es influenciada más fuerte por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más alto que por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más bajo y derivar una señal de mezcla descendente de audífonos utilizando las funciones de transferencia relacionadas con la cabeza modificadas y la representación de la señal de mezcla descendente . De acuerdo con un cuarto aspecto de la presente invención, este objeto es obtenido por un receptor o reproductor de audio que tiene un descodificador para derivar una señal de mezcla descendente de audífonos utilizando una representación de una mezcla descendente de una señal de multicanal y utilizando un parámetro de nivel que tiene información en cuanto a una relación de nivel entre dos canales de la señal de multicanal y utilizando función de transferencia relacionadas con la cabeza relacionadas con los dos canales de la señal de multicanal, que comprende: un calculador de filtro para derivar funciones de transferencia relacionadas con la cabeza modificadas al ponderar funciones de transferencia relacionadas con la cabeza de los dos canales utilizando el parámetro de nivel, de tal manera que una función de transferencia relacionada con la cabeza modificada es influenciada más fuerte por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más alto que por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más bajo y un sintetizador para derivar la señal de mezcla descendente de audífonos utilizando las funciones de transferencia relacionadas con la cabeza modificadas y la representación de la señal de mezcla descendente. De acuerdo con un quinto aspecto de la presente invención, este objeto es obtenido por un método para recibir o reproducción de audio, el método tiene un método para derivar una señal de mezcla descendente de audífonos utilizando una representación de una mezcla descendente de una señal de multicanal y utilizando un parámetro de nivel que tiene información en cuanto a una relación de nivel entre dos canales de la señal de multicanal y utilizando funciones de transferencia relacionadas con la cabeza relacionada con los dos canales de la señal de multicanal, el método comprende: derivar, utilizando el parámetro de nivel, funciones de transferencia relacionadas con la cabeza modificadas al ponderar las funciones de transferencia relacionadas con la cabeza de los dos canales, de tal manera que una función de transferencia relacionada con la cabeza modificada es influenciada más fuerte por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más alto que por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más bajo y derivar la señal de mezcla descendente de audífonos utilizando las funciones de transferencia relacionada con la cabeza modificada y la representación de la señal de mezcla descendente. De acuerdo con un sexto aspecto de la presente invención, este objeto es obtenido por un descodificador para derivar una señal de mezcla descendente estéreo espacial utilizando una representación de una mezcla descendente de una señal de multicanal y utilizando un parámetro de nivel que tiene información en cuanto a una relación de nivel entre dos canales de la señal de multicanal y utilizando filtros de cancelación de diafonía relacionados con los canales de la señal de multicanal, que comprende: un calculador de filtro para derivar filtros de cancelación de diafonía modificados al ponderar los filtros de cancelación de diafonía de los dos canales utilizando el parámetro de nivel, de tal manera que filtros de cancelación de diafonía modificados son influenciados más fuerte por el filtro de cancelación de diafonía de un canal que tiene un nivel más alto por el filtro de cancelación de diafonía de un canal que tiene un nivel más bajo y un sintetizador para derivar la señal de mezcla descendente estéreo espacial utilizando los filtros de cancelación de diafonía modificados y la representación de la señal de mezcla descendente. La presente invención está basada en el descubrimiento de que una señal de mezcla descendente de audífonos puede ser derivada de una mezcla descendente paramétrica de una señal de multicanal, cuando se usa un calculador de filtro para derivar HRTF modificados (funciones de transferencia relacionadas con la cabeza) de HRTF originales de la señal de multicanal y cuando el convertidor de filtro usa un parámetro de nivel que tiene información en cuanto a una relación de nivel entre dos canales de la señal de multicanal, de tal manera que las HRTF modificadas son influenciadas más fuerte por las HRTF de un canal que tiene un nivel más alto que por la HRTF de un canal que tiene un nivel más bajo. HRTF modificadas son derivadas durante el proceso de descodificación tomando en cuenta la intensidad relativa o fuerza relativa de los canales asociados con las HRTF. Las HRTF originales son modificadas de tal manera que, una señal de mezcla descendente de una representación paramétrica de una señal de multicanal puede ser usada directamente para sintetizar la señal de mezcla descendente de audífonos sin la necesidad de una plena reconstrucción de multicanal paramétrica de la señal de mezcla descendente paramétrica. En una modalidad de la presente invención, se usa un descodificador de la invención que implementa una reconstrucción de multicanal paramétrica también como una reconstrucción binaural de la invención de una mezcla descendente paramétrica de transmitida de una señal de multicanal original. De acuerdo con la presente invención, una plena reconstrucción de la señal de multicanal antes de la mezcla descendente binaural no es requerida, que tiene la mayor ventaja obvia de una complejidad de cálculo fuertemente reducida. Esto permite, por ejemplo, que dispositivos móviles que tienen depósitos de energía solamente limitados prolonguen la duración de reproducción significativamente. Una ventaja adicional es que el mismo dispositivo puede servir como proveedor para señales de multicanal completos (por ejemplo, señales 5.1, 7.1, 7.2) también como para mezcla descendente binaural de la señal que tiene una experiencia de escucha espacial aún cuando se usan solamente audífonos de dos altavoces. Esto podría, por ejemplo, ser extremadamente ventajoso en configuraciones de entretenimiento en casa. En una modalidad adicional de la presente invención, se usa un calculador de filtro para derivar HRTF modificadas no solamente operativas para combinar las HRTF de los dos canales al aplicar factores de ponderación individuales a las HRTF, sino al introducir factores de fase adicionales para cada HTRF a ser combinada. La introducción del factor de fase tiene la ventaja de obtener una comparación de retardo de los dos filtros antes de su superposición o combinación. Esto conduce a una respuesta combinada que modela un tiempo de retardo principal correspondiente a una posición intermedia entre los altavoces frontal y posterior. Una segunda ventaja es que un factor de ganancia, que tiene que ser aplicado durante la combinación de los filtros para asegurar la conservación de energía, es mucho más estable con respecto a su comportamiento con frecuencia que sin la introducción del factor de fase. Esto es en particular relevante para el concepto de la invención, tal como de acuerdo con una modalidad de la presente invención una representación de una mezcla descendente de una señal de multicanal es procesada dentro de un dominio de banco de filtros para derivar la señal de mezcla descendente de audífonos. Como tal, diferentes bandas de frecuencia de la representación de la señal de mezcla descendente van a ser procesadas separadamente y por consiguiente, un comportamiento uniforme de las funciones de ganancia aplicadas individualmente es vital. En una modalidad adicional de la presente invención, las funciones de transferencia relacionadas con la cabeza son convertidas a filtros de sub-banda para los dominios de sub-banda, de tal manera que el número total de HRTF modificadas usadas en el dominio de sub-banda es menor que el número total de HRTF originales. Esto tiene la ventaja evidente de que la complejidad de cómputo para derivar las señales de mezcla descendente de audífonos es aún disminuida en comparación con la mezcla descendente utilizando filtros de HRTF estándar. La implementación del concepto de la invención permite el uso de HTRF extremadamente largas y así permite la reconstrucción de señales de mezcla descendente de audífonos basadas en una representación de una mezcla descendente paramétrica de una señal de multicanal con excelente calidad perceptual . Además, utilizando el concepto de la invención en filtros de cancelación de diafonía permite la generación de una mezcla descendente estéreo espacial a ser usada con un conjunto de dos altavoces estándar basado en una representación de una mezcla descendente paramétrica de una señal multicanal con excelente calidad perceptual.
Una gran ventaja adicional del concepto de descodificación de la invención es que un solo descodificador binaural de la invención que implementa el concepto inventivo puede ser usado para derivar una mezcla descendente binaural también como una reconstrucción de multicanal de una mezcla descendente transmitida tomando en cuenta los parámetros espaciales transmitidos adicionalmente . En una modalidad de la presente invención, un descodificador binaural de la invención que tiene un banco de filtro de análisis para derivar la representación de la mezcla descendente de la señal de multicanal en un dominio de sub-banda y un descodificador de la invención que implementa el cálculo de las HRTF modificadas. El descodificador comprende además un banco de filtro de síntesis para derivar finalmente una representación de dominio de tiempo de una señal de mezcla descendente de audífonos, que está preparada para ser reproducida mediante cualquier equipo de reproducción de audio convencional . En los siguientes párrafos, esquemas de descodificación de multicanal parámetros y esquemas de descodificación binaurales son explicados en más detalle con referencia a las figuras adjuntas, para bosquejar más claramente las mayores ventajas del concepto de la invención. La mayoría de las modalidades de la presente invención detalladas posteriormente en la presente describen el concepto de la invención utilizando HRTF. Como se indica previamente, el procesamiento de HTRF es similar al uso de filtros de cancelación de diafonía. Por consiguiente, todas las modalidades se entenderán como para referirse al procesamiento de HTRF, también como a filtro de cancelación de diafonía. En otras palabras, todos los filtros de HRTF podrían ser reemplazados por filtros de cancelación de diafonía antes de la aplicación del concepto de la invención al uso de filtros de cancelación de diafonía.
BREVE DESCRIPCION DE LAS FIGURAS Modalidades preferidas de la presente invención son descritas subsecuentemente al referirse a las figuras adjuntas, en donde : La Figura 1 muestra una síntesis binaural convencional utilizando HRTF; La Figura Ib muestra el uso convencional de filtros de cancelación de diafonía; La Figura 2 muestra un ejemplo de un codificador espacial en multicanal; La Figura 3 muestra un ejemplo de descodificadores espaciales/binaurales del arte previo; La Figura 4 muestra un ejemplo de un codificador de multicanal paramétrico; La Figura 5 muestra un ejemplo de un descodificador de multicanal paramétrico ; La Figura 6 muestra un ejemplo de un descodificador de la invención; La Figura 7 muestra un diagrama de bloques que ilustra el concepto de transformar filtros al dominio de sub-banda ; La Figura 8 muestra un ejemplo de un descodificador de la invención; La Figura 9 muestra un ejemplo adicional de un descodificador de la invención; y La Figura 10 muestra un ejemplo para un receptor o reproductor de audio de la invención.
DESCRIPCION DETALLADA DE MODALIDADES PREFERIDAS Las modalidades descritas posteriormente en la presente son solamente ilustrativas para los principios de la presente invención para la descodificación binaural de señales de multicanal mediante filtración de HRTF Morphed. Se comprenderá que modificaciones y variaciones de las disposiciones y los detalles descritos en la presente serán evidentes para otros experimentados en el arte. Es el intento, por consiguiente, estar limitado solamente por el alcance de las reivindicaciones de patente pendientes y no por los detalles específicos presentados a manera de descripción y explicación de las modalidades de la presente.
Con el fin de bosquejar mejor los elementos y ventajas de la presente invención, una descripción más elaborada del arte previo será dada ahora. Un algoritmo de síntesis binaural convencional es bosquejado en la Figura 1. un conjunto de canales de entrada (frente izquierdo (LF) , frente derecho (RF) , envolvente izquierdo (LS) , envolvente derecho (RS) y central (C) ) , 10a, 10b, 10c, lOd y lOe es filtrado por un conjunto de HRTF 12a a 12j . Cada señal de entrada es dividida en dos señales (un componente izquierdo "L" y un componente derecho "R" ) , en donde cada uno de estos componentes de señal son filtrados subsecuentemente por una HRTF correspondiente a la posición de sonido deseada. Finalmente, todas las señales de oído izquierdo son sumados por un sumador 14a para generar la señal de salida binaural izquierda L y las señales de oído derecho son sumadas por un sumador 14b para generar la señal de salida binaural derecha R. Se pueden notar que la convolucion de HRTF puede ser efectuada principalmente en el dominio de tiempo, pero es frecuentemente preferido efectuar la filtración en el dominio de frecuencia debido a la eficiencia de cómputo incrementada. Esto significa que, la suma mostrada en la Figura 1 es también efectuada en el dominio de frecuencia y una transformación subsecuente a un dominio en el tiempo es adicionalmente requerida . La Figura Ib ilustra el procesamiento de cancelación de diafonía diseñado para obtener una impresión de escucha espacial utilizando solamente dos altavoces de un ambiente de reproducción estéreo estándar. El objetivo es la reproducción de una señal multicanal por medio de un sistema de reproducción estéreo que tiene solamente dos altavoces 16a y 16b, de tal manera que el usuario 18 experimenta una experiencia de escucha espacial . Una diferencia principal con respecto a la reproducción de audífonos es que las señales de ambos altavoces 16a y 16b llegan directamente a ambos oídos del usuario 18. Las señales indicadas por las líneas discontinuas (diafonía) por consiguiente tienen que ser tomadas en cuenta adicíonalmente . Por facilidad de explicación solamente, una señal de entrada de 3 canales que tiene 3 fuentes 20a a 20c es ilustrada en la Figura Ib. Se sigue que el escenario puede en principio ser extendido a un número arbitrario de canales. Para derivar la señal estéreo a ser reproducida, cada fuente de entrada es procesada por 2 de los filtros de cancelación de diafonía 21a a 21f, un filtro para cada canal de la señal de reproducción. Finalmente, todas las señales filtradas para el canal de reproducción izquierdo 16a y el canal de reproducción derecho 16b son sumadas para la reproducción. Es evidente que los filtros de cancelación de diafonía en general serán diferentes para cada fuente 20a y 20b (dependiendo de su posición percibida deseada) y que podrían además depender aún del usuario. Debido a la alta flexibilidad del concepto de la invención, uno de los principios de la alta flexibilidad en el diseño y aplicación de los filtros de cancelación de diafonía de tal manera que los filtros pueden ser optimizados para cada aplicación o dispositivo de reproducción individualmente. Una ventaja adicional es que el método es extremadamente eficiente desde el punto de vista de cómputo, *" puesto que solamente dos bancos de filtro de síntesis son requerimientos. Un esquema principal de un codificador de audio espacial es mostrado en la Figura 2. En tal escenario de codificación básica, un descodificador de audio espacial 40 comprende un codificador espacial 42, un codificador de mezcla descendente 44 y un multiplexor 46. Una señal de entrada de multicanal 50 es analizada por el codificador espacial 42, extrayendo los parámetros espaciales que describen las propiedades espaciales de la señal de entrada de multicanal que tiene que ser transmitida al lado de descodificador . La señal mezclada descendentemente generada por el codificador espacial 42 puede ser por ejemplo una señal monofónica o estéreo dependiendo de diferentes escenarios de codificación. Luego el codificador de mezcla descendente 44 puede codificar la señal de mezcla descendente monofónica o estéreo utilizando cualquier esquema de codificación de audio mono o estéreo convencional. El multiplexor 46 crea una corriente de bits de salida al combinar los parámetros espaciales y la señal de mezcla descendente codificada a la corriente de bits de salida. La Figura 3 muestra una combinación directa posible de un descodificador de multicanal correspondiente al codificador de la Figura 2 y un método de síntesis binaural tal como por ejemplo el resumido en la Figura 1. Como se puede ver, el procedimiento del arte previo de combinar los elementos es simple y directo. El montaje comprende un des-multiplexor 60, un descodificador de mezcla descendente 62, un descodificador espacial 64 y un sintetizador binaural 66. Una corriente de bits de entrada 68 es de-multiplexada dando como resultado parámetros espaciales 70 y una corriente de bits de señal de mezcla descendente. La última corriente de bits de señal de mezcla descendente es descodificada por el descodificador de mezcla descendente 62 utilizando un descodificador mono o estéreo convencional. La mezcla descendente descodificada es introducida, junto con los parámetros espaciales 70, al descodificador espacial 64 que genera una señal de salida de multicanal 62 que tiene las propiedades espaciales indicadas por los parámetros espaciales 70. El tener una señal de multicanal 72 completamente reconstruida, el procedimiento de agregar simplemente un sintetizador binaural 66 para implementar el concepto de síntesis binaural de la Figura 1 es directo. Por consiguiente, la señal de salida de multicanal 72 es usada como entrada para el sintetizador binaural 66 que procesa la señal de salida de multicanal para derivar la señal de salida binaural resultante 74. El procedimiento mostrado en la Figura 3 tiene por lo menos tres desventajas: - una representación de señal de multicanal completa tiene que ser calculada como una etapa intermedia, seguida por convolución de HRTF y mezcla descendente en la síntesis binaural . Aunque la convolución de HRTF debe ser efectuada en una base según canal, dado el hecho de que cada canal de audio puede tener una posición espacial diferente, esta es una situación indeseable desde el punto de vista de complejidad. Así, la complejidad de cómputo es alta y se desperdicia energía . - El descodificador espacial opera en un dominio de banco de filtros (QMF) . La convolución de HRTF, por otra parte, es aplicada comúnmente en el dominio de FFT. Por consiguiente, una cascada de un banco de filtro de síntesis de QMF de multicanal, una transformada de DFT de multicanal y una transformada de DFT inversa estéreo es necesaria, dando como resultado un sistema con altas demandas de cómputo. Artefactos de codificación creados por el descodificador espacial para crear una reconstrucción de multicanal serán audibles y posiblemente realzados en la salida binaural (estéreo) . Una descripción aún más detallada de la codificación y descodificación de multicanal es dada en la Figura 4 y 5. El codificador espacial 100 mostrado en la Figura 4 comprende un primer OTT (codificador 1 a 2) 102a, un segundo OTT 102b y una bloque de TTT (codificador de 3 a 2) 104. Una señal de entrada de multicanal 106 que consiste de canales LF, LS, C, RF, RS (izquierdo-frontal , izquierdo-envolvente, central, derecho-frontal y derecho-envolvente) es procesada por el codificador espacial 100. Los bloques de OTT reciben dos canales de audio de entrada cada uno y derivan un canal de salida de audio monofónico individual y parámetros especiales asociados, los parámetros que tienen información en cuanto a las propiedades espaciales de los canales originales entre sí o con respecto al canal de salida (por ejemplo parámetros CLD, ICC) . En el codificador 100, los canales de LF y LS son procesados por el codificador de OTT 102a y los canales de RF y RS son procesados por el codificador de OTT 102b. Dos señales, L y R son generadas, la única que tiene información en el lado izquierdo y la otra solamente información en cuanto al lado derecho. Las señales L, R y C son procesadas adicionalmente por el codificador de TTT 104, generando una mezcla descendente estéreo y parámetros adicionales. Los parámetros resultantes del codificador de TTT consisten comúnmente de un par de coeficientes de predicción para cada banda de parámetros o un par de diferencia de nivel para describir las proporciones de energía de las tres señales de entrada. Los parámetros de los codificadores de "OTT" consisten de diferencias de nivel y valores de coherencia o valores de correlación cruzada entre las señales de entrada para cada banda de frecuencia. Se puede notar que aunque el bosquejo esquemático de codificador espacial 100 apunta a un procesamiento secuencial de los canales individuales de la señal de mezcla descendente durante la codificación, también es posible implementar el proceso de mezcla descendente completo del codificador 100 dentro de una sola operación de matriz. La Figura 5 muestra un descodificador espacial correspondiente, que recibe como entrada las señales de mezcla descendente, tal como son provistas por el codificador de la Figura 4 y los parámetros espaciales correspondientes. El descodificador espacial 120 comprende un descodificador de 2 a 3 122 y descodificadores de 1 a 2 124a a 124c. Las señales de mezcla descendente L0 y o son introducidas al descodificador 2 a 3 122 que recrea un canal central C, un canal derecho R y un canal izquierdo L. Estos tres canales son procesados adicionalmente por los descodificadores de OTT 124a a 124c produciendo seis canales de salida. Se puede notar que la derivación de un canal de mejora de baja frecuencia LFE no es determinante y puede ser omitido de tal manera que un solo codificador de OTT puede ser guardado dentro del descodificador envolvente 120 mostrado en la Figura 5.
De acuerdo con una modalidad de la presente invención, el concepto de la invención es aplicado en un descodificador como se muestra en la Figura 6. El descodificador de la invención 100 comprende un descodificador de 2 a 3 104 y seis filtros de HRTF 106a a 106f. Una señal de entrada estéreo (L0, Ro) es procesada por el descodificador de TTT 104, derivando tres señales L, C y R. Se puede notar que la señal de entrada estéreo se supone que es alimentada dentro de un dominio de sub-banda, puesto que codificador de TTT puede ser el mismo codificador como se muestra en la Figura 5 y de aquí adaptado para ser operativo en señales de sub-banda. Las señales de L, R y C son sometidas a procesamiento de parámetros de HRTF por los filtros de HRTF 106a a 106f. Los 6 canales resultantes son sumados para generar el par de salida binaural estéreo {Lb/ ¾) . El descodificador de TTT, 106, puede ser descrito como la siguiente operación de matriz: con la entrada de matriz m^y dependientes de los parámetros espaciales. La relación de los parámetros espaciales y entrada de matriz es idéntica a aquellas relaciones como el descodificador envolvente de MPEG de multicanal de 5.1. Cada una de las tres resultantes L, R y C son divididas en dos y procesadas con parámetros de HRTF correspondientes a la posición deseada (percibida) de estas fuentes de sonido. Para el canal central (C) , los parámetros espaciales de la posición de fuente de sonido puede ser aplicado directamente, dando como resultado dos señales de salida para el centro, LB(C) y RB(C) : Para el canal izquierdo (L) , los parámetros de HRTF de los canales izquierdo- frontal e izquierdo-envolvente son combinados a un solo conjunto de parámetros de HRTF, utilizando los pesos wif y wrf. Los parámetros de HTRF "combinados" resultantes simulan el efecto de ambos de los canales frontales y envolventes en un sentido estadístico. Las siguientes ecuaciones son usadas para generar el par de salida binaural (LB, RB) para el canal izquierdo: De manera similar, la salida binaural para el canal derecho es obtenida de acuerdo con: Dadas las definiciones anteriores de B(C) , RB(C) , LB{L) , RB(L) , L B{R) y RB(R) , las señales de LB y RB completas pueden ser derivadas de una sola matriz de 2 x 2 dada la señal de entrada estéreo: con ?„ =m11Hi(¿) + W21Hi(i?)+m31H£(C), ?,. = muHL(L) + m22HL(R)+m32HL(C) , \ =mnHR(L) + m HR(R)+m^HR(C) , = ™nHR(L) + m22HR(R) + m32HR(C) . En lo anterior, se supuso que los parámetros de HY{X) para Y = L0,R0 y X = L,R,C, eran escalares complejos. Sin embargo, la presente invención enseña cómo extender el procedimiento de un descodificador binaural de matriz de 2 por 2 para manejar filtros de HRTF de longitud arbitraria. Con el fin de obtener esto, la presente invención comprende las siguientes etapas: - Transformar las respuestas de filtro de HRTF a un dominio de banco de filtros; - Extracción de la diferencia de retardo global o extracción de diferencia de fase de pares de filtros de HRTF; - Morfear las respuestas del par de filtros de HRTF como función de los parámetros de CLD - Ajuste de ganancia. Esto es obtenido al reemplazar las seis ganancias complejas HY{X) para Y = L0,RQ y X = L,R,C con seis filtros. Estos filtros son derivados de los diez filtros HY(X) para Y - L0,RQ y X = Lf,Ls,Rf,Rs,C , que describen las respuestas de filtro de HRTF dadas en el dominio de QMF. Estas representaciones de QMF pueden ser obtenidas de acuerdo con el método descrito en uno de los párrafos subsecuentes. En otras palabras, la presente invención enseña un concepto para derivar HRTF modificadas tales como al modificar (morfear) los filtros de canal envolvente del extremo frontal utilizando una combinación lineal compleja de acuerdo con HY(X) = gwf exp(-j<f>XYw*)Hy(Xf) + gws .
Como se puede ver de la fórmula anterior, la derivación de las HRTF modificadas es una superposición ponderada de las HRTF originales, aplicando adicionalmente factores de fase. Los pesos wg, Wf dependen de los parámetros de CLD diseñados a ser usados por los descodificadores de OTT 124a y 124b de la Figura 5. Los pesos wif y wls dependen del parámetro CLD del bloque "OTT" Lf y Ls : lf 1 + 10CLDl "0 ' 1 + 10a-0'710 Los pesos wrf y wrs dependen del parámetro CLD del bloque "OTT" para Rf y Rs : 10c^/,o l M¿ = 1 i 1 + 10a£>r/1° " l +10Cií>r/10 El parámetro fase parámetro F?? puede ser derivado de la diferencia de tiempo de retardo principal ??? entre los filtros de HRTF frontal y posterior y el índice de sub-banda n del banco QMF : El papel de este parámetro de fase en el morfeo de filtros es doble. En primer lugar, realiza una compensación de retardo de los filtros antes de la superposición que conduce a una respuesta combinada que modela un tiempo de retardo principal correspondiente a una posición fuente entre los altavoces frontal y posterior. En segundo lugar, hace el factor de compensación de ganancia necesario g mucho más estable y que varía lentamente sobre la frecuencia, que en el caso de una superposición simple con F??- . El factor de ganancia g es determinado por la regla de potencia de adhesión incoherente, PY(X)2 = w)PY{Xf + w)PY(Xsf en donde PY(X)2 = g2 (wf' PyiXf)2 + + 2wfwsPY{Xf)PY(Xs)PxY ) y ??? es el valor real de la correlación cruzada compleja normalizada entre los filtros 8?G?F??)??(??) y HY(Xs) Para las ecuaciones anteriores, P denota un parámetro que describe un nivel promedio por banda de frecuencia para la respuesta de impulso del filtro especificado por los índices.
Esta intensidad media es por supuesto fácilmente derivada, una vez que la función de respuesta de filtro es conocida. En el caso de superposición simple con el valor de ??? varía de manera errática y oscilatoria como función de la frecuencia, que conduce a la necesidad de ajuste de ganancia extenso. En implementación práctica, es necesario limitar el valor de la ganancia g y una colorización espectral restante de la señal no puede ser evitada. En contraste, el uso de morfeo con una compensación de fase a base de retardo como se enseña por la presente invención conduce a un comportamiento uniforme de ??? como función de la frecuencia. Este valor es frecuentemente aún cercano a uno para pares de filtro derivados de HRTF naturales puesto que difiere principalmente en retardo y amplitud y el propósito del parámetro de fase es tomar en cuenta la diferencia de fase en el dominio de banco de filtro de QMF. Una elección benéfica alternativa del parámetro de fase F?? enseñado por la presente invención es dada por el ángulo de fase de la correlación cruzada compleja normalizada entre los filtros HY {Xf) y Hr {Xs) t y el desenvolvimiento de los valores de fase con técnicas de desenvoltura estándar como función del índice sub-banda n del banco de QMF. Esta elección tiene la consecuencia de que ??? es nunca negativo y de aquí la ganancia de compensación g satisface l/ ¡2=g=\ para todas las sub-bandas. Además esta elección de parámetro de fase permite el morfeo de los filtros de canal frontal y envolvente en situaciones en donde una diferencia de tiempo de retardo principal t?? no está disponible . Para la modalidad de la presente invención como se describe anteriormente, se enseña para transformar exactamente las HRTF a una representación eficiente de los filtros de HRTF dentro del dominio de QMF . La Figura 7 da un bosquejo principal del concepto para transformar exactamente filtros de tiempo-dominio a los filtros dentro del dominio de sub-banda que tienen el mismo efecto neto sobre una señal reconstruida. La Figura 7 muestra un banco de análisis complejo 300, un banco de síntesis 302 correspondientes al banco de análisis 300, un convertidor de filtro 304 y un filtro de sub-banda 306. Una señal de entrada 310 es provista para lo cual un filtro 312 es conocido que tiene propiedades deseadas. El objetivo de la implementación del convertidor de filtro 304 es que la señal de salida 314 tenga las mismas características después del análisis por el banco de filtros de análisis 300, filtración 306 de sub-banda subsecuente y síntesis 302 como habría tenido cuando es filtrada por el filtro 312 en el dominio de tiempo. El objetivo de proporcionar un número de filtros de sub-banda correspondientes a número de sub-bandas utilizadas es satisfecho por el convertidor de filtro 304. La siguiente descripción resume un método para implementar un filtro de FIR dado h(y) en el dominio de sub-banda de QMF complejo. El principio de operación es mostrado en la Figura 7. Aquí, la filtración de sub-banda es simplemente la aplicación de un filtro de FIR de valor complejo para cada sub-banda, n = ?,?,...,?,-l para transformar los índices originales cn a sus contrapartes filtradas dn de acuerdo con la siguiente fórmula : i Obsérvese que esta es diferente de métodos bien conocidos desarrollados para tomar muestras críticamente de bancos de filtros puesto que aquellos métodos requieren filtración de multibanda con respuesta más largas. El componente clave es el convertidor de filtro, que convierte cualquier filtro de FIR de dominio de tiempo a los filtros de dominio de sub-banda complejos. Puesto que el dominio de sub-banda de QMF complejo es sobre -muéstreado, no hay ningún conjunto canónico de filtro de sub-banda para un filtro de dominio de tiempo dado. Diferentes filtros de sub-banda pueden tener el mismo efecto neto de la señal de dominio de tiempo. Lo que se describirá en la presente es una solución aproximativa particularmente atractiva, que es obtenida al restringir el convertidor de filtro para ser un banco de análisis complejo similar al QMF . Suponiendo que el prototipo de convertidor de filtro es de longitud , Un filtro de FIR de derivación de real es transformado a un conjunto de 64 filtros de sub-banda K + K —1 K =3 de derivación H Q complejos. Para Q , un filtro de FIR de 1024 derivaciones es convertido a una filtración de 18 sub-bandas de derivación con una calidad de aproximación de 50 dB. Las derivaciones de filtro de sub-banda son calculadas a partir de la fórmula f p ? SÁk) = ? h(v +kL)q(v)exp -i-{n + )v v=-8 V / en donde es el filtro de prototipo de FIR derivado del filtro de prototipo de QMF. Como se puede ver, este es solo un análisis de banco de filtro complejo del filtro dado h<y). En lo siguiente, el concepto de la invención será resumido para una modalidad adicional de la presente invención, en donde una representación paramétrica de multicanal para una señal de multicanal que tiene cinco canales está disponible. Por favor nótese que en esta modalidad particular de la presente invención, los diez filtros de HRTF originales VY, X (tal como por el ejemplo dado por una representación de QMF de los filtros 12a a 12j de la Figura 1) son morfeados a seis filtros hv,x para Y = L, R y X = L,R,C.
Los diez filtros para Y = L>R ? X = FL,BL,FR,BR,C describen las respuestas de filtro de HRTF dadas en un dominio de Q F híbrido. La combinación de los filtros de canales frontal y envolvente es efectuada con una combinación lineal compleja de acuerdo con hi,c =v L ,C h U R,C = v T R,C HL,L = gL.L°FL )VL,FL + SL,L°BL +SL,R°B ^R,R = §R,RC FR ev ~J FR,BRsBR ) R,FR + &R,R< BR ß??(- ¾,Bfl°« ) Y R,BR Los factores de ganancia SL.L'SL.R'SK,L>8R,R SON determinados por <FXCFBY,X + s . &Y,X aF2XCFB x +s?2? +2aFXaBXCFBYXICCFB*x Los parámetros C BYtX,ICCFBY¡x ^ -^qs parametros ¿e fases f son definidos como sigue: Un cociente promedio de nivel frontal/posterior por banda híbrida para los filtros HERF es definido para Y =L,R y X = L,R por Además, estos parámetros F?? son luego definidos para 1 ' y ' por en donde las correlaciones cruzadas complejas son definidas por Una desenvoltura de fase es aplicada a los parámetros de fase junto con el índice de sub-banda ^ , de tal manera que el valor absoluto del incremento de fase de la sub-banda ^ a la sub-banda ^+ 1 es menor o igual a p para k = 0,\,... _ En casos en donde hay dos elecciones, -p , para el incremento, el signo de incremento para una medición de fase en el intervalo ~p>p es escogido . Finalmente, correlaciones cruzadas compensadas en fase normalizadas son definidas para Y=L'R y X=L,R p0r (lCCFB^)k=\(CICY )k Por favor nótese que en el caso en donde el procesamiento de multicanal es efectuado dentro de un dominio de sub-banda híbrido, esto es, en un dominio en donde las sub-bandas son descompuestas adicionalmente a diferentes bandas de frecuencia, un mapeo de la respuesta de HRTF al filtro de banda híbridos puede por ejemplo ser efectuado como sigue: Como en el caso sin un banco de filtros híbridos, las diez respuestas de impulso de HRTF dadas de la fuente X = FL,BL,FR,BR,C al objetivo Y = L,R son todas convertidas filtros de sub-banda de QMF de acuerdo con el método resumido anteriormente. El resultado son diez filtros de sub-banda ?·? con componentes (^,,)m(0 para la sub-banda QMF w = 0,1,...,63 y e^ segmento de tiempo de QMF ^ ®A,---,Lq 1 ^ ^ mapeo de índice de la banda híbrida * a la banda QMF m denotada por m = Qik) _ y Entonces, los filtros de HRTF ?·? en dominio de banda híbrido son definidos por Para la modalidad específica descrita en los párrafos previos, la conversión de filtro de los filtros de HRTF a dominios QMF puede ser implementada como sigue, dado un filtro de FIR de longitud ^h a ser transferido al dominio de sub-banda de QMF complejo: La filtración de sub-banda consiste de la aplicación separada del filtro de FIR de valor complejo para cada sub-banda de QMF, /w = 0,1,...,63 _ EI componente clave es el convertidor de filtro, que convierte el filtro de FIR de dominio de tiempo dado a los filtros de dominio de sub- banda complejos ^( _ El convertidor de filtro es un banco de análisis complejo similar al banco de análisis de QMF. Su filtro prototipo es de longitud 192. Una extensión con ceros del filtro de FIR de dominio de tiempo es definida por de otra manera, Los filtros de dominio de sub-banda de longitud, y / = o,i,...,^ + i por p hm(0 - Xh(v + 64(/ -2))q(v)exp -j—(m +†) ( - 95) Aunque el concepto de la invención ha sido detallado con respecto a una señal de mezcla descendente que tiene dos canales, esto es, una señal estéreo transmitida, la aplicación del concepto de la invención no está de ninguna manera restringida a un escenario que tenga una señal de mezcla descendente estéreo. Resumiendo, la presente invención es concerniente con el problema de usar filtros de cancelación de diafonía o filtro de HTRF largos para la producción binaural de señales de multicanal paramétricos . La invención enseña nuevas maneras para extender el procedimiento de HTRF paramétrico a la longitud arbitraria de filtro de HTRF. La presente invención comprende los siguientes elementos : - multiplicación de la señal de mezcla descendente estéreo por una matriz de 2 x 2 en donde cada elemento de matriz es un filtro de FIR o longitud arbitraria (tal como es dada por el filtro de HRTF) ; - derivar los filtros a la matriz de 2 x 2 mediante morfeo de los filtros de HRTF originales en base a los parámetros de multicanal transmitidos; - cálculo del morfeo de los filtros de HRTF de tal manera que se obtiene la envolvente espectral correcta y energía global correcta. La Figura 8 muestra un ejemplo para un descodificador de la invención 300 para derivar una señal de mezcla descendente de audífonos. El descodificador comprende un calculador de filtro 302 y un sintetizador 304. El calculador de filtro recibe como primera entrada parámetros de nivel 306 y como segunda entrada HTRF (funciones de transferencia relacionadas con la cabeza) 308 para derivar HRTF modificada 310 que tienen el mismo efecto neto sobre una señal cuando son aplicadas a la señal en el dominio de sub-banda que las funciones de transferencia relacionadas con la cabeza 308 aplicadas en el dominio de tiempo. Los HRTF modificados 310 sirven como primera entrada al sintetizador 304 que recibe como segunda entrada una representación de una señal de mezcla descendente 312 dentro de un dominio de sub-banda. La representación de la señal de mezcla descendente 312 es derivada por un codificador de multicanal parámetro y diseñada para ser usada como base para la reconstrucción de una señal de multicanal plena por un descodificador de multicanal. El sintetizador 404 es así apto de derivar una señal de mezcla descendente de audífonos 314 utilizando las HRTF modificadas 310 y la representación de la señal de mezcla descendente 312. Se puede notar que las HRTF podrían ser provistas en cualquier representación paramétrica posible, por ejemplo como la función de transferencia asociada al filtro, como la respuesta de impulso del filtro o como una serie de coeficientes de derivación para un filtro de FIR. Los ejemplos previos asumen que la representación de la señal de mezcla descendente ya está suministrada como representación de banco de filtros, esto es, como muestra derivadas por un banco de filtros. Sin embargo, en aplicaciones prácticas, una señal de mezcla descendente de dominio de tiempo es suministrada comúnmente y transmitida para permitir también una representación directa de la señal presentada en medios ambientes de reproducción simples. Por consiguiente, en la Figura 9, en una modalidad adicional de la presente invención, en donde un descodificador compatible binaural 400 comprende un banco de filtro de análisis 402 y un banco de filtro de síntesis 404 y un descodificador de la invención que podría por ejemplo ser el descodificador 300 de la Figura 8. Funcionalidades del descodificador y sus descripciones son aplicables en la Figura 9 también como en la Figura 8 y la descripción del descodificador 300 será omitida en el siguiente párrafo . El banco de filtro de análisis 402 recibe una mezcla descendente de una señal de multicanal 406 tal como es creada por un codificador paramétrico de multicanal. El banco de filtro de análisis 402 deriva la representación de banco de filtros de la señal de mezcla descendente recibida 406 que es luego introducida al descodificador 300 que deriva una señal de mezcla descendente de audífonos 408, todavía dentro del dominio de banco de filtros. Esto es, la mezcla descendente es representada por una multitud de muestras o coeficientes dentro de las bandas de frecuencia introducidas por el banco de filtro de análisis 402. Por consiguiente, para proporcionar una señal de mezcla descendente de audífonos final 410 en el dominio de tiempo, la señal de mezcla descendente de audífonos 408 es introducida al banco de filtros de síntesis 404 que deriva la señal de me descendente de audífonos 410, que está preparada para ser reproducida por el equipo de reproducción estéreo. La Figura 10 muestra un receptor o reproductor de audio de la invención 500, que tiene un descodificador de audio de la invención 501, una entrada de corriente de bits 502 y una salida de audio 504. Una corriente de bits puede ser introducida en la entrada 502 del receptor/reproductor de audio de la invención 500. Luego la corriente de bits es descodificada por el descodificador 501 y la señal decodificada es emitida o reproducida en la salida 504 del receptor/reproductor de audio de la invención 500. Aunque los ejemplos han sido derivados en los párrafos precedentes para implementar el concepto de la invención que depende de una mezcla descendente estéreo transmitida, el concepto de la invención puede también ser aplicado en configuraciones basadas en un solo canal de mezcla descendente monofónico o en uno o más de dos canales de mezcla descendentes. Una implementación particular de la transferencia de funciones de transferencia relacionadas con la cabeza al dominio de sub-banda es dada en la descripción de la presente invención. Sin embargo, otras técnicas para derivar los filtros de sub-banda pueden también ser usadas sin limitar el concepto de la invención. Los factores de fase introducidos en la derivación de las HRTF modificadas pueden ser derivadas también por otros cálculos que los presentados previamente. Por consiguiente, la derivación de aquellos factores de manera diferente no limita el alcance de la invención. Aún ya que el concepto de la invención es mostrado en particular para HRTF y filtros de cancelación de diafonía, puede ser usado para otros filtros definidos para uno o más canales individuales de una señal de multicanal para permitir una generación eficiente desde el punto de vista de cómputo de una señal de reproducción estéreo de alca calidad. Los filtros no solamente están restringidos además a filtros diseñados para modelar un medio ambiente de escucha. Aún filtros que agregan componentes "artificiales" a una señal pueden ser usados, tal como por ejemplo reverberación u otros filtros de distorsión. Dependiendo de ciertos requerimientos de implementación de los métodos de la invención, los métodos de la invención pueden ser implementados en elementos físicos o elementos de programación. La implementación puede ser efectuada utilizando un medio de almacenamiento digital, en particular un disco, DVD o un CD que tiene señales de control que se pueden leer electrónicamente almacenadas en el mismo, que cooperan con un sistema de computadora programable, de tal manera que los métodos de la invención son efectuados. En general, por consiguiente, la presente invención es un producto de programa de computadora con un código de programas almacenado en un portador que se puede leer por la máquina, el código de programa siendo operativo para efectuar los métodos de la invención, cuando el producto de computadora se ejecuta en una computadora. En otras palabras, los métodos de la invención son por consiguiente un programa de compuesto que tiene un código de programa para efectuar por lo menos uno de los métodos de la invención cuando el programa de computadora se ejecuta en una computadora. En tanto que lo anterior ha sido mostrado y descrito en particular con referencia a modalidades particulares de la misma, se comprenderá por aquellos experimentados en el arte que varios cambios en forma y detalle se pueden efectuar sin desviarse del espíritu y alcance de la presente. Se entenderá que varios cambios se pueden hacer adaptarse a diferentes modalidades sin desviarse de los conceptos más amplios revelados en la presente y abarcados por las reivindicaciones que siguen.

Claims (27)

  1. REIVINDICACIONES 1. Un descodificador para derivar una señal de mezcla descendente de audífonos utilizando una representación de una mezcla descendente de una señal de multicanal y utilizando un parámetro de nivel que tiene información en cuanto a una relación de nivel entre dos canales de la señal de multicanal y utilizando funciones de transferencia relacionadas con la cabeza relacionadas con los canales de la señal de multicanal, caracterizado porque comprende: un calculador de filtro para derivar funciones de transferencia relacionadas con la cabeza modificada al ponderar las funciones de transferencia relacionadas con la cabeza de los dos canales utilizando el parámetro de nivel, de tal manera que una función de transferencia relacionada con la cabeza modificada es influenciada más fuente por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más alto que por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más bajo, y un sintetizador para derivar la señal de mezcla descendente de audífonos utilizando las funciones de transferencia relacionadas con la cabeza modificada y la representación de la señal de mezcla descendente.
  2. 2. El descodificador de conformidad con la reivindicación 1, caracterizado porque el calculador de filtro es operativo para derivar las funciones de transferencia relacionadas con la cabeza modificadas, aplicando además desplazamiento de fase a las funciones de transferencia relacionadas con la cabeza de los dos canales, de tal manera que las función de transferencia relacionada con la cabeza de un canal que tiene un nivel más bajo es desplazada más cercana a una fase media de las funciones de transferencia relacionadas con la cabeza de los dos canales que un canal que tiene un nivel más alto.
  3. 3. El descodificador de conformidad con la reivindicación 1, caracterizado porque el calculador de filtro es operativo de tal manera que el número de funciones de transferencia relacionadas con la cabeza modificadas derivadas es menor que el número de funciones de transferencia relacionadas con la cabeza asociadas de los dos canales.
  4. 4. El descodificador de conformidad con la reivindicación 1, caracterizado porque el calculador de filtro es operativo para derivar funciones de transferencia relacionadas con la cabeza modificadas abarcadas para ser aplicadas a una representación de banco de filtros de la señal de mezcla descendente.
  5. 5. El descodificador de conformidad con la reivindicación 1, caracterizado porque está adaptado para usar una representación de la señal de mezcla descendente derivada en un dominio de banco de filtros.
  6. 6. El descodificador de conformidad con la reivindicación 1, caracterizado porque el calculador de filtros es operativo para derivar funciones de transferencia relacionadas con la cabeza modificadas utilizando funciones de transferencia relacionadas con la cabeza caracterizadas por más de tres parámetros.
  7. 7. El descodificador de conformidad con la reivindicación 1, caracterizado porque el calculador de filtro es operativo para derivar los factores de ponderación para las funciones de transferencia relacionadas con la cabeza de los dos canales utilizando el mismo parámetro de nivel.
  8. 8. El descodificador de conformidad con la reivindicación 7, caracterizado porque el calculador de filtro es operativo para derivar un primer factor de ponderación wif para un primer canal f y un segundo factor de ponderación wis para un segundo canal s utilizando el parámetro de nivel CLDi de acuerdo con las siguientes formulas: wi = wt = l + _j_
  9. 9. El descodificador de conformidad con la reivindicación 1, caracterizado porque el calculador de filtro es operativo para derivar funciones de transferencia relacionadas con la cabeza modificadas aplicando un factor de ganancia común a las funciones de transferencia relacionadas con la cabeza de los dos canales, de tal manera que la energía es ahorrada cuando se derivan las funciones de transferencia relacionadas con la cabeza modificadas.
  10. 10. El descodificador de conformidad con la reivindicación 9, caracterizado porque el factor de ganancia común está dentro del intervalo de [^^,1] .
  11. 11. El descodificador de conformidad con la reivindicación 2, caracterizado porque el calculador de filtro es operativo para derivar la fase promedio utilizando un tiempo de retardo entre la respuesta de impulso de funciones de transferencia relacionadas con la cabeza de los dos canales.
  12. 12. El descodificador de conformidad con la reivindicación 11, caracterizado porque el calculador de filtro es operativo en un dominio de banco de filtros que tiene n bandas de frecuencia y para derivar desplazamientos de fase promedio individuales para cada banda de frecuencia utilizando el tiempo de retardo.
  13. 13. El descodificador de conformidad con la reivindicación 11, caracterizado porque el calculador de filtro es operativo en un dominio de banco de filtros que tiene más de dos bandas de frecuencia y para derivar desplazamientos de fase promedio individuales para cada banda de frecuencia utilizando el tiempo de retardo ??? de acuerdo con la siguiente fórmula : TXY „ . L XY
  14. 14. El descodificador de conformidad con la reivindicación 2, caracterizado porque el calculador de filtro es operativo para derivar la fase promedio utilizando el ángulo de fase de la correlación cruzada completa normalizada entre la respuesta de impulso de las funciones de transferencia relacionadas con la cabeza del primero y el segundo canal .
  15. 15. El descodificador de conformidad con la reivindicación 1, caracterizado porque el primer canal de los dos canales es un canal frontal del lado izquierdo o el lado derecho de la señal de multicanal y el segundo canales de los dos canales es un canal posterior de mismo lado.
  16. 16. El descodificador de conformidad con la reivindicación 15, caracterizado porque el calculador de filtro es operativo para derivar la función de transferencia relacionada con la cabeza modificada ^r(^Q utilizando la función de transferencia relacionada con la cabeza de canal frontal HY(Xf) y ]_a funci n ¿e transferencia relacionada con la cabeza de canal posterior HY{Xs) utilizando la siguiente combinación lineal compleja: HY{X) = gwf exp(-j<XYw*)Hr(Xf) + gws expC/^¼^)H (Xs) en donde ^)?? es la fase promedio, w¡ y Wf son factores de ponderación derivados utilizando el parámetro de nivel y es un factor de ganancia común derivado usando el parámetro de nivel .
  17. 17. El descodificador de conformidad con la reivindicación 1, caracterizado porque está adaptado para usar una representación de una señal de mezcla descendente que tiene un canal izquierdo y un canal derecho derivado de una señal de multicanal que tiene un canal izquierdo-frontal, un canal izquierdo-envolvente, un canal derecho-frontal, un canal derecho-envolvente y un canal central .
  18. 18. El descodificador de conformidad con la reivindicación 1, caracterizado porque el sintetizador es operativo para derivar canales de la señal de mezcla descendente de audífonos aplicando una combinación lineal de las funciones de transferencia relacionadas con la cabeza modificadas a la representación de la mezcla descendente de la señal de multicanal.
  19. 19. El descodificador de conformidad con la reivindicación 18, caracterizado porque el sintetizador es operativo para usar coeficientes para la combinación lineal dependiendo del parámetro de nivel .
  20. 20. El descodificador de conformidad con la reivindicación 18, caracterizado porque el sintetizador es operativo para usar coeficientes para a combinación lineal dependiendo de parámetros de multicanal adicionales relacionados con propiedades especiales adicionales de la señal de multicanal.
  21. 21. Un descodificador binaural, caracterizado porque comprende : el descodificador de conformidad con la reivindicación 1; un banco de filtros de análisis para derivar la representación de la mezcla descendente de la señal de multicanal mediante filtración de sub-banda de la mezcla descendente de la señal de multicanal, y un banco de filtro de síntesis para derivar una señal de audífonos de dominio de tiempo al sintetizar la señal de mezcla descendente de audífonos.
  22. 22. Un descodificador para derivar una señal de mezcla descendente estéreo espacial utilizando una representación de una mezcla descendente de una señal de multicanal y usando un parámetro de nivel que tiene información en cuanto a una relación de nivel entre dos canales de la señal de multicanal y usando filtros de cancelación de diafonía relacionados con los dos canales de la señal de multicanal, caracterizado porque comprende: un calculador de filtro para derivar filtros de cancelación de diafonía modificados al ponderar los filtros de cancelación de diafonía de los dos canales utilizando el parámetro de nivel, da tal manera que un filtro de cancelación de diafonía modificado es influenciado más fuerte por el filtro de cancelación de diafonía de un canal que tiene un nivel más alto que por el filtro de cancelación de diafonía de un canal que tiene un nivel más bajo, y un sintetizador para derivar la señal de mezcla descendente estéreo espacial utilizando los filtros de cancelación de diafonía modificados y la representación de la señal de mezcla descendente.
  23. 23. Un método para derivar una señal de mezcla descendente de audífonos utilizando una representación de una mezcla descendente de una señal de multicanal y usando un parámetro de nivel que tiene inferior en cuando a una relación de nivel entre dos canales de la señal de multicanal y utilizando funciones de transferencia relacionadas con la cabeza relacionada con los dos canales de la señal de multicanal, el método está caracterizado porque comprende: derivar, utilizando el parámetro de nivel, funciones de transferencia relacionadas con la cabeza modificadas al ponderar las funciones de transferencia relacionadas con la cabeza de los dos canales, de tal manera que una función de transferencia relacionada con la cabeza modificada es influenciada más fuerte por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más alto que por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más bajo, y derivar la señal de mezcla descendente de audífonos utilizando las funciones de transferencia relacionadas con la cabeza modificadas y la representación de la señal de mezcla descendente .
  24. 24. Un receptor o reproductor de audio que tiene un descodificador para derivar una señal de mezcla descendente de audífonos utilizando una representación de una mezcla descendente de una señal de multicanal y usando un parámetro de nivel que tiene información en cuanto a una relación de nivel entre dos canales de la señal de multicanal y usando funciones de transferencia relacionadas con la cabeza relacionadas con los dos canales de la señal de multicanal, caracterizado porque comprende : un calculador de filtro para derivar funciones de transferencia relacionadas con la cabeza modificada al ponderar las funciones de transferencia relacionadas con la cabeza de los dos canales utilizando el parámetro de nivel, de tal manera que una función de transferencia relacionada con la cabeza modificada es influenciada más fuerte por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más alto que por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más bajo, y un sintetizador para derivar la señal de mezcla descendente de audífonos utilizando las funciones de transferencia relacionadas con la cabeza modificadas y la representación de la señal de mezcla descendente.
  25. 25. Un método para recibir o reproducir audio, el método tiene un método para derivar una señal de mezcla descendente de audífonos utilizando una representación de una mezcla descendente de una señal de multicanal y usando un parámetro de nivel que tiene información en cuanto a una relación de nivel entre dos canales de la señal de multicanal y usando funciones de transferencia relacionadas con la cabeza relacionada con los dos canales de la señal de multicanal, el método está caracterizado porque comprende: derivar, utilizando el parámetro de nivel, funciones de transferencia relacionadas con la cabeza modificadas al ponderar las funciones de trans erencia relacionadas con la cabeza de los dos canales, de tal manera que una función de transferencia relacionada con la cabeza modificada es influenciada más fuerte por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más alto que por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más bajo, y derivar la señal de mezcla descendente de audífonos utilizando las funciones de transferencia relacionadas con la cabeza modificadas y la representación de la señal de mezcla descendente .
  26. 26. Un programa de computadora que tiene códigos de programa para efectuar, cuando se ejecuta en una computadora, un método para derivar una señal de mezcla descendente de audífonos utilizando una representación de una mezcla descendente de una señal de multicanal y usando un parámetro de nivel que tiene información en cuanto a una relación de nivel entre dos canales de la señal de multicanal y usando^ funciones de transferencia relacionadas con la cabeza relacionadas con los dos canales de la señal de multicanal, el método está caracterizado porque comprende: derivar, usando el parámetro de nivel, funciones de transferencia relacionadas con la cabeza modificadas al ponderar las funciones de transferencia relacionadas con la cabeza de los dos canales, de tal manera que una función de transferencia relacionada con la cabeza modificada es influenciada más fuerte por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más alto que por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más bajo, y derivar la señal de mezcla descendente de audífonos utilizando las funciones de transferencia relacionadas con la cabeza modificadas y la representación de la señal de mezcla descendente.
  27. 27. Un programa de computadora que tiene códigos de programa para efectuar, cuando es ejecutado en una computadora, un método para recibir o reproducir audio, el método tiene un método para derivar una señal de mezcla descendente de audífonos utilizando una representación de una mezcla descendente de una señal de multicanal y usando un parámetro de nivel que tiene información en cuanto a una relación de nivel entre dos canales de la señal de multicanal y usando las funciones de transferencia relacionadas con la cabeza relacionada con los dos canales de la señal de multicanal, el método está caracterizado porque comprende-. derivar, usando el parámetro de nivel, funciones de transferencia relacionadas con la cabeza modificadas al ponderar las funciones de transferencia relacionadas con la cabeza de los dos canales, de tal manera que una función de transferencia relacionada con la cabeza modificada es influenciada más fuerte por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más alto que por la función de transferencia relacionada con la cabeza de un canal que tiene un nivel más bajo, y derivar la señal de mezcla descendente de audífonos utilizando las funciones de transferencia relacionadas con la cabeza modificadas y la representación de la señal de mezcla descendente .
MX2008011994A 2006-03-24 2006-09-01 Generacion de mezclas descendentes espaciales a partir de representaciones parametricas de señales de multicanal. MX2008011994A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE0600674 2006-03-24
US74455506P 2006-04-10 2006-04-10
PCT/EP2006/008566 WO2007110103A1 (en) 2006-03-24 2006-09-01 Generation of spatial downmixes from parametric representations of multi channel signals

Publications (1)

Publication Number Publication Date
MX2008011994A true MX2008011994A (es) 2008-11-27

Family

ID=37547471

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2008011994A MX2008011994A (es) 2006-03-24 2006-09-01 Generacion de mezclas descendentes espaciales a partir de representaciones parametricas de señales de multicanal.

Country Status (2)

Country Link
HK (1) HK1122174A1 (es)
MX (1) MX2008011994A (es)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2986932A1 (fr) * 2012-02-13 2013-08-16 Franck Rosset Procede de synthese transaurale pour la spatialisation sonore
US10321252B2 (en) 2012-02-13 2019-06-11 Axd Technologies, Llc Transaural synthesis method for sound spatialization

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2986932A1 (fr) * 2012-02-13 2013-08-16 Franck Rosset Procede de synthese transaurale pour la spatialisation sonore
WO2013121136A1 (fr) * 2012-02-13 2013-08-22 Franck Rosset Procédé de synthèse transaurale pour la spatialisation sonore
US10321252B2 (en) 2012-02-13 2019-06-11 Axd Technologies, Llc Transaural synthesis method for sound spatialization

Also Published As

Publication number Publication date
HK1122174A1 (en) 2009-05-08

Similar Documents

Publication Publication Date Title
EP1999999B1 (en) Generation of spatial downmixes from parametric representations of multi channel signals
US20200335115A1 (en) Audio encoding and decoding
US9093063B2 (en) Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
JP5191886B2 (ja) サイド情報を有するチャンネルの再構成
CN111970629B (zh) 音频解码器和解码方法
US20090240505A1 (en) Audio decoding
CN104246873A (zh) 用于编码多声道音频信号的参数编码器
JP4988718B2 (ja) オーディオ信号のデコーディング方法及び装置
MX2008011994A (es) Generacion de mezclas descendentes espaciales a partir de representaciones parametricas de señales de multicanal.
JP2021015310A (ja) オーディオ・デコーダおよびデコード方法
MX2008010631A (es) Codificacion y decodificacion de audio

Legal Events

Date Code Title Description
FG Grant or registration
HC Change of company name or juridical status