ES2812343T3 - Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro - Google Patents

Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro Download PDF

Info

Publication number
ES2812343T3
ES2812343T3 ES18199399T ES18199399T ES2812343T3 ES 2812343 T3 ES2812343 T3 ES 2812343T3 ES 18199399 T ES18199399 T ES 18199399T ES 18199399 T ES18199399 T ES 18199399T ES 2812343 T3 ES2812343 T3 ES 2812343T3
Authority
ES
Spain
Prior art keywords
filter
impulse response
values
value
subband
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18199399T
Other languages
English (en)
Inventor
Lars Villemoes
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Priority claimed from PCT/EP2007/005887 external-priority patent/WO2008003467A1/en
Application granted granted Critical
Publication of ES2812343T3 publication Critical patent/ES2812343T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Compresor de filtro (102, 501) para generar respuestas a los impulsos del filtro de subbanda comprimida de las respuestas a los impulsos del filtro de subbanda de entrada correspondientes a subbandas, que comprenden valores de respuesta a los impulsos del filtro en derivaciones intermedias de filtro, comprendiendo el filtro: un procesador (820) para examinar los valores de respuesta a los impulsos del filtro de al menos dos respuestas a los impulsos del filtro de subbanda de entrada para encontrar valores de respuesta a los impulsos del filtro que tengan valores en un primer conjunto de valores, y al menos un valor de respuesta a los impulsos del filtro que tenga un segundo valor siendo el segundo valor inferior a los valores en el primer conjunto de valores; y un calculador de respuesta a los impulsos del filtro (305) para calcular las respuestas a los impulsos de filtro de subbanda comprimida usando los valores de respuesta a los impulsos del filtro que tengan los valores en el primero conjunto de valores, en el que el calculador de respuesta a los impulsos del filtro (305) está adaptado para calcular las respuestas a los impulsos del filtro de subbanda comprimida de manera que las respuestas a los impulsos del filtro de subbanda comprimida no incluyan los valores de respuesta a los impulsos del filtro correspondientes a las derivaciones intermedias de filtro del al menos un valor de respuesta a los impulsos del filtro que tenga el segundo valor; o comprendan valores de respuesta a los impulsos del filtro de valor cero correspondientes a las derivaciones intermedias de filtro del al menos un valor de respuesta a los impulsos del filtro que tenga el segundo valor, en el que uno o más valores de respuesta a los impulsos del filtro estén o estén cerca de un nivel de alias de banco de filtros utilizado para generar las respuestas a los impulsos del filtro de subbanda de entrada, y en el que el compresor de filtro (102, 501) está configurado para fijar a cero o no incluir valores de respuesta a los impulsos del filtro, cuando el valor de un valor de respuesta a los impulsos del filtro esté cerca de un nivel de alias del banco de filtros.

Description

DESCRIPCIÓN
Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro
Campo técnico
La presente invención se refiere a un compresor de filtro en el dominio de subbanda que a veces también se denomina dominio QMF (QMF = Banco de Filtros de Espejo en Cuadratura), que puede ser, por ejemplo, empleado en el campo de las aplicaciones de audio, como el filtrado de funciones de transferencia relacionadas con la cabeza (HRTF) para una experiencia de sonido multicanal por medio de auriculares.
Antecedentes
El desarrollo reciente en las técnicas de conversión de filtros ha permitido una representación QMF muy eficiente de un filtro en el dominio en el tiempo. En general, cualquier filtro FIR (FIR = Respuesta al Impulso Finita) en el dominio en el tiempo se puede convertir en un conjunto de filtros complejos, cada uno correspondiente a una subbanda específica en el QMF. Por lo tanto, el filtrado puede tener lugar en el dominio QMF complejo, de forma similar a cómo se puede realizar el filtrado utilizando la FFT (FFT = Transformada Rápida de Fourier). Aun así, la complejidad de cálculo de la representación y ejecución del filtrado en el dominio QMF puede ser sustancial, por ejemplo, en el caso de los filtros que tienen una respuesta a los impulsos larga en el dominio en el tiempo.
Además, el desarrollo reciente en la codificación de audio ha puesto a disposición la capacidad de recrear una representación multi canal de una señal de audio basada en una señal estéreo (o mono) y en los datos de control correspondientes. Estos métodos difieren sustancialmente de las soluciones basadas en matrices más antiguas, como Dolby Prologic®, ya que se transmiten datos de control adicionales para controlar la recreación, también conocida como mezcla ascendente, de los canales envolventes basados en los canales mono o estéreo transmitidos.
Por lo tanto, tal descodificador de audio multicanal paramétrico, es decir, Envolvente MPEG, reconstruye N canales basados n M canales transmitidos, con N y M como posibles números enteros, en donde N> M, y los datos de control adicionales. Los datos de control adicionales representan una velocidad de datos significativamente menor que la transmisión de todos los N canales, lo que hace que la codificación sea muy eficiente y, al mismo tiempo, garantiza la compatibilidad tanto con los dispositivos del canal M como con los dispositivos del canal N.
Estos métodos de codificación envolvente paramétrica generalmente comprenden una parametrización de la señal envolvente basada en IID (Diferencia de Intensidad entre Canales) e ICC (Coherencia entre Canales). Estos parámetros describen relaciones de potencia y correlación entre pares de canales en el proceso de mezcla ascendente. Otros parámetros también utilizados en la técnica anterior comprenden parámetros de predicción utilizados para predecir canales intermedios o de salida durante el procedimiento de mezcla ascendente.
Otros desarrollos en la codificación de audio han proporcionado medios para obtener una impresión de señal multicanal por medio de auriculares estéreo. Esto se hace comúnmente mezclando descendentemente una señal multicanal a estéreo usando la señal multicanal original y los llamados filtros HRTF (Funciones de Transferencia Relacionadas con la Cabeza). Se ha demostrado en la técnica anterior que el descodificador de audio multicanal paramétrico se puede combinar con un algoritmo binaural de mezcla descendente que hace posible interpretar una señal multicanal por medio de auriculares sin la necesidad de volver a crear la señal multicanal a partir de la señal transmitida de mezcla descendente, y posteriormente mezclarla nuevamente por medio de los filtros HRTF. Esto se logra combinando los filtros HRTF en cuatro filtros en función de la representación multicanal paramétrica. Como consecuencia, los cuatro filtros describen cómo una función de la representación multicanal paramétrica cómo la señal estéreo (dos canales) utilizada como entrada para la representación multicanal se combinará o mezclará para lograr las señales de salida binaurales o estéreo resultantes (dos canales). Por lo tanto, cada uno de los cuatro filtros se relaciona con una de las dos señales de entrada con respecto a las dos señales de salida. Sin embargo, los filtros HRTF pueden ser bastante largos para modelar bien las características de la sala y, por lo tanto, la complejidad de cálculo de filtrar los cuatro filtros HRTF en el dominio QMF puede volverse significativa.
El documento EP 1047047 A2 describe un procedimiento en el que una señal de entrada se transforma en frecuenciatiempo, posteriormente los coeficientes en el dominio de frecuencia se dividen en segmentos de coeficiente de aproximadamente 100 Hz de ancho para generar una secuencia de segmentos de coeficiente, y la secuencia de segmentos de coeficiente se divide en subbandas, cada una de las cuales consiste en segmentos de coeficientes plurales. Se determina un valor umbral en función de la intensidad de cada segmento de coeficiente en cada subbanda. La intensidad de cada segmento de coeficiente se compara con el valor umbral, y los segmentos de coeficiente se clasifican en grupos de baja y alta intensidad. Los segmentos de coeficiente se cuantifican para cada grupo, o se aplanan respectivamente y luego se cuantifican mediante recombinación. El método utiliza la secuencia de segmentos de coeficientes previamente divididos en subbandas, cada una con varios segmentos. El valor umbral se encuentra en función de la intensidad de cada segmento en cada subbanda. Esta intensidad se compara con el valor umbral y los segmentos clasificados en grupos de baja y alta intensidad. Los segmentos se cuantifican para cada grupo o se aplanan respectivamente y se cuantifican mediante recombinación. Las reivindicaciones independientes describen un método de descodificación, un aparato de codificación, un aparato de descodificación y un medio de grabación.
Resumen
De acuerdo con una realización de la presente invención, un compresor de filtro para generar respuestas a los impulsos del filtro de subbanda comprimida a partir de las respuestas a los impulsos del filtro de subbanda de entrada correspondientes a subbandas, que comprende valores de respuesta a los impulsos del filtro en derivaciones intermedias del filtro, comprende un procesador para examinar los valores de respuesta a los impulsos del filtro de al menos dos respuestas a los impulsos del filtro de subbanda de entrada para encontrar valores de respuesta a los impulsos del filtro que tengan los valores más altos, y al menos un valor de respuesta a los impulsos del filtro que tenga un valor inferior a los valores más altos, y un constructor de respuesta a los impulsos del filtro para construir las respuestas a los impulsos del filtro de subbanda comprimida usando los valores de respuesta a los impulsos del filtro que tengan los valores más altos, en donde las respuestas a los impulsos del filtro de subbanda comprimida no incluyen los valores de respuesta a los impulsos del filtro correspondiente a las derivaciones intermedias del filtro del al menos un valor de respuesta a los impulsos del filtro que tenga el valor más bajo o valores de valor cero correspondientes a las derivaciones intermedias del filtro del al menos un valor de respuesta a los impulsos del filtro que tenga el valor más bajo.
Una realización adicional de la presente invención se refiere a un método para fabricar respuestas a los impulsos de subbanda comprimida a partir de respuestas de filtro de subbanda de entrada correspondientes a subbandas, que comprenden valores de respuesta a los impulsos del filtro en derivaciones intermedias del filtro que comprende examinar los valores de respuesta a los impulsos del filtro de al menos dos respuestas a los impulsos del filtro de subbanda de entrada para encontrar valores de respuesta a los impulsos del filtro que tengan los valores más altos, y en al menos un valor de respuesta a los impulsos del filtro que tenga un valor inferior a los valores más altos y construir respuestas a los impulsos del filtro de subbanda comprimida utilizando los valores de respuesta a los impulsos del filtro que tengan los valores más altos, en donde las respuestas a los impulsos del filtro de subbanda comprimida no incluyen valores de respuesta a los impulsos del filtro correspondientes a las derivaciones intermedias del filtro del al menos un valor de respuesta a los impulsos del filtro que tenga el valor más bajo o valores de valor cero correspondientes a las derivaciones intermedias del filtro del al menos un valor de respuesta a los impulsos del filtro que tenga el valor más bajo.
Una realización de un medio de almacenamiento interpretable por ordenador comprende almacenada en él una pluralidad de conjuntos de respuestas a los impulsos del filtro de subbanda, aproximando cada conjunto de respuestas a los impulsos del filtro de subbanda juntas un filtro relacionado con la función de transferencia relacionada con la cabeza en el dominio en el tiempo, en el que una respuesta a los impulsos del filtro relacionada con la función de transferencia relacionada con la cabeza en el dominio en el tiempo es mayor que la suma de las longitudes de las respuestas a los impulsos del filtro de subbanda del conjunto respectivo de respuestas a los impulsos del filtro de subbanda, o en donde una respuesta a los impulsos del filtro relacionado con la función de transferencia relacionada con la cabeza en el dominio en el tiempo es mayor que la suma de las longitudes de los valores de respuesta a los impulsos del filtro de valor complejo de las respuestas a los impulsos del filtro de subbanda del conjunto respectivo de respuestas a los impulsos del filtro de subbanda, cuando los valores de respuesta a los impulsos del filtro son de valor complejo.
Algunas realizaciones de la presente invención pueden volverse favorables cuando se trata de equilibrar la eficiencia de cálculo por un lado y la calidad por el otro. Las realizaciones ofrecen ambos, una reducción significativa de la complejidad de cálculo por y una excelente aproximación de un filtro representado por las respuestas a los impulsos del filtro de subbanda de entrada. Examinar (que finalmente comprende seleccionar o determinar) y construir las respuestas a los impulsos del filtro de subbanda comprimida usando los valores de respuesta a los impulsos del filtro seleccionados (o determinados) pueden lograr tanto, la reducción de la complejidad de cálculo como la excelente aproximación en algunas realizaciones y/o aplicaciones, lo que puede conducir a una experiencia auditiva (casi) audiblemente indistinguible. En algunas realizaciones, esto se logra al encontrar, seleccionar o determinar los valores de respuesta a los impulsos del filtro de las respuestas a los impulsos del filtro de entrada que tengan los valores más altos, mientras que al menos un valor de respuesta a los impulsos del filtro no se selecciona o se determina, el que tenga un valor inferior a los valores más altos. Usando los valores de respuesta a los impulsos del filtro seleccionados o determinados o los valores de respuesta a los impulsos del filtro que tengan los valores más altos, se construye o fabrica una respuesta a los impulsos del filtro comprimida que tiene valores de respuesta a los impulsos del filtro comprimida. Dependiendo de la ejecución, el valor de respuesta a los impulsos del filtro no seleccionado o no determinado o el valor de respuesta a los impulsos del filtro que tenga un valor inferior a los valores superiores se fija a cero o no se tiene en cuenta. En otras palabras, los valores de respuesta a los impulsos del filtro pueden comprender un patrón de valores de respuesta a los impulsos del filtro no considerados, fijados a cero o de otro modo modificados.
Además, algunas realizaciones pueden ofrecer una amplia gama de reducciones alcanzables de complejidad de cálculo al influir en la selección de valores de respuesta a los impulsos del filtro en base a la cual se construyen las respuestas a los impulsos del filtro de subbanda comprimida. Como consecuencia, algunas realizaciones de la presente invención ofrecen una enorme flexibilidad para equilibrar la adaptación alcanzable de la complejidad de cálculo, por un lado, y la calidad de la aproximación, por otro lado.
Por lo tanto, algunas realizaciones de la presente invención pueden aplicarse especialmente en el campo del audio u otras aplicaciones que impliquen filtros que tengan una respuesta a los impulsos comparativamente larga (finita) en el dominio en el tiempo. Como se explicará más adelante, al convertir el filtro o elemento de filtro en el dominio en el tiempo en el dominio de subbanda (complejo), los cálculos se pueden realizar en paralelo ya que las respuestas a los impulsos de los filtros de subbanda individuales son significativamente más cortas en comparación con la respuesta a los impulsos del filtro el dominio en el tiempo.
Sin embargo, la complejidad de cálculo general no solo puede reducirse mediante una transición pura desde el dominio en el tiempo al dominio de subbanda (complejo) único. Por ejemplo, para filtros que tienen una, comparativamente larga respuesta a los impulsos, tales como los filtros HRTF, incluso los filtros de subbandas individuales generalmente tienen una larga respuesta a los impulsos finita, que es, aproximadamente hablando, del orden de la respuesta a los impulsos finita del filtro correspondiente en el dominio en el tiempo dividido por el número de subbandas individuales. Por lo tanto, dependiendo de la potencia de cálculo disponible en ciertas aplicaciones, la complejidad de cálculo general o incluso la complejidad de cálculo relacionada con un filtro de subbanda individual puede ser sustancial.
Además, o alternativamente, también se puede determinar por niveles la respuesta a los impulsos del filtro en una realización de un compresor de filtro. En tal caso, el compresor de filtro se puede adaptar de modo que al menos un valor de respuesta a los impulsos del filtro se pueda fijar a cero o se descarte, cuando el valor (por ejemplo, el valor absoluto) de la respuesta a los impulsos del filtro esté por debajo de un umbral. En algunos campos de aplicaciones, uno o más valores de respuesta a los impulsos del filtro pueden estar cerca de un nivel de alias de un banco de filtros correspondiente a la respuesta a los impulsos del filtro de subbanda de entrada. Cuando el valor del valor de respuesta a los impulsos del filtro esté cerca del nivel de alias de dicho banco de filtros correspondiente, se permite que se fijen a cero ciertas derivaciones intermedias para que los coeficientes del filtro correspondientes o los valores de respuesta a los impulsos del filtro se puedan fijar de forma segura a cero. Como consecuencia, no se requiere la realización de un filtro basándose en dicha respuesta a los impulsos del filtro comprimido para realizar una suma múltiple para coeficientes de valor cero o valores de respuesta a los impulsos.
En este contexto, un nivel de alias de un banco de filtros es una característica inherente de muchos bancos de filtros. Tal nivel de alias de un banco de filtros puede resultar de un procesamiento puramente de la señal, por ejemplo, en el marco de una aplicación SBR. Como cada valor de respuesta a los impulsos del filtro o derivación intermedia del filtro contribuye a la señal de salida, cuanto más pequeñas (por ejemplo, un valor absoluto de) sean las tabulaciones, más pequeña resultará la contribución de las derivaciones intermedias respectivas en términos de la salida del banco de filtros. Por lo tanto, puede suceder que las derivaciones intermedias pequeñas tengan una contribución tan pequeña a la salida del banco de filtros que su contribución estará en el rango o en el orden del nivel de alias del banco de filtros respectivo. En este caso, se puede tolerar una distorsión adicional introducida al fijar a cero las derivaciones intermedias correspondientes en muchos casos, ya que no introducirá distorsiones audibles adicionales. En muchos casos, los rangos típicos del nivel de alias están en el rango de y por debajo de -30 dB, -40 dB, -50 dB, -60 dB y -70 dB en comparación con una señal de pico.
Por ejemplo, en el caso de los filtros HRTF, después de convertir los filtros HRTF en el dominio en el tiempo a una representación compleja de QMF, algunos de los cuadros frecuencia-tiempo en la representación compleja de QMF pueden tener valores absolutos bajos (en el nivel de alias del banco de filtros envolvente MPEG). Estas entradas en la representación compleja QMF de los filtros HRTF pueden fijarse a cero. Esto permite una reducción de la complejidad para realizar filtros HRTF largos con respuesta de sala incluida en la representación compleja de QMF. Por lo tanto, para lograr una binauralización a complejidad reducida, al tiempo de mantener los efectos ambientales realistas, un convertidor de filtro puede ser seguido por un proceso de reducción de filtro en forma de una realización de un compresor de filtro. La etapa de reducción de filtro tiene como objetivo simplificar los filtros HRTF de modo que los filtros HRTF de subbanda comprendan al menos unos pocos o incluso un número sustancial de ceros. Dado que hay menos coeficientes activos, se puede lograr una reducción significativa en la complejidad de cálculo.
Por lo tanto, una realización de un compresor de filtro, un conjunto de respuestas a los impulsos del filtro de subbanda comprimida fabricado proporcionadas por una realización del método para fabricar el mismo y una realización de un medio de almacenamiento interpretable por ordenador que comprende una pluralidad de respuestas a los impulsos del filtro de subbanda comprimida pueden ser capaces de reducir significativamente la complejidad de cálculo individual para cada filtro de subbanda, así como la complejidad total de cálculo relativa a todos los filtros de subbandas implicados.
Breve descripción de los dibujos
La presente invención se describirá ahora a modo de ejemplos ilustrativos, sin limitar el alcance o espíritu de la invención, con referencia a los dibujos adjuntos, en los que:
La figura 1 ilustra una interacción de un convertidor de filtro y una realización de un compresor de acuerdo con la presente invención;
La figura 2 ilustra un escenario de caso de uso para la presente invención;
La figura 3 ilustra una realización del compresor de filtro de acuerdo con la presente invención;
La figura 4 ilustra una realización adicional del compresor de filtro de acuerdo con la presente invención;
La figura 5 ilustra una realización adicional del compresor de filtro de acuerdo con la presente invención que funciona en múltiples filtros simultáneamente;
La figura 6 ilustra una realización de la presente invención utilizada en el contexto del filtrado HRTF;
La figura 7 ilustra una posible solución para un filtro adaptable;
La figura 8 ilustra una posible solución para un componente clave de un convertidor de filtro;
La figura 9 ilustra una posible solución de un banco de filtros de análisis (complejo);
La figura 10 ilustra una posible solución de un banco de filtros de subbanda adaptable;
La figura 11 ilustra una primera solución posible de un banco de filtros de síntesis (complejo);
La figura 12 ilustra una primera solución posible de un banco de filtros de síntesis (complejo);
La figura 13 ilustra una realización adicional de un compresor de filtro según la presente invención;
Las figuras 14a a 14c ilustran un blanqueo espectral empleado en una realización de un compresor de filtro de acuerdo con la presente invención; y
La figura 15 ilustra una realización de un compresor de filtro de acuerdo con la presente invención funcionando en múltiples filtros simultáneamente.
Descripción detallada de realizaciones
Las realizaciones descritas a continuación son meramente ilustrativas para los principios de la presente invención para una eficaz representación del filtro. Se entiende que las modificaciones y variaciones de las disposiciones y detalles descritos en este documento serán evidentes para los expertos en la materia. Es la intención, por lo tanto, de estar limitado solo por el alcance de las inmediatas solicitudes de patente y no por los detalles específicos presentados a modo de descripción y explicación de las realizaciones en este documento.
Antes de describir la realización de la presente invención con más detalle, de los componentes adicionales y las aplicaciones de las realizaciones, debe tenerse en cuenta que los objetos, estructuras y componentes con las mismas o similares propiedades funcionales se denominan con los mismos signos de referencia. A menos que se indique explícitamente lo contrario, la descripción con respecto a objetos, estructuras y componentes con propiedades y características funcionales similares o iguales se pueden intercambiar entre sí. Además, en el siguiente resumen, se utilizarán signos de referencia para objetos, estructuras y componentes, que son idénticos o similares en una realización, o que aparecen en diferentes estructuras mostradas en una de las figuras, a menos que se describan las propiedades o características del objeto específico, la estructura del componente. El uso de signos de referencia resumidos permite una descripción más compacta y clara de las realizaciones de la presente invención y subraya la posibilidad de un intercambio de características y descripciones entre diferentes realizaciones.
Además, debe observarse que en las siguientes realizaciones mostradas en las figuras se describen igualmente las realizaciones correspondientes de los métodos. Por lo tanto, las realizaciones mostradas en las figuras no solo ilustran las realizaciones correspondientes de, por ejemplo, un compresor de filtro, sino que también representan un diagrama de flujo de las realizaciones correspondientes de los métodos correspondientes. Como se describe a continuación, dicha realización de un método puede realizarse en hardware o en software.
En la figura 1, se describe una realización de la presente invención junto con una posible aplicación. Para ser más precisos, la figura 1 muestra un convertidor de filtro 101 que está conectado a una realización de un compresor de filtro 102. El convertidor de filtro 101 se describirá con más detalle más adelante. Las realizaciones de un convertidor de filtro 101 se proporcionan con una señal de entrada que comprende información relativa a una respuesta a los impulsos finita h(n) de un filtro o de un elemento de filtro en el dominio en el tiempo. El índice n es en este contexto un entero que indica diferentes valores o muestras de la respuesta a los impulsos finita (FIR), en donde h(n) es un número de valor real.
La respuesta a los impulsos finita de un filtro en el dominio en el tiempo h(n) es una respuesta de un filtro o elemento de filtro en el dominio en el tiempo sobre una excitación en forma de un solo impulso que tiene una amplitud definida. En principio, el comportamiento completo del elemento de filtro en el dominio en el tiempo está comprendido en la respuesta a los impulsos finita del filtro. En el caso de un sistema digital, la respuesta a los impulsos del filtro puede determinarse o medirse aplicando una señal de entrada que tenga en un solo caso en el tiempo un valor diferente de cero. Este valor puede, por ejemplo, ser igual a 1.
El convertidor de filtro 101 es capaz de proporcionar un conjunto de respuestas a los impulsos finitas H(n,k) que se pueden usar en el marco de un filtro adaptable, como se describirá en el contexto de la figura 10. Cabe señalar que, en el caso de un convertidor de filtro complejo basado en un banco de filtros de análisis complejo, las respuestas a los impulsos finitas H(n,k) comprenden números de valores complejos, en donde n una vez más indica las muestras diferentes y k = 0,..., (L-1) indica la subbanda correspondiente a la que corresponde la respuesta a los impulsos finita del filtro de subbanda. Ambos, l y k son enteros. Además, el número de subbandas L también es un entero positivo. En el caso de los sistemas digitales, el número L de las subbandas proporcionadas por el convertidor de filtro 101 y luego utilizado para filtrar señales de entrada de audio digital, se elige a menudo como una potencia de 2, por ejemplo, 16, 32, 64, 128, 256, 512. En los siguientes ejemplos, el número de subbandas se elige para que L sea = 64. Sin embargo, como se señaló anteriormente, se puede emplear en principio cada entero positivo L como un número de subbandas en aplicaciones, componentes y realizaciones de un compresor de filtro.
Como se explicó, el filtro en el dominio en el tiempo h(n) se introduce en el convertidor de filtro 101 que produce un QMF complejo o representación de subbanda del filtro H(n,k). En este ejemplo en particular en el que se usa una subbanda q Mf L = 64, la representación compleja QMF del filtro, para un filtro en el dominio en el tiempo de longitud K que tiene una longitud de respuesta a los impulsos finita de una multiplicidad de L = 64, estará representada por L = 64 filtros complejos de longitud K/64+2.
El filtro H(n,k) se introduce posteriormente en el compresor de filtro 102, de acuerdo con la presente invención, que presenta H(n,k) como una respuesta a los impulsos del filtro de subbanda comprimida. La realización del compresor de filtro 102 genera un filtro H(n,k) que tiene un mayor número de coeficientes de valor cero que el filtro origina1 H(n,k) y, por lo tanto, permite una menor complejidad de cálculo.
Dependiendo de la realización y de la aplicación, el convertidor de filtro 101 y el compresor de filtro 102 están acoplados entre sí por medio de conexiones L, sobre cada una de las cuales se transmite una respuesta a los impulsos del filtro correspondiente a las diferentes subbandas (índice k = 0, ..., L-1 o k = 1..., L). Esta opción se indica en la figura 1 por la barra (/) que cruza la conexión del convertidor de filtro 101 y del compresor de filtro 102. Sin embargo, los dos componentes también pueden estar acoplados entre sí por un número menor de conexiones o incluso solo por una única conexión, a través de la cual se transmiten las señales o la información correspondiente. En aras de la simplicidad en las figuras y las realizaciones mostradas, se muestra donde corresponde una posible conexión en paralelo de los elementos que comprenden una conexión individual para cada subbanda. Sin embargo, cada vez que se transmiten señales o información sobre las subbandas, por ejemplo, como lo ilustran las variables que lo indican (por ejemplo, H(n,k)) se puede realizar cualquier conexión.
Como se explicará con más detalle más adelante en la realización del compresor de filtro 102 también se genera un conjunto o una pluralidad de respuestas a los impulsos del filtro para un número respectivo de filtros de subbanda comprendidos, por ejemplo, en un banco de filtros de subbanda. Tanto las respuestas a los impulsos del filtro de subbanda de entrada H(n,k) como las respuestas a los impulsos del filtro de subbanda comprimida H(n,k) son ambos números de valores complejos dispuestos en una matriz bidimensional que está etiquetada por lo relativo al tiempo n y lo relativo a la subbanda k como se explicó previamente.
Sin embargo, se describirán con más detalle más adelante diferentes realizaciones de un compresor de filtro 102. Además, la relación entre las respuestas a los impulsos del filtro de subbanda comprimida H(n,k) y las respuestas del filtro de subbanda de entrada H(n,k) también se explicarán para diferentes realizaciones de un compresor de filtro 102 más tarde. Es importante tener en cuenta que, en principio, los dos conjuntos respectivos de pluralidades de respuestas a los impulsos del filtro H(n,k) y H(n,k) pueden diferir en más formas que solo con respecto al número de coeficientes de valor cero, como será descrito brevemente.
En la figura 2, se describe un escenario en caso de uso general para la presente invención. Aquí el filtro en el dominio en el tiempo h(n), entra nuevamente al convertidor de filtro 101 que produce una representación QMF compleja del filtro H(n,k), el filtro QMF complejo H(n,k) entra en una realización de un compresor de filtro 102, que genera el filtro QMF complejo reducido o comprimido H(n,k) como se explicó anteriormente.
Aparte de un convertidor de filtro 101, que se proporciona con la respuesta a los impulsos de valor real de un filtro en el dominio en el tiempo h(n) y la realización de un compresor de filtro 102, que se explicaron en el contexto de la figura 1, el escenario en caso del uso mostrado en la figura 2 comprende además un banco de filtros de análisis QMF 203, que es también conocido como un banco de filtros de análisis complejo. El banco de filtros de análisis QMF 203 está alimentado con una señal de entrada x(n), que puede ser, por ejemplo, una señal de audio digital. El dominio del filtro de análisis QMF 203 proporciona en una salida una representación QMF compleja) X(n,k) de la señal de entrada x(n). Como se explicó en el contexto de la figura 1, los enteros n y k son relativos a la muestra o índice de tiempo y al índice de subbanda, respectivamente. Una posible solución para un banco de filtros de análisis QMF 203 se explicará con más detalle en el contexto de la figura 9.
La representación QMF compleja X(n,k) de la señal de entrada x(n) se proporciona posteriormente a una etapa de filtrado 201 que funciona en el dominio de subbanda. La etapa de filtrado o filtro de subbanda 201 es un banco de filtros de subbanda ajustable, que comprende una pluralidad de L filtros intermedios que están acoplados a la salida de la realización de un compresor de filtro 102. Por medio de la realización del compresor de filtro 102, los filtros intermedios del banco de filtros de subbanda 201 se alimentan con las respuestas a los impulsos del filtro de subbanda comprimida H(n,k) que se usó para filtrar la representación QMF (de valor complejo) X(n,k).
En principio, como también se explicará más adelante, la representación QMF compleja X(n,k) se puede filtrar calculando la convolución de la representación compleja QMF X(n,k) y la respuesta a los impulsos del filtro respectivo H(n,k) proporcionado por la realización del compresor de filtro 102 para cada subbanda identificada por el índice de subbanda k.
La señal de filtro proporcionada por el banco de filtros de subbanda 201 en el dominio QMF complejo se envía luego a un banco de filtros de síntesis QMF o banco de filtros de síntesis complejo, que finalmente sintetiza la señal de salida (valor real) y(n). Una posible solución para un banco de filtros de síntesis QMF 202 o un banco de filtros de síntesis complejo se describirá en el marco de las figuras 11 y 12.
En otras palabras, en paralelo al convertidor de filtro 101 y a la realización del compresor de filtro 102, como se muestra en la figura 1, la señal x(n) se introduce en un módulo de análisis de QMF 203 que genera X(n,k), es decir, una representación QMF compleja de la señal de entrada. La señal se filtra posteriormente 201 en el dominio QMF usando la salida del filtro QMF compleja por el compresor de filtro 102, y la señal filtrada finalmente se sintetiza en el dominio en el tiempo por el banco de filtros de síntesis QMF 202 que produce la señal de salida filtrada y(n).
En la figura 3 se da una vista más detallada de la realización del compresor de filtro 102. De nuevo el filtro en el dominio en el tiempo h(n) como la respuesta a los impulsos de entrada en el dominio en el tiempo se introduce en el convertidor de filtro 101. La respuesta a los impulsos en el dominio en el tiempo del filtro se muestra en 301. Como se explicó anteriormente, después del convertidor del filtro, el filtro en el dominio en el tiempo se transfiere al dominio de subbanda y se representa por H(n,k). Un gráfico de tiempo/frecuencia de valor absoluto de la respuesta del filtro viene dado por 302.
La realización del compresor de filtro 102 mostrado en la figura 3 comprende un módulo de representación en valor absoluto 303, que está conectado a la entrada de la realización del compresor de filtro 102. La realización del compresor de filtro 102 comprende además un generador de máscara 304, que está acoplado a una salida del módulo de representación en valor absoluto 303. Un calculador de filtro 305 también está comprendido en la realización del compresor de filtro 102, que está conectado a ambas, a la entrada de la realización del compresor de filtro 102 y a una salida del generador de máscara 304. El calculador de filtro 305 comprende una salida, que también representa una salida de la realización del compresor de filtro 102.
El filtro complejo QMF o el filtro de entrada de subbanda H(n,k) se introduce en la realización del compresor de filtro 102, que comprende el módulo de representación en valor absoluto 303, el generador de máscara de filtro 304 y el calculador de filtro 305. El módulo de representación en valor absoluto 303 crea un gráfico tiempo/frecuencia de valor absoluto de los filtros, como se ejemplifica en la figura parcial 302. Esto puede, por ejemplo, ser una representación logarítmica de los valores absolutos de los coeficientes del filtro en el dominio QMF, como se describirá más adelante. El generador de máscara de filtro 304, selecciona o determina en una realización los coeficientes (n,k) que tienen los valores más grandes en la representación en valor absoluto del filtro en el dominio QMF basándose en la información proporcionada por el módulo de representación en valor absoluto 302. El generador de máscara de filtro 304 determina o selecciona un número ajustable, programable, fijo o predeterminado de coeficientes que dependen de la magnitud de compresión del filtro que se desee. Un menor número de coeficientes de filtro seleccionados dan una mayor reducción de la complejidad. Se explicarán ejemplos y más detalles en el curso posterior de la aplicación. En muchos casos, en el marco de la presente descripción, las palabras determinar, seleccionar, decidir, fijar y encontrar pueden, por lo tanto, usarse como sinónimos. En muchos casos, los valores de respuesta a los impulsos del filtro que se determinan o seleccionan son tales valores de respuesta a los impulsos del filtro que tengan (o comprendan) valores más altos en comparación con los valores de respuesta a los impulsos del filtro que tienen valores más bajos que los valores más altos. Estos valores de respuesta a los impulsos del filtro de menor valor también se conocen como no seleccionados o no determinados.
Como se describió anteriormente, de manera alternativa o adicional, la reducción de la complejidad también se puede lograr basándose en examinar las derivaciones intermedias del filtro o los valores de respuesta a los impulsos del filtro en comparación con el denominado nivel de alias del banco de filtros correspondiente a la respuesta a los impulsos del filtro como se proporciona a una realización de un compresor de filtro. Si ciertas derivaciones intermedias de los valores de respuesta a los impulsos del filtro en el dominio QMF están cerca del nivel de alias del banco de filtros, estas derivaciones intermedias del filtro pueden fijarse de forma segura a cero o tratarse de otra manera para reducir la complejidad de cálculo. Estas derivaciones intermedias de filtro se pueden descartar de forma segura en el caso de que no se requiera incluir una realización de un filtro como coeficientes de valor cero en el marco de una suma múltiple en una realización de dicho filtro. Por ejemplo, después de convertir los filtros HRTF en el dominio en el tiempo a una representación QMF compleja, algunos de los gráficos frecuencia-tiempo en la representación QMF compleja pueden tener valores absolutos bajos en el nivel de alias del banco de filtros envolvente MPEG correspondiente. Estas entradas en la representación QMF compleja de los filtros HRTF pueden fijarse a cero, que permite una reducción de la complejidad para realizar los filtros HRTF largos con respuesta de sala incluida.
El generador de máscara de filtro crea, basándose en la información proporcionada por el módulo de representación en valor absoluto 302 una máscara de filtro M(n,k) y genera la máscara de filtro seleccionada M(n,k), indicando los coeficientes del filtro seleccionado de H(n,k) al calculador del filtro 305. El calculador del filtro 305 produce un nuevo filtro comprimido H(n,k) a partir del filtro original H(n,k) en el dominio QMF que comprende los coeficientes del filtro seleccionados. A continuación, se aportarán detalles adicionales sobre diferentes realizaciones relativas a la ejecución.
La figura 4 muestra una realización adicional de un compresor de filtro 102, que tiene la misma estructura básica que la realización del compresor de filtro 102 que se muestra en la figura 3. Para ser más precisos, la realización del compresor de filtro 102 que se muestra en la figura 4 también comprende un módulo de representación en valor absoluto 303 que, por un lado, está conectado a una entrada de la realización del compresor de filtro 102 y, por otro lado, a través de una salida del módulo de representación en valor absoluto 303 a un generador de máscara 304. La realización del compresor de filtro 102 en la figura 4 también comprende un calculador de filtro 305, que también está conectado a la entrada del compresor de filtro y a una salida del generador de máscara 304. Una salida del calculador de filtro 305 representa una vez más una salida de la realización del compresor de filtro 102 mostrado en la figura 4.
Sin embargo, comparada con la realización de un compresor de filtro 102 mostrado en la figura 3, el módulo de representación en valor absoluto 303, así como el calculador de filtro 305 se muestran con más detalle en el caso de la realización mostrada en la figura 4 y se explicará con más detalle junto con realizaciones alternativas o adicionales en las siguientes secciones de la presente solicitud de patente.
El módulo de representación en valor absoluto 303 comprende un módulo de función algorítmica de valor absoluto 401, que está conectado en serie con un módulo de blanqueo 402 entre la entrada y la salida del módulo de representación en valor absoluto 303. El módulo calculador de filtro 305 comprende un módulo diezmador de filtro 403, que está conectado en serie con un calculador de ganancia 404. Tanto el módulo diezmador de filtro 403 como el calculador de ganancia 404 están conectados en serie entre la entrada y la salida del módulo calculador de filtro 305. Dependiendo de la realización concreta, la información relativa a la máscara según lo provisto por el generador de máscara 304 se proporcionará al módulo diezmador de filtro 403 y opcionalmente también al módulo calculador de ganancia 404, como se indica en la figura 4. Sin embargo, dependiendo también de la realización concreta del módulo calculador de filtro 305, el módulo calculador de ganancia 404 puede proporcionarse opcionalmente con las respuestas a los impulsos del filtro de subbanda de entrada H(n,k), como se proporciona a la realización del compresor de filtro 102 a través de la conexión opcional entre el módulo calculador de ganancia 404 y la entrada del módulo calculador de filtro 305, como se indica por la línea discontinua en la figura 4.
Antes de describir los módulos individuales de las realizaciones del compresor de filtro 102 que se muestran en la figura 4 con más detalle, se dará una visión general de la funcionalidad de la realización del compresor de filtro 102 como se muestra en la figura 4.
En la figura 4 se describe la realización diferente del compresor de filtro 102 de acuerdo con la presente invención. Aquí el módulo de representación en valor absoluto 303 comprende los valores absolutos y la función logarítmica 401, y un módulo de blanqueo 402 que realiza un blanqueo espectral de la representación en valor absoluto suministrado por los valores absolutos y el módulo de función logarítmica 401. El generador de máscara de filtro 304 es el mismo que antes, y envía la máscara de filtro M(n,k) al módulo calculador de filtro 305. Este comprende el módulo diezmador de filtro 403 que mantiene los coeficientes seleccionados del filtro H(n,k) y fija a cero los otros coeficientes en esta realización, y el módulo calculador de ganancia 404, que ajusta la ganancia del filtro para que la ganancia del filtro comprimida H(n,k) sea la misma que la del filtro original H(n,k).
Comenzando con el módulo de representación en valor absoluto 303, el módulo de función algorítmica y valor absoluto 401 se alimenta con la respuesta a los impulsos del filtro de subbanda de entrada H(n,k) y calcula una representación de evaluación A(n,k) de las respuestas a los impulsos del filtro de subbanda de entrada H(n,k) en donde una vez más, n indica la muestra o índice dentro de una respuesta a los impulsos del filtro de subbanda individual, mientras que k=0,...,(L-1) representa el índice de las subbandas. La representación de evaluación A(n,k) calculada en la realización del compresor de filtro 102 por medio de la función logarítmica y valor absoluto 401 se lleva a cabo basándose en la siguiente ecuación
Figure imgf000008_0001
La representación de evaluación A(n,k) como se indica en la ecuación (1) refleja una distribución de volumen con respecto al oído humano sin tener en cuenta las características acústicas específicas del oído humano.
Sin embargo, también se pueden realizar diferentes representaciones de evaluación A(n,k) en el marco del módulo de representación en valor absoluto 303. Como ejemplo, en la realización mostrada en la figura 3, la representación de evaluación A(n,k) proporcionada por el módulo de representación en valor absoluto 303 al generador de máscara 304 puede, por ejemplo, basarse en la ecuación
Figure imgf000008_0002
en donde s es un número real distinto de cero y | .... | indica el valor absoluto de una expresión. En algunas realizaciones s es un número entero distinto de cero. Mientras que la representación de evaluación A(n,k) de acuerdo con la ecuación (1) se basa en una escala de decibelios basada en la energía, la representación de evaluación de acuerdo con la ecuación (2) corresponde a una energía en el caso del número entero s = 2. Sin embargo, también otros números enteros s, por ejemplo, s = 1 pueden emplearse para calcular la representación de evaluación A(n,k). Además, se pueden emplear otras formas de calcular la representación de evaluación, por ejemplo, realizando modelos psicoacústicos. Es importante tener en cuenta que en la realización mostrada en la figura 4, así como en la realización mostrada en la figura 3, el convertidor de filtro 101 crea, basándose en la respuesta a los impulsos en el dominio en el tiempo de valor real h(n) una respuesta a los impulsos del filtro de subbanda de entrada de valor complejo H(n,k) por razones matemáticas, para poder comparar diferentes valores de respuestas a los impulsos de las correspondientes respuestas a los impulsos del filtro de subbanda de entrada H(n,k), se recomienda aplicar una medida matemática a las respuestas del filtro de subbanda de entrada. En el caso de las realizaciones mostradas en las figuras 3 y 4 en relación con las ecuaciones (1), (2), esta medida matemática es el valor absoluto como se indica mediante | .... | . Sin embargo, en principio, se pueden aplicar también otras medidas matemáticas, tales como tomar la parte real, tomar la parte imaginaria, tomar el ángulo del número complejo correspondiente con respecto al sentido positivo de los números con valores reales en el plano de los números complejos. En otras palabras, aunque en el marco de las ecuaciones (1), (2) los valores complejos de las respuestas a los impulsos del filtro de subbanda de entrada H(n,k) se transfieren al conjunto de números con valor real calculando el valor absoluto, también otras medidas matemáticas como se explicó anteriormente pueden utilizarse dependiendo de los requisitos de realización concretos.
La figura parcial 302 en la figura 3 que representa esquemáticamente la representación de evaluación A(n,k) puede ser entendida como un diagrama tridimensional de la representación de evaluación A(n,k) como una función de los dos índices k, n en el plano que se muestra en la figura 3, mientras que los valores de representación de evaluación A(n,k) se trazan perpendicularmente al plano n-k de la figura parcial 302. En otras palabras, la figura parcial 302 muestra una representación esquemática de la representación de evaluación de la representación tiempo-frecuencia de valor absoluto del filtro A(n,k) como una función del índice de muestra o índice de tiempo n y el índice de subbanda k. El índice de tiempo o el índice de muestra n pueden diferir del índice n de la respuesta a los impulsos en el dominio en el tiempo h(n), por ejemplo, por un factor de L (número de subbandas). Como se explicará en el contexto de las figuras 9, 11 y 12, el convertidor de filtro 101 puede comprender un banco de filtros de análisis de modulación compleja, que a su vez puede comprender uno o más muestreadores descendentes, que reducen el número de muestras en un factor, que puede ser, por ejemplo, el número de subbandas L. Sin embargo, como estos muestreadores descendentes son componentes opcionales, el índice n puede referirse a un índice de tiempo o índice de muestra comparable al índice n de la respuesta a los impulsos en el dominio en el tiempo H(n), o puede corresponder a un índice de tiempo reducido o un índice de muestra diferente del índice de tiempo o índice de muestra n de la respuesta a los impulsos en el dominio en el tiempo H(n), por ejemplo, por un factor de L.
A continuación, se detallarán más detalles sobre el módulo de blanqueo 402. El propósito del módulo de blanqueo enseñado por la presente invención es permitir una ponderación perceptiva de los filtros antes de la generación de máscara para evitar la situación en la que se descarten las derivaciones intermedias del filtro perceptivamente importantes, porque tengan un valor absoluto pequeño, a favor de otras derivaciones intermedias de filtro perceptualmente menos importantes.
En una realización de la presente invención, la representación en valor absoluto proporcionada por 401 en el dominio logarítmico viene dada por
Figure imgf000009_0001
como se mostró en la ecuación (1) en el caso de la realización mostrada en la figura 4. En la realización de la figura 4, el módulo de blanqueo 402 comienza dividiendo la frecuencia en P intervalos perceptualmente relevantes de subbandas con puntos finales ko, k i ,...,kp,
I(p) = {kP,..... kp+i— 1} (3)
en donde P, Ko,..„.Kp son enteros no negativos, mientras que P es un entero positivo.
Para cada p = 0, 1,..., (P-1), la representación en valor absoluto blanqueada o la representación de evaluación Aw(n,k) se puede definir restando el coeficiente de filtro máximo en el intervalo correspondiente, de acuerdo con
Aw(n,k) = A(n,k) maxid(p) maxn A(n,l), k £ I(p) (4)
en donde Aw(n,k) es la representación de evaluación blanqueada generada por el módulo de blanqueo 402. En este contexto, debe observarse que el blanqueo y la ponderación pueden usarse como sinónimos en el marco de la presente solicitud.
Aunque el blanqueo espectral se explicará con más detalle en el contexto de la figura 14, y especialmente a la vista del blanqueo como se describe por medio de la ecuación (4), debe tenerse en cuenta que el blanqueo (espectral) se basa en el hallazgo de que puede ser aconsejable transferir energía de las partes espectrales a diferentes partes espectrales para prevenir o minimizar la distorsión creada en el curso de la compresión de filtro.
Los filtros y los sistemas de audio en la vida real a menudo tienen una distribución tiempo/frecuencia distribuida de manera desigual, lo que puede dar como resultado que las respuestas a los impulsos del filtro en el dominio de la subbanda tengan longitudes significativamente mayores comparando subbandas situadas en frecuencias más bajas que las subbandas situadas en frecuencias más altas. Además, las distribuciones desiguales de amplitud/frecuencia de filtros y sistemas de audio en la vida real también pueden conducir a diferentes relevancias de los filtros de subbandas individuales entre sí. En otras palabras, por ejemplo, debido a una mayor amortiguación de los filtros y los sistemas de audio en la vida real los filtros de subbanda a frecuencias más altas correspondientes a frecuencias más altas pueden ser menos importantes en comparación con los filtros de subbanda correspondientes a frecuencias más bajas. Sin embargo, para evitar o al menos minimizar los efectos que puede tener una compresión de filtro en los filtros de subbanda de mayor frecuencia, el blanqueo (espectral) se puede realizar favorablemente para evitar en el escenario descrito anteriormente, que los filtros de subbanda a frecuencias más altas se supriman por completo en el curso de la compresión, lo que conduce a graves distorsiones de la experiencia auditiva. Por lo tanto, el blanqueo (espectral), también conocido como ponderación, puede ser un punto crucial para los filtros y sistemas de audio de la vida real.
El módulo de blanqueo 402 tal como está comprendido en el módulo de representación en valor absoluto 303 en la realización mostrada en la figura 4, aplica, por lo tanto, un blanqueo espectral en el que se emplea un efecto de normalización dividiendo el rango de frecuencia global en bandas de frecuencia. Como se explicará con más detalle en el contexto de un banco de filtros de análisis modulado complejo, cada subbanda corresponde a un rango de frecuencia específico con una frecuencia central específica. Como consecuencia, las subbandas se pueden organizar de acuerdo con las frecuencias centrales. En una elección natural, el índice de subbanda k corresponde en orden creciente a las frecuencias centrales en orden creciente.
Para realizar el blanqueo espectral en forma de efecto de normalización con respecto a las mencionadas bandas de frecuencia, se forman intervalos perceptualmente relevantes de subbandas o subgrupos de subbandas, que comprenden al menos una subbanda cada uno. Además, en muchas realizaciones concretas, una subbanda individual pertenece exactamente a un subgrupo en su conjunto. Sin embargo, cada subgrupo de subbandas puede comprender más de una subbanda. En este caso, normalmente un subgrupo solo comprende subbandas con frecuencias centrales vecinas.
En otras palabras, si las subbandas están ordenadas de acuerdo con sus frecuencias centrales en un orden creciente y al mismo tiempo de acuerdo con un índice de subbanda creciente k, un subgrupo que solo comprende subbandas con frecuencias vecinas se relaciona con subbandas con índices de subbanda k, que pueden organizarse de modo que una diferencia máxima entre dos índices de subbanda dispuestos sea igual a /-1 como se explica en el contexto de la ecuación (3). En otras palabras, cada banda de frecuencia puede ser representada por un subgrupo o un intervalo de subbandas, que es un superconjunto de las subbandas. Sin embargo, debe tenerse en cuenta que un subgrupo de subbandas también puede comprender exactamente una subbanda.
Como se mencionó anteriormente, en el marco del blanqueo espectral, se distinguen un número específico P de bandas de frecuencia, subgrupos o intervalos de subbandas. Mientras que, en principio, el número de subgrupos de subbandas p es un número entero, que es menor que el número de subbandas L debido a la restricción de que cada subgrupo comprende al menos una subbanda y cada subbanda pertenece exactamente a un subgrupo de subbandas. En el caso de un sistema de filtro que funciona en L = 64 subbandas, se puede elegir que sea 28 el número P típico de subgrupos de subbandas. Sin embargo, este número no es limitativo como se explicó anteriormente. El número correspondiente de subgrupos de subbandas P (por ejemplo, P = 32) se puede elegir en función de un modelo acústico que represente intervalos perceptualmente relevantes en el dominio de frecuencia.
Por lo tanto, el blanqueo conduce en muchos filtros y sistemas de audio de la vida real a una transferencia de energía de las partes espectrales inferiores a las partes espectrales superiores, opcionalmente en función de las características de percepción del oído humano con respecto a los modelos psicoacústicos.
Sin embargo, también se pueden acometer fácilmente diferentes realizaciones del módulo de blanqueo 402 en el marco de la representación en valor absoluto 303. Para ser más precisos, las realizaciones alternativas comprenden las posibilidades de blanquear individualmente las representaciones de evaluación A(n,k) para cada subbanda con índice k en lugar de realizar el blanqueo basándose en todas las subbandas comprendidas en el subgrupo respectivo de subbandas de acuerdo con la ecuación (4). Además, en lugar de restar el valor máximo como se muestra en la ecuación (4), se puede realizar un blanqueo dividiendo todos los valores de la representación de evaluación A(n,k) y normalizando así todos los valores de la representación de evaluación con respecto al máximo de cada subbanda o con respecto al valor máximo de cada subgrupo de subbandas. Además, la normalización descrita dividiendo la representación de evaluación también puede ser llevada a cabo de manera que la suma de todos los valores de la representación de evaluación respectiva A(n,k) (ya sea con respecto a cada subbanda individual o con respecto a cada subgrupo de subbandas). En este caso, en la primera etapa se determinará la suma de todos los valores de la representación de evaluación con respecto a la subbanda respectiva o al subgrupo respectivo de subbandas, a la cual a continuación se le resta de acuerdo con la ecuación (4) o se dividen los valores de la representación de evaluación con el valor suma respectivo.
Para resumir, en la realización descrita anteriormente, tanto el examen como la selección se basan en el valor absoluto de los valores de respuesta a los impulsos del filtro en las derivaciones intermedias del filtro. Por lo tanto, en esta realización, los valores de respuesta a los impulsos del filtro se seleccionan o no según una comparación relativa a los valores absolutos de las derivaciones intermedias del filtro al seleccionar al menos uno que comprenda un valor más alto. En diferentes realizaciones, la comparación o el examen de las derivaciones intermedias del filtro pueden basarse en la aplicación de otras medidas matemáticas, si es necesario. Si las derivaciones intermedias del filtro tienen un valor real, en principio no se requiere la aplicación de una medida matemática, sin embargo, se puede realizar el cálculo o la determinación del valor absoluto.
En el caso de las derivaciones intermedias del filtro de valor complejo, puede ser aconsejable aplicar alguna medida matemática. Los ejemplos pueden ser derivar los valores absolutos o derivar los ángulos o fases de las derivaciones intermedias del filtro con respecto a una dirección predeterminada o bien definida en el plano de los números complejos (por ejemplo, la dirección de los números reales positivos). Además, determinar la parte real, el valor absoluto de la parte real, la parte imaginaria, el valor absoluto de la parte imaginaria o cualquier otra función que mapee los números complejos respectivos en números reales (opcionalmente positivos) puede en principio ser aplicado.
En la realización mostrada en la figura 4, la representación de evaluación de blanqueo Aw(n,k) como generada por el módulo de blanqueo 402 se lleva al generador de máscara 304, que crea una máscara de filtro o máscara M(k) basada en la representación de evaluación de blanqueo. Debido al hecho de que el módulo de blanqueo 402 en la representación de evaluación, el generador de máscara 304 ahora es capaz de seleccionar los coeficientes de filtro más relevantes (perceptualmente). La máscara de filtro es, en la realización mostrada en la figura 4, un conjunto de ceros y unos, en donde M(n,k) = 1 indica que la correspondiente derivación intermedia del filtro o el valor de respuesta a los impulsos del filtro se selecciona para ser usada o mantenida. En consecuencia, el valor M(n,k) = 0 indica que la correspondiente derivación intermedia del filtro o el valor de respuesta a los impulsos del filtro identificado por el índice de muestra o índice de tiempo n y el índice de subbanda k no se ha seleccionado y por lo tanto no se utilizará. En otras palabras, el valor específico de respuesta a los impulsos del filtro no se tendrá en cuenta o se fijará a cero.
La realización concreta de un generador de máscara 304 puede diferir sustancialmente de una realización a la siguiente realización de un compresor de filtro 102. En la realización mostrada en la figura 4, el generador de máscara puede, por ejemplo, elegir un número específico de valores de respuesta a los impulsos, basándose en la representación de evaluación de blanqueo Aw(n,k) estableciendo los valores correspondientes de la máscara de filtro M(n,k) = 1, mientras que los valores restantes en la máscara de filtro se fijan a 0. Además de elegir un número absoluto específico de valores de respuesta a los impulsos, también es posible un número relativo con respecto al número total de valores de respuesta a los impulsos dados por el conjunto de respuestas del filtro de subbanda H(n,k). En un ejemplo concreto en el caso de una realización de subbanda QMF L = 64 en la que cada respuesta a los impulsos del filtro de subbanda de entrada comprende 16 derivaciones intermedias de filtro distintas de cero, que no desaparecen o que no son triviales, la matriz global de las respuestas del filtro de subbanda de entrada está dada por una matriz 64 • 16 que contiene 1024 valores de respuesta a los impulsos. En este ejemplo, el generador de máscara 304 puede, por ejemplo, elegir un número predeterminado específico de los valores de respuesta a los impulsos (por ejemplo, 256 elementos de acuerdo con los valores absolutos máximos proporcionados por la representación de evaluación de blanqueo) o el generador de máscara 304 puede seleccionar una relación predeterminada o específica (número relativo) de las respuestas a los impulsos del filtro con respecto al número total de respuestas a los impulsos del filtro (por ejemplo, 25% del número total de valores de respuesta del filtro). En ambos casos, el resto de los valores de respuesta a los impulsos se ignorarán o no se seleccionarán fijando a cero los valores correspondientes de la máscara de filtro M(n,k) (M(n,k) = 0).
En una realización adicional de un compresor de filtro 102, el generador de máscara 304 puede adaptarse para recibir una señal indicativa del número absoluto de valores de respuesta a los impulsos a seleccionar o indicativo de la relación de valores de respuesta a los impulsos con respecto al número total de valores de respuesta a los impulsos. En tal realización de un compresor de filtro 102, la relación de compresión se puede ajustar ajustando las cifras previamente mencionadas.
Además, el generador de máscara 304 puede estar alternativa o adicionalmente, adaptado para seleccionar los valores de respuesta a los impulsos del filtro respectivos basándose en diferentes criterios. Como ejemplo, el generador de máscara 304 puede adaptarse para seleccionar un número de valores de respuesta a los impulsos predeterminado, fijo, programable o adaptable por subbanda (por ejemplo, los 3 valores de respuesta a los impulsos que tengan los valores máximos con respecto a la representación de evaluación para cada subbanda). Además, el generador de máscara 304 puede adaptarse de manera que se cumpla un criterio de umbral, de modo que, por ejemplo, se seleccionen todos los valores de respuesta a los impulsos, cuyos valores de representación de evaluación correspondientes sean mayores que un valor de umbral predeterminado, fijo, ajustable o programable. En una realización adicional, puede ser aconsejable adaptar el generador de máscara 304 de modo que sea capaz de seleccionar los valores de respuesta a los impulsos, basándose en una comparación del valor respectivo, con sus valores de respuesta a los impulsos vecinos. Como ejemplo, el generador de máscara 304 puede adaptarse de modo que no se seleccione un valor de respuesta a los impulsos del filtro si el valor respectivo es a la vista de la representación de evaluación (opcionalmente blanqueada) menor que una relación fija, predeterminada, programable o ajustable en comparación con los valores vecinos (por ejemplo, menor del 25%). Sin embargo, también se pueden realizar otros esquemas de selección.
Sin embargo, debido al blanqueo, como se describe en el contexto de la ecuación (4), basado en cada subgrupo de subbandas, o en cada subbanda individual, se selecciona al menos un valor de respuesta a los impulsos en cada subgrupo de subbandas o en cada subbanda, dependiendo de la realización concreta, aunque el número de los valores de respuesta a los impulsos seleccionado pueda diferir sustancialmente de una subbanda a la siguiente subbanda, o de un subgrupo al siguiente subgrupo. En el caso del blanqueo realizado dividiendo la representación de evaluación A(n,k) por, por ejemplo, el valor máximo del subconjunto correspondiente de valores de representación de evaluación, en la realización descrita anteriormente del generador de máscara 304, al menos un valor de respuesta a los impulsos del filtro se selecciona en cada subbanda o en cada subgrupo de subbandas, como se explicará en el contexto de la figura 14.
Como consecuencia, la interacción del módulo de representación en valor absoluto 303 y del generador de máscara 304 conducirá a una concentración en las áreas importantes de los valores de respuesta a los impulsos del filtro en el plano n-k (véase la figura parcial 302 en la figura 3), y una "compresión" de "vacío" o "aire" entre áreas perceptivamente relevantes del plano n-k. Los valores relevantes de la respuesta a los impulsos serán ignorados fijando la máscara M(n,k) en consecuencia.
El módulo calculador de filtro o constructor de respuesta a los impulsos del filtro, también denominado módulo calculador de filtro 305, comprende en la realización mostrada en la figura 4 como un elemento, un diezmador de filtro 403, que fija todas las derivaciones intermedias de filtro no seleccionadas o los valores de respuesta a los impulsos del filtro a cero, como lo indica la máscara de filtro M(n,k). El diezmador 403 genera en este caso una matriz enmascarada de respuestas a los impulsos del filtro de subbanda HM(n,k), que es igual al elemento de matriz correspondiente de las respuestas a los impulsos del filtro de subbanda H(n,k), si el valor de máscara de filtro correspondiente M(n,k) es igual a 1. Si, la máscara de filtro de un valor de respuesta a los impulsos del filtro correspondiente M(n,k) se fija a 0, la matriz enmascarada de respuestas a los impulsos del filtro de subbanda HM(n,k), se fija a 0. En otras palabras, la máscara M(n,k) del generador de máscara 304 se aplica al diezmador de filtro 403 para formar un filtro diezmado.
Figure imgf000012_0001
En esta realización, la máscara consiste en entradas que son cero o uno. Las entradas con ceros describen qué coeficientes de filtro deben descartarse y las entradas con unos describen qué coeficientes de filtro deben mantenerse (seleccionados).
A continuación, se describen más detalles sobre el módulo calculador de ganancia 404 comprendido en el módulo calculador de filtro o más bien en el constructor de respuestas a los impulsos del filtro 305. El propósito del módulo calculador de ganancia 404 enseñado por la presente invención es reajustar la ganancia de potencia de los filtros diezmados de modo que el filtro comprimido ajustado de ganancia final tenga la misma característica espectral principal que el filtro original. Como la ganancia de potencia del filtro diezmado es menor que la del filtro original, se calcula una ganancia de compensación en el módulo calculador de ganancia 304 para cada subbanda. En una realización de la presente invención, esta ganancia viene definida por
Figure imgf000012_0002
en donde min {...} se refiere al mínimo, Gmax, es una ganancia máxima, y es un número pequeño (positivo), normalmente significativamente más pequeño que el segundo sumando del denominador de la ecuación (6).
Esta ganancia se aplica al filtro diezmado para obtener el filtro comprimido final
H(n,k) = G(k) Hm (n,k). (7)
En otra realización diferente de la presente invención, se calcula una ganancia solo para cada intervalo perceptualmente relevante de subbandas (subgrupo de subbandas),
Figure imgf000012_0003
y se aplica la misma ganancia en cada intervalo o subgrupo,
H(n,k) = G(p) Hm (n, k), k € 1 (p), p = 0,1, ..., P — 1, (9)
En ambos casos, Gmax es un límite superior en la compensación de ganancia y es un pequeño número positivo incluido para evitar la división por cero. Ambos, Gmax y □□ son por lo tanto números, que son útiles en una realización numérica del calculador de ganancia 404 para evitar una división por cero (es decir, □ > 0) y limitar la ganancia aplicada por el módulo calculador de ganancia 404 a una subbanda al valor definido por la ganancia máxima Gmax, debido al mínimo de los dos términos entre paréntesis en las ecuaciones (6), (8), las ganancias respectivas G(k) y G(p) están limitadas al valor de G max.
En otras palabras, ajustar la ganancia en cada una de las bandas de frecuencia P o más bien en subgrupos de subbandas mantiene la energía de la señal filtrada por el filtro de subbanda respectivo en una muy buena constante de aproximación, al comparar las respuestas a los impulsos del filtro de subbanda enmascarado y no enmascarado HM(n,k) y H(n,k). Las energías de las señales filtradas con los filtros respectivos en función de las respuestas a los impulsos del filtro son en ambos casos proporcionales a la suma de los cuadrados de los valores absolutos de los respectivos valores de respuesta a los impulsos del filtro de la subbanda, como lo indican las expresiones
Ecc Y ¡H (n , k f (10a)
y
E X ^ \ H M( n , k f (10b)
para los valores de respuesta a los impulsos del filtro de subbanda de entrada enmascarado y original. Como se puede verificar fácilmente, las ganancias G(k) y G(p) en las ecuaciones (6), (8), se basan en una comparación de las dos energías como se refleja en las ecuaciones (10a) y (10b), donde el sumando adicional □□ solo se ha introducido en las ecuaciones (6), (8), para evitar en una realización concreta una división por cero.
Por lo tanto, un módulo calculador de ganancia 404 normaliza las derivaciones intermedias enmascaradas del filtro HM(n,k) con respecto a la energía para compensar la energía perdida en el curso del enmascaramiento de al menos parte de las respuestas de entrada de la subbanda de entrada. En otras palabras, debido al enmascaramiento en el marco del filtro diezmador 403, una señal filtrada con una respuesta de entrada del filtro de subbanda correspondiente a las respuestas a los impulsos del filtro de subbanda enmascarado HM(n,k) tendrá una energía menor en comparación con un filtro de subbanda que emplee las respuestas a los impulsos del filtro de subbanda H(n,k).
Sin embargo, en el módulo calculador de ganancia 404 también se puede adaptar para aplicar un esquema de ganancia diferente, como, por ejemplo, no se puede emplear tanto la energía sino una comparación directa de los valores absolutos de las respuestas a los impulsos del filtro de subbanda para determinar un factor de ganancia. Además, o alternativamente, el factor de ganancia G también se puede determinar, en función del número total de valores de respuesta a los impulsos del filtro de subbandas, en lugar de los valores de respuesta a los impulsos de una subbanda individual o un subgrupo individual de subbandas, como se explica en el contexto de las ecuaciones (6) y (8). Además, debe tenerse en cuenta que un módulo calculador de ganancia 404 no es un componente necesario, sino más bien un componente opcional.
El constructor de respuesta a los impulsos del filtro o el módulo calculador de filtro 305 pueden en otras realizaciones de la presente invención, ser capaces de construir las respuestas a los impulsos del filtro de subbanda comprimida, no solo fijando a cero los valores de respuesta a los impulsos del filtro de subbanda no seleccionados como se explicó anteriormente. Dependiente de la realización concreta, el constructor de respuesta a los impulsos del filtro 305 puede lograr esto, por ejemplo, ponderando, copiando o derivando los valores de respuesta a los impulsos del filtro de subbanda seleccionados o determinados apropiados para construir las respuestas a los impulsos del filtro de subbanda comprimida.
En este contexto, debe tenerse en cuenta que incluso descartando o no incluyendo no determinados o no seleccionados valores de respuesta a los impulsos del filtro no conducen a una compresión del filtro en el tiempo. En el marco de la presente descripción, descuidar, ignorar o no usar valores de respuesta a los impulsos del filtro no seleccionados o no determinados no conduce a un cambio significativo del orden de los sumandos individuales de la expresión polinómica de la correspondiente expresión polinómica (banco de filtros QMF) aparte de las puras modificaciones a los coeficientes de los operadores de retardo z-1. En otras palabras, descartar, despreciar, fijar a cero o de lo contrario no seguir con respecto a una derivación de filtro o un valor de respuesta a los impulsos del filtro no conduce a una nueva distribución de derivaciones intermedias del filtro con respecto a la potencia de los operadores de retardo z-1. Un valor de respuesta a los impulsos del filtro o una derivación intermedia de filtro después de un valor de respuesta a los impulsos del filtro no seleccionado o no determinado, que se selecciona o se determina, no se verá alterado en términos de la potencia de los operadores de retardo.
En otras palabras, las respuestas a los impulsos del filtro de subbanda comprimida, tal como las construye el constructor de respuesta a los impulsos del filtro 305, pueden comprender valores de valor cero correspondientes a las derivaciones intermedias del filtro de valores de respuesta a los impulsos del filtro no seleccionados o las respuestas a los impulsos del filtro de subbanda comprimida pueden no incluir los respectivos valores de respuesta a los impulsos del filtro no seleccionados en absoluto. En otras palabras, el constructor de respuesta a los impulsos del filtro 305 puede, por ejemplo, ser capaz de construir una respuesta a los impulsos del filtro de subbanda comprimida que tenga en principio el mismo número de valores de respuesta a los impulsos del filtro de subbanda que las respuestas a los impulsos del filtro de subbanda de entrada, pero con un mayor número de valores de valor cero o las respuestas a los impulsos del filtro de subbanda comprimida pueden tener una longitud total más corta, ya que el constructor de respuesta a los impulsos del filtro 305 solo copia los valores seleccionados y no tiene en cuenta los valores no seleccionados.
Como los valores de respuesta a los impulsos del filtro de valor real conducen a una reducción de complejidad significativa en comparación con los valores de respuesta a los impulsos del filtro de valor complejo, el constructor de respuesta a los impulsos del filtro 305 también puede generar ventajosamente los valores absolutos de algunos de los valores de respuesta a los impulsos del filtro seleccionados. Este modo de funcionamiento es particularmente atractivo en subbandas correspondientes a frecuencias más altas donde la audición humana es menos sensible a las relaciones de fase.
Como consecuencia, los valores de respuesta a los impulsos de subbanda de las subbandas correspondientes a las frecuencias centrales por encima de una frecuencia límite pueden ser opcionalmente reemplazados por un valor absoluto, una parte imaginaria, una parte real, una fase, una combinación lineal, una combinación polinómica o una expresión de valor real de al menos uno de los elementos antes mencionados. La parte imaginaria de un valor complejo también se considera un número de valor real en el marco de la presente descripción. Dependiendo de la realización concreta, la frecuencia límite puede estar en el rango de 1 kHz a 10 kHz, mientras que en muchas aplicaciones se puede utilizar una realización de una frecuencia límite en el rango de entre 1 kHz a 5 kHz o de 1 a 3 kHz considerando una típica audición característica de un ser humano. Además, dependiendo de la realización concreta de un compresor de filtro, el reemplazo descrito de una respuesta a los impulsos del filtro de valor complejo por un valor de valor real basándose en el valor de respuesta a los impulsos del filtro de valor complejo puede realizarse dependiendo del valor de respuesta a los impulsos del filtro seleccionado o determinado o no seleccionado o no determinado. Alternativa o adicionalmente, los valores de respuesta a los impulsos del filtro que pertenecen a subbandas correspondientes a frecuencias centrales por encima de la frecuencia de borde generalmente pueden reemplazarse por los valores de valor real correspondientes basándose en los valores de respuesta a los impulsos del filtro de valor complejo. En este contexto, debe tenerse en cuenta que el uso de valores de respuesta a los impulsos del filtro determinados o seleccionados también comprende el uso de valores (por ejemplo, valores reales) basados en dichos valores de respuesta a los impulsos del filtro para reemplazar los valores de respuesta a los impulsos del filtro correspondientes.
La figura 5 muestra realizaciones adicionales de un compresor de filtro 501, de acuerdo con la presente invención que funciona en múltiples filtros simultáneamente. En la figura 5 se describe una realización diferente. Aquí se múltiples filtros (Nfiltros, indicados por v = 0, ..., (N-1), siendo N un entero positivo, son la entrada a la realización del compresor de filtro 501, en donde cada filtro se lleva a un módulo de representación valor absoluto individual 303 y las N representaciones de N se llevan a un generador de máscara de filtro 502.
Para ser más precisos, la realización de un compresor de filtro 501 que se muestra en la figura 5 está conectada o acoplada a un conjunto de N convertidores de filtro 101 a los que se suministra un conjunto de respuestas a los impulsos en el dominio en el tiempo real H(n,k) a, en donde, como se explicó anteriormente, v = 0, ..., (N-1) es el índice del filtro correspondiente en el dominio en el tiempo. Como ejemplo, en el caso de una señal de entrada de cinco canales en el marco de un sistema tipo HRTF, para cada uno de los cinco canales de entrada y para cada uno de los dos canales de auriculares (izquierdo y derecho), se emplea un filtro en el dominio en el tiempo individual que conduce a un número total de N = 10 filtros en el dominio en el tiempo.
En otras palabras, el compresor de filtro 501 que se muestra en la figura 5 está provisto de una pluralidad de conjuntos de respuestas a los impulsos, en las que cada conjunto de respuestas a los impulsos del filtro de la pluralidad de conjuntos es suministrado por un convertidor de filtro diferente 101 en el caso ilustrado en la figura 5. Sin embargo, con respecto a un conjunto de respuestas a los impulsos del filtro suministradas por un convertidor de filtro individual 101, el conjunto de respuestas a los impulsos del filtro comprende L respuestas a los impulsos del filtro individuales, cada una con un número específico de derivaciones intermedias del filtro o valores de respuesta a los impulsos del filtro. Como se explicó anteriormente en el contexto de las frecuencias centrales, cada respuesta a los impulsos del filtro correspondiente a una subbanda individual está asociada a una frecuencia central, por lo que las frecuencias centrales forman una pluralidad de frecuencias centrales.
Las respuestas a los impulsos del filtro correspondientes al mismo índice de subbanda k, pero pertenecientes a diferentes conjuntos de respuestas a los impulsos del filtro como se indica por el índice v, también corresponden a la misma frecuencia central. En otras palabras, a cada frecuencia central de la pluralidad de frecuencias centrales (como se define por un conjunto de respuestas a los impulsos del filtro) corresponde (exactamente) una respuesta a los impulsos del filtro en cada uno de los conjuntos de respuestas a los impulsos del filtro, al menos antes de la compresión.
Cada uno de los convertidores de filtro 101 suministra a cada uno de los filtros en el dominio en el tiempo un conjunto de respuestas a los impulsos del filtro de subbanda de valor complejo H(n,k), las cuales, se suministran a la realización del compresor de filtro 501 mostrado en la figura 5. Cada una de las respuestas a los impulsos del filtro de subbanda para los N filtros en el dominio en el tiempo diferentes se suministra a un módulo de representación en valor absoluto individual 303, que proporciona una representación en valor absoluto o una representación de evaluación para cada uno de los N filtros en el dominio en el tiempo al generador de máscara de filtro 502. Los módulos de representación en valor absoluto 303 pueden derivarse de uno de las otras realizaciones de un compresor de filtro de la invención descrito en la presente solicitud como se indica por el mismo signo de referencia.
A continuación, se describen más detalles sobre el generador de máscara de filtro 502 para múltiples filtros. Dado el valor absoluto de la representación de N filtros
Figure imgf000015_0001
Como lo proporcionan los N módulos de representación en valor absoluto 303, una realización del generador de máscara de filtro 502 para múltiples filtros forma una representación conjunta en valor absoluto definida por el valor medio
Figure imgf000015_0002
Esta representación en valor absoluto (conjunta) forma la base para una sola generación de máscara M(n,k) exactamente como en el generador de máscara de filtro único 304 en las realizaciones anteriores. En caso de que se realice una etapa de blanqueo, esto puede hacerse para cada módulo de representación en valor absoluto individual 303 o realizarse solo una vez para la representación conjunta en valor absoluto.
En el contexto de la figura 15, se describirá una realización de un compresor de filtro 501 en el que el blanqueo (espectral) se realiza para cada filtro v = 0, (N - 1) individualmente. El generador de máscara de filtro 502 en esta realización crea una única máscara de filtro M(n,k) para todos los filtros basándose en la representación en valor absoluto N de todos los filtros. Esta es una gran ventaja de la realización de la presente invención, ya que el generador de máscara de filtro 502 puede tener en cuenta cómo se combinarán los filtros comprimidos en un estado posterior. Cada uno de los filtros originales se lleva a un calculador de filtro 305 como se describió anteriormente, y el compresor de filtro produce N nuevos filtros Aw v(n,k), ya que cada uno de los calculadores de filtro está provisto de la misma máscara M(n,k).
Sin embargo, en una realización adicional de un compresor de filtro 502, la representación en valor absoluto (conjunta) puede definirse alternativamente por
A M
A(n,k) = Y l ú>(y)-Av(f%>k) , ( 11’)
en la que w(v) es un factor de ponderación que depende del índice del filtro v = 0, (N - 1). Los factores de ponderación w(v) ofrecen la posibilidad de ponderar los diferentes filtros v: para la espectral, psico acústica u otra relevancia para la impresión acústica general. Podría ser aconsejable, aunque no necesario, definir los factores de ponderación w(v) de modo que la suma de los factores de ponderación sea igual a uno, de modo que se cumpla la siguiente expresión:
Figure imgf000015_0003
• ( i r ‘ >
En comparación con la ecuación (11), la representación en valor absoluto (conjunta) A(n,k) de la ecuación (11 ') puede ser transformada en el resultado de la ecuación (11) definiendo un factor de ponderación igualmente distribuido w(v) = 1/N. En otras palabras, el cálculo de la representación en valor absoluto de acuerdo con la ecuación (11) representa una forma especializada de la representación en valor absoluto de acuerdo con la ecuación (11') que ofrece una mayor flexibilidad ya que permite ponderar la importancia perceptiva de los respectivos filtros indicados por el índice v.
Al usar la misma máscara de filtro M(n,k) para cada uno de los N filtros individuales en el dominio en el tiempo, la realización del compresor de filtro 501 es capaz de crear un conjunto de respuestas a los impulsos del filtro de subbanda comprimida para cada uno de los N filtros, de modo que incluso un procesamiento posterior de los N filtros de subbanda individuales después del compresor de filtro 501 no conducirá a una respuesta a los impulsos del filtro de subbanda resultante comprimida que tenga una entrada con un valor de respuesta a los impulsos relevante que no tenga el valor de respuesta a los impulsos seleccionada correspondiente en uno de los otros filtros. Comparando el generador de máscara 502 de la realización mostrada en la figura 5 con los generadores de máscara 304 de la realización mostrada en las figuras 3 y 4, es importante tener en cuenta que el generador de máscara 502, aunque provisto de N respuestas a los impulsos del filtro de subbanda de entrada para N filtros individuales en el dominio en el tiempo solo, produce una sola máscara M(n,k) indicativa de todas las respuestas a los impulsos del filtro de subbanda N.
En realizaciones adicionales de un compresor de filtro 501, se pueden emplear diferentes generadores de máscara 502, que en principio pueden usar diferentes esquemas para proporcionar una representación de evaluación común para todos los filtros N en el dominio en el tiempo. En otras palabras, además de aplicar el promedio, como se indica en la ecuación (11), las representaciones de evaluación individuales proporcionadas por los módulos de representación en valor absoluto 303 pueden combinarse en una única representación de evaluación sumando los valores respectivos, por combinación lineal de los valores respectivos, en donde, por ejemplo, se puede realizar una ponderación con respecto a las subbandas involucradas, o empleando una combinación más compleja (por ejemplo, una combinación cuadrática o de orden superior) de los valores respectivos de las representaciones de evaluación.
En la figura 6, se describe una realización de la presente invención en el contexto de la descodificación binaural usando HRTF. Como se explicó anteriormente, diez filtros HRTF son la entrada a un convertidor de filtro 601, que comprende diez (N = 10) convertidores de filtro de acuerdo con 101 (cf. un convertidor de filtro 101 mostrado en la figura 1). El convertidor de filtro 601 recibe un total de respuestas a los impulsos del filtro N.L, en donde L es nuevamente el número de subbandas. Los diez filtros HRTF en la representación en el dominio QMF se introducen en una realización de un compresor de filtro 501, como se describió anteriormente, y proporcionan diez filtros comprimidos y opcionalmente ajustados en ganancia Hv(n,k). Los diez filtros comprimidos Hv(n,k) (v = 0, 9; N = 10) se introducen en un descodificador binaural 602 que dada la señal de entrada estéreo 603, los parámetros espaciales 604, produce una señal estéreo binaural 605 que da una impresión de sonido envolvente a través de un canal estéreo (por ejemplo, un auricular). El descodificador binaural 602 logra esto combinando linealmente los diez filtros HRTF en cuatro filtros HRTF que se aplican a la señal de entrada estéreo. La realización del compresor de filtro 501 está diseñada para crear la misma máscara de filtro para todos los filtros, de modo que cuando se combinan linealmente, una entrada en un filtro que se ha fijado a cero no tiene una entrada correspondiente distinta de cero en ningún otro filtro. Como consecuencia, cada conexión que acopla el convertidor de filtro 601, el convertidor de filtro 501 y el descodificador binaural 604 transfiere la información relativa a las subbandas L como se indica mediante la barra en la figura 6.
Como ya se explicó anteriormente, el descodificador binaural 602 combina los 10 (cinco canales de entrada de audio para dos canales de salida de audio (estéreo)) en cuatro filtros HRTF, que pueden aplicarse inmediatamente a la señal de entrada estéreo 603. Sin embargo, los filtros HRTF dependen en los parámetros espaciales 604 proporcionados al descodificador binaural 602 para representar la señal estéreo binaural 605. Como se mencionó anteriormente, especialmente los filtros HRTF pueden comprender un número sustancial de valores de respuesta a los impulsos del filtro de subbanda no triviales, no nulos o que no desaparecen como derivaciones intermedias del filtro, ya que a menudo se tienen que modelar interacciones muy complejas entre las señales de salida estéreo binaurales para el oído humano y las fuentes del sonido a modelar. Los respectivos filtros HRTF, por ejemplo, pueden llegar a ser sustancialmente largos para modelar eficazmente las características de la sala del entorno y otras influencias a modelar.
Especialmente en este contexto, las realizaciones de un compresor de filtro 501 se pueden aplicar eficientemente para reducir significativamente la complejidad de cálculo en términos del descodificador binaural 602. Al reducir el número de valores de respuesta a los impulsos del filtro de subbanda relevantes a considerar en el marco del descodificador binaural 602, el descodificador binaural 602 puede realizarse con una potencia de cálculo menor, que en última instancia conduce a un menor consumo de energía, ya que, por ejemplo, la frecuencia de reloj del descodificador binaural correspondiente puede reducirse debido a un menor número de cálculos en un período de tiempo dado. Alternativamente, el descodificador binaural 602 puede construirse más pequeño por las mismas razones, de modo que, en principio, puede evitarse un segundo núcleo de procesamiento.
Como se describirá en el contexto de las figuras 7 a 13 con más detalle, empleando un convertidor de filtro con 192 (=3 64) derivaciones intermedias de filtro utilizadas para convertir 10 filtros HRTF en el dominio en el tiempo en el dominio QMF complejo o en el dominio de subbanda complejo, un filtro HRTF en el dominio en el tiempo con 896 (= 1464) se transferirá por el filtro convertidor 601 o más bien los 10 convertidores de filtro 101, como se muestra, por ejemplo, en la figura 1, en 64 respuestas a los impulsos del filtro de subbandas individuales, que comprenden 16 (= 14 3-1) derivaciones intermedias de filtro cada una. Las resultantes 1024 derivaciones intermedias de filtro para cada uno de los 10 filtros HRTF en el dominio en el tiempo darán como resultado una carga de cálculo sustancial para el descodificador binaural 602, a menos que se emplee una realización del compresor de filtro 501 para reducir el número total de derivaciones intermedias del filtro, por ejemplo, por un factor de 4 a 256 (= 1024/4). Aunque este ejemplo se basa en un sistema que comprende L = 64 subbandas para cada uno de los 10 filtros HRTF en el dominio QMF complejo o en el dominio de subbanda, en principio se puede emplear cualquier número de subbandas L.
Antes de describir otras realizaciones de un compresor de filtro y el método para fabricar filtros de respuesta a los impulsos del filtro de subbanda comprimida, se explicará con mayor detalle una posible solución del convertidor de filtro y un filtro que funciona en un dominio complejo de subbanda (dominio QMF). Sin embargo, antes de desglosar los antecedentes técnicos con más detalle, especialmente de un convertidor de filtro, se analizará el concepto general de aplicar un filtro digital a una entrada de audio digital (en el dominio en el tiempo o en el dominio de subbanda).
La figura 7 muestra una posible solución para un filtro o elemento de filtro 700, al que se le suministra una entrada de audio digital. Cabe señalar que la entrada de audio digital podría ser, en principio, ambas, una señal en el dominio en el tiempo y una señal en el dominio de subbanda (complejo). El elemento de filtro proporciona en una salida, una salida de audio digital, que representa la entrada de audio digital filtrada, dependiendo de una señal de definición de filtro o una señal de respuesta a los impulsos del filtro respectivo.
Con la muestra o el índice de tiempo n, una entrada de audio digital x(n) es una señal de entrada de valor real o de valor complejo, dependiendo del dominio involucrado, y la señal de salida de audio digital y(n), así como la señal de respuesta a los impulsos f(n) del filtro 700, la señal de salida de audio digital viene dada por
y(n) = ^ f ( l ) ' x ( n - l ) , (12)
i
en la que l es un índice de suma utilizado para calcular la señal de salida de audio digital resultante, basándose en la convolución dada por la ecuación (12).
Un convertidor de filtro 101 comprende, como se muestra en la figura 8, un banco de filtros de análisis complejo 710 como componente central al que se le proporciona la señal de respuesta a los impulsos del filtro correspondiente. El banco de filtros de análisis complejo 710 analiza las señales de respuesta a los impulsos del filtro en el dominio en el tiempo, que se transferirá al dominio QMF, mediante el filtrado con una red de filtros de análisis L, seguido por un muestreo descendente opcional de un factor L, en el que L es una vez más el número entero positivo, preferiblemente mayor que 1 e indica el número de subbandas del banco de filtros de análisis complejo 710. Los filtros de análisis generalmente se obtienen mediante una modulación compleja de un filtro prototipo q(n), en donde n es nuevamente positivo entero que indica el índice en una matriz de datos o un índice de un valor en una señal. La salida de un banco de filtros 710 consiste en señales de subbanda L, que en su conjunto representan el filtro caracterizado por su respuesta a los impulsos del filtro en el dominio en el tiempo en el dominio complejo QMF. Para ser más precisos, la salida de un banco de filtros de análisis complejo 710 es un conjunto de respuestas a los impulsos del filtro de subbanda, que puede proporcionarse a un elemento de filtro 700 para realizar un filtrado de una señal de entrada de audio en el dominio QMF complejo, que conduce a una diferencia perceptualmente indistinguible de la señal de salida de audio, en comparación con un filtrado directo en el dominio en el tiempo.
A continuación, se desglosarán y se expondrán con más detalle tanto, el filtro prototipo q(n) así como el diseño básico de un banco de filtros de análisis modulado. Además, en lo que sigue, se supone que el número de subbandas está fijado en L = 64. Sin embargo, como se explicó anteriormente, esto no es una restricción de las realizaciones de la presente invención, sino que simplemente sirve como un ejemplo adecuado.
La figura 9 muestra con más detalle una posible solución de un banco de análisis complejo 710. El banco de análisis complejo 710 comprende una pluralidad de L filtros de análisis intermedio 720 para cada subbanda a ser suministrada por el banco de análisis complejo 710. Para ser más precisos, cada uno de los L filtros de análisis intermedio 720 está conectado en paralelo a un nodo 730 al cual se le proporciona una señal de respuesta a los impulsos en el dominio en el tiempo como una señal de entrada a procesar. Cada uno de los filtros de análisis intermedio 720 está adaptado para filtrar la señal de entrada del banco de análisis complejo 710 con respecto a una frecuencia central de cada subbanda. De acuerdo con las frecuencias centrales de las diferentes subbandas, cada subbanda está marcada por un índice de subbanda o índice k, en donde k es nuevamente un número entero no negativo, típicamente en el rango de 0 a (L-1). Los filtros de análisis intermedio 720 del banco de análisis complejo 710 pueden derivarse de un filtro prototipo p(n) mediante una modulación compleja de acuerdo con el índice de subbanda k de la subbanda a la que se aplica el filtro de análisis intermedio 720. A continuación, se explican más detalles sobre la modulación compleja de un filtro prototipo.
Ya sea directamente por los filtros de análisis intermedio 720 o por un muestreador descendente 740 opcional (indicado por líneas punteadas en la figura 8, la frecuencia de muestreo de la señal emitida por los filtros de análisis intermedios 720 se reduce por un factor L. Como se mencionó anteriormente, los muestreadores descendentes 740 suministrados a cada salida de señal de subbanda por los correspondientes filtros de análisis intermedio 720 son opcionales de modo que, dependiendo de la realización en concreto, el muestreo descendente también se puede llevar a cabo en el marco de los filtros de análisis intermedio 720. En principio, no se requiere el muestreo descendente de la señal emitida por los filtros de análisis intermedio 720. Sin embargo, la presencia explícita o implícita de muestreadores descendentes 740 puede ser una opción favorable en algunas aplicaciones, ya que la cantidad de datos proporcionados por el banco de análisis complejo 710 aumentaría alternativamente por un factor de L, lo que llevaría a una importante redundancia de datos.
La figura 10 muestra una posible solución de un filtro de subbanda 750 y su interacción con el convertidor de filtro 101 con más detalle. El filtro de subbanda 750 comprende una pluralidad de filtros intermedios 760, en el que se proporciona un filtro intermedio 760 para cada señal de subbanda de valor complejo que se suministra al filtro de subbanda 750. Por lo tanto, el filtro de subbanda 750 comprende L filtros intermedios 760.
El convertidor de filtro 101 está conectado a cada uno de los filtros intermedios 760. Como consecuencia, el convertidor de filtro 101 es capaz de proporcionar las derivaciones intermedias de filtro para cada uno de los filtros intermedios 760 del filtro de subbanda 720. Más detalles sobre el filtrado realizado por los filtros intermedios 760 se explicarán en el curso posterior de la aplicación. Por lo tanto, las derivaciones intermedias de filtro proporcionadas a los diferentes filtros intermedios 760 y generadas por el convertidor de filtro 101 forman la señal de definición del filtro intermedio.
Además, debe tenerse en cuenta que las realizaciones, soluciones y realizaciones podrían comprender retardos adicionales y/u opcionales para retardar cualquiera de las señales o un subconjunto de señales, que hayan sido omitidas en las figuras. Sin embargo, los retrasos o retrasos pueden estar comprendidos en los elementos mostrados (por ejemplo, filtros) o añadidos como elementos opcionales en todas las realizaciones y soluciones, dependiendo de su realización en concreto.
La figura 11 ilustra una posible solución para un banco de síntesis complejo 770. El banco de síntesis complejo 770 comprende L filtros de síntesis intermedios 780 a los cuales se les proporcionan L señales de subbanda. Dependiendo de la realización en concreto del banco de síntesis complejo 770 antes del filtrado en el marco de los filtros de síntesis intermedios 780, las señales de subbanda son muestreadas ascendentemente por L muestreadores ascendentes 790, que reconstruyen la frecuencia muestreada de las señales de subbanda aumentando la frecuencia de muestreo por un factor de L. En otras palabras, el muestreador ascendente 790 opcional reconstruye o reforma las señales de subbanda proporcionadas al muestreador ascendente 790 de tal manera que la información contenida en cada una de las señales de subbanda se retiene mientras la frecuencia de muestreo aumenta en un factor de L.
Sin embargo, como ya se explicó en el contexto de la figura 9, los muestreadores ascendentes 790 son componentes opcionales, ya que el muestreo ascendente también puede llevarse a cabo en el marco de los filtros de síntesis intermedios 780. Por lo tanto, la etapa de muestreo ascendente de las señales de subbanda llevada a cabo por el muestreador ascendente 790 puede procesarse simultáneamente en el marco de los filtros de síntesis intermedios 780. Sin embargo, si los muestreadores descendentes 740 no se realizan explícita ni implícitamente, los muestreadores ascendentes 790 no tienen que realizarse explícita o implícitamente.
Los filtros de síntesis intermedios 780 están conectados a través de una salida a un sumador 800 que suma las señales de subbanda filtradas emitidas por los filtros de síntesis intermedios L 780. El sumador 800 está conectado además a un extractor de partes reales 810, que extrae o forma una señal de valor real o más bien una señal de salida en el dominio en el tiempo (valor real) basándose en la señal de valor complejo proporcionada por el sumador 800. El extractor de parte real 810 puede realizar esta tarea, por ejemplo, extrayendo la parte real de una señal de valor complejo proporcionada por el sumador 810, calculando el valor absoluto de la señal de valor complejo proporcionada por el sumador 810 o por otro método que conforme una señal de salida de valor real basándose en una señal de entrada de valor complejo.
La segunda solución posible para un banco de síntesis complejo 770 que se muestra en la figura 12 difiere de la primera posible solución mostrada en la figura 11 solo en relación con los extractores de parte real 810 y el sumador 800. Para ser más precisos, las salidas de los filtros de síntesis intermedios 780 están conectadas por separado de cada subbanda a un extractor de parte real 810 que extrae o forma una salida de señal de valor real basándose en la señal de valor complejo por medio de los filtros de síntesis intermedios 780. Los extractores de parte real 810 se conectan entonces al sumador 800, que suma las señales de valor real L derivadas de las señales de la subbanda filtrada L para formar la señal de salida de valor real proporcionada por el sumador 800.
Como se explicó anteriormente, la figura 3 ilustra una posible selección de un convertidor de filtro 101. Se supone que el filtro viene dado por su respuesta a los impulsos. Viendo esta respuesta a los impulsos como una señal de tiempo discreta, es analizada por el banco (filtro) de análisis manual complejo de banda L 710. Las salidas de la señal de subbanda resultantes son entonces exactamente las respuestas a los impulsos de los filtros que se aplicarán por separado en cada subbanda en el filtrado de subbanda 705 mostrado en la figura 10. En el caso mostrado en la figura 8, la señal de definición del filtro suministrada al convertidor de filtro 101 y su banco de análisis complejo o banco de filtros de análisis complejo 710 es la señal de respuesta a los impulsos indicativa de la característica de amplitud/frecuencia de un filtro, que se transferirá al dominio de subbanda. Por lo tanto, la salida del banco de análisis complejo (filtro) 710 de cada una de las subbandas L representa la respuesta a los impulsos de los filtros intermedios comprendidos en el filtrado de subbanda 750.
El banco de análisis complejo 710 se deriva en principio de un banco de análisis para una señal de salida de audio, pero tiene un filtro prototipo diferente y una estructura de modulación ligeramente diferente, cuyos detalles se describirán en la siguiente descripción. La longitud del filtro prototipo q(v) puede diseñarse para que sea comparativamente pequeña. Debido al muestreo descendente por un factor L, la longitud de los filtros de subbanda también es un factor de L menor que la suma de las longitudes del filtro en el dominio en el tiempo dado y del filtro prototipo q(v).
En la presente solicitud, una derivación intermedia o valor que no se desvanece es una derivación intermedia o un valor, que idealmente es distinto de cero. Sin embargo, debido a restricciones de realización en el marco de esta aplicación, un valor o una derivación intermedia que no se desvanece es una derivación intermedia o valor de valor real o complejo con un valor absoluto mayor que un umbral predeterminado, por ejemplo, 10-b o 2-b, en donde b es un número entero positivo que depende de los requisitos de una realización en concreto. En los sistemas digitales, este umbral se define preferiblemente en el sistema binario (base 2), en el que el número entero b tiene un valor predeterminado que depende de las especificaciones de la realización. Típicamente, el valor de b es 4, 5, 6, 7, 8, 10, 12, 14, 16 o 32.
Bancos de filtros modulados complejos
En lo siguiente, sea Z ( a > ) p(-% ) |a transformada discreta de Fourier en el tiempo de una señal discreta en el tiempo z(n). Como anteriormente, n es un número entero que indica un índice o un índice de tiempo de una señal de tiempo, mientras que w =2 n • f es la frecuencia circular asociada a la frecuencia f n es el número circular (n = 3,1415926...) e i = j = V-1 es la unidad imaginaria.
El banco de filtros de banda L modulado exponencial complejo se define a partir de un filtro prototipo de valor real p(v) de longitud finita. Para los cálculos, a continuación, se supondrá por extensión con ceros que el filtro prototipo está definido para todos los enteros n. Dada una señal de tiempo discreta de valor real x(n), el banco de filtros de análisis 710 aplica, como ya se explicó, los filtros prototipo modulados complejos seguidos del muestreo descendente por un factor L para suministrar las señales de subbanda,
Figure imgf000019_0001
para cada índice de subbanda k = 0,1,..., (L - 1) e índice de tiempo entero m. En la siguiente descripción, el índice de tiempo m difiere del índice de tiempo n con respecto al hecho de que m se refiere a las señales muestreadas descendentemente, mientras que el número entero n se refiere a señales con la frecuencia de muestreo completa.
Dadas las señales de subbanda de valor complejo dk(n), el banco de filtros de síntesis 770 aplica el filtrado seguido de muestreo ascendente por un factor de L y una extracción de valor real para suministrar las señales de valor real, como ya se explicó, para obtener la señal de salida
Figure imgf000019_0002
En las ecuaciones (13) y (14) 0 y y representan factores de fase (constantes) para filtrar la señal de tiempo discreta de valor real x(n) en la señal de subbanda de valor complejo y para reconstruir las muestras de salida de valor real y(n) a partir de señales de subbandas de valor complejo dk(m). Es bien sabido que un filtro prototipo y factores de fase fija 0 y y pueden elegirse para proporcionar una reconstrucción perfecta, y(n) = x(n), en el caso en que dk(m) = ck(m), es decir, cuando las señales de subbanda no se alteran. En la práctica, la propiedad de reconstrucción perfecta se mantendrá verdadera hasta un retardo (y/o un cambio de signo), pero en los cálculos que siguen, este detalle será ignorado al permitir el uso de un filtro prototipo no causal, como también se explica en el caso del tipo pseudo QMF de diseño como en el documento PCT/SE02/00626 "Aliasing reduction using complex exponential modulated filter banks". Aquí el filtro prototipo es simétrico p(-n) = p(n), y su transformada de Fourier discreta en el tiempo P(oo) esencialmente se desvanece fuera del intervalo M í n/L._ La reconstrucción perfecta también se reemplaza por una casi perfecta propiedad de reconstrucción. Para la derivación que sigue, se supondrá por simplicidad que ambos mantienen la reconstrucción perfecta y que P(oo) = 0 para k / L < |ts| < tc. por 0tra parte, se supone que los factores de fase satisfacen la condición de que y - 0 sea igual a un múltiplo entero de 4L.
En un banco de filtros muestreado críticamente, la alteración de las señales de subbanda antes de la síntesis generalmente conduce a la introducción de artefactos de alias. Esto se supera aquí debido al hecho de que un sobre muestreo por un factor de dos se introduce mediante el uso de señales de valor complejo. Aunque la tasa de muestreo total de las muestras de subbanda es idéntica a la tasa de muestreo de la señal de entrada de tiempo discreto, la señal de entrada es de valor real y las muestras de subbanda tienen un valor complejo. Como se describirá a continuación, la ausencia de alias abre la puerta a un procesamiento eficiente de la señal invariante en el tiempo.
Filtrado de subbandas en un banco de filtros modulados complejos
Considérese la modificación del filtrado de subbanda 750 de cada señal de subbanda obtenida filtrando las muestras de análisis ck(m) del banco de análisis complejo 710 con un filtro con respuesta a los impulsos gn(m) antes de la síntesis (12) realizada por el banco (filtro) de síntesis complejo 770
dk{m) = J ]g k(l)ck(m - l) . (15)
i
Los cálculos elementales muestran que las suposiciones dadas sobre la respuesta en frecuencia del filtro prototipo, el efecto resultante sobre la señal reconstruida en el tiempo es el de un filtrado discreto en el tiempo
Y (w) = G (w) X (w), (16)
donde
Figure imgf000019_0003
Aquí, la transformada discreta de Fourier en el tiempo del filtro aplicado en la subbanda k para ^ -^ y
Gk{m) - G k(~a>y for k < 0 ( 18)
donde * indica conjugación compleja. Obsérvese aquí que el caso especial Gk(w) = 1 conduce a G(w) = 1 en (17) debido al diseño especial supuesto del prototipo p(v), lo que implica
Figure imgf000020_0001
Otro caso de interés es Gk(w) = exp (-i w) que conduce a G(w) = exp (iL w), de modo que y(n) = x(n - L),
Aproximación a una respuesta de filtro dada por filtrado de subbanda
Sea H(w) un filtro dado (por ejemplo, función de transferencia) con respuesta a los impulsos de valor real h(n). Estos datos se consideran como la entrada al convertidor de filtro 101. A la vista de (17) y (19), una elección trivial para los filtros de subbanda que dan como resultado la respuesta deseada G(w) = H(w) viene dada por
Gk(o}) = H(a)/L), for \co~n{k -hl/2)[ < n , (20)
El inconveniente de esta fórmula es que, aunque H(w) es una función suave de w, el segmento periodizado de ella definido por (20) exhibirá saltos y la respuesta a los impulsos de los filtros de subbanda será innecesariamente larga. El uso desventajoso del banco pseudo QMF complejo para la ecualización o el ajuste de envolvente consiste en aplicar una sola ganancia gk en cada subbanda, lo que da como resultado la función de transferencia
Figure imgf000020_0002
con la extensión f>*-&*-/■*para k <0 definida de acuerdo con (18). A la vista de (19), se consigue
Figure imgf000020_0003
y la función de transferencia se interpola entre esas frecuencias. Por lo tanto, para las respuestas del filtro objetivo H(w) que varían lentamente como una función de la frecuencia w , se obtiene un primer método de aproximación del filtro eligiendo
Figure imgf000020_0004
Se usa un convertidor de filtro 101 para convertir el filtro (definido por su respuesta a los impulsos) h(n) en filtros de subbanda intermedios 760 por medio del banco de filtros de análisis 710 que emplea un filtro prototipo de valor real q(n),
gk(m)= ¿ h{n m L)q(n)exá- i j(k ±)n (24)
y L
En términos de transformadas de Fourier, esto da
Figure imgf000020_0005
La ventaja de este procedimiento es que cualquier filtro dado h(n) puede transformarse eficientemente en respuestas de filtro de subbanda intermedias. Si q(n) tiene Kq • L, derivaciones intermedias, un filtro en el dominio en el tiempo h(n) de Kh L derivaciones intermedias se convierte en filtros en el dominio de subbanda (24) con (Kh + Kq - 1) derivaciones intermedias, donde Kh y Kq son enteros positivos. En el caso de que Kq sea igual a 3 (L dKq = 192) y con una respuesta a los impulsos de un filtro en el dominio en el tiempo correspondiente a una longitud de Kh 64 (L = 64), cada filtro de subbanda intermedia 760 tiene una longitud de respuesta a los impulsos de solo Kh + 3 - 1 = Kh + 2 derivaciones intermedias.
Diseño del prototipo de filtro para el convertidor de filtro.
La inserción
Figure imgf000020_0006
Por lo tanto, la condición para mantener G (w) = H (w) es que
Figure imgf000021_0001
En la que
Figure imgf000021_0002
para 1=0 y ^ ~ ° p a r a Una solución simple para (27) viene dada por el filtro bloque
Figure imgf000021_0003
Este filtro prototipo corresponde a la opción (20) y tiene la desventaja de tener una respuesta a los impulsos que decae infinita y lentamente q(n). En cambio, la ecuación (17) se resuelve aproximadamente (por ejemplo, en el sentido de los mínimos cuadrados) con un filtro de respuesta a los impulsos finita q(n). El equivalente en el dominio en el tiempo de (27) es el sistema de ecuaciones lineales para k = 0, I, L - 1 y para todos los enteros m,
Figure imgf000021_0004
donde
Figure imgf000021_0005
es la autocorrelación de p(n). Para cualquier longitud de soporte dada, el sistema de ecuaciones lineales (28) puede ser resuelto en el sentido de los mínimos cuadrados para un filtro prototipo q(n). Es deseable utilizar un soporte significativamente más corto que el del filtro de prototipo original del banco de filtros p(n), y en ese caso el sistema lineal (28) está sobre determinado. Una calidad de aproximación dada también se puede cambiar por otras propiedades deseables mediante la optimización conjunta. Un ejemplo de tal propiedad es un tipo paso bajo de respuesta de frecuencia Q (w).
A continuación, se describe la determinación de una representación QMF múlti ventana (dominio de subbanda) de los filtros HRTF. La conversión del filtro en el dominio en el tiempo al dominio complejo de subbanda QMF se realiza mediante un filtro FIR en el convertidor de filtro 101. Para ser más precisos, la siguiente descripción especifica un método para realizar un filtro FIR dado h(n) de longitud Nh en el dominio de subbanda QMF complejo.
El filtrado de subbanda en sí mismo se lleva a cabo mediante los filtros intermedios 760 dentro del filtrado de subbanda 750. Para ser más precisos, el filtrado de subbanda consiste en la aplicación por separado de un filtro intermedio FIR de valor complejo gk(l) para cada subbanda QMF con un índice k = 0,1, ..., 63. En otras palabras, en la siguiente descripción se harán referencias especiales para el caso de L = 64 señales de subbanda diferentes. Sin embargo, este número específico de señales de subbanda no es esencial y las ecuaciones apropiadas también se darán en una forma más general.
El convertidor de filtro 101, que convierte el filtro FIR en el dominio en el tiempo dado h(n) en los filtros complejos en el dominio de subbanda gk(l) comprende el banco de análisis complejo 710. El filtro prototipo del banco de filtros de análisis complejo 710 del convertidor de filtro 101 q(n) de longitud 192 (= 364) para el caso específico de señales de subbanda L = 64 se crea resolviendo en el sentido de los mínimos cuadrados el sistema sobre determinado de la ecuación (28). Los coeficientes de filtro q(n) se describirán con más detalle para el caso de L = 64 señales de subbanda más adelante.
Para ser más exactos en términos de descripción matemática, una extensión con ceros en el filtro FIR en el dominio en el tiempo se define por
Figure imgf000021_0006
Los filtros en el dominio de subbanda intermedia resultantes se basan en la ecuación (24) y se pueden expresar en el caso general como
Figure imgf000021_0007
en donde lo y no son retardos, l es un número entero que indica un índice de las derivaciones intermedias del filtro y Nq (= Nq) es la longitud de la respuesta a los impulsos del filtro prototipo q(n).
Cabe señalar que en el marco de la presente solicitud bajo una ecuación que se basa en una ecuación se entiende una introducción de factores de retrasos adicionales (0 y no) factores, coeficientes adicionales y una introducción de una función de ventana u otra simple función. Además, se pueden descartar constantes simples, sumandos constantes, etc. Además, también se incluyen las transformaciones algebraicas, las transformaciones de equivalencia y las aproximaciones (por ejemplo, una aproximación de Taylor) que no cambien el resultado de la ecuación en absoluto o de manera significativa. En otras palabras, tanto las ligeras modificaciones como las transformaciones que conduzcan esencialmente en términos de idéntico resultado se incluyen en el caso de que una ecuación o expresión se base en una ecuación o expresión.
En el caso L = 64, la expresión para los filtros en el dominio de subbanda o los filtros intermedios 760 se convierte en
git(0 = g f í (K 64 -( / - 2 ) ) ^ ( n ) 'e x p ^ - ¡ ~ ^ | j( f? -95 ) j . (32)
Estos filtros de subdominio tienen una longitud Lq = Kh + 2, donde
Kh =¡Nh /64\ (33)
y Nh es la longitud de la respuesta a los impulsos h(n) de las características del filtro a transferir en el dominio de subbanda.
En este caso, el entero k = 0, 1,63 es nuevamente el índice de una subbanda y / = 0, 1, (Kh + l) es un número entero que indica las derivaciones intermedias de los filtros intermedios resultantes 760.
El agregado añadido de (-2) en la ecuación (32) en comparación con la ecuación (24) existe, porque la ecuación (24) se desarrolló sin tener en cuenta la baja de los filtros. Las realizaciones reales siempre causarán retardos. Por lo tanto, dependiendo de la realización concreta, se pueden realizar retardos o retardadores adicionales, que se han omitido en las figuras en aras de la simplicidad.
En muchos casos, el sistema de ecuaciones lineales (28) está sobre determinado. Sin embargo, se puede resolver o aproximar en el sentido de los mínimos cuadrados con respecto a los coeficientes del filtro prototipo q(n). Resolver el sistema de ecuaciones lineales (28) en el sentido de los mínimos cuadrado, lleva a las siguientes derivaciones intermedias del filtro del filtro prototipo q(n) para cumplir las siguientes relaciones para enteros n de 0 a 191:
q[0] = -0.2029343380 q[27] = -0.0308428572 q[l] = -0.1980331588 q[28] = -0.0234390115 q[2] = -0.1929411519 q[29] = -0.0159703957 q[3] = -0.1876744222 q[30] = -0.0084353584 q[4] = -0.1822474011 q[31] = -0.0008319956 q[5] = -0.1766730202 q[32] = 0.0068418435 q[6] = -0.1709628636 q[33] = 0.0145885527 q[7] — -0.1651273005 q[34] = 0.0224107648 q[8] = -0,1591756024 q[35] = 0.0303113495 q[9] = -0.1531160455 q[36] = 0.0382934126 q[10] = -0.1469560005 q[37] = 0.0463602959 q[l 1] - -0.1407020132 q[38] = 0.0545155789 q[12] = -0.1343598738 q[39] = 0.0627630810 q[13] = -0.1279346790 q[40] = 0.0711068657 q[14] = -0.1214308876 q[41] = 0.0795512453 q[15] = -0.1148523686 q[42] = 0.0881007879 q[16] = -0.1082024454 q[43] = 0.0967603259 q[17] = -0.1014839341 q[44] = 0.1055349658 q[l 8] = -0.0946991783 q[45] =0.1144301000 q[19] =-0.0878500799 q[46] =0.1234514222 q[20] = -0.0809381268 q[47] = 0.1326049434 q[21] = -0,0739644174 q[48] = 0.1418970123 q[22] = -0.0669296831 q[49] = 0.1513343370 q[23] = -0.0598343081 q[50] = 0.1609240126 q[24] = -0.0526783466 q[51] = 0.1706735517 q[25] = -0.0454615388 q[52] = 0.1805909194 q[26] = -0.0381833249 q[53] = 0.1906845753 q[54] = 0.2009635191 q[92] = 1.0002369837 q[55] = 0,2114373458 q[93] = 1.0006301028 q[56] = 0.2221163080 q[94]= 1.0008654482 q[57] = 0.2330113868 q[95] = 1.0009438063 q[58] = 0.2441343742 q[96] = 1.0008654482 q[59] = 0.2554979664 q[97] = 1.0006301028 q[60] = 0.2671158700 q[98] = 1.0002369837 q[61] = 0.2790029236 q[99] = 0.9996847806 q[62] = 0.2911752349 q[100] = 0.9989716504 q[63] = 0.3036503350 q[101] = 0.9980952118 q[64] = 0.9025275713 q[102] = 0.9970525352 q[65] = 0.9103585196 q[103] = 0.9958401318 q[66] = 0.9176977825 q[l 04] = 0.9944539395 q[67] = 0.9245760683 q[105] =0.9928893067 q[68] = 0.9310214581 q[106] = 0.9911409728 q[69] = 0.9370596739 q[l 07] = 0.9892030462 q[70] = 0.9427143143 q[108] = 0.9870689790 q[71] = 0.9480070606 q[109] = 0.9847315377 q[72] = 0.9529578566 q[l 10] = 0.9821827692 q[73] = 0.9575850672 q[l 11] = 0.9794139640 q[74] = 0.9619056158 q[l 12] = 0.9764156119 q[75] = 0.9659351065 q[l 13] = 0.9731773547 q[76] = 0.9696879297 q[l 14] = 0.9696879297 q[77] = 0.9731773547 q[l 15] = 0.9659351065 q[78] = 0.9764156119 q[l 16] = 0.9619056158 q[79] = 0.9794139640 q[l 17] = 0.9575850672 q[80] = 0.9821827692 q[l 18] = 0.9529578566 q[81] = 0.9847315377 q[l 19] = 0,9480070606 q[82] = 0.9870689790 q[120] = 0.9427143143 q[83] = 0.9892030462 q[121] = 0.9370596739 q[84] = 0.9911409728 q[122] = 0.9310214581 q[85] = 0.9928893067 q[123] = 0.9245760683 q[86] = 0.9944539395 q[124] = 0.9176977825 q[87] = 0.9958401318 q[125] = 0.9103585196 q[88] = 0.9970525352 q[126] = 0.9025275713 q[89] = 0.9980952118 q[127] =0.8941712974 q[90] = 0.9989716504 q[128] = 0.2911752349 q[91] = 0.9996847806 q[129] = 0.2790029236 q[130] = 0.2671158700 q[161] = -0.0159703957
q[131] = 0.2554979664 q[162] = -0.0234390115
q[132] = 0.2441343742 q[163] = -0.0308428572
q[133] = 0.2330113868 q[164] = -0.0381833249
q[134] = 0.2221163080 q[165] = -0.0454615388
q[135] = 0.2114373458 q[166] = -0.0526783466
q[136] = 0.2009635191 q[167] = -0.0598343081
q[137] = 0.1906845753 q[168] = -0.0669296831
q[138] = 0,1805909194 q[169] = -0,0739644174
q[139] = 0,1706735517 q[170] = -0.0809381268
q[140] = 0,1609240126 q[171] = -0.0878500799
q[141] = 0.1513343370 q[ 172] = -0.0946991783
q[142] = 0.1418970123 q[173] = -0.1014839341
q[143] = 0.1326049434 q[174] = -0.1082024454
q[144] = 0.1234514222 q[175] = -0.1148523686
q[145] = 0.1144301000 q[176] = -0.1214308876
q[146] = 0.1055349658 q[l 77] = -0.1279346790
q[l 47] = 0.0967603259 q[178] = -0.1343598738
q[148] = 0.0881007879 q[179] = -0.1407020132
q[149] = 0,0795512453 q[180] = -0,1469560005
q[150] = 0,0711068657 q[181] = -0.1531160455
q[151] = 0,0627630810 q[182] = -0.1591756024
q[152] = 0,0545155789 q[183] = -0.1651273005
q[153] = 0.0463602959 q[184] = -0.1709628636
q[154] = 0.0382934126 q[l 85] =-0.1766730202
q[155] = 0.0303113495 q[ 186] = -0.1822474011
q[156] = 0.0224107648 q[187] = -0.1876744222
q[157] = 0.0145885527 q[188] = -0.1929411519
q[158] = 0.0068418435 q[189] = -0.1980331588
q[l 59] = -0.0008319956 q[190] = -0.2029343380
q[160] = -0.0084353584 q[191] = -0.2076267137
La figura 13 muestra un diagrama de bloques simplificado de una realización de un compresor de filtro 102 que comprende un procesador 820 y un constructor de respuesta a los impulsos del filtro 305 que están conectados en serie entre una entrada y una salida de la realización del compresor de filtro 102. La realización de un compresor de filtro 102 recibe en la entrada, un conjunto de respuestas a los impulsos del filtro de subbanda de entrada, que tienen valores de respuesta a los impulsos del filtro en derivaciones intermedias de filtro, que se llevan al procesador 820. El procesador 820 examina los valores de respuesta a los impulsos del filtro de al menos dos de las respuestas a los impulsos del filtro de subbanda de entrada y es capaz de seleccionar los valores de respuestas a los impulsos del filtro que tengan un valor absoluto más alto, como se explicó en el contexto de la figura 4 y especialmente en el contexto del módulo de representación en valor absoluto 303 y el módulo de blanqueo 402, en particular, junto con un generador de máscara 304. Además, el procesador 820 es capaz de no seleccionar al menos un valor de respuestas a los impulsos del filtro, que tenga un valor absoluto más bajo en comparación con al menos una respuesta a los impulsos del filtro seleccionada.
En otras palabras, el procesador 820 de la realización mostrada en la figura 13 comprende la funcionalidad del módulo de representación en valor absoluto 303 y el generador de máscara 304. El constructor de respuesta a los impulsos del filtro, o más bien el módulo calculador de filtro 305 es capaz de construir respuestas a los impulsos del filtro de subbanda comprimida utilizando los valores de respuesta a los impulsos del filtro seleccionados, en donde las respuestas a los impulsos del filtro de subbanda comprimida no incluyen valores de respuesta a los impulsos del filtro o valores de valor cero correspondientes a las derivaciones intermedias de valores de respuesta a los impulsos del filtro no seleccionados. Como se explicó anteriormente, debe tenerse en cuenta que el filtro de respuesta a los impulsos del filtro 305 puede adaptarse para fijar a cero valores de respuesta a los impulsos no seleccionados o construir las respuestas a los impulsos del filtro de subbanda comprimida copiando solo los valores de respuesta a los impulsos seleccionados o por algún otro medio de ignorar los valores de respuesta a los impulsos del filtro no seleccionados.
Como consecuencia, la realización del compresor de filtro 102, como se muestra en la figura 13, es capaz de llevar a cabo una realización de un método inventivo para fabricar respuestas a los impulsos del filtro de subbanda comprimida a partir de entradas en respuestas a los impulsos del filtro de subbanda que tienen valores de respuesta a los impulsos del filtro en derivaciones intermedias de filtro. En el contexto de las respuestas a los impulsos del filtro de subbanda comprimida, la fabricación del mismo puede entenderse igualmente como generar o proporcionar las respuestas a los impulsos del filtro de subbanda comprimida como un sistema o un medio de almacenamiento interpretable por ordenador.
Como se indicó en el contexto de la descripción del módulo de blanqueo 402 en la figura 4, los métodos descritos para blanquear o ponderar la representación de evaluación A(n,k) o más bien la representación en valor absoluto ^ > que puede llevarse a cabo de acuerdo con la ecuación (4) se explicará con más detalle en el contexto de la figura 14. En consecuencia, la figura 14a muestra una representación esquemática de una característica de ejemplo del filtro 850, como función de la frecuencia del filtro en el dominio en el tiempo. Además, la figura 14a muestra esquemáticamente la disposición de las bandas de frecuencia correspondientes 860-0...... 860-4, que corresponden a las subbandas con índices k = 0 , 4 . Cada una de estas bandas de frecuencia 860 (utilizando signos de referencia resumidos como se indicó anteriormente) correspondiente a una de las subbandas con el índice de subbanda respectivo k se puede caracterizar además en términos de una frecuencia central, que se indica en la figura 14a como una línea discontinua 870-0...... 8704. La frecuencia central, así como las bandas de frecuencia de las subbandas respectivas están determinadas por la estructura interna de los bancos de filtros modulados complejos, empleados en el convertidor de filtro 101. Para ser más precisos, el filtro prototipo g(n) junto con la frecuencia central dependiendo del índice de subbanda k, como se puede ver, por ejemplo, en el caso de la ecuación (14), determina las bandas de la frecuencia correspondiente de la subbanda respectiva. Si, por ejemplo, el filtro prototipo del banco de filtros modulados complejos correspondiente p(n) o g(n) es un filtro paso bajo para la subbanda con el índice k = 0, debido a la modulación compleja expresada por la función exponencial en la ecuación (14), se transferirá al filtro paso banda para los índices de subbanda más altos
La figura 14b muestra una representación esquemática de las respuestas a los impulsos del filtro de subbanda de entrada como proporcionado, por ejemplo, por el convertidor de filtro 101. Para ser más precisos, la figura 14b muestra esquemáticamente lo que indica la representación de evaluación A(k,n) para las diferentes subbandas, indicada como un conjunto de flechas 880. Por razones de simplicidad solamente se muestra, para cada subbanda un conjunto de tres flechas 880 en la figura 14b para cada una de las subbandas 890-0......890-4. Como se indica por los corchetes 900-0......900-2, las cinco subbandas 890-0.......890-4 están dispuestas en tres subgrupos de subbandas 900-0, 900­ 1, 900-2, en donde el primer subgrupo 900-0 comprende solo la primera subbanda 890-0 (k = 0), mientras que el segundo y el tercer subgrupos 900-1,900-2, cada uno comprende dos, en términos de las subbandas vecinas de las frecuencias centrales 890-1 y 890-2, así como 890-3 y 890-4,
De acuerdo con el blanqueo o el blanqueo espectral realizado en el marco del módulo de blanqueo 402 que se muestra en la figura 4, de acuerdo con la ecuación (4) con respecto a cada uno de los subgrupos de subbandas 900, se determina el valor máximo de la representación de evaluación, y se restará luego de cada uno de los valores de representación de evaluación para obtener la representación de evaluación blanqueada Aw(k,n), como se muestra en la figura 14c. Como consecuencia de restar el valor máximo de la representación de evaluación, para cada uno de los subgrupos 900, la contribución máxima de la representación de evaluación se fijará a cero, como se indica en la figura 14c por los puntos 910.
Debido a la determinación del valor máximo para cada uno de los subgrupos 900 de acuerdo con la ecuación (4), cada uno de los subgrupos de subbandas 900 comprende al menos un valor de representación de evaluación blanqueada que tiene el valor de cero, en donde el resto de los valores de representación de evaluación blanqueada Aw(k,n) es menor o igual a cero. Como consecuencia, en cada uno de los subgrupos 900, al menos un valor se fija a cero y, por lo tanto, representa un valor máximo para que cada uno de los subgrupos de subbandas, que se determinaron de acuerdo con un modelo psico acústico en algunas de las realizaciones, en el curso de la compresión al menos un valor de respuesta a los impulsos del filtro de cada uno de los subgrupos 900, se conserve.
De este modo, en el curso del blanqueo espectral como se describió en la ecuación (4), la ponderación espectral o la energía espectral se transfiere desde las subbandas que tienen una frecuencia central más baja a las subbandas que tienen frecuencias más altas aplicando el esquema de blanqueo. Una comparación directa de las figuras 14b y 14c también subraya esto. Mientras que en la figura 14b los valores de representación de evaluación en el subgrupo 900­ 2 son significativamente más pequeños que los del subgrupo 900-1, después de aplicar el procedimiento de blanqueo, los valores de representación de evaluación blanqueados resultantes en los subgrupos 900-2 son significativamente mayores en comparación con al menos algunos de los valores de la representación de evaluación del subgrupo 900­ 1. Debe observarse en este contexto que el subgrupo 900-1 comprende dos valores de representación de evaluación de valor cero como se indica por los puntos 910, que se debe al hecho de que las representaciones de evaluación A(k,n) como se muestra en la figura 14b del subgrupo comprenden dos valores máximos idénticos, Esto, sin embargo, no es una violación de una aplicación de la ecuación (4). La ecuación (4) solo asegura que al menos un valor de la representación de evaluación de cada subgrupo se fija a cero y, por lo tanto, representa el valor máximo en el contexto de la representación de evaluación blanqueada Aw(k,n).
La figura 15 muestra una realización adicional de un compresor de filtro 501, que es capaz de procesar más de una respuesta a los impulsos del filtro de subbanda de entrada Hv(n,k). La estructura del compresor de filtro que se muestra en la figura 15 es muy similar a la que se muestra en la figura 5 y difiere de esa realización solo con respecto al hecho de que los módulos de representación en valor absoluto 303 comprende cada uno un valor absoluto y un módulo de función logarítmica 401 y un módulo de blanqueo 402, que también se muestra y explica en el contexto de la figura 4. Además, el módulo de cálculo de filtro o el constructor de respuesta a los impulsos del filtro 305 comprende, cada uno, un módulo diezmador del filtro 403, así como un calculador de ganancia 404 que puede realizarse como un componente opcional en el contexto de la figura 4.
La realización mostrada en la figura 15 difiere de la realización mostrada en la figura 5 además con respecto al generador de máscara 502 para múltiples filtros, Para ser más precisos, el generador de máscara 502 de la figura 15 comprende un módulo de cálculo medio 920, que puede, por ejemplo, realizar el cálculo de la representación del valor absoluto conjunto A(n,k) sobre la base de la representación en valor absoluto individual (opcionalmente blanqueado) Av(n,k) de acuerdo con la ecuación (9). Para ser aún más precisos, en el marco de la ecuación (9), las representaciones de valor absoluto individual o las representaciones de evaluación para cada uno de los filtros Av(n,k) para los filtros v = 0,...., (N-1) debe reemplazarse por las representaciones de evaluación blanqueadas apropiadas Awv (n, k), ya que estos valores de representación de evaluación blanqueada son proporcionados por los módulos de blanqueo 402 al módulo de cálculo medio 920. En una realización del compresor de filtro 501, como por ejemplo se muestra en la figura 15, el constructor de respuesta a los impulsos del filtro individual 305 para los diferentes filtros va = 0, (N-1), en donde N es el número de filtros proporcionados a la realización 501, puede realizarse como un constructor de respuesta a los impulsos del filtro único (global) 305 como se indica en la figura 15 por la línea discontinua. Para ser más precisos, dependiendo de la realización concreta y de las circunstancias técnicas, puede ser aconsejable realizar un único constructor de respuesta a los impulsos del filtro 305 más que N constructores de respuesta a los impulsos del filtro individual 305. Este puede ser el caso, por ejemplo, cuando la potencia de cálculo, al menos en el marco de los constructores de respuesta a los impulsos del filtro, no es un objetivo o requisito de diseño esencial. En otras palabras, también la realización 501 mostrada en la figura 15 puede considerarse como la realización en la que el procesador 820 y el constructor de respuesta a los impulsos del filtro 305 están conectados en serie entre una entrada y una salida del respectivo compresor de filtro 501.
Además, debe tenerse en cuenta que con respecto a las realizaciones de los métodos y de los métodos llevado a cabo por las realizaciones de los compresores de filtro 102, 501, las figuras 1 a 6, 13 y 15 también pueden considerarse como diagramas de flujo de los métodos respectivos, en los que el "sentido del flujo" está comprendido en el sentido de las señales. En otras palabras, las figuras mencionadas anteriormente no solo reflejan diferentes realizaciones de los compresores de filtro 102, 501, sino que también ilustran tanto, los métodos llevados a cabo por estas realizaciones, como las realizaciones de los métodos para generar las respuestas a los impulsos del filtro de subbanda comprimida por sí mismas.
Por lo tanto, las realizaciones de la presente invención se refieren a un compresor de filtro en el dominio de subbanda que a veces también se conoce como QMF (QMF = Banco de Filtros de Espejo en Cuadratura), que, por ejemplo, puede emplearse en el campo de las aplicaciones de audio, como el filtrado de funciones de transferencia relacionadas con la cabeza (HRTF) para una experiencia de sonido multicanal por medio de auriculares.
La presente invención se refiere al problema de la complejidad de cálculo del uso de largos filtros en el dominio QMF. La invención enseña nuevas formas de reducir el cálculo requerido al aplicar el filtrado en el dominio QMF seleccionando los coeficientes de filtro más relevantes en una representación frecuencia-tiempo de uno o más filtros, creando una máscara de filtro que indica los coeficientes de filtro más relevantes e ignorando los coeficientes no cubiertos por la máscara de filtro.
Sin embargo, en realizaciones de un compresor de filtro 501, no se requiere que el procesador 820 considere todos los filtros proporcionados al compresor de filtro 501 al examinar y seleccionar los valores de respuesta a los impulsos del filtro para las respuestas a los impulsos del filtro comprimido emitidas por el compresor de filtro. Sin embargo, las realizaciones de un compresor de filtro pueden adaptarse en este caso para construir también una respuesta a los impulsos del filtro comprimido o más de una respuesta a los impulsos del filtro comprimido para una o más respuestas a los impulsos del filtro de entrada, que no se han derivado en consideración en el marco de examinar y seleccionar los valores de respuesta a los impulsos del filtro. Esto puede, por ejemplo, ser aconsejable en el caso de que uno o más filtros sean perceptualmente no tan importantes así que para reducir aún más la complejidad de cálculo, no sea necesario tener en cuenta estos filtros al examinar y seleccionar los valores de respuesta a los impulsos del filtro.
Esto puede realizarse, por ejemplo, si uno o más filtros no tienen una magnitud significativa de energía o volumen. En estos casos, las distorsiones introducidas al no examinar y no seleccionar los valores de respuesta a los impulsos del filtro basados en estos filtros pueden ser aceptables dependiendo de las circunstancias especiales de estos filtros.
Algunas realizaciones de la presente invención comprenden las siguientes características:
- Convertir el filtro en el dominio en el tiempo o diversos filtros en una representación de filtro QMF compleja;
- Crear una representación tiempo/frecuencia de valor absoluto del filtro en el dominio QMF;
- Aplicar un blanqueo espectral de la representación en valor absoluto;
- Crear una máscara de filtro que indique los coeficientes de filtro deseados dada la representación tiempo/frecuencia de valor absoluto de uno o más filtros;
- Crear nuevos filtros QMF complejos que contengan los coeficientes indicados por la máscara de filtro;
Ajuste de la ganancia del nuevo filtro o filtros para obtener la misma ganancia de los nuevos filtros que los filtros originales,
Una realización de un aparato para recalcular la representación de filtros en el dominio QMF complejo es capaz de llevar a cabo:
- transformar el filtro en el dominio en el tiempo en una representación en el dominio QMF;
- crear una representación de filtro de la representación QMF del filtro;
- crear una máscara de filtro basada en la representación de la representación en el dominio QMF del filtro; y
- crear un nuevo filtro QMF basado en el primer filtro QMF y en la máscara de filtro.
Algunas realizaciones de la presente invención pueden resolver el problema de la alta complejidad de cálculo de filtrado de filtros largos, Presentan un compresor de filtro que funciona en el dominio complejo QMF. Algunas realizaciones de la presente invención, por lo tanto, pueden ofrecer una reducción de la complejidad de cálculo del filtrado. Las realizaciones de la presente invención pueden realizarse, por ejemplo, como un compresor de filtro, un método para fabricar respuestas a los impulsos del filtro de subbanda comprimidas, un medio de almacenamiento interpretable por ordenador o como un programa de ordenador.
Una realización de un compresor de filtro 102, 501 ofrece la oportunidad de mejorar la calidad de sonido en general significativamente, aunque las características de muchas respuestas a los impulsos relacionadas con el audio es tener un registro tiempo/frecuencia, más bien escaso. A menudo, la contribución más larga solo está presente para frecuencias bajas y la duración efectiva del tiempo es mucho más corta que la longitud nominal del filtro para frecuencias más altas. Las realizaciones de la presente invención, por ejemplo, en forma de compresores de filtro, son capaces de explotar estas características.
Además, debe tenerse en cuenta que las respuestas a los impulsos del filtro de subbanda comprimida, como lo proporciona una realización de un compresor de filtro, pueden almacenarse en un medio de almacenamiento interpretable por ordenador que haya almacenado en él un conjunto de o una pluralidad de respuestas a los impulsos de filtro de subbanda, que juntas se aproximen o representen un filtro HRTF en el dominio en el tiempo. En comparación con un respectivo conjunto de respuestas a los impulsos del filtro relacionadas con HRTF en el dominio QMF complejo, la pluralidad de respuestas a los impulsos del filtro de subbanda comprimida almacenadas en el medio de almacenamiento interpretable por ordenador, típicamente tiene una respuesta a los impulsos más corta, que puede realizarse si se tiene un número menor de valores de respuesta a los impulsos respectivos, por un número reducido de derivaciones intermedias de filtro no triviales o distintas de cero o una combinación de ambas.
Si, por ejemplo, las funciones de filtro HRTF correspondientes comprenden derivaciones intermedias de filtro Kh en el dominio en el tiempo, y las respuestas a los impulsos del filtro de subbanda comprimida almacenadas en el medio de almacenamiento interpretable por ordenador están destinadas a utilizarse en un subsistema con subbandas L, las respuestas a los impulsos más cortos típicamente comprenden menos de (Kh/ L) al menos en términos de una respuesta a los impulsos del filtro de subbanda. Preferiblemente, al menos una respuesta a los impulsos del filtro de subbanda comprende incluso menos de (Kh/L - 3) derivaciones intermedias de filtro no triviales o distintas de cero.
Además, si en el medio de almacenamiento interpretable por ordenador se almacenan más de una pluralidad de conjuntos de respuestas a los impulsos del filtro de subbandas correspondientes a los filtros HRTF en el dominio en el tiempo comprimidos, los conjuntos correspondientes de respuestas a los impulsos del filtro de subbanda comprimida comprenden un patrón de datos común, en el que el patrón de datos común indica valores de respuesta a los impulsos, que indican al menos en parte del conjunto de respuestas a los impulsos del filtro de subbanda almacenadas en el medio de almacenamiento interpretable por ordenador, los valores de respuesta a los impulsos que tienen un valor trivial o que faltan. En otras palabras, el patrón de datos común se relaciona con valores de respuesta a los impulsos del filtro no seleccionados en más de un conjunto de respuestas a los impulsos del filtro, que no ha sido utilizado por un constructor de respuesta a los impulsos del filtro como parte de una realización de un compresor de filtro. Tal patrón de datos (similar) puede, por ejemplo, ser causado por una máscara de filtro común M(n,k) proporcionada por un generador de máscara 502 para múltiples filtros de entrada Ha(n,k).
En otras palabras, un medio de almacenamiento interpretable por ordenador puede comprender no solo un conjunto único de (comprimido) respuestas a los impulsos del filtro de subbandas para diferentes subbandas, sino una pluralidad de respuestas a los impulsos del filtro. Cada uno de estos conjuntos de respuestas a los impulsos del filtro puede comprender un patrón de datos en común, cuando se mira como un todo, que viene dado por un valor de respuesta a los impulsos correspondiente que tiene un valor cero o falta en absoluto. Cada uno de estos conjuntos de respuestas a los impulsos del filtro comprende el mismo patrón de datos común que se almacena en el medio de almacenamiento interpretable por ordenador. Por ejemplo, si en un conjunto de valores de respuesta a los impulsos del filtro un valor específico indicado por el tiempo o el índice de muestra n y el índice de subbanda k falta o tiene un valor cero, los valores de respuesta a los impulsos identificados por la misma muestra o índice de tiempo n y el mismo índice de subbanda k de otros conjuntos de respuestas a los impulsos de subbanda, también faltan, son de valor cero o tienen otro valor predefinido. En este contexto, los diferentes conjuntos de respuestas a los impulsos del filtro se identifican o etiquetan mediante los respectivos índices v, en donde el índice v puede, por ejemplo, adquirir cualquiera de los valores enteros en el rango de 0 a (N- 1), en donde N es una vez más el número de filtros.
En otras palabras, el patrón de datos descrito anteriormente se refiere a valores de respuesta a los impulsos del filtro, que, por ejemplo, pueden no seleccionarse en el sentido descrito en el contexto de las realizaciones de un compresor de filtro 501. Por lo tanto, el patrón de datos es reconocible o puede definirse en términos de índices (n,k) que se refieren a los índices de muestra o de tiempo n y a los índices de subbandas k de diferentes conjuntos de respuestas a los impulsos del filtro identificadas por el índice de filtro respectivo v estando todos los conjuntos puestos a cero o faltando.
El medio de almacenamiento interpretable por ordenador puede, por ejemplo, comprender filtros relativos HRTF. Además, una pluralidad de conjuntos de respuestas a los impulsos del filtro de subbanda almacenadas en el medio de almacenamiento interpretable por ordenador puede ser un conjunto de respuestas a los impulsos del filtro para un sistema de audio espacial.
Es importante tener en cuenta que un medio de almacenamiento interpretable por ordenador puede ser, en principio, cualquier medio de almacenamiento interpretable por ordenador. Ejemplos de tales medios de almacenamiento interpretables por ordenador son medios de almacenamiento transportables, como un disquete, un CD, un CD-ROM, un DVD o cualquier otro medio de almacenamiento, que sea capaz de almacenar información de manera interpretable por ordenador. Además, también se pueden utilizar memorias integradas tales como RAM (memoria de acceso aleatorio), ROM (memoria de solo lectura), memorias de disco duro, NVM (memoria no volátil) o memorias flash. En otras palabras, un medio de almacenamiento interpretable por ordenador en el sentido de la presente solicitud no es solo un medio de almacenamiento portátil, sino también un medio de almacenamiento incorporado. Además, el término medios de almacenamiento interpretables por ordenador también se refiere a los medios en los que los datos o la información se pueden alterar o cambiar, así como a esas memorias, en las que la información de los datos respectivos no se puede cambiar.
Por lo tanto, de acuerdo con una realización de la presente invención, un medio de almacenamiento interpretable por ordenador puede haber almacenado en él una pluralidad de respuestas a los impulsos del filtro de subbanda, aproximando juntas una función de transferencia relacionada con la cabeza en el dominio del tiempo, en la que la pluralidad de respuestas de filtro a los impulsos del filtro de subbanda tienen una respuesta a los impulsos más corta en comparación con la función de transferencia relacionada con la cabeza en el dominio del tiempo.
En una realización del compresor de filtro 102, 501, el procesador 820 para examinar los valores de respuesta a los impulsos del filtro está adaptado para procesar los valores de respuesta a los impulsos del filtro de valores complejos, y el constructor de respuesta a los impulsos del filtro 305 está adaptado para procesar los valores de respuesta a los impulsos de valores complejos.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para examinar los valores de respuesta a los impulsos del filtro basados en un valor absoluto, de modo que los valores más altos son los valores absolutos más altos y el valor más bajo es un valor absoluto más bajo.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para examinar los valores de respuesta a los impulsos del filtro basados en un valor absoluto, una parte real, un valor absoluto de la parte real, una parte imaginaria, un valor absoluto de la parte imaginaria o una fase de los valores complejos de los valores de respuesta a los impulsos del filtro.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para calcular la representación de evaluación basada en un modelo psico acústico, o en un modelo basado en una característica de un oído humano. En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para calcular los valores absolutos basados en los valores de respuesta a los impulsos del filtro para obtener la representación de evaluación. En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para calcular los valores logarítmicos basados en los valores de respuesta a los impulsos del filtro para obtener la representación de evaluación. En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para calcular la representación de evaluación A(n,k) basada en la ecuación
Figure imgf000030_0001
en la que H(n,k) son los valores de respuesta a los impulsos del filtro, en la que n es un número entero que indica una muestra o un índice de tiempo, y en la que k es un número entero que indica un índice de la subbanda de las al menos dos respuestas a los impulsos del filtro de subbanda a los impulsos.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para calcular la representación de evaluación A(n,k) basándose en la ecuación
Figure imgf000030_0002
en la que n es un número entero que indica una muestra o índice de tiempo, en la que k es un número entero que indica un índice de las subbandas de las al menos respuestas a los impulsos del filtro de subbanda de entrada, y en la que s es un número real de valor distinto de cero.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para ponderar la representación de evaluación basándose en un modelo psico acústico basado en las frecuencias centrales de las subbandas correspondientes a las respuestas a los impulsos del filtro de subbanda de entrada para obtener una representación de evaluación blanqueada.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para ponderar la representación de evaluación basándose en al menos un subgrupo de subbandas, en el que cada subbanda pertenece como máximo a un subgrupo de subbandas.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para ponderar la representación de evaluación basándose en al menos un subgrupo de subbandas, en donde cada subgrupo de subbandas comprende al menos una subbanda y cada subbanda pertenece exactamente a un subgrupo de subbandas.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para ponderar la representación de evaluación basándose en al menos un subgrupo de subbandas, en donde cada subgrupo que comprende al menos dos subbandas comprende solo subbandas con frecuencias centrales vecinas con respecto a un conjunto de frecuencias centrales de todas las subbandas ordenadas de acuerdo con las frecuencias centrales respectivas de las subbandas.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para ponderar la representación de evaluación para obtener una representación de evaluación blanqueada de manera que cada subbanda o cada subgrupo de subbandas comprenda al menos un valor de la representación de evaluación blanqueada correspondiente a un valor de respuesta a los impulsos y que comprenda un valor predeterminado, adaptable, programable o fijo. En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para ponderar la representación de evaluación para cada subbanda individualmente.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para ponderar la representación de evaluación de tal manera que la ponderación comprende determinar un valor máximo para cada subgrupo de subbandas o para cada subbanda y restar el valor máximo determinado de cada valor de la representación de evaluación para el subgrupo respectivo de subbandas o para las respectivas subbandas.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para ponderar la representación de evaluación A(n,k) para obtener la representación de evaluación blanqueada Aw(n,k) basándose en la ecuación Aw(n,k) = A(n,k) —maxe/p) maxn A(n,l), k e I(p
en la que n es un entero que indica una muestra o índice de tiempo, en la que k y l son enteros que indican índices de las subbandas de las al menos dos respuestas a los impulsos del filtro de subbanda de entrada, en la que p es un entero que indica un subgrupo de subbandas, y en la l(p) es un conjunto de índices de subbanda comprendidos en el subgrupo de subbandas indicado por el entero p.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para ponderar la representación de evaluación de manera que la ponderación comprende determinar un valor máximo para cada subgrupo de subbandas o para cada subbanda y dividir cada valor de la representación de evaluación del subgrupo de subbandas respectivo o de la subbanda respectiva por el valor máximo determinado o un valor derivado del mismo para el subgrupo respectivo de subbandas o por el valor máximo determinado para la subbanda respectiva.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para encontrar los valores de respuesta a los impulsos del filtro basados en la representación de evaluación.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para examinar los valores de respuesta a los impulsos del filtro de manera que con respecto a al menos una subbanda o con respecto a al menos un subgrupo de subbandas menos del 50% del número total de valores de respuesta a los impulsos del filtro respectivos tengan valores inferiores a los valores más altos.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para examinar los valores de respuesta a los impulsos del filtro de modo que con respecto a al menos una subbanda, el número de valores de respuesta a los impulsos del filtro sea igual o menor que (Kq - 3).
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para examinar el valor de respuesta a los impulsos del filtro de tal manera que, basándose en la representación de evaluación o la representación de evaluación blanqueada, un número predeterminado, ajustable, fijo o programable de valores de respuesta a los impulsos tenga los valores más altos.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado de modo que el número predeterminado, ajustable, fijo o programable sea mayor o igual que el número de subbandas o igual o mayor que el número de subgrupos de subbandas.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para encontrar en al menos un valor de respuesta a los impulsos del filtro menor que los valores más altos, cuando el valor del valor de respuesta a los impulsos del filtro esté cerca de un nivel de alias de un banco de filtros correspondiente a la respuesta a los impulsos del filtro de subbanda de entrada.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para proporcionar la máscara M(n,k) que tiene un valor binario que indica si el valor de respuesta a los impulsos indicado por los enteros n,k tiene un valor más alto o tiene un valor más bajo que los valores más altos.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado de manera que examinar los valores de respuesta a los impulsos del filtro comprende seleccionar las respuestas a los impulsos del filtro que tengan los valores más altos.
En una realización del compresor de filtro 102, 501, el constructor de respuesta a los impulsos del filtro 305 está adaptado para construir las respuestas a los impulsos del filtro de subbanda comprimida usando los valores de respuesta a los impulsos del filtro que tengan un valor más alto por al menos uno de tomar y copiar los valores de respuesta a los impulsos respectivos.
En una realización del compresor de filtro 102, 501, el constructor de respuesta a los impulsos del filtro 305 está adaptado para construir las respuestas a los impulsos del filtro de subbanda comprimida HM(n,k) basándose en la ecuación
HM(n,k) = M(n,k) ■ H(n,k)
en la que H(n,k) son los valores de respuesta a los impulsos del filtro, M(n,k) es una máscara proporcionada por el procesador 820 que indica los valores de respuesta a los impulsos del filtro que tengan un valor más alto o un valor menor que los valores más altos, en la que la máscara comprende el valor 0 para un valor de respuesta a los impulsos del filtro que tenga un valor más bajo que los valores más altos, en la que n es un número entero que indica una muestra o índice de tiempo y en la que k es un número entero que indica un índice de las subbandas de las al menos dos respuestas a los impulsos del filtro de subbanda de entrada.
En una realización del compresor de filtro 102, 501, el constructor de respuesta a los impulsos del filtro 305 está adaptado para ajustar al menos un valor de respuesta a los impulsos del filtro de una respuesta a los impulsos del filtro de subbanda comprimida tal que el al menos un valor de respuesta a los impulsos del filtro ajustado comprenda un valor absoluto mayor en comparación con el valor absoluto del valor de respuesta a los impulsos del filtro correspondiente.
En una realización del compresor de filtro 102, 501, el constructor de respuesta a los impulsos del filtro 305 está adaptado para ajustar los valores de respuesta a los impulsos que tengan un valor más alto multiplicando los valores de respuesta a los impulsos respectivos por un factor de ganancia específico de subbanda dependiendo de la subbanda respectiva.
En una realización del compresor de filtro 102, 501, el constructor de respuesta a los impulsos de filtro 305 está adaptado para ajustar los valores de respuesta a los impulsos que tengan un valor más alto multiplicando los valores de respuesta a los impulsos respectivos por un factor de ganancia específico de subgrupo dependiendo del subgrupo respectivo de subbandas,
En una realización del compresor de filtro 102, 501, el constructor de respuesta a los impulsos de filtro 305 está adaptado para construir los valores de respuesta a los impulsos del filtro de subbanda comprimida proporcionando un valor de valor real basado en un valor de respuesta a los impulsos del filtro de valor complejo como el valor de respuesta a los impulsos del filtro de subbanda comprimida correspondiente, cuando el valor de respuesta de filtro de entrada de valor complejo corresponde a una frecuencia central por encima de una frecuencia límite.
En una realización del compresor de filtro 102, 501, el constructor de respuesta los impulsos de filtro 305 está adaptado de modo que el valor de valor real basado en el valor de respuesta a los impulsos del filtro de valor complejo sea al menos uno de una parte real, una parte imaginaria, un valor absoluto, una fase, una combinación lineal basada en los mismos, una expresión polinómica basada en los mismos y una expresión de valor real basada en los mismos.
En una realización del compresor de filtro 102, 501, el constructor de respuesta a los impulsos de filtro 305 está adaptado para proporcionar el valor de valor real reemplazando el valor de respuesta de filtro de entrada de valor complejo por el valor de valor real.
En una realización del compresor de filtro 102, 501, el constructor de respuesta a los impulsos de filtro 305 está adaptado de modo que la frecuencia límite esté en el rango de 1 kHz a 10 kHz.
En una realización del compresor de filtro 102, 501, el constructor de respuesta a los impulsos de filtro 305 está adaptado para proporcionar el valor de valor real basado en el valor de respuesta de filtro de entrada de valor complejo como el valor de respuesta a los impulsos comprimida como el correspondiente a la respuesta a los impulsos del filtro comprimida, cuando el valor de respuesta a los impulsos del filtro tenga un valor más alto.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para examinar los valores de respuesta a los impulsos del filtro de al menos dos respuestas a los impulsos del filtro de subbanda de entrada de al menos un conjunto de la pluralidad de conjuntos de respuestas a los impulsos del filtro de entrada, y en el que el procesador 820 está además adaptado para encontrar los valores de respuesta a los impulsos del filtro que tengan los valores más altos de al menos dos conjuntos de respuestas a los impulsos del filtro de entrada correspondientes a la misma frecuencia central.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para encontrar valores de respuesta a los impulsos del filtro que tengan los valores más altos de todos los conjuntos de respuestas a los impulsos del filtro de entrada correspondientes a la misma frecuencia central.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para encontrar valores de respuesta a los impulsos del filtro que tengan los valores más altos de al menos dos conjuntos de respuestas a los impulsos del filtro de entrada de la pluralidad de conjuntos de respuestas a los impulsos del filtro de entrada correspondientes a una misma muestra o índice de tiempo n, en donde n es un número entero.
En una realización del compresor de filtro 102, 501, el procesador 820 está adaptado para calcular la representación de evaluación A(n,k) basándose en una de las ecuaciones
A ' - l A! ~ ¡
A n , k ) = J ] A v(ni k) y A(n,k) = ^ A ^ ( n , k ) , r-0 r-0
en las que N es un número entero que indica el número de conjuntos de respuestas a los impulsos del filtro de entrada,
En una realización del medio de almacenamiento interpretable por ordenador, la pluralidad de conjuntos de respuestas a los impulsos del filtro de subbanda comprende un patrón de datos común.
En una realización del medio de almacenamiento interpretable por ordenador, el patrón de datos común se refiere a los valores de respuestas a los impulsos del filtro de valor cero o que faltan de las respuestas a los impulsos del filtro de subbanda de al menos dos conjuntos de respuestas a los impulsos del filtro de subbanda o de valores de valor real, cuando los valores de respuesta a los impulsos del filtro sean de valor complejo.
En una realización del medio de almacenamiento interpretable por ordenador, al menos un conjunto de respuestas a los impulsos de filtro de subbanda juntas se aproxima a un filtro de audio espacial.
Dependiendo de ciertos requisitos de ejecución de las realizaciones del método inventivo, las realizaciones del método inventivo pueden realizarse en hardware o en software. La realización puede realizarse utilizando un medio de almacenamiento digital, un medio de almacenamiento interpretable por ordenador, por ejemplo, un disco, CD o DVD que tenga una señal de control interpretable electrónicamente almacenada en el mismo, que coopera con un procesador, tal como se ejecuta una realización del método inventivo. En general, una realización de la presente invención es, por lo tanto, un producto de programa de ordenador con un código de programa almacenado en el soporte interpretable por el ordenador, siendo operativo el código de programa para realizar una realización de un método inventivo, cuando el programa de ordenador se ejecuta en un procesador. En otras palabras, las realizaciones de los métodos de la invención son, por lo tanto, un programa de ordenador que tiene un código de programa para realizar al menos una realización de los métodos inventivos, cuando el programa de ordenador se ejecuta en un ordenador. Un procesador, puede en este contexto, estar formado por un sistema de ordenador programable, un ordenador programable, una unidad central de procesamiento (CPU), un circuito integrado de aplicación específica (ASIC), un procesador u otro circuito integrado (IC).
Si bien lo anterior se ha mostrado y descrito particularmente con referencia a realizaciones en particular de las mismas, los expertos en la materia entenderán que se pueden realizar otros cambios en la forma y en los detalles sin apartarse del alcance de los mismos.
Debe entenderse que se pueden hacer diversos cambios en la adaptación a diferentes realizaciones, sin apartarse del concepto más amplio descrito en este documento y comprendido por las reivindicaciones siguientes.

Claims (14)

REIVINDICACIONES
1. Compresor de filtro (102, 501) para generar respuestas a los impulsos del filtro de subbanda comprimida de las respuestas a los impulsos del filtro de subbanda de entrada correspondientes a subbandas, que comprenden valores de respuesta a los impulsos del filtro en derivaciones intermedias de filtro, comprendiendo el filtro:
un procesador (820) para examinar los valores de respuesta a los impulsos del filtro de al menos dos respuestas a los impulsos del filtro de subbanda de entrada para encontrar valores de respuesta a los impulsos del filtro que tengan valores en un primer conjunto de valores, y al menos un valor de respuesta a los impulsos del filtro que tenga un segundo valor siendo el segundo valor inferior a los valores en el primer conjunto de valores; y
un calculador de respuesta a los impulsos del filtro (305) para calcular las respuestas a los impulsos de filtro de subbanda comprimida usando los valores de respuesta a los impulsos del filtro que tengan los valores en el primero conjunto de valores, en el que el calculador de respuesta a los impulsos del filtro (305) está adaptado para calcular las respuestas a los impulsos del filtro de subbanda comprimida de manera que las respuestas a los impulsos del filtro de subbanda comprimida
no incluyan los valores de respuesta a los impulsos del filtro correspondientes a las derivaciones intermedias de filtro del al menos un valor de respuesta a los impulsos del filtro que tenga el segundo valor;
o comprendan valores de respuesta a los impulsos del filtro de valor cero correspondientes a las derivaciones intermedias de filtro del al menos un valor de respuesta a los impulsos del filtro que tenga el segundo valor,
en el que uno o más valores de respuesta a los impulsos del filtro estén o estén cerca de un nivel de alias de banco de filtros utilizado para generar las respuestas a los impulsos del filtro de subbanda de entrada, y en el que el compresor de filtro (102, 501) está configurado para fijar a cero o no incluir valores de respuesta a los impulsos del filtro, cuando el valor de un valor de respuesta a los impulsos del filtro esté cerca de un nivel de alias del banco de filtros.
2. Compresor de filtro (102; 501) de acuerdo con la reivindicación 1, en el que el procesador (820) está adaptado para calcular una representación de evaluación basándose en los valores de respuesta a los impulsos del filtro de las respuestas del filtro de entrada.
3. Compresor de filtro (102; 501) de acuerdo con cualquiera de las reivindicaciones anteriores, en el que el procesador (820) está adaptado para encontrar al menos un valor de respuesta a los impulsos del filtro de cada subbanda o al menos un valor de respuesta a los impulsos del filtro de cada subgrupo de subbandas a incluir en el primer conjunto de valores independientemente del valor absoluto de los valores de respuesta a los impulsos de las subbandas o del subgrupo de subbandas.
4. Compresor de filtro (102; 501) de acuerdo con cualquiera de las reivindicaciones anteriores, en el que el procesador (820) está adaptado para encontrar valores de respuesta a los impulsos del filtro de modo que con respecto a al menos una subbanda, un número de valores de respuesta a los impulsos que tengan un valor inferior que los valores en el primer conjunto de valores, que sea menor que Kq, en el que el número de valores de respuesta a los impulsos del filtro de un filtro en el dominio en el tiempo correspondiente a las respuestas a los impulsos del filtro de subbanda de entrada sea al menos Kq • L, en donde L es el número de subbandas, y en donde Kq y L son enteros positivos.
5. Compresor de filtro (102; 501) de acuerdo con cualquiera de las reivindicaciones anteriores, en el que el procesador (820) está adaptado para encontrar un valor de respuesta a los impulsos del filtro menor que el conjunto de los primeros valores, cuando los valores de respuesta a los impulsos del filtro, el valor correspondiente de la representación de evaluación o el valor correspondiente de la representación de evaluación blanqueada estén por debajo de un umbral.
6. Compresor de filtro (102; 501) de acuerdo con cualquiera de las reivindicaciones anteriores, en el que el procesador (820) está adaptado para proporcionar una máscara M(n,k) que indique los valores de respuesta a los impulsos que tengan los valores del primer conjunto de valores, en la que n es un número entero que indica una muestra o índice de tiempo, y en la que k es un número entero que indica un índice de las subbandas de las al menos dos respuestas a los impulsos del filtro de subbanda de entrada.
7. Compresor de filtro (102; 501) de acuerdo con cualquiera de las reivindicaciones anteriores, en el que el calculador de respuesta a los impulsos del filtro (305) está adaptado para calcular las respuestas a los impulsos del filtro de subbanda comprimida utilizando los valores de respuesta a los impulsos del filtro que tengan valores en el primer conjunto de valores proporcionando los respectivos valores de respuesta a los impulsos del filtro de subbanda o los valores basados en ellos como los valores de respuesta a los impulsos del filtro de subbanda comprimida; y
por al menos uno de
fijar los valores de respuesta a los impulsos que tengan el segundo valor a cero;
sin tener en cuenta los valores de respuesta a los impulsos que tengan el segundo valor; y
proporcionar un valor de valor real basado en un valor de respuesta a los impulsos del filtro de valor complejo que tenga el segundo valor, cuando el valor de respuesta a los impulsos del filtro es de valor complejo.
8. Compresor de filtro (102; 501) de acuerdo con cualquiera de las reivindicaciones anteriores, en el que el calculador de los impulsos del filtro (305) está adaptado para ajustar los valores de respuesta a los impulsos del filtro que tengan los valores en el primer conjunto de valores multiplicando los respectivos valores de respuesta a los impulsos HM(n,k) por un factor de ganancia específico de subbanda G(k) basándose en la ecuación
Figure imgf000035_0001
para obtener las respuestas a los impulsos del filtro de subbanda comprimida H(n,k) basándose en la ecuación
H{n,k) = G{k)HM{n.k )
en la que H(n,k) son los valores de respuesta a los impulsos del filtro, en la que n es un número entero que indica una muestra o índice de tiempo, en la que k es un número entero que indica un índice de las subbandas de las al menos dos respuestas a los impulsos del filtro de subbanda de entrada, en la que Gmax es un número positivo de valor real que indica un factor de ganancia máxima, en la que e es un valor real de valor real positivo.
9. Compresor de filtro (102; 501) de acuerdo con cualquiera de las reivindicaciones 1 a 7, en el que el calculador de los impulsos del filtro (305) está adaptado para ajustar los valores de respuesta a los impulsos del filtro que tengan valores en el primer conjunto de valores multiplicando los respectivos valores de respuesta a los impulsos HM(n,k) por un factor de ganancia específico de subbanda G(p) basándose en la ecuación
Figure imgf000035_0002
en la que H(n,k) son los valores de respuesta a los impulsos del filtro, en la que n es un número entero que indica una muestra o índice de tiempo, en la que k es un número entero que indica un índice de las subbandas de las al menos dos respuestas a los impulsos del filtro de subbanda de entrada, en la que Gmax es un número positivo de valor real que indica un factor de ganancia máxima, en la que c es un número positivo de valor real, para obtener las respuestas a los impulsos del filtro de subbanda comprimida H (n>k) basándose en la ecuación
H (n ,k ) = G (p )H M (n ,k ) , k e l ( p ) ,
en la que p es un número entero que indica un índice de un subgrupo de subbandas, en la que I(p) es un conjunto de índices de subbandas comprendidas en el subgrupo de subbandas indicado por el índice p.
10. Compresor de filtro (502) de acuerdo con cualquiera de las reivindicaciones anteriores, en el que el compresor de filtro (501) está adaptado para generar una pluralidad de conjuntos de respuestas a los impulsos del filtro comprimidas basándose a una pluralidad de conjuntos de respuestas a los impulsos del filtro de entrada, en el que cada respuesta a los impulsos del filtro comprimida de un conjunto de respuestas a los impulsos del filtro comprimidas corresponde exactamente a una frecuencia central de una pluralidad de frecuencias centrales, correspondiendo cada frecuencia central de la pluralidad de frecuencias centrales exactamente a una respuesta a los impulsos del filtro comprimida de cada conjunto de la pluralidad de los conjuntos de respuestas a los impulsos del filtro comprimidas, cada impulso de filtro de entrada la respuesta de un conjunto de respuestas a los impulsos del filtro de entrada corresponde exactamente a una frecuencia central de la pluralidad de frecuencias centrales, y correspondiendo cada frecuencia central de la pluralidad de frecuencias centrales a exactamente una respuesta a los impulsos del filtro de entrada de cada conjunto de la pluralidad de conjuntos de respuestas a los impulsos del filtro de entrada.
11. Compresor de filtro (501) de acuerdo con la reivindicación 10, en el que el procesador (820) está adaptado para calcular una representación de evaluación Av(n,k) o una representación de evaluación blanqueada Awv(n,k) para cada conjunto de respuestas a los impulsos del filtro de entrada, en la que v es un número entero que indica los conjuntos de respuestas a los impulsos del filtro de entrada, en la que n es un número entero que indica una muestra o índice de tiempo, en la que k es un número entero que indica un índice de las subbandas, y en el que el procesador (820) está adaptado además para calcular la representación de evaluación A(n,k) basándose en al menos dos representaciones de evaluación Av(n,k) o en al menos dos representaciones de evaluación blanqueadas Awv(n,k).
12. Compresor de filtro (501) de acuerdo con cualquiera de las reivindicaciones 10 a 11, en el que el calculador de respuesta a los impulsos del filtro (305) está adaptado para calcular las respuestas a los impulsos del filtro de subbanda comprimidas de la pluralidad de conjuntos de respuestas a los impulsos del filtro comprimidas de manera que los valores de respuesta a los impulsos del filtro de las respuestas a los impulsos del filtro comprimidas correspondientes a las mismas frecuencias centrales y la misma muestra o índice de tiempo puestos a cero, no se incluyen en las respuestas a los impulsos del filtro comprimidas de la pluralidad de conjuntos de respuestas a los impulsos del filtro comprimidas o se reemplazan por un valor de valor real respectivo, cuando los correspondiente valores de respuesta a los impulsos del filtro son de valor complejo.
13. Método para generar respuestas a los impulsos del filtro de subbanda comprimidas a partir de respuestas a los impulsos del filtro subbanda de entrada correspondientes a las subbandas, que comprenden valores de respuesta a los impulsos del filtro en derivaciones intermedias de filtro, que comprende:
examinar los valores de respuesta a los impulsos del filtro de al menos dos respuestas a los impulsos del filtro de subbanda de entrada para encontrar valores de respuesta a los impulsos del filtro que tengan valores en un primer conjunto de valores y al menos un valor de respuesta a los impulsos del filtro que tenga un segundo valor, siendo el segundo valor más bajo que los valores en el primer conjunto de valores; y
calcular las respuestas a los impulsos del filtro de subbanda comprimidas utilizando los valores de respuesta a los impulsos del filtro que tengan los valores en el primer conjunto de valores,
en el que, las respuestas a los impulsos del filtro de subbanda comprimidas
no incluyen los valores de respuesta a los impulsos del filtro correspondientes a las derivaciones intermedias de filtro del al menos un valor de respuesta a los impulsos del filtro que tenga el segundo valor; o
comprenden los valores de respuesta a los impulsos del filtro de valor cero correspondientes a las derivaciones intermedias del filtro del al menos un valor de respuesta a los impulsos del filtro que tenga el segundo valor,
en el que uno o más valores de respuestas a los impulsos del filtro estén o estén cerca de un nivel de alias de un banco de filtros utilizado para generar las respuestas a los impulsos del filtro de subbanda de entrada, y en el que el método está configurado para fijar a cero o no incluir valores de respuesta a los impulsos del filtro, cuando el valor de un valor de respuesta a los impulsos del filtro esté cerca de un nivel de alias del banco de filtros.
14. Programa de ordenador para realizar, cuando se ejecuta en un procesador, un método de acuerdo con la reivindicación 13.
ES18199399T 2006-07-04 2007-07-03 Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro Active ES2812343T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE0601462 2006-07-04
US80660706P 2006-07-05 2006-07-05
PCT/EP2007/005887 WO2008003467A1 (en) 2006-07-04 2007-07-03 Filter unit and method for generating subband filter impulse responses

Publications (1)

Publication Number Publication Date
ES2812343T3 true ES2812343T3 (es) 2021-03-16

Family

ID=74871960

Family Applications (1)

Application Number Title Priority Date Filing Date
ES18199399T Active ES2812343T3 (es) 2006-07-04 2007-07-03 Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro

Country Status (2)

Country Link
ES (1) ES2812343T3 (es)
HU (1) HUE051138T2 (es)

Also Published As

Publication number Publication date
HUE051138T2 (hu) 2021-03-01

Similar Documents

Publication Publication Date Title
ES2905764T3 (es) Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro
ES2940283T3 (es) Filtración eficiente con un banco de filtros modulado complejo
ES2822163T3 (es) Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja
ES2496571T3 (es) Método y aparato para procesar una señal de medios
ES2374014T3 (es) Banco de filtros de análisis, banco de filtros de síntesis, codificador, descodificador, mezclador y sistema de conferencia.
ES2323294T3 (es) Dispositivo de decodificacion con una unidad de decorrelacion.
ES2709755T3 (es) Descodificación estéreo de predicción compleja basada en TCMD
ES2914474T3 (es) Método de decodificación de una señal de audio estéreo codificada usando una dirección de predicción variable
ES2297825T3 (es) Cuantificacion dependiente de energia para la codificacion eficaz de parametros de audio espaciales.
ES2307188T3 (es) Sintetizador multicanal y procedimiento para generar una señal de salida multicanal.
ES2300099T3 (es) Banco de filtros modulado parcialmente complejo.
ES2812343T3 (es) Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro
Bai et al. Multirate synthesis of reverberators using subband filtering