ES2446245T3

ES2446245T3 - Método y aparato para procesar una señal de medios

Info

Publication number: ES2446245T3
Application number: ES07701036.1T
Authority: ES
Inventors: Hyen O Oh; Hee Suck Pang; Dong Soo Kim; Jae Hyun Lim; Yang Won Jung
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2006-01-19
Filing date: 2007-01-19
Publication date: 2014-03-06
Anticipated expiration: 2027-01-19
Also published as: JP4814343B2; JP4695197B2; EP1974345A1; EP1974348B1; CA2636494C; KR100953643B1; TW200735037A; WO2007083955A1; US20090028344A1; TWI469133B; US20090003611A1; EP1974347B1; TW200939208A; EP1974345A4; US20080310640A1; US8351611B2; US8521313B2; TW200731833A; KR100953641B1; KR20080044868A

Abstract

Método de procesamiento de una señal de audio, que comprende las etapas siguientes: recibir una señal de submezcla e información espacial, incluyendo la información espacial por lo menos unosparámetros "CLD" de diferencia de nivel de canal, y siendo la señal de submezcla generada realizando lasubmezcla de una señal de audio multicanal; generar información de mapeado de fuentes utilizando información espacial; generar información de subrenderización aplicando información de filtro de función de transferencia relacionadacon la cabeza "HRTF" para obtener un efecto de sonido envolvente en la información de mapeado de fuentes;generar información de renderización integrando la información de subrenderización; y generar una señal de sonido envolvente que presenta el efecto del sonido envolvente aplicando la información derenderización a la señal de submezcla, en el que la señal de submezcla incluye un canal de entrada izquierdo y un canal de entrada derecho, y la señal de sonidoenvolvente generada incluye un canal de salida izquierdo y un canal de salida derecho, y la información de renderización comprende una primera información de renderización y una segunda informaciónde renderización, estando la primera información de renderización destinada a generar el canal de salidaizquierdo mediante su aplicación al canal de entrada izquierdo o a generar el canal de salida derecho mediantesu aplicación al canal de entrada derecho, y estando la segunda información de renderización destinada agenerar el canal de salida derecho mediante su aplicación al canal de entrada izquierdo o a generar el canal desalida izquierdo mediante su aplicación al canal de entrada derecho.

Description

Método y aparato para procesar una señal de medios.

5 Campo técnico

La presente invención se refiere a un aparato para procesar una señal de medios y un método del mismo, y más particularmente a un aparato para generar una señal de sonido envolvente mediante información espacial de la señal de medios y un método del mismo.

Antecedentes de la técnica

En general, diversos tipos de aparatos y métodos han gozado de un uso muy extendido en la generación de una señal de medios multicanal mediante la información espacial para la señal de medios multicanal y una señal de

15 submezcla (en inglés, “dwonmix signal”), en la que la señal de submezcla se genera realizando la submezcla de la señal de medios multicanal para su conversión como señal mono o estéreo.

Sin embargo, los métodos y aparatos anteriores no pueden utilizarse en entornos inadecuados para generar una señal multicanal. Por ejemplo, no pueden utilizarse para un dispositivo capaz de generar solo una señal estéreo. En

20 otras palabras, no existe ningún método o aparato para generar una señal de sonido envolvente, en los que la señal de sonido envolvente presente características multicanal en un entorno incapaz de generar una señal multicanal mediante la información espacial de la señal multicanal.

El documento "New use cases for spatial audio coding", de Pasi Ojala, ITU STUDY GROUP 16 - VIDEO CODING

25 EXPERTS GROUP -ISO/JEC MPEG & ITU-T VCEG (ISO/IEC JTC1/SC29/WG11 AND ITU-T SG16 Q6), se refiere a una descripción genérica de un decodificador SAC. Una señal de entrada que consiste en uno o dos canales de audio sometidos a submezcla se transforma primero al dominio QMF, tras lo cual se aplican los parámetros espaciales para reconstruir audio multicanal que se transforma después al dominio del tiempo mediante síntesis QMF.

30 El documento WO 2004/028204 A2 se refiere a un método y un sistema de medios para generar por lo menos una señal de salida a partir de por lo menos una señal de entrada de un segundo conjunto de señales de sonido que presentan un segundo conjunto relacionado de funciones "Head Related Transfer Functions".

35 En consecuencia, dado que no existe ningún método o aparato para generar una señal de sonido envolvente en un dispositivo capaz de generar solo una señal mono o estéreo, es difícil procesar con eficacia la señal de medios.

Exposición de la invención

40 Problema técnico

En consecuencia, la presente invención se dirige a un aparato para procesar una señal de audio y un método según las reivindicaciones 1 y 6, que evitan sustancialmente uno o más de los problemas debidos a las limitaciones y desventajas de la técnica relacionada.

45 Uno de los objetivos de la presente invención es ofrecer un aparato para procesar una señal de medios y un método del mismo, por medio de los cuales la señal de medios puede convertirse en una señal de sonido envolvente mediante la información espacial para la señal de medios.

50 En la descripción siguiente, se exponen características y ventajas adicionales de la presente invención, que en parte resultarán evidentes a partir de la presente descripción o se podrán deducir mediante la puesta en práctica de la presente invención. Los objetivos y otras ventajas de la presente invención se llevarán a cabo y alcanzarán mediante la estructura especialmente señalada en la descripción y las reivindicaciones, así como los dibujos adjuntos, del presente documento.

55 Solución técnica

Para obtener estas y otras ventajas y conforme al propósito de la presente invención, un método de procesamiento de una señal según la presente invención comprende las etapas siguientes: generación de información de mapeado

60 de fuente correspondiente a cada fuente de las diversas fuentes mediante información espacial que indica características entre las diversas fuentes; generación de información de subrenderización aplicando información de filtro que produce un efecto de sonido envolvente a la información de mapeado de fuente de cada fuente; generación de información de renderización para generar una señal de sonido envolvente integrando por lo menos una de las informaciones de subrenderización y generación de la señal de sonido envolvente aplicando la información de

65 renderización a una señal de submezcla generada realizando la submezcla de las diversas fuentes.

Para obtener además estas y otras ventajas y conforme al propósito de la presente invención, un aparato para procesar una señal comprende una unidad de mapeado de fuentes que genera información de mapeado de fuente correspondiente a cada fuente de las diversas fuentes mediante información espacial que indica características entre las diversas fuentes; una unidad de generación de información de subrenderización que genera información de

5 subrenderización aplicando información de filtro que presenta un efecto de sonido envolvente a la información de mapeado de fuente de cada fuente; una unidad de integración que genera información de renderización para generar una señal de sonido envolvente integrando la por lo menos una de las informaciones de subrenderización; y una unidad de renderización que genera la señal de sonido envolvente aplicando la información de renderización a una señal de submezcla generada realizando la submezcla de las diversas fuentes.

10 Debe tenerse en cuenta que tanto la descripción general anterior como la descripción detallada siguiente son ejemplificativas e ilustrativas y pretenden ofrecer más detalles de la invención reivindicada.

Efectos ventajosos

15 Un aparato y método de procesamiento de señales según la presente invención permiten que un decodificador, que recibe un tren de bits que comprende una señal de submezcla generada realizando la submezcla de una señal multicanal e información espacial de la señal multicanal, para generar una señal que presenta un efecto de sonido envolvente en entornos incapaces de recuperar la señal multicanal.

Breve descripción de los dibujos

Los dibujos adjuntos, que se facilitan para permitir una mayor comprensión de la presente invención y que se incorporan a la presente memoria y forman parte de esta, ilustran formas de realización de la presente invención y, 25 junto con la descripción, sirven para explicar los principios de la presente invención.

En los dibujos:

la figura 1 es un diagrama de bloques de un aparato de codificación de señales de audio y un aparato de 30 decodificación de señales de audio según una forma de realización de la presente invención;

la figura 2 es un diagrama estructural de un tren de bits de una señal de audio según una forma de realización de la presente invención;

35 la figura 3 es un diagrama de bloques detallado de una unidad de conversión de información espacial según una forma de realización de la presente invención;

las figuras 4 y 5 son diagramas de bloque de las configuraciones de canales utilizadas para el método de mapeado de fuentes según una forma de realización de la presente invención;

40 las figuras 6 y 7 son diagramas de bloque detallados de una unidad de renderización para una señal de submezcla estéreo según una forma de realización de la presente invención;

la figuras 8 y la figura 9 son diagramas de bloques detallados de una unidad de renderización para una señal de 45 submezcla mono según una forma de realización de la presente invención;

las figuras 10 y 11 son diagramas de bloque de una unidad de suavizado y una unidad de expansión según una forma de realización de la presente invención;

50 la figura 12 es un gráfico para describir un primer método de suavizado según una forma de realización de la presente invención;

la figura 13 es un gráfico para describir un segundo método de suavizado según una forma de realización de la presente invención;

55 la figura 14 es un gráfico para describir un tercer método de suavizado según una forma de realización de la presente invención;

la figura 15 es un gráfico para describir un cuarto método de suavizado según una forma de realización de la 60 presente invención;

la figura 16 es un gráfico para describir un quinto método de suavizado según una forma de realización de la presente invención;

65 la figura 17 es un diagrama para describir la información de filtro prototipo correspondiente a cada canal;

la figura 18 es un diagrama de bloques para un primer método de generación de información de filtro de renderización en una unidad de conversión de información espacial según una forma de realización de la presente invención;

la figura 19 es un diagrama de bloques para un segundo método de generación de información de filtro de renderización en una unidad de conversión de información espacial según una forma de realización de la presente invención;

la figura 20 es un diagrama de bloques para un tercer método de generación de información de filtro de renderización en una unidad de conversión de información espacial según una forma de realización de la presente invención;

la figura 21 es un diagrama para describir un método de generación de una señal de sonido envolvente en una unidad de renderización según una forma de realización de la presente invención;

la figura 22 es un diagrama para un primer método de interpolación según una forma de realización de la presente invención;

la figura 23 es un diagrama para un segundo método de interpolación según una forma de realización de la presente invención;

la figura 24 es un diagrama para un método de conmutación de bloques según una forma de realización de la presente invención;

la figura 25 es un diagrama de bloques para una posición a la cual se aplica una longitud de ventana elegida por una unidad de elección de longitud de ventana según una forma de realización de la presente invención;

la figura 26 es un diagrama para unos filtros de diversas longitudes utilizados en el procesamiento de una señal de audio según una forma de realización de la presente invención;

la figura 27 es un diagrama para un método de procesamiento de una señal de audio de forma dividida mediante una pluralidad de subfiltros según una forma de realización de la presente invención;

la figura 28 es un diagrama de bloques para un método de renderización de información de renderización de partición generada por una pluralidad de subfiltros para una señal de submezcla mono según una forma de realización de la presente invención;

la figura 29 es un diagrama de bloques para un método de renderización de información de renderización de partición generada por una pluralidad de subfiltros para una señal de submezcla estéreo según una forma de realización de la presente invención;

la figura 30 es un diagrama para un primer método de conversión de dominio de una señal de submezcla según una forma de realización de la presente invención y

la figura 31 es un diagrama de bloques para un segundo método de conversión de dominio de una señal de submezcla según una forma de realización de la presente invención.

Mejor modo de poner en práctica la invención

A continuación, se hará referencia detallada a las formas de realización preferidas de la presente invención, ejemplos de las cuales se ilustran en los dibujos adjuntos.

la figura 1 es un diagrama de bloques de un aparato de codificación de señales de audio y un aparato de decodificación de señales de audio según una forma de realización de la presente invención.

Con referencia a la figura 1, un aparato de codificación 10 comprende una unidad de submezcla 100, una unidad de generación de información espacial 200, una unidad de codificación de señales de submezcla 300, una unidad de codificación de información espacial 400 y una unidad de multiplexación 500.

Si se aplica una señal de audio multifuente (X1, X2,..., Xn) a la unidad de submezcla 100, la unidad de submezcla 100 realiza la submezcla de la señal aplicada y la convierte en una señal de submezcla. En este caso, la señal de submezcla comprende una señal de audio mono, estéreo y multifuente.

La fuente comprende un canal y, por conveniencia, se representa como un canal en la descripción siguiente. En la presente memoria, se toma como referencia la señal de submezcla mono o estéreo. Sin embargo, la presente invención no se limita a la señal de submezcla mono o estéreo.

El aparato de codificación 10 es capaz de utilizar opcionalmente una señal de submezcla arbitraria directamente facilitada desde un entorno externo.

La unidad de generación de información espacial 200 genera información espacial a partir de una señal de audio multicanal. La información espacial puede generarse en el transcurso de un método de submezcla. La unidad de codificación de señales de submezcla 300 y la unidad de codificación de información espacial 400, respectivamente, codifican la señal de submezcla generada y la información espacial y, a continuación, estas se transfieren a la unidad de multiplexación 500.

En la presente invención, "información espacial" se refiere a la información necesaria para generar una señal multicanal mediante la aplicación de aumento de mezcla a una señal de submezcla por un aparato de decodificación, en la que la señal de submezcla se genera mediante la aplicación de submezcla a la señal multicanal por un aparato de codificación y se transfiere al aparato de decodificación. La información espacial comprende parámetros espaciales. Los parámetros espaciales comprenden la CLD (diferencia de nivel de los canales) que indica una diferencia de energía entre los canales, las ICC (coherencias intercanal) que indican una correlación entre los canales, los CPC (coeficientes de predicción de canales) utilizados en la generación de tres canales a partir de dos canales, etc.

En la presente invención, "unidad de codificación de señales de submezcla" o "unidad de decodificación de señales de submezcla" se refieren a un códec que codifica o decodifica una señal de audio en lugar de información espacial. En la presente memoria, se toma como ejemplo de señal de audio una señal de audio de submezcla en lugar de la información espacial. La unidad de codificación o decodificación de señales de submezcla puede comprender una unidad de MP3, AC-3, DTS o AAC. Por otra parte, la unidad de codificación o de decodificación de señales de submezcla puede comprender un códec diseñado en el futuro, así como el códec de diseño anterior.

La unidad de multiplexación 500 genera un tren de bits multiplexando la señal de submezcla y la información espacial y, a continuación, transfiere el tren de bits generado al aparato de decodificación 20. La estructura del tren de datos se describirá en relación con la figura 2 más adelante.

Un aparato de decodificación 20 comprende una unidad de demultiplexación 600, una unidad de decodificación de señales de submezcla 700, una unidad de decodificación de información espacial 800, una unidad de renderización 900 y una unidad de conversión de información espacial 1000.

La unidad de demultiplexación 600 recibe un tren de bits y, a continuación, separa una señal de submezcla codificada y una información espacial codificada del tren de bits. Subsiguientemente, la unidad de decodificación de señales de submezcla 700 decodifica la señal de submezcla codificada, y la unidad de decodificación de información espacial 800 decodifica la información espacial codificada.

La unidad de conversión de información espacial 1000 genera información de renderización aplicable a una señal de submezcla mediante la información espacial y la información de filtro decodificadas. En este caso, la información de renderización se aplica a la señal de submezcla para generar una señal de sonido envolvente.

Por ejemplo, la señal de sonido envolvente se genera de la manera siguiente. En primer lugar, un método para generar una señal de submezcla a partir de una señal de audio multicanal llevado a cabo por el aparato de codificación 10 puede comprender varias etapas en las que se utiliza una caja OTT (uno a dos) o TTT (tres a tres). En este caso, puede generarse información espacial de cada una de las etapas. La información espacial se transfiere al aparato de decodificación 20. El aparato de decodificación 20 genera entonces una señal de sonido envolvente convirtiendo la información espacial y, a continuación, reproduciendo la información espacial convertida con una señal de submezcla. En lugar de generar una señal multicanal mediante el aumento de mezcla de una señal de submezcla, la presente invención se refiere a un método de renderización que comprende las etapas de extracción de información espacial para cada etapa de aumento de mezcla y de renderización mediante la información espacial extraída. Por ejemplo, el filtrado HRTF (Head-Related Transfer Functions) puede utilizarse en el método de renderización.

En este caso, la información espacial es un valor aplicable a un dominio híbrido también. Por lo tanto, la renderización puede clasificarse en los siguientes tipos conforme a los dominios.

En el primer tipo la renderización se ejecuta en un dominio híbrido haciendo pasar una señal de submezcla a través de un banco de filtros híbrido. En este caso, la conversión del dominio para la información espacial es innecesaria.

En el segundo tipo la renderización se ejecuta en el dominio del tiempo. En este caso, el segundo tipo aprovecha la modelización del filtro HRTF como filtro FIR (de respuesta finita inversa) o filtro IIR (de respuesta infinita inversa) en el dominio del tiempo. En consecuencia, es necesario un método para convertir información espacial en un coeficiente de filtro del dominio del tiempo.

En el tercer tipo la renderización se ejecuta en un dominio de frecuencia diferente. Por ejemplo, la renderización se ejecuta en el dominio de la DFT (transformada discreta de Fourier). En este caso, es necesario un método para transformar información espacial en un dominio correspondiente. En particular, el tercer tipo permite un funcionamiento rápido mediante la sustitución del filtrado en el dominio del tiempo por una operación en el dominio de la frecuencia.

En la presente invención, la información de filtro es la información necesaria para que un filtro procese una señal de audio y comprende un coeficiente de filtro facilitado a un filtro específico. A continuación se describen ejemplos de información de filtro. En primer lugar, la información de filtro prototipo es información de filtro original de un filtro específico y puede representarse como GL_L o de una forma similar. La información de filtro convertida indica un coeficiente de filtro una vez que la información de filtro prototipo se ha convertido y puede representarse como GL_L

o de una forma similar. La información de subrenderización se refiere a la información de filtro resultante de la espacialización de la información de filtro prototipo para generar una señal de sonido envolvente y puede representarse como FL_L1 o de una forma similar. La información de renderización se refiere a la información de filtro necesaria para la ejecución de la renderización y puede representarse como HL_L o de una forma similar. La información de renderización interpolada/suavizada se refiere a la información de filtro resultante de la interpolación/suavizado de la información de renderización y puede representarse como HL_L o de una forma similar. En la presente memoria se hace referencia a las informaciones de filtro anteriores. Sin embargo, la presente invención no está restringida por los nombres de las informaciones de filtro. En particular, las funciones HRTF se toman como ejemplo de información de filtro. Sin embargo, la presente invención no se limita a las funciones HRTF.

La unidad de renderización 900 recibe la señal de submezcla decodificada y la información de renderización y, entonces, genera una señal de sonido envolvente mediante la señal de submezcla decodificada y la información de renderización. La señal de sonido envolvente puede ser la señal para facilitar un efecto envolvente a un sistema de audio capaz de generar solo una señal estéreo. Además, la presente invención puede aplicarse a diversos sistemas, así como al sistema de audio capaz de generar solo la señal estéreo.

La figura 2 es un diagrama estructural para un tren de bits de una señal de audio según una forma de realización de la presente invención, en la que el tren de bits comprende una señal de submezcla codificada e información espacial codificada.

Con referencia a la figura 2, la carga útil de audio de 1 trama comprende un campo de señal de submezcla y un campo de datos auxiliares. La información espacial codificada puede almacenarse en el campo de datos auxiliares. Por ejemplo, si una carga útil de audio es de 48~128 kb/s, la información espacial puede presentar un rango de 5~32 kb/s. Sin embargo, los rangos de la carga útil de audio y la información espacial no están sujetos a ninguna limitación.

La figura 3 es un diagrama de bloques detallado de una unidad de conversión de información espacial según una forma de realización de la presente invención.

Con referencia a la figura 3, una unidad de conversión de información espacial 1000 comprende una unidad de mapeado de fuentes 1010, una unidad de generación de información de subrenderización 1020, una unidad de integración 1030, una unidad de procesamiento 1040 y una unidad de conversión de dominio 1050.

La unidad de mapeado de fuentes 101 genera información de mapeado de fuentes correspondiente a cada fuente de una señal de audio ejecutando el mapeado de fuentes mediante información espacial. En este caso, la información de mapeado de fuentes se refiere a información de cada fuente generada para corresponderse con cada fuente de una señal de audio mediante información espacial y similares. La fuente comprende un canal y, en este caso, se genera la información de mapeado de fuente correspondiente a cada canal. La información de mapeado de fuentes puede representarse como un coeficiente. El método de mapeado de fuentes se describirá en detalle más adelante con referencia a la figura 4 y la figura 5.

La unidad de generación de información de subrenderización 1020 genera información de subrenderización correspondiente a cada fuente mediante la información de mapeado de fuentes y la información de filtro. Por ejemplo, si la unidad de renderización 900 es el filtro HRTF, la unidad de generación de información de subrenderización 1020 es capaz de generar información de subrenderización mediante información de filtro HRTF.

La unidad de integración 1030 genera información de renderización integrando la información de subrenderización para que se corresponda con cada fuente de una señal de submezcla. La información de renderización, que se genera mediante la información espacial y la información de filtro, se refiere a la información para generar una señal de sonido envolvente mediante su aplicación a la señal de submezcla.

La información de renderización comprende un tipo de coeficiente de filtro. La integración puede omitirse para reducir la cantidad de operaciones del método de renderización. Subsiguientemente, la información de renderización se transfiere a la unidad de procesamiento 1042.

La unidad de procesamiento 1042 comprende una unidad de interpolación 1041 y/o una unidad de suavizado 1042. La información de renderización es interpolada por la unidad de interpolación 1041 y/o suavizada por la unidad de suavizado 1042.

La unidad de conversión de dominio 1050 convierte el dominio de la información de renderización al dominio de la señal de submezcla utilizada por la unidad de renderización 900. La unidad de conversión de dominio 1050 puede disponerse en una de diversas posiciones posibles, incluida la posición representada en la figura 3. Por consiguiente, si la información de renderización se genera en el mismo dominio que la unidad de renderización 900, se puede omitir la unidad de conversión de dominio 1050. La información de renderización de dominio convertido se transfiere a la unidad de renderización 900.

La unidad de conversión de información espacial 1000 puede comprender una unidad de conversión de información de filtro 1060. En la figura 3 la unidad de conversión de información de filtro 1060 está dispuesta dentro de la unidad de conversión de información espacial 100. Como alternativa, la unidad de conversión de información de filtro 1060 `puede estar dispuesta fuera de la unidad de conversión de información espacial 100. La unidad de conversión de información de filtro 1060 se convierte a fin de que resulte adecuada para generar información de subrenderización o información de renderización a partir de información de filtro aleatoria, por ejemplo, HRTF. El método de conversión de la información de filtro puede comprender las etapas siguientes.

En primer lugar, se incluye una etapa de adaptación de dominio para permitir su aplicación. Si el dominio de la información de filtro no coincide con el dominio para la ejecución de la renderización, es necesaria la etapa de adaptación de dominio. Por ejemplo, se necesita una etapa de conversión de información HRTF del dominio del tiempo al dominio DFT, QMF o un dominio híbrido para generar la información de renderización.

En segundo lugar, puede incluirse una etapa de reducción de coeficientes. En este caso, es fácil guardar la información HRTF de dominio convertido y aplicar la HRTF de dominio convertido a la información espacial. Por ejemplo, si un coeficiente de filtro prototipo tiene una respuesta de número de muestras (longitud) elevado, deberá almacenarse en la memoria un correspondiente coeficiente que corresponde a una respuesta que equivale a una correspondiente longitud total de 10 en el caso de los canales 5.1. Esto incrementa la carga de la memoria y la cantidad de operaciones. Para prevenir este problema, puede utilizarse un método para reducir el coeficiente de filtro que se va a almacenar y mantener al mismo tiempo las características de filtro en el método de conversión de dominio. Por ejemplo, la respuesta HRTF puede convertirse en varios valores de parámetros. En este caso, el método de generación de un parámetro y un valor de parámetro pueden diferir conforme al dominio aplicado.

La señal de submezcla pasa a través de una unidad de conversión de dominio 1110 y/o una unidad de decorrelación 1200 antes de reproducirse con la información de renderización. En caso de que el dominio de la información de renderización sea diferente del de la señal de submezcla, la unidad de conversión de dominio 1110 convierte el dominio de la señal de submezcla a fin de hacer corresponder los dos dominios.

La unidad de decorrelación 1200 se aplica a la señal de submezcla de dominio convertido. Esto puede conllevar una cantidad de operaciones relativamente superior a la de un método de aplicación de un decorrelador a la información de renderización. Sin embargo, permite evitar que se produzcan distorsiones en el método de generación de información de renderización. La unidad de decorrelación 1200 puede comprender una pluralidad de decorreladores que difieren entre sí en características si la cantidad de operaciones es admisible. Si la señal de submezcla es una señal estéreo, la unidad de decorrelación 1200 puede no utilizarse. En la figura 3, en caso de que en el método de renderización se utilice una señal de submezcla mono de dominio convertido, es decir, una señal de submezcla mono en un domino de frecuencia, híbrido, QMF o DFT, se utilizará un decorrelador en el correspondiente dominio. La presente invención comprende un decorrelador utilizado en el dominio del tiempo también. En este caso, una señal de submezcla mono anterior a la unidad de conversión de dominio 1100 se introduce directamente en la unidad de decorrelación 1200. Como decorrelador puede utilizarse un filtro IIR (o un filtro FIR) de primer orden o de orden superior.

Subsiguientemente, la unidad de renderización 900 genera una señal de sonido envolvente mediante la señal de submezcla, la señal de submezcla decorrelacionada y la información de renderización. Si la señal de submezcla es una señal estéreo, no es necesario utilizar la señal de submezcla decorrelacionada. Los detalles del método de renderización se facilitan más adelante con referencia a las figuras 6 a 9.

La señal de sonido envolvente es convertida al dominio del tiempo por una unidad de conversión de dominio inversa 1300 y, a continuación, se emite. En tal caso, el usuario puede oír un sonido que tiene un efecto multicanal a través de auriculares estereofónicos o similares.

Las figuras 4 y 5 son diagramas de bloques de las configuraciones de canales utilizadas para el método de mapeado de fuentes según una forma de realización de la presente invención. Un método de mapeado de fuentes es un método para generar información de mapeado de fuente correspondiente a cada fuente de una señal de audio mediante información espacial. Como se ha mencionado en la descripción anterior, la fuente comprende un canal, y puede generarse información de mapeado de fuentes de tal forma que se corresponda con los canales representados en la figura 4 y la figura 5. Se genera información de mapeado de fuentes de un tipo adecuado para un método de renderización.

Por ejemplo, si una señal de submezcla es una señal mono, puede generarse información de mapeado de fuentes 5 mediante información espacial, tal como CLD1~CLD5, ICC1~ICC5 y similares.

La información de mapeado de fuentes puede representarse como un valor tal como D_L (=DL), D_R (=DR), D_C (=DC), D_LFE (DLFE), D_Ls (=DLs), D_Rs (=DRs) y similares. En este caso, el método para generar la información de mapeado de fuentes es variable conforme a una estructura en árbol correspondiente a la información espacial, el

10 rango de información espacial que se va a utilizar y similares. En la presente memoria, la señal de submezcla es una señal mono, por ejemplo, que no impone ningún límite a la presente invención.

Las salidas del canal derecho e izquierdo obtenidas de la unidad de renderización 900 pueden expresarse como la figura matemática 1. 15

En este caso, el operador "*" indica un producto en un dominio DFT y puede sustituirse por una convolución en el dominio QMF o del tiempo.

20 La presente invención comprende un método de generación de los valores L, C, R, Ls y Rs sometiendo la información a mapeado de fuentes mediante información espacial o sometiendo la información a mapeado de fuentes mediante información espacial e información de filtro. Por ejemplo, puede generarse información de mapeado de fuentes mediante la CLD de la información espacial solo o la CLD y la ICC de la información espacial. A

25 continuación se describe el método de generación de información de mapeado de fuentes mediante la CLD solo.

En caso de que la estructura en árbol presente la estructura representada en la figura 4, un primer método de obtención de información de mapeado de fuentes mediante la CLD solo puede expresarse como la figura matemática 2.

En este caso:

y "m" indica una señal de submezcla mono.

En caso de que la estructura en árbol presente la estructura representada en la figura 5, un segundo método de obtención de información de mapeado de fuentes mediante la CLD solo puede expresarse como la figura matemática 3.

Si se genera información de mapeado de fuentes mediante la CLD solo, puede reducirse el efecto tridimensional.

10 Por lo tanto, se puede generar información de mapeado de fuentes mediante la ICC y/o el decorrelador. Una señal multicanal generada mediante el uso de una señal de salida de decorrelador dx(m) puede expresarse como la figura matemática 4.

15 En este caso, "A", "B" y "C" son valores que pueden representarse mediante la CLD y la ICC. Los valores "d0" a "d3" indican decorreladores. El valor "m" indica una señal de submezcla mono. Sin embargo, este método es incapaz de generar información de mapeado de fuentes, tal como D_L, D_R y similares.

20 Por consiguiente, el primer método de generación de información de mapeado de fuentes mediante la CLD, la ICC y/o los decorreladores para la señal de submezcla contempla dx(m) (x=0, 1, 2) como una entrada independiente. En este caso, el valor "dx" puede utilizarse para un método para generar información de filtro de subrenderización conforme a la figura matemática 5.

La información de renderización puede generarse conforme a la figura matemática 6 mediante el resultado de la figura matemática 5.

5 Se ofrecen detalles del método de generación de información de renderización más adelante. El primer método de generación de la información de mapeado de fuentes mediante la CLD, la ICC y/o los decorreladores procesa un valor de salida dx, es decir, "dx(m)" como una entrada independiente, lo cual puede incrementar la cantidad de operaciones.

10 Un segundo método de generación de información de mapeado de fuentes mediante la CLD, la ICC y/o los decorreladores emplea decorreladores aplicados al dominio de la frecuencia. En este caso, la información de mapeado de fuentes puede expresarse como la figura matemática 7.

15 En este caso, aplicando los decorreladores al dominio de la frecuencia, puede generarse la misma información de mapeado de fuentes, tal como D_L, D_R y similares antes de la aplicación de los decorreladores. Por consiguiente, la implementación tiene lugar de una manera sencilla.

20 Un tercer método de generación de información de mapeado de fuentes mediante la CLD, la ICC y/o los decorreladores emplea decorreladores que presentan la característica "pasa todo" de los decorreladores del segundo método. En este caso, la característica pasa todo se refiere a que el tamaño es fijo y solo se produce variación de la fase. La presente invención puede utilizar decorreladores que presentan la característica pasa todo de los decorreladores del primer método.

25 Un cuarto método de generación de información de mapeado de fuentes mediante la CLD, la ICC y/o los decorreladores lleva a cabo la decorrelación mediante decorreladores para los respectivos canales (por ej., L, R, C, Ls, Rs, etc.) en lugar de utilizar los decorreladores "d0" a "d3" del segundo método. En este caso, la información de mapeado de fuentes puede expresarse como la figura matemática 8.

30 En este caso, "k" es un valor de energía de una señal decorrelacionada determinada a partir de valores de CLD e ICC. Los valores "d_L", "d_R", "d_C", "d_Ls" y "d_Rs" indican decorreladores aplicados a los respectivos canales.

5 Un quinto método de generación de información de mapeado de fuentes mediante la CLD, la ICC y/o los decorreladores aumenta al máximo el efecto de decorrelación configurando los decorreladores "d_L" y "d_R" para que sean simétricos en el cuarto método y configurando los decorreladores "d_Ls" y "d_Rs" para que sean simétricos en el cuarto método. En particular, suponiendo que d_R=f(d_L) y d_Rs=f(d_Ls), es necesario diseñar los

10 decorreladores "d_L", "d_C" y "d_Ls" solamente.

Un sexto método de generación de información de mapeado de fuentes mediante la CLD, la ICC y/o los decorreladores consiste en configurar los decorreladores "d_L" y "d_Ls" para que presenten una correlación en el quinto método. Los decorreladores "d_L" y "d_C" pueden configurarse de tal forma que presenten un mapeado

15 también.

Un séptimo método de generación de información de mapeado de fuentes mediante la CLD, la ICC y/o los decorreladores consiste en utilizar los decorreladores del tercer método como una estructura en serie o anidada de los filtros pasa todo. El séptimo método aprovecha la ventaja que supone que la característica pasa todo se

20 mantenga aun cuando el filtro pasa todo se utilice como una estructura en serie o anidada. En caso de que se utilice el filtro pasa todo como la estructura en serie o anidada, será posible obtener una mayor diversidad de tipos de respuestas de fase. En consecuencia, el efecto de decorrelación puede aumentar al máximo.

Un octavo método de generación de información de mapeado de fuentes mediante la CLD, la ICC y/o los

25 decorreladores consiste en utilizar conjuntamente el decorrelador de técnica relacionada y el decorrelador del dominio de la frecuencia del segundo método. En este caso, la señal multicanal puede expresarse como la figura matemática 9.

30 En este caso, un método de generación de coeficientes de filtro utiliza el mismo método descrito en el primer método, excepto en que "A" se transforma en "A+Kd".

Un noveno método de generación de información de mapeado de fuentes mediante la CLD, la ICC y/o los decorreladores consiste en generar un valor sometido a decorrelación adicional mediante la aplicación de un

35 decorrelador del dominio de la frecuencia a la salida del decorrelador de técnica relacionada en caso de que se utilice el decorrelador de técnica relacionada. Por lo tanto, es posible generar información de mapeado de fuentes con una pequeña cantidad de operaciones superando la limitación del decorrelador del dominio de la frecuencia.

Un décimo método de generación de información de mapeado de fuentes mediante la CLD, la ICC y/o los 40 decorreladores se expresa como la figura matemática 10.

En este caso, "di_(m)" (i=L, R, C, Ls, Rs) es un valor de salida del decorrelador aplicado a un canal i. El valor de salida puede procesarse en el dominio del tiempo, el dominio de la frecuencia, el dominio QMF, un dominio híbrido o

5 similares. Si el valor de salida se procesa en un dominio que difiere del dominio procesado actualmente, este puede convertirse mediante conversión del dominio. Es posible utilizar el mismo valor "d" para los decorreladores d_L, d_R, d_C, d_Ls y d_Rs. En este caso, la figura matemática 10 puede expresarse de una manera muy sencilla.

Si la figura matemática 10 se aplica a la figura matemática 1, la figura matemática 1 puede expresarse como la 10 figura matemática 11.

En este caso, la información de renderización HM_L es el valor resultante de combinar información espacial e

15 información de filtro para generar una señal de sonido envolvente Lo con una entrada m. La información de renderización HM_R es un valor resultante de combinar información espacial e información de filtro para generar una señal de sonido envolvente Ro con una entrada m. Por otra parte, "d(m)" es el valor de salida de un decorrelador generado transfiriendo el valor de salida del decorrelador de un dominio arbitrario al valor del dominio actual, o el valor de salida del decorrelador generado tras ser procesado en el dominio actual. La Información de renderización

20 HMD_L es un valor que indica en qué medida se ha añadido el valor de salida del decorrelador d(m) a la señal "Lo" al representar el valor d(m), y también el valor resultante de combinar información espacial e información de filtro. La Información de renderización HMD_R es un valor que indica en qué medida se ha añadido el valor de salida del decorrelador d(m) a la señal "Ro" al representar el valor d(m).

25 Por lo tanto, a fin de aplicar un método de renderización a una señal de submezcla mono, la presente invención propone un método de generación de una señal de sonido envolvente mediante la renderización de la información de renderización generada combinando información espacial e información de filtro (por ejemplo, el coeficiente de filtro HRTF) para una señal de submezcla y una señal de submezcla decorrelacionada. El método de renderización puede ejecutarse independientemente de los dominios. Si "d(m)" se expresa como "d*m" (operador de producto)

30 ejecutado en el dominio de la frecuencia, la figura matemática 11 puede expresarse como la figura matemática 12.

Por lo tanto, en caso de aplicar un método de renderización a una señal de submezcla en el dominio de la 35 frecuencia, es posible reducir al mínimo la cantidad de operaciones en la manera de representar el valor resultante de combinar correctamente información espacial, información de filtro y los decorreladores como un producto.

Las figuras 6 y 7 son diagramas de bloques detallados de una unidad de renderización para una señal de submezcla estéreo según una forma de realización de la presente invención.

40 Con referencia a la figura 6, la unidad de renderización 900 comprende una unidad de renderización A 910 y una unidad de renderización B 920.

Si una señal de submezcla es una señal estéreo, la unidad de conversión de información espacial 1000 genera información de renderización para los canales izquierdo y derecho de la señal de submezcla. La unidad de renderización A 910 genera una señal de sonido envolvente reproduciendo la información de renderización para el canal izquierdo de la señal de submezcla para el canal izquierdo de la señal de submezcla. La unidad de renderización B 920 genera una señal de sonido envolvente representando la información de renderización para el canal derecho de la señal de submezcla para el canal derecho de la señal de submezcla. Los nombres de los canales constituyen solo ejemplos y no imponen ninguna limitación a la presente invención.

La información de renderización puede comprender información de renderización facilitada a un mismo canal e información de renderización facilitada a otro canal.

Por ejemplo, la unidad de conversión de información espacial 1000 es capaz de generar información de renderización HL_L y HL_R introducida en la unidad de renderización para el canal izquierdo de la señal de submezcla, facilitándose la información de renderización HL_L a una salida izquierda correspondiente al mismo canal y facilitándose la información de renderización HL_R a una salida derecha correspondiente al otro canal. La unidad de conversión de información espacial 1000 es capaz de generar información de renderización HL_R y HL_L introducida en la unidad de renderización para el canal derecho de la señal de submezcla, facilitándose la información de renderización HL_R a una salida derecha correspondiente al mismo canal y facilitándose la información de renderización HL_L a una salida izquierda correspondiente al otro canal.

Con referencia a la figura 7, la unidad de renderización 900 comprende una unidad de renderización 1A 911, una unidad de renderización 2A 912, una unidad de renderización 1B 921 y una unidad de renderización 2B 922.

La unidad de renderización 900 recibe una señal de submezcla estéreo e información de renderización desde la unidad de conversión de información espacial 1000. Subsiguientemente, la unidad de renderización 900 genera una señal de sonido envolvente reproduciendo la información de renderización para la señal de submezcla estéreo.

En particular, la unidad de renderización 1A 911 lleva a cabo la renderización mediante la información de renderización HL_L facilitada a un mismo canal, procedente de la información de renderización para el canal izquierdo de la señal de submezcla. La unidad de renderización 2A 912 lleva a cabo la renderización mediante la información de renderización HL_R facilitada a otro canal, procedente de la información de renderización para el canal izquierdo de la señal de submezcla. La unidad de renderización 1B 921 lleva a cabo la renderización mediante la información de renderización HR_R facilitada a un mismo canal, procedente de la información de renderización para el canal derecho de la señal de submezcla. La unidad de renderización 2B 922 lleva a cabo la renderización mediante la información de renderización HR_L facilitada a otro canal, procedente de la información de renderización para el canal derecho de la señal de submezcla.

En la siguiente descripción, la información de renderización facilitada a otro canal se denomina "información de renderización cruzada". La información de renderización cruzada HL_R o HR_L se aplica a un mismo canal y, a continuación, se añade a otro canal por medio de un dispositivo de adición. En este caso, la información de renderización cruzada HL_R y/o HR_L puede ser igual a cero. Si la información de renderización cruzada HL_R y/o HR_L es igual a cero, significa que no se ha realizado ninguna aportación a la correspondiente trayectoria.

A continuación se describe un ejemplo del método de generación de la señal de sonido envolvente representado en la figura 6 o la figura 7.

En primer lugar, si la señal de submezcla es una señal estéreo, la señal de submezcla definida como "x", la información de mapeado de fuentes generada mediante información espacial definida como "D", la información de filtro prototipo definida como "G", una señal multicanal definida como "p" y una señal de sonido envolvente definida como "y" pueden representarse mediante las matrices representadas en la figura matemática 13.

En este caso, si los valores anteriores se encuentran en el dominio de la frecuencia, estos podrán resolverse de la manera indicada a continuación.

En primer lugar, la señal multicanal p, representada en la figura matemática 14, puede expresarse como un producto entre la información de mapeado de fuentes D generada mediante la información espacial y la señal de submezcla x.

10 La señal de sonido envolvente y, representada en la figura matemática 15, puede generarse representando la información de filtro prototipo G para la señal multicanal p.

Figura matemática 15

15 y = G.p

En este caso, si se inserta la figura matemática 14 en p, puede generarse la figura matemática 16.

Figura matemática 16 20 y = GDx

En este caso, si la información de renderización H se define como H=GD, la señal de sonido envolvente y la señal de submezcla x pueden tener la relación de la figura matemática 17. 25

Por lo tanto, una vez que se ha generado la información de renderización H mediante procesamiento del producto entre la información de filtro y la información de mapeado de fuentes, la señal de submezcla x se multiplica por la 30 información de renderización H para generar la señal de sonido envolvente y.

Conforme a la definición de la información de renderización H, la información de renderización H puede expresarse como la figura matemática 18.

Las figuras 8 y 9 son diagramas de bloques detallados de una unidad de renderización para una señal de submezcla mono según una forma de realización de la presente invención.

Con referencia a la figura 8, la unidad de renderización 900 comprende una unidad de renderización A 930 y una unidad de renderización B 940.

Si la señal de submezcla es una señal mono, la unidad de conversión de información espacial 1000 genera la información de renderización HM_L y HM_R, siendo utilizada la información de renderización HM_L en la renderización de la señal mono para un canal izquierdo y siendo utilizada la información de renderización HM_R en la renderización de la señal mono para un canal derecho.

La unidad de renderización A 930 aplica la información de renderización HM_L a la señal de submezcla mono para generar una señal de sonido envolvente del canal izquierdo. La unidad de renderización B 940 aplica la información de renderización HM_R a la señal de submezcla mono para generar una señal de sonido envolvente del canal derecho.

En la unidad de renderización 900 del dibujo no se utiliza ningún decorrelador. Sin embargo, si la unidad de renderización A 930 y la unidad de renderización B 940 llevan a cabo la renderización mediante las respectivas informaciones de renderización y Hmoverall_L Hmoverall_R definidas en la figura matemática 12, es posible obtener las respectivas salidas a las cuales se aplica el decorrelador.

Mientras tanto, en caso de que se trate de obtener una salida de una señal estéreo en lugar de una señal de sonido envolvente una vez terminada la renderización aplicada a una señal de submezcla mono, pueden ponerse en práctica los dos métodos indicados a continuación.

El primer método consiste en utilizar un valor utilizado para una salida estéreo en lugar de utilizar la información de renderización para un efecto envolvente. En este caso, es posible obtener una señal estéreo modificando solo la información de renderización en la estructura representada en la figura 3.

El segundo método consiste en un método de decodificación para generar una señal multicanal mediante una señal de submezcla e información espacial que permite obtener una señal estéreo aplicando el método de decodificación solo a una correspondiente etapa para obtener un número de canales específico.

Con referencia a la figura 9, la unidad de renderización 900 corresponde a un caso en el que la señal decorrelacionada se representa como una (figura matemática 11). La unidad de renderización 900 comprende una unidad de renderización 1A 931, una unidad de renderización 2A 932, una unidad de renderización 1B 941 y una unidad de renderización 2B 942. La unidad de renderización 900 es similar a la unidad de renderización para la señal de submezcla estéreo, excepto en que la unidad de renderización 900 comprende las unidades de renderización 941 y 942 para una señal decorrelacionada.

En el caso de la señal de submezcla estéreo, puede interpretarse que uno de los dos canales es una señal decorrelacionada. Por lo tanto, sin emplear decorreladores adicionales, es posible realizar un método de renderización mediante los cuatro tipos de información de renderización definidos anteriormente HL_L, HL_R, etc. En particular, la unidad de renderización 1A 931 genera una señal que se va a facilitar a un mismo canal aplicando la información de renderización HM_L a una señal de submezcla mono. La unidad de renderización 2A 932 genera una señal que se va a facilitar a otro canal aplicando la información de renderización HM_R a la señal de submezcla mono. La unidad de renderización 1B 941 genera una señal que se va a facilitar a un mismo canal aplicando la información de renderización HMD_R a una señal decorrelacionada. La unidad de renderización 2B 942 genera una señal que se va a facilitar a otro canal aplicando la información de renderización HMD_L a la señal decorrelacionada.

Si la señal de submezcla es una señal mono, la señal de submezcla definida como x, la información de canal de fuente definida como D, la información de filtro prototipo definida como G, la señal multicanal definida como p y la señal de sonido envolvente definida como y pueden representarse mediante las matrices indicadas en la figura matemática 19.

En este caso, la relación entre las matrices es similar a la del caso en el que la señal de submezcla es la señal estéreo. Por este motivo, se omiten los detalles de esta.

5 Mientras tanto, la información de mapeado de fuentes descrita con referencia a la figura 4 y la figura 5 y la información de renderización generada mediante la información de mapeado de fuentes presentan valores diferentes dependiendo de la banda de frecuencias, la banda de parámetros y/o el intervalo de tiempo transmitido. En este caso, si el valor de la información de mapeado de fuentes y/o la información de renderización presenta una

10 diferencia considerable entre bandas o entre intervalos de tiempo adyacentes, podría producirse distorsión en el método de renderización. Para evitar la distorsión, es necesario aplicar un método de suavizado en el dominio de la frecuencia y/o en el dominio del tiempo. Además del suavizado en el dominio de la frecuencia y/o el suavizado en el dominio del tiempo puede utilizarse otro método de suavizado adecuado para la renderización. Es posible utilizar el valor resultante de multiplicar la información de mapeado de fuentes o la información de renderización por una

15 ganancia específica.

Las figuras 10 y 11 son diagramas de bloques de una unidad de suavizado y una unidad de expansión según una forma de realización de la presente invención.

20 Un método de suavizado según la presente invención, tal como el representado en la figura 10 y la figura 11, es aplicable a la información de renderización y/o la información de mapeado de fuentes. No obstante, el método de suavizado es aplicable a otro tipo información. La descripción siguiente se refiere al suavizado en el dominio de la frecuencia. Sin embargo, la presente invención comprende suavizado en el dominio del tiempo y suavizado en el dominio de la frecuencia.

25 Con referencia a la figura 10 y la figura 11, la unidad de suavizado 1042 es capaz de aplicar el suavizado a la información de renderización y/o la información de mapeado de fuentes. Más adelante se describirá un ejemplo detallado de la posición del suavizado con referencia a las figuras 18 a 20.

30 La unidad de suavizado 1042 puede configurarse con una unidad de expansión 1043, en la que la información de renderización y/o la información de mapeado de fuentes puede expandirse hasta un rango más amplio que el de una banda de parámetros, por ejemplo, una banda de filtros. En particular, la información de mapeado de fuentes puede ampliarse hasta una resolución de frecuencia (p. ej., banda de filtros) correspondiente a la información de filtro que se va a multiplicar por la información del filtro (por ejemplo, el coeficiente de filtro HRTF). El suavizado según la

35 presente invención se ejecuta antes o junto con la expansión. Cuando el suavizado tiene lugar junto con la expansión, se puede emplear uno de los métodos representados en las figuras 12 a 16.

La figura 12 es un gráfico para ilustrar un primer método de suavizado según una forma de realización de la presente invención.

40 Con referencia a la figura 12, un primer método de suavizado utiliza un valor que tiene el mismo tamaño que la información espacial de cada banda de parámetro. En este caso, es posible conseguir un efecto de suavizado mediante una función de suavizado adecuada.

45 La figura 13 es un gráfico para describir un segundo método de suavizado según una forma de realización de la presente invención.

Con referencia a la figura 13, un segundo método de suavizado consiste en obtener un efecto de suavizado conectando posiciones representativas de la banda de parámetros. La posición representativa es el centro justo de

50 cada una de las bandas de parámetros, una posición central proporcional a una escala logarítmica, una escala Bark

o similares, un valor de la frecuencia más baja o una posición determinada previamente mediante un método diferente.

La figura 14 es un gráfico para describir un tercer método de suavizado según una forma de realización de la presente invención.

Con referencia a la figura 14, un tercer método de suavizado consiste en aplicar suavizado en forma de una curva o una línea recta para conectar con suavidad los límites de conexión de los parámetros. En este caso, el tercer método de suavizado utiliza una curva de suavizado de bordes predefinida o un filtrado pasabaja por el filtro IIR o el filtro FIR de primer orden o superior.

La figura 15 es un gráfico para describir un cuarto método de suavizado según una forma de realización de la presente invención.

Con referencia a la figura 15, un cuarto método de suavizado consiste en conseguir un efecto de suavizado añadiendo una señal, tal como un ruido aleatorio, a un contorno de información espacial. En este caso, puede utilizarse un valor que difiere en canal o en banda como ruido aleatorio. En caso de añadir un ruido aleatorio en el dominio de la frecuencia, es posible añadir solo un valor de tamaño dejando intacto un valor de fase. El cuarto método de suavizado permite obtener un efecto de decorrelación intercanal, así como un efecto de suavizado en el dominio de la frecuencia.

La figura 16 es un gráfico para describir un quinto método de suavizado según una forma de realización de la presente invención.

Con referencia a la figura 16, un quinto método de suavizado consiste en utilizar una combinación de los métodos de suavizado segundo a cuarto. Por ejemplo, una vez que se han conectado las posiciones representativas de las respectivas bandas de parámetros, se añade el ruido aleatorio y a continuación se aplica filtrado pasa baja. Al hacerlo, la secuencia puede modificarse. El quinto método de suavizado reduce al mínimo los puntos discontinuos en el dominio de la frecuencia y el efecto de decorrelación intercanal puede mejorarse.

En los métodos de suavizado primero a quinto, el total de potencias para los valores de información espacial (por ejemplo, los valores de CLD) en los respectivos dominios de frecuencia de cada canal debe ser tan uniforme como una constante. Por ello, tras realizarse el método de suavizado en cada canal, deberá realizarse la normalización de las potencias. Por ejemplo, si una señal de submezcla es una señal mono, los valores de nivel de los respectivos canales deberían satisfacer la relación de las figura matemática 20.

En este caso, "pb = 0~número total de bandas de parámetros 1", y "C" es una constante arbitraria.

La figura 17 es un diagrama para describir la información de filtro prototipo de cada canal.

Con referencia a la figura 17, para la renderización, una señal que ha pasado a través del filtro GL_L para una fuente de canal izquierdo se envía a una salida izquierda, mientras que una señal que ha pasado a través del filtro GL_R se envía a una salida derecha.

Subsiguientemente, una salida final izquierda (por ejemplo, Lo) y una salida final derecha (por ejemplo, Ro) se generan combinando todas las señales recibidas desde los respectivos canales. En particular, las salidas de canal izquierdo/derecho reproducidas pueden expresarse como la figura matemática 21.

En la presente invención, las salidas de canal izquierdo/derecho reproducidas pueden generarse mediante los valores L, R, C, Ls y Rs generados decodificando la señal de submezcla en la señal multicanal mediante la información espacial. La presente invención es capaz de generar las salidas de canal izquierdo/derecho reproducidas mediante la información de renderización sin generar los valores L, R, C, Ls y Rs, generándose la información de renderización mediante la información espacial y la información de filtro.

A continuación se describe un método para generar información de renderización mediante información espacial, con referencia a las figuras 18 a 20.

5 La figura 18 es un diagrama de bloques para un primer método de generación de información de renderización en una unidad de conversión de información espacial 900 según una forma de realización de la presente invención.

Con referencia a la figura 18, tal como se ha mencionado en la descripción anterior, la unidad de conversión de información espacial 900 comprende la unidad de mapeado de fuentes 1010, la unidad de generación de

10 información de subrenderización 1020, la unidad de integración 1030, la unidad de procesamiento 1040 y la unidad de conversión de dominio 1050. La unidad de conversión de información espacial 900 presenta la misma configuración representada en la figura 3.

La unidad de generación de información de subrenderización 1020 comprende por lo menos una o más unidades de 15 generación de información de subrenderización (1.ª unidad de generación de información de subrenderización a N.ª unidad de generación de información de subrenderización).

La unidad de generación de información de subrenderización 1020 genera información de subrenderización mediante la información de filtro y la información de mapeado de fuentes.

20 Por ejemplo, si una señal de submezcla es una señal mono, la primera unidad de generación de información de subrenderización es capaz de generar información de subrenderización correspondiente a un canal izquierdo del multicanal. La información de subrenderización puede representarse como la figura matemática 22 mediante la información de mapeado de fuentes D_L y la información de filtro convertida GL_L' y GL_R'.

En este caso, el valor D_L se genera mediante la información espacial en la unidad de mapeado de fuentes 1010. Sin embargo, un método para generar el valor D_L puede seguir la estructura en árbol.

30 La segunda unidad de generación de información de subrenderización es capaz de generar información de subrenderización FR_L y FR_R correspondiente a un canal derecho del multicanal. La N.ª unidad de generación de información de subrenderización es capaz de generar información de subrenderización FRs_L y FRs_R correspondiente a un canal derecho de sonido envolvente del multicanal.

35 Si una señal de submezcla es una señal estéreo, la primera unidad de generación de información de subrenderización es capaz de generar información de subrenderización correspondiente al canal izquierdo del multicanal. La información de subrenderización puede representarse como la figura matemática 23 mediante la información de mapeado de fuentes D_L1 y D_L2.

En la figura matemática 23, la información FL_R1 se explica por ejemplo de la siguiente manera.

5 En primer lugar, en la FL_R1, "L" indica una posición del multicanal, "R" indica un canal de salida de una señal de sonido envolvente y "1" indica un canal de la señal de submezcla. En concreto, la FL_R1 indica la información de subrenderización utilizada en la generación del canal de salida derecho de la señal de sonido envolvente a partir del canal izquierdo de la señal de submezcla.

10 En segundo lugar, los valores D_L1 y D_L2 se generan mediante la información espacial en la unidad de mapeado de fuentes 1010.

Si la señal de submezcla es una señal estéreo, es posible generar una pluralidad de informaciones de subrenderización a partir de por lo menos una unidad de generación de información de subrenderización de la

15 misma manera que en el caso en que la señal de submezcla es la señal mono. Los tipos de informaciones de subrenderización generadas por una pluralidad de las unidades de generación de información de subrenderización son ejemplos no limitativos de la presente invención.

La información de subrenderización generada por la unidad de generación de información de subrenderización 1020

20 se transfiere a la unidad de renderización 900 por medio de la unidad de integración 1030, la unidad de procesamiento 1040 y la unidad de conversión de dominio 1050.

La unidad de integración 1030 integra las informaciones de subrenderización generadas para cada canal como información de renderización (por ejemplo, HL_L, HL_R, HR_L, HR_R) para un método de renderización. A

25 continuación se describe un método de integración efectuado en la unidad de integración 1030 para el caso de una señal mono y el caso de una señal estéreo.

En primer lugar, si la señal de submezcla es una señal mono, la información de renderización puede expresarse como la figura matemática 24.

En segundo lugar, si la señal de submezcla es una señal estéreo, la información de renderización puede expresarse como la figura matemática 25.

Subsiguientemente, la unidad de procesamiento 1040 comprende una unidad de interpolación 1041 y/o una unidad de suavizado 1042 y realiza la interpolación y/o el suavizado para la información de renderización. La interpolación 5 y/o el suavizado pueden ejecutarse en el dominio del tiempo, el dominio de la frecuencia o el dominio QMF. En la presente memoria, el dominio del tiempo es un ejemplo que no impone ninguna limitación a la presente invención.

La interpolación se realiza para obtener información de renderización no existente entre las informaciones de renderización si la información de renderización transmitida presenta un amplio intervalo en el dominio del tiempo.

10 Por ejemplo, en el supuesto de que existan informaciones de renderización en un n-ésimo intervalo de tiempo y un (n+k)-ésimo intervalo de tiempo (k>1), respectivamente, será posible realizar la interpolación lineal en un intervalo de tiempo no transmitido mediante las informaciones de renderización generadas (por ejemplo, HL_L, HR_L, HL_R, HR_R).

15 La información de renderización generada a partir de la interpolación se describe con referencia al caso en que la señal de submezcla es una señal mono y al caso en que la señal de submezcla es una señal estéreo.

Si la señal de submezcla es la señal mono, la información de renderización interpolada puede expresarse como la figura matemática 26.

Si la señal de submezcla es la señal estéreo, la información de renderización interpolada puede expresarse como la figura matemática 27.

En este caso, es 0 <j<k. "j" y "k" son números enteros. Y "a" es un número real correspondiente a "0<a<1" que se expresará como la figura matemática 28.

30 Figura matemática 28

a = j/k

35 Entonces, sería posible obtener un valor correspondiente al intervalo de tiempo no transmitido en una línea recta que conecta los valores en los dos intervalos de tiempo según la figura matemática 27 y la figura matemática 28. Los detalles de la interpolación se facilitarán más adelante con referencia a la figura 22 y la figura 23.

En caso de que un valor de filtro varíe bruscamente entre dos intervalos de tiempo adyacentes en el dominio del

40 tiempo, la unidad de suavizado 1042 ejecuta el suavizado para prevenir un problema de distorsión debido a la presencia de un punto discontinuo. El suavizado en el dominio del tiempo puede llevarse a cabo mediante el método de suavizado descrito con referencia a las figuras 12 a 16. El suavizado puede realizarse junto con la expansión. El suavizado puede variar según la posición aplicada. Si la señal de submezcla es una señal mono, el suavizado en el dominio del tiempo puede representarse como la figura matemática 29.

En concreto, el suavizado puede ejecutarse mediante el tipo de filtro IIR de 1 polo obtenido multiplicando la información de renderización HM_L(n-1) o HM_R(n-1) suavizada en un intervalo de tiempo anterior n-1 por (1-b), multiplicando la información de renderización HM_L(n) o HM_R(n) generada en un intervalo de tiempo actual n por b

10 y sumando las dos multiplicaciones. En este caso, "b" es una constante para 0<b<1. Si "b" disminuye, el efecto de suavizado aumenta. Si "b" aumenta, el efecto de suavizado disminuye. El resto de los filtros puede aplicarse de la misma manera.

La interpolación y el suavizado pueden representarse como la expresión de la figura matemática 30 mediante la 15 figura matemática 29 para el suavizado en el dominio del tiempo.

Si la unidad de interpolación 1041 realiza la interpolación y/o si la unidad de suavizado 1042 realiza el suavizado, 20 puede obtenerse información de renderización que presenta un valor de energía diferente al de la información de renderización prototipo. Para prevenir este problema, puede llevarse a cabo también la normalización de la energía.

Por último, la unidad de conversión de dominio 1050 aplica conversión de dominio a la información de renderización de un dominio para ejecutar la renderización. Si el dominio para ejecutar la renderización es idéntico al dominio de la 25 información de renderización, no es necesario ejecutar la conversión del dominio. A continuación, la información de renderización de dominio convertido se transfiere a la unidad de renderización 900.

La figura 19 es un diagrama de bloques para un segundo método de generación de información de renderización en una unidad de conversión de información espacial según una forma de realización de la presente invención.

30 El segundo método es similar al primer método en la medida en que una unidad de conversión de información espacial 1000 comprende una unidad de mapeado de fuentes 1010, una unidad de generación de información de subrenderización 1020, una unidad de integración 1030, una unidad de procesamiento 1040 y una unidad de conversión de dominio 1050, y en la medida en que la unidad de generación de información de subrenderización

35 1020 comprende por lo menos una unidad de generación de información de subrenderización.

Con referencia a la figura 19, el segundo método de generación de la información de renderización difiere del primer método en la posición de la unidad de procesamiento 1040. Por lo tanto, la interpolación y/o el suavizado puede aplicarse en cada canal a las informaciones de subrenderización (por ejemplo, FL_L y FL_R en caso de que la señal

40 sea mono o FL_L1, FL_L2, FL_R1, FL_R2 en caso de que la señal sea estéreo) generadas para cada canal en la unidad de generación de información de subrenderización 1020.

Subsiguientemente, la unidad de integración 1030 integra las informaciones de subrenderización interpoladas y/o suavizadas en información de renderización.

45 La información de renderización generada se transfiere a la unidad de renderización 900 por medio de la unidad de conversión de dominio 1050.

La figura 20 es un diagrama de bloques para un tercer método de generación de información de filtro de 50 renderización en una unidad de conversión de información espacial según una forma de realización de la presente invención.

El tercer método es similar al primer o al segundo métodos en la medida en que una unidad de conversión de información espacial 1000 comprende una unidad de mapeado de fuentes 1010, una unidad de generación de 55 información de subrenderización 1020, una unidad de integración 1030, una unidad de procesamiento 1040 y una

unidad de conversión de dominio 1050, y en la medida en que la unidad de generación de información de subrenderización 1020 comprende por lo menos una unidad de generación de información de subrenderización.

Con referencia a la figura 20, el tercer método de generación de la información de renderización difiere del primer o el segundo método en la medida en que la unidad de procesamiento 1040 está situada junto a la unidad de mapeado de fuentes 1010. Por consiguiente, la interpolación y/o el suavizado pueden aplicarse en cada canal a la información de mapeado de fuentes generada mediante información espacial en la unidad de mapeado de fuentes 1010.

Subsiguientemente, la unidad de generación de información de subrenderización 1020 genera información de subrenderización mediante la información de mapeado de fuentes interpolada y/o suavizada e información de filtro.

La información de subrenderización se integra en la información de renderización en la unidad de integración 1030. La información de renderización generada se transfiere a la unidad de renderización 900 por medio de la unidad de conversión de dominio 1050.

La figura 21 es un diagrama para describir un método de generación de una señal de sonido envolvente en una unidad de renderización según una forma de realización de la presente invención. La figura 21 representa un método de renderización ejecutado en el dominio DFT. Sin embargo, el método de renderización puede implementarse también en un dominio diferente de una manera similar. La figura 21 representa un caso en el que la señal de entrada es una señal de submezcla mono. Sin embargo, la figura 21 es aplicable a otros canales de entrada, incluida una señal de submezcla estéreo y similares, de la misma manera.

Con referencia a la figura 21, una señal de submezcla mono en el dominio del tiempo ejecuta preferentemente un enventanado que presenta un intervalo de superposición OL en la unidad de conversión de dominio. La figura 21 representa un caso en el que se utiliza un 50% de superposición. Sin embargo, la presente invención comprende casos en los que se utilizan otras superposiciones.

Una función ventana para la ejecución del enventanado puede emplear una función que presenta una buena selectividad en frecuencia en el dominio DFT gracias a su conexión sin interrupción ni discontinuidad en el dominio del tiempo. Por ejemplo, como función ventana puede utilizarse una función ventana seno cuadrado.

Subsiguientemente, se aplica relleno de ceros a la izquierda ZL, de una longitud de muestras [exactamente, (longitud de muestras) -1] de un filtro de renderización mediante información de renderización convertida en la unidad de conversión de dominio, a una señal de submezcla mono de una longitud OL*2 obtenida por enventanado. A continuación, se realiza una conversión de dominio al dominio DFT. La figura 20 representa cómo se realiza la conversión de dominio al dominio DFT de una señal de submezcla de bloque k.

La señal de submezcla de dominio convertido se reproduce mediante un filtro de renderización que utiliza información de renderización. El método de renderización puede representarse como un producto de la señal de submezcla y la información de renderización. La señal de submezcla reproducida se somete a IDFT (transformada discreta de Fourier inversa) en la unidad de conversión de dominio inversa y, a continuación, se superpone a la señal de submezcla (bloque k-1 en la figura 20) ejecutada previamente con un retardo de longitud OL para generar una señal de sonido envolvente.

Puede aplicarse interpolación a cada uno de los bloques que se someten al método de renderización. El método de interpolación se describe a continuación.

La figura 22 es un diagrama para un primer método de interpolación según una forma de realización de la presente invención. La interpolación según la presente invención puede ejecutarse en diversas posiciones. Por ejemplo, la interpolación puede ejecutarse en diversas posiciones en la unidad de conversión de información espacial representada en las figuras 18 a 20 o puede ejecutarse en la unidad de renderización. La información espacial, la información de mapeado de fuentes, la información de filtro y similares pueden utilizarse como valores para interpolar. En la presente memoria, la información se utiliza a título de ejemplo para la descripción. Sin embargo, la presente invención no se limita a la información espacial. La interpolación se ejecuta después o junto con la expansión a una banda más amplia.

Con referencia a la figura 22, la información espacial transferida desde un aparato de codificación puede transferirse desde una posición aleatoria en lugar de transmitirse en cada intervalo de tiempo. Una trama espacial puede contener una pluralidad de conjuntos de información espacial (por ejemplo, los conjuntos de parámetros n y n+1 de la figura 22). En el caso de una tasa de bits baja, una trama espacial puede contener un único conjunto nuevo de información espacial. Por lo tanto, la interpolación se realiza para un intervalo de tiempo no transmitido mediante los valores de un conjunto de información espacial transmitido adyacente. El intervalo entre ventanas para ejecutar la renderización no siempre coincide con el intervalo de tiempo. Por consiguiente, se halla y utiliza un valor interpolado en el centro de las ventanas de renderización (K-1, K, K+1, K+2, etc.), tal como se representa en la figura 22. Aunque la figura 22 representa la aplicación de interpolación lineal entre intervalos de tiempo cuando se dispone de

un conjunto de información espacial, la presente invención no se limita al método de interpolación. Por ejemplo, la interpolación no se realiza en un intervalo de tiempo en el que no se dispone de un conjunto de información espacial. En su lugar, puede utilizarse un valor anterior o predeterminado.

La figura 23 es un diagrama para un segundo método de interpolación según una forma de realización de la presente invención.

Con referencia a la figura 23, un segundo método de interpolación según una forma de realización de la presente invención presenta una estructura en la que se combinan un intervalo que utiliza un valor anterior, un intervalo que utiliza un valor predeterminado y similares. Por ejemplo, la interpolación puede realizarse mediante por lo menos uno de los siguientes métodos: un método de mantenimiento de un valor anterior, un método de utilización de un valor por omisión preestablecido y un método de ejecución de interpolación lineal en un intervalo de una trama espacial. En caso de que existan por lo menos dos nuevos conjuntos de información espacial en una ventana, puede producirse distorsión. La siguiente descripción se refiere a la conmutación de bloques para prevenir la distorsión.

La figura 24 es un diagrama para un método de conmutación de bloques según una forma de realización de la presente invención.

En relación con la referencia (a) representada en la figura 24, puesto que la longitud de la ventana es superior a la longitud del intervalo de tiempo, pueden existir por lo menos dos conjuntos de información espacial (por ejemplo, los conjuntos de parámetros n y n+1 de la figura 24) en un intervalo de ventana. En ese caso, cada uno de los conjuntos de información espacial debería aplicarse a un intervalo de tiempo diferente. Sin embargo, si se aplica el valor resultante de la interpolación de los por lo menos dos conjuntos de información espacial, puede producirse distorsión. Es decir, puede producirse distorsión atribuida a la falta de resolución temporal según la longitud de la ventana.

Para resolver este problema puede utilizarse un método de conmutación de variación del tamaño de la ventana para adaptar la resolución de un intervalo de tiempo. Por ejemplo, el tamaño de ventana representado mediante la referencia (b) en la figura 24 puede cambiarse por un tamaño de ventana más corto cuando un intervalo requiere alta resolución. En este caso, en la parte inicial y la parte final de las ventanas conmutadas, se utiliza la conexión de ventanas para evitar que se produzcan discontinuidades en el dominio del tiempo de las ventanas conmutadas.

La longitud de la ventana puede elegirse utilizando información espacial en un aparato de decodificación, en lugar de transferirse como información adicional separada. Por ejemplo, la longitud de la ventana puede determinarse utilizando un plazo de un intervalo de tiempo para actualizar la información espacial. En concreto, si el plazo para actualizar la información espacial es corto, se utiliza una función de ventana de poca longitud. Si el plazo para actualizar la información espacial es largo, se utiliza una función de ventana de gran longitud. En este caso, cuando se utiliza una ventana de longitud variable durante la renderización, resulta ventajoso no utilizar bits para enviar información de longitud de ventana por separado. En la referencia (b) de la figura 24 se representan dos tipos de longitud de ventana. Sin embargo, pueden utilizarse ventanas de diversas longitudes según la frecuencia de transmisión y las relaciones de la información espacial. La información de longitud de ventana elegida es aplicable a las diversas etapas para generar una señal de sonido envolvente como se describe a continuación.

La figura 25 es un diagrama de bloques para una posición a la cual se aplica una longitud de ventana elegida por una unidad de elección de longitud de ventana según una forma de realización de la presente invención.

Con referencia a la figura 25, una unidad de elección de longitud de ventana 1400 es capaz de elegir la longitud de una ventana mediante información espacial. La información para la longitud de ventana elegida es aplicable a una unidad de mapeado de fuentes 1010, una unidad de integración 1030, una unidad de procesamiento 1040, unas unidades de conversión de dominio 1050 y 1100 y una unidad de conversión de dominio inversa 1300. La figura 25 representa un caso en el que se utiliza una señal de submezcla estéreo. Sin embargo, la presente invención no se limita a la señal de submezcla estéreo solo. Como se menciona en la descripción anterior, aunque la longitud de la ventana se reduzca, la longitud de relleno de ceros elegida según el número de muestras del filtro no es ajustable. Por este motivo, a continuación se describe una solución al problema.

La figura 26 es un diagrama para los filtros de diversas longitudes utilizados en el procesamiento de una señal de audio según una forma de realización de la presente invención. Como se ha indicado en la descripción anterior, si la longitud de relleno de ceros elegida según el número de muestras del filtro no está ajustada, se produce una superposición sustancial que equivale a una correspondiente longitud que provoca un descenso de la resolución temporal. Una solución para el problema consiste en reducir la longitud del relleno de ceros restringiendo la longitud de una toma del filtro. Un método de reducción de la longitud del relleno de ceros puede consistir en truncar una parte posterior de una respuesta (por ejemplo, un intervalo de difusión correspondiente a la reverberación). En este caso, un método de renderización puede ser menos preciso que cuando no se realiza el truncamiento de la parte posterior de la respuesta del filtro. Sin embargo, los valores de coeficiente de filtro en el dominio del tiempo son muy pequeños como para tener un efecto importante sobre la reverberación. Por consiguiente, la calidad del sonido no se ve significativamente afectada por el truncamiento.

Con referencia a la figura 26, pueden utilizarse cuatro tipos de filtro. Los cuatro tipos de filtro pueden utilizarse en el dominio de la DFT, lo cual no impone ninguna limitación a la presente invención.

Un filtro N indica un filtro que presenta una longitud de filtro FL elevada y una longitud 2*OL de relleno de ceros elevada cuyo número de muestras de filtro no está restringido. Un filtro N2 indica un filtro que presenta una longitud de relleno de ceros 2*OL más corta que la del filtro N1 gracias a la restricción del número de muestras del filtro con la misma longitud de filtro FL. Un filtro N3 indica un filtro que tiene una longitud de relleno de ceros 2*OL larga gracias a la no limitación del número de muestras del filtro con una longitud de filtro FL más corta que la del filtro N1. Y un filtro N4 indica un filtro que presenta una longitud de ventana FL más corta que la del filtro N1 con una longitud de relleno de ceros 2*OL corta gracias a la restricción del número de muestras del filtro.

Como se ha mencionado en la descripción anterior, es posible resolver el problema de la resolución temporal mediante los cuatro ejemplos de clases de filtros anteriores. Para la parte posterior de la respuesta del filtro, puede utilizarse un coeficiente de filtro diferente para cada dominio.

La figura 27 es un diagrama para un método de procesamiento de una señal de audio de forma dividida mediante una pluralidad de subfiltros según una forma de realización de la presente invención. Un filtro puede dividirse en subfiltros que presentan coeficientes de filtro que difieren entre sí. Después de procesar la señal de audio mediante los subfiltros, puede utilizarse un método de adición de los resultados del método. En caso de que se aplique información espacial a una parte posterior de una respuesta de filtro que presenta poca energía, es decir, en caso de que se realice la renderización mediante un filtro con una muestra de filtro larga, el método ofrece una función para procesar de forma dividida la señal de audio según una unidad de longitud predeterminada. Por ejemplo, puesto que la parte posterior de la respuesta del filtro no varía de forma considerable en cada HRTF correspondiente a cada canal, es posible realizar la renderización extrayendo un coeficiente común a una pluralidad de ventanas. En la presente memoria, se describe un caso de ejecución en el dominio DFT. Sin embargo, la presente invención no se limita al dominio DFT.

Con referencia a la figura 27, una vez que un filtro FL se ha dividido en una pluralidad de subáreas, la pluralidad de subáreas puede procesarse mediante una pluralidad de subfiltros (filtro A y filtro B) que presentan coeficientes de filtro diferentes.

Subsiguientemente, una salida procesada por el filtro A y una salida procesada por el filtro B se combinan. Por ejemplo, se aplica IDFT (transformada discreta de Fourier inversa) a cada salida procesada por el filtro A y la salida procesada por el filtro B para generar una señal del dominio del tiempo. Y las señales generadas se combinan. En este caso, se aplica, a la posición a la cual se añade la salida procesada por el filtro B, un retardo que supera en FL a la posición de la salida procesada por el filtro A. De esta manera, la señal procesada por una pluralidad de subfiltros produce el mismo efecto que en el caso de una señal procesada por un único filtro.

La presente invención comprende un método de renderización de la salida procesada por el filtro B para una señal de submezcla directamente. En este caso, es posible representar la salida para la señal de submezcla mediante coeficientes que extraen una parte de la información espacial o sin utilizar la información espacial.

El método se caracteriza porque un filtro que presenta un número de muestras elevado puede aplicarse de forma dividida, y porque una parte posterior del filtro que presenta poca energía puede aplicarse sin conversión mediante información espacial. En este caso, si no se aplica la conversión mediante información espacial, tampoco se aplica un filtro diferente a cada ventana procesada. Por consiguiente, no es necesario aplicar el mismo sistema que en la conmutación de bloques. La figura 26 representa las dos áreas en las que se divide el filtro. Sin embargo, la presente invención permite dividir el filtro en una pluralidad de áreas.

La figura 28 es un diagrama de bloques para un método de renderización de información de renderización de partición generada por una pluralidad de subfiltros para una señal de submezcla mono según una forma de realización de la presente invención. La figura 28 se refiere a un coeficiente de renderización. El método puede ejecutarse para cada coeficiente de renderización.

Con referencia a la figura 28, la información de filtro A de la figura 27 corresponde a una primera información de renderización de partición HM_L_A, y la información de filtro B de la figura 27 corresponde a una segunda información de renderización de partición HM_L_B. La figura 28 representa una forma de realización de una partición en dos subfiltros. Sin embargo, la presente invención no se limita a los dos subfiltros. Los dos subfiltros pueden obtenerse por medio de una unidad de división 1500 con la información de procesamiento HM_L generada en la unidad de generación de información espacial 1000. Como alternativa, los dos los subfiltros pueden obtenerse mediante información de filtro HRTF prototipo o información elegida conforme a una selección del usuario. La información elegida conforme a la selección del usuario puede comprender información espacial seleccionada según las preferencias del usuario, por ejemplo. En este caso, HM_L_A es la información de renderización basada en la información espacial recibida, y HM_L_B puede ser la información de renderización para dar un efecto tridimensional aplicado de forma generalizada a las señales.

Como se ha mencionado en la descripción anterior, el procesamiento con una pluralidad de subfiltros es aplicable al dominio de tiempo y al dominio QMF, así como al dominio DFT. En particular, los valores de coeficiente divididos por el filtro A y el filtro B se aplican a la señal de submezcla mediante renderización en el dominio del tiempo o en el dominio QMF y a continuación se combinan para generar una señal definitiva.

La unidad de renderización 900 comprende una primera unidad de renderización de partición 950 y una segunda unidad de renderización de partición 960. La primera unidad de renderización de partición 950 realiza un método de renderización mediante la información HM_L_A, mientras que la segunda unidad de renderización de partición 960 realiza un método de renderización mediante la información HM_L_B.

Si el filtro A y el filtro B representados en la figura 27 son divisiones de un mismo filtro en función del tiempo, es posible tomar en consideración un retardo adecuado para que se corresponda con el intervalo de tiempo. La figura 28 representa un ejemplo de señal de submezcla mono. En caso de que se utilice una señal de submezcla mono y un decorrelador, la parte correspondiente al filtro B no se aplica al decorrelador, sino a la señal de submezcla mono directamente.

La figura 29 es un diagrama de bloques para un método de renderización de información de renderización de partición generada por una pluralidad de subfiltros para una señal de submezcla estéreo según una forma de realización de la presente invención.

Un método de renderización de partición representado en la figura 29 es similar al de la figura 28, en la medida en que se obtienen dos subfiltros en un divisor 1500 mediante información de renderización generada por la unidad de conversión de información espacial 1000, información de filtro HRTF prototipo o información de elección por el usuario. La diferencia respecto de la figura 28 radica en que un método de renderización de partición correspondiente al filtro B se aplica de manera generalizada a las señales L/R.

En particular, el divisor 1500 genera una primera información de renderización de partición correspondiente al filtro A, una segunda información de renderización de partición y una tercera información de renderización de partición correspondiente a la información del filtro B. En este caso, la tercera información de renderización de partición puede generarse mediante información de filtro o información espacial aplicable de forma generalizada a las señales L/R.

Con referencia a la figura 29, una unidad de renderización 900 comprende una primera unidad de renderización de partición 970, una segunda unidad de renderización de partición 980 y una tercera unidad de renderización de partición 990.

La tercera información de renderización de partición generada se aplica a una señal de suma de las señales L/R en la tercera unidad de renderización de partición 990 para generar una señal de salida. La señal de salida se añade a las señales de salida L/R que un filtro A1 y un filtro A2 de la primera y la segunda unidades de renderización de partición 970 y 980, respectivamente, reproducen de manera independiente para generar señales de sonido envolvente. En este caso, la señal de salida de la tercera unidad de renderización de partición 990 se puede añadir después de un retardo adecuado. En la figura 29, la expresión de información de renderización cruzada aplicada a otro canal a partir de entradas L/R se omite de la descripción por conveniencia.

La figura 30 es un diagrama de bloques para un primer método de conversión de dominio de una señal de submezcla según una forma de realización de la presente invención. El método de renderización ejecutado en el dominio DFT se ha descrito ya. Como se ha mencionado en la descripción anterior, el método de renderización es ejecutable en otros dominios, así como en el dominio DFT. La figura 30 representa el método de renderización ejecutado en el dominio DFT. Una unidad de conversión de dominio 1100 comprende un filtro QMF y un filtro DFT. Una unidad de conversión de dominio inversa 1300 comprende un filtro IDFT y un filtro IQMF. La figura 30 se refiere a una señal de submezcla mono que no impone ninguna limitación a la presente invención.

Con referencia a la figura 30, una señal de submezcla del dominio del tiempo de p muestras pasa a través de un filtro QMF para generar P muestras de subbanda. Se reúnen W muestras por cada banda. Una vez que se ha aplicado enventanado a las muestras reunidas, se realiza el relleno de ceros. A continuación se ejecuta DFT de M puntos (FFT). En este caso, la DFT permite un procesamiento mediante el tipo de enventanado citado anteriormente. Un valor que conecta los M/2 valores del dominio de frecuencia de cada banda obtenidos mediante aplicación de la DFT de M puntos a P bandas puede considerarse como un valor aproximado de un espectro de frecuencias obtenido mediante DFT de M/2*P puntos. Por lo tanto, un coeficiente de filtro representado en el dominio DFT de M/2*P puntos se multiplica por el espectro de frecuencias para llevar el mismo efecto del método de renderización al dominio DFT.

En este caso, la señal que ha pasado a través del filtro QMF presenta fugas, por ejemplo, solapamiento entre bandas adyacentes. En particular, un valor que corresponde a una banda adyacente se esparce por la banda actual y una parte de un valor existente en la banda actual se desplaza hasta la banda adyacente. En este caso, si se ejecuta la integración QMF, puede recuperarse una señal original debido a las características QMF. Sin embargo, si

se aplica un método de filtrado a la señal de la correspondiente banda como en el caso de la presente invención, la señal se distorsiona debido a la fuga. Para reducir al mínimo este problema, puede añadirse un método para recuperar una señal original, de tal manera que se hace pasar una señal a través de una mariposa B para reducir al mínimo las fugas antes de aplicar la DFT a cada banda después de la QMF en la unidad de conversión de dominio 100 y realizar un método de inversión V después de la IDFT en la unidad de conversión de dominio inversa 1300.

Mientras tanto, para hacer coincidir el método de generación de la información de renderización generada en la unidad de conversión de información espacial 1000 con el método de generación de la señal de submezcla, puede aplicarse DFT a una señal de paso QMF para información de filtro prototipo en lugar de ejecutar la DFT de M/2*P puntos al principio. En este caso, puede producirse retardo y dispersión de datos debida al filtro QMF.

La figura 31 es un diagrama de bloques para un segundo método de conversión de dominio de una señal de submezcla según una forma de realización de la presente invención. La figura 31 representa un método de renderización aplicado al dominio QMF.

Con referencia a la figura 31, una unidad de conversión de dominio 1100 comprende una unidad de conversión de dominio QMF, y una unidad de conversión de dominio inversa 1300 comprende una unidad de conversión de dominio IQMF. La configuración representada en la figura 31 es igual a la del caso en el que se utiliza la DFT solo excepto en que la unidad de conversión de dominio es un filtro QMF. En la siguiente descripción, el término QMF comprende un QMF y un QMF híbrido que presentan el mismo ancho de banda. La diferencia con el caso en el que se utiliza solo la DFT radica en que la generación de la información de renderización se realiza en el dominio QMF y en que el método de renderización se representa como una convolución en lugar del producto en el dominio de la DFT, puesto que el método de renderización realizado por un reproductor M 3012 se ejecuta en el dominio QMF.

Suponiendo que el filtro QMF disponga de B bandas, un coeficiente de filtro puede representarse como un conjunto de coeficientes de filtro que presentan diferentes características (coeficientes) para la B bandas. Ocasionalmente, si el número de muestras de filtro se convierte en un número de primer orden (es decir, se multiplica por una constante), un método de renderización en el dominio DFT de B espectros de frecuencias y un método operativo coincidirán. La figura matemática 31 representa un método de renderización ejecutado en una banda QFM (b) para una trayectoria a fin de realizar el método de renderización mediante información de renderización HM_L.

En este caso, k indica un orden temporal en la banda QMF, es decir, una unidad de intervalo de tiempo. El método de renderización ejecutado en el dominio QMF es ventajoso en la medida en que, si la información espacial transmitida es un valor aplicable al dominio QMF, la aplicación de los correspondientes datos se facilita mucho, y en la medida en que permite reducir al mínimo la distorsión en el transcurso de la aplicación. Sin embargo, en el caso de la conversión en el dominio QMF del método de conversión de la información de filtro prototipo (por ejemplo, el coeficiente de filtro prototipo), se necesita una cantidad de operaciones considerable para un método de aplicación del valor convertido. En este caso, la cantidad de operaciones puede reducirse al mínimo mediante el método de parametrización del coeficiente HRTF en el método de conversión de información de filtro.

Aplicabilidad industrial

En consecuencia, el método y el aparato de procesamiento de señales según la presente invención utilizan información espacial facilitada por un codificador para generar las señales de sonido envolvente mediante información de filtro HRTF o información de filtro conforme a un usuario en un aparato de decodificación capaz de generar multicanales. La presente invención es aplicable de forma ventajosa a diversos tipos de decodificadores capaces de reproducir señales estéreo solo.

Aunque la presente invención se ha descrito e ilustrado con referencia a las formas de realización preferidas de la misma, resultará evidente para los expertos en la materia que es posible realizar diversas modificaciones y variantes sin abandonar el alcance de la presente invención. Por lo tanto, la presente invención pretende cubrir las modificaciones y variantes de la invención que entran dentro del alcance de las reivindicaciones adjuntas y sus equivalentes.

Claims

REIVINDICACIONES

1. Método de procesamiento de una señal de audio, que comprende las etapas siguientes:

5 recibir una señal de submezcla e información espacial, incluyendo la información espacial por lo menos unos parámetros "CLD" de diferencia de nivel de canal, y siendo la señal de submezcla generada realizando la submezcla de una señal de audio multicanal;

generar información de mapeado de fuentes utilizando información espacial;

generar información de subrenderización aplicando información de filtro de función de transferencia relacionada con la cabeza “HRTF” para obtener un efecto de sonido envolvente en la información de mapeado de fuentes;

generar información de renderización integrando la información de subrenderización; y

15 generar una señal de sonido envolvente que presenta el efecto del sonido envolvente aplicando la información de renderización a la señal de submezcla, en el que

la señal de submezcla incluye un canal de entrada izquierdo y un canal de entrada derecho, y la señal de sonido envolvente generada incluye un canal de salida izquierdo y un canal de salida derecho, y

la información de renderización comprende una primera información de renderización y una segunda información de renderización, estando la primera información de renderización destinada a generar el canal de salida izquierdo mediante su aplicación al canal de entrada izquierdo o a generar el canal de salida derecho mediante

25 su aplicación al canal de entrada derecho, y estando la segunda información de renderización destinada a generar el canal de salida derecho mediante su aplicación al canal de entrada izquierdo o a generar el canal de salida izquierdo mediante su aplicación al canal de entrada derecho.
2.

Método según la reivindicación 1, en el que la información espacial incluye además parámetros de correlación intercanal.
3.

Método según las reivindicaciones 1 o 2, en el que la información de mapeado de fuentes es información correspondiente a cada canal de la señal de audio multicanal.

35 4. Método según cualquiera de las reivindicaciones 1 a 3, en el que la información de subrenderización incluye información generada aplicando la información de filtro HRTF por lo menos a dos informaciones de mapeado de fuentes.
5.

Método según cualquiera de las reivindicaciones 1 a 4, en el que la información de filtro HRTF es sometida a conversión de dominio para convertirla en información del dominio de la señal de sonido envolvente generada.
6.

Aparato para procesar una señal de audio que comprende:

una unidad de demultiplexación (600) que recibe una señal de submezcla e información espacial, incluyendo la

45 información espacial por lo menos unos parámetros "CLD" de diferencia de nivel de canal, y siendo la señal de submezcla generada realizando la submezcla de una señal de audio multicanal;

una unidad de mapeado de fuentes (1010) que genera información de mapeado de fuentes utilizando la información espacial;

una unidad de generación de información de subrenderización (1020) que genera información de subrenderización aplicando información de filtro de función de transferencia relacionada con la cabeza “HRTF para obtener un efecto de sonido envolvente en la información de mapeado de fuentes;

55 una unidad de integración (1030) que genera información de renderización integrando dicha por lo menos una información de subrenderización; y

una unidad de renderización (900) que genera una señal de sonido envolvente que presenta el efecto del sonido envolvente aplicando la información de renderización a la señal de submezcla, en el que

la señal de submezcla incluye un canal de entrada izquierdo y un canal de entrada derecho, y la señal de sonido envolvente generada incluye un canal de salida izquierdo y un canal de salida derecho, y

la información de renderización comprende una primera información de renderización y una segunda información

65 de renderización, estando la primera información de renderización destinada a generar el canal de salida izquierdo mediante su aplicación al canal de entrada izquierdo o a generar el canal de salida derecho mediante su aplicación al canal de entrada derecho, y estando la segunda información de renderización destinada a generar el canal de salida derecho mediante su aplicación al canal de entrada izquierdo o a generar el canal de salida izquierdo mediante su aplicación al canal de entrada derecho.

5 7. Aparato según la reivindicación 6, en el que la información espacial incluye además parámetros de correlación intercanal.
8. Aparato según las reivindicaciones 6 o 7, en el que la información de mapeado de fuentes es información

correspondiente a cada canal de la señal de multicanal. 10
9. Aparato según cualquiera de las reivindicaciones 6 a 8, en el que la información de subrenderización incluye información generada aplicando la información de filtro HRTF por lo menos a dos informaciones de mapeado de fuentes.

15 10. Aparato según cualquiera de las reivindicaciones 6 a 9, en el que la información de filtro es sometida a conversión de dominio para su conversión en información del dominio de la señal de sonido envolvente generada.