ES2649725T3

ES2649725T3 - Aparato, procedimiento y programa informático para mapear primer y segundo canales de entrada con al menos un canal de salida

Info

Publication number: ES2649725T3
Application number: ES14738861.5T
Authority: ES
Inventors: Jürgen HERRE; Fabian KÜCH; Michael Kratschmer; Achim Kuntz; Christof Faller
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2013-07-22
Filing date: 2014-07-15
Publication date: 2018-01-15
Anticipated expiration: 2034-07-15
Also published as: CA2968646C; EP3518563A3; ZA201601013B; WO2015010962A3; PT3258710T; AU2014295309A1; ES2688387T3; BR112016000990B1; US11272309B2; EP2830335A3; CA2968646A1; ES2729308T3; US9936327B2; CN107040861A; CN105556992B; US10798512B2; CN105556991B; US20200396557A1; PT3133840T; JP6227138B2

Abstract

Aparato (10; 30; 50; 60) para mapear un primer canal de entrada (12) y un segundo canal de entrada (14) de una configuración de canales de entrada con canales de salida (16, 42, 44) de una configuración de canales de salida, en el que cada canal de entrada y cada canal de salida tiene una dirección en la cual está situado un altavoz asociado con respecto a una posición central del oyente (P), en el que los primer y segundo canales de entrada (12, 14) tienen diferentes ángulos de elevación con respecto a un plano horizontal del oyente (300), en el que el aparato está configurado para: mapear el primer canal de entrada (12) con un primer canal de salida (16) de la configuración de canales de salida; y pese a que una desviación del ángulo azimutal entre una dirección del segundo canal de entrada (14) y una dirección del primer canal de salida (16) es menor que una desviación del ángulo azimutal entre una dirección del segundo canal de entrada (14) y un segundo canal de salida (42) y/o es menor que una desviación del ángulo azimutal entre la dirección del segundo canal de entrada (14) y la dirección de un tercer canal de salida (44), mapear el segundo canal de entrada (14) con los segundo y tercer canales de salida (42, 44) mediante distribución en estéreo (52, 62) entre los segundo y tercer canales de salida (42, 44) para generar una fuente fantasma en la posición del altavoz asociado con el primer canal de salida.

Description

DESCRIPCIÓN

Aparato, procedimiento y programa informático para mapear primer y segundo canales de entrada con al menos un canal de salida 5

[0001] La presente solicitud se refiere a un aparato y un procedimiento para mapear primer y segundo

canales de entrada con al menos un canal de salida y, en particular, un aparato y un procedimiento adecuados para usar en una conversión de formato entre diferentes configuraciones de canales de altavoces.

10 [0002] Las herramientas de codificación de audio espacial son muy conocidas en la técnica y han sido

normalizadas, por ejemplo, en la norma MPEG-surround. La codificación de audio espacial se inicia con una pluralidad de entradas originales, por ejemplo, cinco o siete canales de entrada, que se identifican por su ubicación en una configuración de reproducción, por ejemplo, como un canal izquierdo, un canal central, un canal derecho, un canal surround izquierdo, un canal surround derecho y un canal de intensificación de efectos de baja frecuencia 15 (LFE). Un codificador de audio espacial puede derivar uno o más canales de mezcla descendente de los canales originales y, además, puede derivar datos paramétricos según indicios paramétricos relacionados con indicios espaciales tales como diferencias de nivel entre canales en los valores de coherencia de canales, diferencias de fase entre canales, diferencias de tiempo entre canales, etc. Los uno o más canales de mezcla descendente se transmiten junto con la información suplementaria paramétrica que indica los indicios espaciales a un decodificador 20 de audio espacial para decodificar los canales de mezcla descendente y los datos paramétricos asociados a fin de obtener, en última instancia, canales de salida que son una versión aproximada de los canales de entrada originales. La ubicación de los canales en la configuración de salida puede ser fija, por ejemplo, un formato 5.1, un formato 7.1, etc.

25 [0003] Además, las herramientas de codificación de audio espacial son muy conocidas en la técnica y han

sido normalizadas, por ejemplo, en la norma MPEG SAOC (SAOC = codificación de objetos de audio espacial). A diferencia de la codificación de audio espacial que parte de los canales originales, la codificación de objetos de audio espacial parte de objetos de audio que no están automáticamente dedicados a una determinada configuración de renderización y reproducción. Por el contrario, la ubicación de los objetos de audio en la escena de reproducción es 30 flexible y puede ser ajustada por un usuario, por ejemplo, introduciendo cierta información de renderización en un decodificador para codificación de objetos de audio espacial. Como alternativa o además, se puede transmitir información de renderización en forma de información suplementaria adicional o metadatos; la información de renderización puede incluir información sobre en qué posición de la configuración de reproducción se deben colocar ciertos objetos de audio (por ejemplo, en función del tiempo). Para obtener una determinada compresión de datos, 35 se codifica un número de objetos de audio usando un codificador SAOC que calcula, a partir de los objetos de entrada, uno o más canales de transporte mediante la mezcla descendente de los objetos de acuerdo con cierta información de mezcla descendente. Más aun, el codificador SAOC calcula información suplementaria paramétrica que representa indicios entre objetos tales como diferencias de nivel de los objetos (OLD), valores de coherencia de los objetos, etc. Como en SAC (SAC = Codificación de audio espacial), se calculan los datos paramétricos entre 40 objetos con respecto a teselas individuales en tiempo/frecuencia. Para una trama determinada (por ejemplo, 1024 o 2048 muestras) de la señal de audio se tiene en cuenta una pluralidad de bandas de frecuencia (por ejemplo 24, 32 ó 64 bandas) de manera que se suministran datos paramétricos por cada trama y cada banda de frecuencia. Por ejemplo, cuando una pieza de audio tiene 20 tramas y cuando cada trama está subdividida en 32 bandas de frecuencia, el número de teselas de tiempo/frecuencia es 640.

45

[0004] Un formato de reproducción deseado, es decir una configuración de los canales de salida (configuración de altavoces de salida), puede diferir de una configuración de los canales de entrada, donde el número de canales de salida es, generalmente, diferente del número de canales de entrada. Por consiguiente, puede ser necesaria la conversión de formato para mapear los canales de entrada de la configuración de los canales

50 de entrada con los canales de salida de la configuración de los canales de salida.

[0005] El objetivo subyacente de la presente invención es proporcionar un aparato y un procedimiento que permiten una reproducción mejorada del sonido, en particular en el caso de una conversión de formato entre diferentes configuraciones de canales de altavoces

55

[0006] Este objetivo se alcanza mediante un aparato de acuerdo con la reivindicación 1, un procedimiento de acuerdo con la reivindicación 3, y un programa informático de acuerdo con la reivindicación 4. Realizaciones de la invención proporcionan un aparato que comprende un conjunto de características de acuerdo con la reivindicación 1.

[0007] Realizaciones de la invención proporcionan un procedimiento que comprende una secuencia de etapas de acuerdo con la reivindicación 3. Las realizaciones de la invención y ejemplos adicionales se basan en el hallazgo de que se puede obtener una reproducción de audio mejorada aún en el caso de un proceso de mezcla descendente de un número de canales de entrada con un número más pequeño de canales de salida si se usa una

5 estrategia destinada a intentar preservar la diversidad espacial de al menos dos canales de entrada que se mapean con al menos un canal de salida. Esto se obtiene mediante el procesamiento de uno de los canales de entrada mapeados con el mismo canal de salida mediante la aplicación de al menos uno de un filtro de ecualización y un filtro de decorrelación. En realizaciones de la invención, esto se obtiene generando una fuente fantasma para uno de los canales de entrada usando dos canales de salida, al menos uno de los cuales tiene una desviación angular 10 respecto del canal de entrada que es mayor que una desviación angular del canal de entrada con respecto a otro canal de salida. Se aplica un filtro de ecualización al segundo canal de entrada y está configurado para incrementar la ganancia de una porción espectral del segundo canal de entrada, conocida por dar al oyente la impresión de que el sonido proviene de una posición correspondiente a la posición del segundo canal de entrada. Un ángulo de elevación del segundo canal de entrada puede ser mayor que un ángulo de elevación de dichos uno o más canales 15 de salida con los cuales se mapea el canal de entrada. Por ejemplo, un altavoz asociado al segundo canal de entrada puede estar en una posición por encima de un plano horizontal del oyente, en tanto que los altavoces asociados a dichos uno o más canales de salida pueden estar en una posición en el plano horizontal del oyente. El filtro de ecualización puede estar configurado para incrementar la ganancia de una porción espectral del segundo canal en un rango de frecuencia de entre 7 kHz y 10 kHz. Procesando de esta manera la segunda señal de entrada, 20 se puede brindar al oyente la impresión de que el sonido proviene de una posición elevada, incluso si no proviene de una posición elevada. El segundo canal de entrada se procesa mediante la aplicación de un filtro de ecualización configurado para procesar el segundo canal de entrada a fin de compensar las diferencias de timbre causadas por las diferentes posiciones del segundo canal de entrada y dicho al menos un canal de salida con el cual se mapea el segundo canal de entrada. De este modo, el timbre del segundo canal de entrada, que es reproducido por un altavoz 25 en una posición errónea puede ser manipulado de manera que un usuario tenga la impresión de que el sonido proviene de otra posición más cercana a la posición original, es decir la posición del segundo canal de entrada. Se aplica un filtro de decorrelación al segundo canal de entrada. La aplicación de un filtro de decorrelación al segundo canal de entrada también puede dar la impresión al oyente de que las señales de sonido reproducidas por el primer canal de salida provienen de diferentes canales de entrada situaos en diferentes posiciones en la configuración de 30 canales de entrada. Por ejemplo, el filtro de decorrelación puede estar configurado para introducir retardos y/o fases aleatorizadas dependientes de la frecuencia en el segundo canal de entrada. El filtro de decorrelación puede ser un filtro de reverberación configurado para introducir porciones de señal con reverberación en el segundo canal de entrada, de manera que un usuario pueda tener la impresión de que las señales de sonido reproducidas a través del primer canal de salida provienen de diferentes posiciones. El filtro de decorrelación puede estar configurado para 35 convolucionar el segundo canal de entrada con una secuencia de ruido en caída exponencial a fin de simular reflexiones difusas en la segunda señal de entrada. Se determinan los coeficientes del filtro de ecualización y/o el filtro de decorrelación basándose en una respuesta binaural al impulso ambiental medida (BRIR) de una sala de audición específica o se establecen basándose en el conocimiento empírico sobre la acústica de la sala que también puede tener en cuenta una sala de audición específica). De este modo, el respectivo procesamiento para tener en 40 cuenta la diversidad espacial de los canales de entrada puede ser adaptado a la situación específica, tal como la sala de audición específica en la cual se debe reproducir la señal por medio de la configuración de los canales de salida.

[0008] Se explican ahora realizaciones y ejemplos de la invención con referencia a las figuras adjuntas, en 45 las cuales:

La figura 1 muestra una visión de conjunto de un codificador de audio 3D de un sistema de audio 3D;

La figura 2 muestra una visión de conjunto de un decodificador de audio 3D de un sistema de audio 3D;

La figura 3 muestra un ejemplo para implementar un conversor de formato que puede ser implementado en el 50 decodificador de audio 3D de la figura 2;

La figura 4 muestra una vista superior esquemática de una configuración de altavoces;

La figura 5 muestra una vista posterior esquemática de otra configuración de altavoces;

Las figuras 6a y 6b muestran vistas esquemáticas de un aparato para mapear primer y segundo canales de entrada con un canal de salida;

55 Las figuras 7a y 7b muestran vistas esquemáticas de un aparato para mapear primer y segundo canales de entrada con varios canales de salida;

La figura 8 muestra una vista esquemática de un aparato para mapear primer y segundo canales con un canal de salida;

La figura 9 muestra una vista esquemática de un aparato para mapear primer y segundo canales de entrada con

diferentes canales de salida;

La figura 10 muestra un diagrama de bloques de una unidad de procesamiento de señales para mapear canales de entrada de una configuración de canales de entrada con canales de salida de una configuración de canales de salida;

5 La figura 11 muestra una unidad de procesamiento de señales; y

La figura 12 es un diagrama que muestra las denominadas bandas de Blauert.

[0009] Antes de describir las realizaciones de la estrategia de la invención en forma más detallada, se

presenta una visión de conjunto de un sistema de códec de audio 3D en el cual se puede implementar la estrategia

10 de la invención.

[0010] Las figuras 1 y 2 muestran los bloques algorítmicos de un sistema de audio 3D de acuerdo con

realizaciones. Más específicamente, la figura 1 muestra una visión de conjunto de un codificador de audio 3D 100. El codificador de audio 100 recibe en un circuito de pre-renderización/mezcla 102, que se puede incluir opcionalmente,

15 señales de entrada, más específicamente una pluralidad de canales de entrada que envían al codificador de audio 100 una pluralidad de señales de canal 104, una pluralidad de señales de objeto 106 y sus correspondientes metadatos de objeto 108. Las señales de objeto 106 procesadas por el pre-renderizador/mezclador 102 (ver las señales 110) pueden ser enviadas a un codificador SAOC 112 (SAOC = Codificación de objetos de audio espacial). El codificador SAOC 112 genera los canales de transporte de SAOC 114 proporcionados a las entradas de un 20 codificador USAC 116 (USAC = Codificación Unificada de Voz y Audio). Además, la SAOC-SI de señal 118 (SAOC- SI = información suplementaria de SAOC) también es enviada a las entradas del codificador USAC 116. El codificador USAC 116 recibe a su vez señales de objeto 120 directamente del pre-renderizador/mezclador, así como las señales de canal y señales de objeto pre-renderizadas 122. La información de metadatos de objeto 108 se aplica a un codificador de OAM 124 (OAM = metadatos de objeto) que envía la información comprimida de 25 metadatos de objeto 126 al codificador USAC. El codificador USAC 116, sobre la base de las señales de entrada mencionadas anteriormente, genera una señal de salida comprimida MP4, como se indica en 128.

[0011] La figura 2 muestra una visión de conjunto de un decodificador de audio 3D 200 del sistema de audio 3d. La señal codificada 128 (MP4) generada por el codificador de audio 100 de la figura 1 es recibida en el

30 decodificador de audio 200, más específicamente en un decodificador de USAC 202. El decodificador USAC 202 decodifica la señal recibida 128 en las señales de canal 204, las señales de objeto pre-renderizadas 206, las señales de objeto 208 y las señales de canal de transporte de SAOC 210. Asimismo, la información comprimida de metadatos de objeto 212 y la SAOC-SI de señal 214 es emitida por el decodificador USAC. Las señales de objeto 208 son enviadas a un renderizador de objetos 216 que emite las señales de objeto renderizadas 218. Las señales 35 de canal de transporte de SAOC 210 son provistas al decodificador SAOC 220 que emite las señales de objeto renderizadas 222. La meta información de objeto comprimida 212 es enviada a un decodificador OAM 224 que envía las respectivas señales de control al renderizador de objetos 216 y al decodificador SAOC 220 para generar las señales de objeto renderizadas 218 y las señales de objeto renderizadas 222. El decodificador comprende además un mezclador 226 que recibe, como se ilustra en la figura 2, las señales de entrada 204, 206, 218 y 222 para emitir 40 las señales de canal 228. Las señales de canal pueden ser enviadas directamente a un altavoz, por ejemplo, un altavoz de 32 canales, como se indica en 230. Como alternativa, las señales 228 pueden ser enviadas a un circuito de conversión de formato 232 que recibe, como entrada de control, una señal de distribución de la reproducción que indica la forma en que las señales de canal 228 se deben convertir. En la forma de realización representada en la figura 2, se presume que la conversión se debe realizar de tal manera que se puedan enviar las señales a un 45 sistema de altavoces 5.1 como se indica en 234. Asimismo, las señales de canal 228 son enviadas a un renderizador binaural 236 que genera dos señales de salida, por ejemplo para un auricular, como se indica en 238.

[0012] El sistema de codificación/decodificación ilustrado en las figuras 1 y 2 se puede basar en el códec MPEG-D USAC para la codificación de señales de canal y de objeto (ver las señales 104 y 106). Para aumentar la

50 eficiencia en la codificación de una gran cantidad de objetos, se puede emplear la tecnología MPEG SAOC. Tres tipos de renderizadores pueden ejecutar las tareas de renderización de objetos a canales, renderización de canales a auriculares o la renderización de canales a una configuración diferente de altavoces (ver la figura 2, números de referencia 230, 234 y 238). Cuando las señales de objeto son explícitamente transmitidas o codificadas paramétricamente usando SAOC, la correspondiente información de metadatos de objeto 108 es comprimida (ver la 55 señal 126) y multiplexada en el flujo de bits de audio 3D 128.

[0013] Las figuras 1 y 2 muestran los bloques algorítmicos correspondientes a la totalidad del sistema de audio 3D que se describe a continuación con más detalle.

[0014] Se puede proporcionar opcionalmente el pre-renderizador/mezclador 102 para convertir un canal más

una escena de entrada de objeto en una escena de canal antes de la codificación. Funcionalmente, es idéntico al renderizador/mezclador de objetos que se describe más adelante en detalle. La pre-renderización de objetos puede ser ventajosa para garantizar una entropía de señal determinística a la entrada del codificador que es básicamente 5 independiente del número de señales de objeto activas simultáneamente. Con la pre-renderización de objetos, no es necesaria la transmisión de metadatos de objeto. Se renderizan señales de objeto discretas a la distribución de canales que el codificador está configurado para usar. Los pesos de los objetos correspondientes a cada canal se obtienen de los metadatos de objeto (OAM) asociados.

10 [0015] El codificador USAC 116 es el códec de núcleo para las señales de altavoces-canales, señales de

objeto discretas, señales de mezcla descendente de objetos y señales pre-renderizadas. Se basa en la tecnología MPEG-D USAC. Se encarga de la codificación de las señales enumeradas generando información de canales y objetos basada en la información geométrica y semántica de la asignación de canales de entrada y objetos. Esta información de mapeo describe cómo se mapean los canales de entrada y objetos con elementos de canales de 15 USAC, como elementos de pares de canales (CPE), elementos de canales individuales (SCE), efectos de baja frecuencia (LFE) y elementos de cuatro canales (QCE) y CPE, SCE y LFE, y la información correspondiente se transmite al decodificador. Todas las cargas útiles adicionales como los datos de SAOC 114, 118 o los metadatos de objeto 126 se tienen en cuenta en el control de tasa del codificador. La codificación de objetos es posible de maneras diferentes, dependiendo de los requisitos de tasa/distorsión y los requisitos de interactividad impuestos al 20 renderizador. De acuerdo con realizaciones, son posibles las siguientes variantes de codificación de objetos:

25

30

• Objetos pre-renderizados: Las señales de objeto son pre-renderizadas y mezcladas con las señales de canal 22.2 antes de la codificación. La cadena de codificación subsiguiente ve las señales de canal 22.2.

• Formas de onda discretas de objetos: Los objetos son enviados al codificador en forma de formas de onda monofónicas. El codificador usa elementos de canal individual (SCE) para transmitir los objetos además de las señales de canal. Los objetos decodificados son renderizados y mezclados del lado del receptor. Se transmite información comprimida de metadatos de objeto al receptor/renderizador.

• Formas de onda paramétricas de objetos: Las propiedades de los objetos y su relación mutua se describen por medio de parámetros de SAOC. La mezcla descendente de las señales de objeto se codifica con la USAC. La información paramétrica se transmite conjuntamente. Se elige el número de canales de mezcla descendente dependiendo del número de objetos y la tasa de datos en general. Se transmite información comprimida de metadatos de objeto al renderizador de SAOC.

35 [0016] El codificador SAOC 112 y el decodificador SAOC 220 para señales de objeto se pueden basar en la

tecnología MPEG SAOC. El sistema tiene capacidad para recrear, modificar y renderizar un número de objetos de audio basados en un número más pequeño de canales transmitidos y datos paramétricos adicionales, tales como OLD, IOC (Coherencia Entre Objetos), DMG (Ganancias de Mezcla Descendente). Los datos paramétricos adicionales exhiben una tasa de datos significativamente más baja que la necesaria para transmitir individualmente 40 todos los objetos, lo que aporta gran eficiencia a la codificación. El codificador SAOC 112 toma como entrada las señales de objeto/canal como formas de onda monofónicas y emite como salida información paramétrica (que está incluida en el flujo de bits de audio 3D 128) y los canales de transporte de SAOC (que se codifican utilizando elementos de canal único y se transmiten). El decodificador SAOC 220 reconstruye las señales de objeto/canal procedentes de los canales de transporte de SAOC decodificados 210 y la información paramétrica 214, y genera la 45 escena de audio de salida sobre la base del trazado de reproducción, la información de metadatos de objeto descomprimida y, opcionalmente, sobre la base de la información de interacción con el usuario.

[0017] El códec de metadatos de objeto (ver codificador de OAM 124 y decodificador de OAM 224) se incluye para que, por cada objeto, los metadatos asociados que especifican la posición geométrica y el volumen de los

50 objetos en el espacio 3D sean codificados de manera eficiente mediante la cuantificación de las propiedades de los objetos en tiempo y espacio. Los metadatos de objeto comprimidos cOAM 126 se transmiten al receptor 200 en forma de información suplementaria.

[0018] El renderizador de objetos 216 utiliza los metadatos de objeto comprimidos para generar formas de 55 onda de objetos de acuerdo con el formato de reproducción dado. Cada objeto es renderizado a un determinado

canal de salida 218 de acuerdo con sus metadatos. La salida de este bloque es el resultado de la suma de los resultados parciales. Si se decodifica tanto el contenido basado en los canales como los objetos discretos/paramétricos, las formas de onda basadas de los canales y las formas de onda de objetos renderizados son mezcladas por el mezclador 226 antes de emitir las formas de onda obtenidas 228 o antes de alimentarlas a un

módulo postprocesador como el módulo renderizador binaural 236 o el módulo renderizador de altavoces 232.

[0019] El módulo renderizador binaural 236 produce una mezcla descendente binaural del material de audio multicanal de tal manera que cada canal de entrada esté representado por una fuente de sonido virtual. El

5 procesamiento se lleva a cabo trama por trama en el dominio de QMF (Banco de Filtros de Espejo en Cuadratura), y la binauralización se basa en respuestas a los impulsos binaurales del recinto medidas.

[0020] El renderizador de altavoces 232 realiza la conversión entre la configuración de canales transmitida

228 y el formato de reproducción deseado. También se le puede denominar “conversor de formato”. El conversor de

10 formato realiza las conversiones a números menores de canales de salida, es decir que crea mezclas descendentes

[0021] En la figura 3 se ilustra una implementación posible de un conversor de formato 232. En realizaciones

de la invención, la unidad de procesamiento de señales es ese tipo de conversor de formato. El conversor de formato 232, al que también se hace referencia como renderizador de altavoces, convierte entre la configuración de

15 canales transmisores y el formato de reproducción deseado mediante el mapeo de los canales transmisores (entrada) de la configuración de canales de transmisión (entrada) a los canales (salida) del formato de reproducción deseado (configuración de canales de salida). El conversor de formato 232 ejecuta, en general, las conversiones a un número más bajo de canales de salida, es decir, ejecuta un proceso de mezcla descendente (DMX) 240. El dispositivo de mezcla descendente 240, que opera preferentemente en el dominio QMF, recibe las señales de salida 20 del mezclador 228 y emite las señales del altavoz 234. Se puede incluir un configurador 242, al que también se hace referencia como controlador, que recibe, como entrada de control, una señal 246 indicativa de la distribución de salida del mezclador (configuración de canales de entrada), es decir, la distribución de cuyos datos representados por la señal de salida del mezclador 228 se determina, y la señal 248 indicativa de la distribución de reproducción deseada (configuración de canales de salida). Basándose en esta información, el controlador 242 genera, 25 preferentemente de manera automática, matrices de mezcla descendente correspondientes a la combinación dada de formatos de entrada y salida y aplica estas matrices al dispositivo de mezcla descendente 240. El conversor de formato 232 da lugar a las configuraciones normales de altavoces, como así también a configuraciones aleatorias con posiciones no estándar de altavoces.

30 [0022] Realizaciones de la presente invención se refieren a la implementación del renderizador de altavoces

232, es decir con aparato y procedimientos para implementar parte de la funcionalidad del renderizador de altavoces

232.

[0023] Se hace referencia ahora a las figuras 4 y 5. La figura 4 muestra una configuración de altavoces que

35 representa un formato 5.1 que comprende seis altavoces que representan un canal izquierdo LC, un canal central

cC, un canal derecho RC, un canal surround izquierdo LSC, un canal surround derecho LRC y un canal de

intensificación de baja frecuencia LFC. La figura 5 ilustra otra configuración de altavoces que comprende altavoces que representan un canal izquierdo LC, un canal central CC, un canal derecho RC y un canal central elevado ECC.

40 [0024] En lo sucesivo, no se hace referencia al canal de intensificación de baja frecuencia puesto que no es

importante la posición exacta del altavoz (subwoofer) asociado al canal de intensificación de baja frecuencia.

[0025] Los canales están dispuestos en direcciones específicas con respecto a una posición central del oyente P. La dirección de cada canal está definida por un ángulo azimutal a y un ángulo de elevación b, ver la figura

45 5. El ángulo azimutal representa el ángulo del canal en un plano horizontal del oyente 300 y puede representar la dirección del canal respectivo con respecto a una dirección anterior central 302. Como se puede ver en la figura 4, la dirección anterior central 302 se puede definir como la dirección supuesta de visualización de un oyente situado en la posición central del oyente P. Una dirección posterior central 304 comprende un ángulo azimutal de 180° con respecto a la dirección anterior central 300. Todos los ángulos azimutales a la izquierda de la dirección anterior 50 central entre la dirección anterior central y la dirección posterior central están a la izquierda de la dirección anterior central y todos los ángulos azimutales a la derecha de la dirección anterior central entre la dirección anterior central y la dirección posterior central están a la derecha de la dirección anterior central. Los altavoces situados delante de una línea virtual 306, que es ortogonal a la dirección anterior central 302 y pasa por la posición central del oyente, son altavoces delanteros y los altavoces situados detrás de la línea virtual 306 son los altavoces traseros. En el 55 formato 5.1, el ángulo azimutal a de un canal LC está 30° a la izquierda, el a de CC está a 0°, el a de RC está 30° a la derecha, el a de LSC está 110° a la izquierda y el a de RSC está 110° a la derecha.

[0026] El ángulo de elevación b de un canal define el ángulo entre el plano horizontal del oyente 300 y la dirección de una línea de conexión virtual entre la posición central del oyente y el altavoz asociado al canal. En la

configuración expuesta en la figura 4, todos los altavoces están dispuestos dentro del plano horizontal del oyente 300 y, por lo tanto, todos los ángulos de elevación son de cero. En la figura 5, los ángulos de elevación b del canal ECC pueden ser 30°. Un altavoz situado exactamente por encima de la posición central del oyente tendría un ángulo de elevación de 90°. Los altavoces dispuestos por debajo del plano horizontal del oyente 300 tienen ángulos de 5 elevación negativos. En la figura 5, LC tiene una dirección x1, CC tiene una dirección x2, RC tiene una dirección x3 y ECC tiene una dirección x4.

[0027] La posición de un canal específico en el espacio (es decir la posición del altavoz asociado al canal específico) está dada por el ángulo azimutal, el ángulo de elevación y la distancia del altavoz desde la posición

10 central del oyente. Cabe señalar que la expresión “posición de un altavoz” es descrita con frecuencia por los expertos en la materia refiriéndose sólo al ángulo azimutal y al ángulo de elevación.

[0028] Por lo general, se realiza una conversión de formato entre diferentes configuraciones de canales de altavoces en forma de proceso de mezcla descendente que mapea un número de canales de entrada con un

15 número de canales de salida, donde el número de canales de salida es generalmente menor que el número de canales de entrada, y donde las posiciones de los canales de salida pueden ser diferentes de las posiciones de los canales de entrada. Uno o más canales de entrada se pueden mezclar entre sí hacia el mismo canal de salida. Al mismo tiempo, uno o más canales de entrada pueden ser renderizados a través de más de un canal de salida. Este mapeo de los canales de entrada con el canal de salida es determinado por lo general por una serie de coeficientes

20 de mezcla descendente, o de lo contrario se le formula en forma de matriz de mezcla descendente. La elección de

los coeficientes de mezcla descendente afecta significativamente a la calidad del sonido de salida con mezcla descendente que se puede obtener. Las malas elecciones pueden llevar a una mezcla desequilibrada o a una reproducción espacial deficiente de la escena de sonido de entrada.

25 [0029] Cada canal tiene asociada una señal de audio que debe ser reproducida por el altavoz asociado. El

principio de que se procesa un canal específico (como por ejemplo mediante la aplicación de un coeficiente, mediante la aplicación de un filtro de ecualización o mediante la aplicación de un filtro de decorrelación) significa que se procesa la correspondiente señal de audio asociada a este canal. En el contexto de la presente solicitud, la expresión “filtro de ecualización” debe abarcar cualquier medio para aplicar una ecualización a la señal, de tal

30 manera que se obtenga una ponderación dependiente de la frecuencia de porciones de la señal. Por ejemplo, un

filtro de ecualización puede estar configurado para aplicar coeficientes de ganancia dependientes de la frecuencia a las bandas de frecuencia de la señal. En el marco de la presente solicitud, la expresión “filtro de decorrelación” debe abarcar cualquier medio para aplicar una decorrelación a la señal, como por ejemplo introduciendo retardos dependientes de la frecuencia y/o fases aleatorizadas a la señal. Por ejemplo, un filtro de decorrelación puede estar 35 configurado para aplicar coeficientes de retardo dependientes de la frecuencia a las bandas de frecuencia de la señal y/o para aplicar coeficientes de fase aleatorizados a la señal.

[0030] En las realizaciones de la invención, el mapeo de un canal de entrada con uno o más canales de

salida incluye la aplicación de al menos un coeficiente que se ha de aplicar al canal de entrada por cada canal de 40 salida con el cual se mapea el canal de entrada. Dicho al menos un coeficiente puede incluir un coeficiente de ganancia, es decir un valor de ganancia, que se ha de aplicar a la señal de entrada asociada al canal de entrada, y/o un coeficiente de retardo, es decir un valor de retardo que se ha de aplicar a la señal de entrada asociada al canal de entrada. En las realizaciones de la invención, el mapeo puede incluir la aplicación de coeficientes selectivos de la frecuencia, es decir coeficientes diferentes para diferentes bandas de frecuencia de los canales de entrada. En 45 realizaciones de la invención, el mapeo de los canales de entrada con los canales de salida incluye generar una o más matrices de coeficientes a partir de los coeficientes. Cada matriz define un coeficiente que se ha de aplicar a cada canal de entrada de la configuración de canales de entrada por cada canal de salida de la configuración de los canales de salida. En el caso de los canales de salida, con los cuales no se mapea el canal de entrada, el coeficiente respectivo de la matriz de coeficientes ha de ser cero. En realizaciones de la invención, se pueden 50 generar matrices de coeficientes separadas para los coeficientes de ganancia y los coeficientes de retardo. En realizaciones de la invención, se puede generar una matriz de coeficientes por cada banda de frecuencia en caso de que los coeficientes sean selectivos de la frecuencia. En realizaciones de la invención, el mapeo puede incluir además la aplicación de coeficientes derivados a las señales de entrada asociadas a los canales de entrada.

55 [0031] Para obtener buenos coeficientes de mezcla descendente, un experto (por ejemplo un ingeniero de

sonido) puede afinar los coeficientes a mano, teniendo en cuenta su conocimiento experto. Otra posibilidad consiste en derivar automáticamente los coeficientes de mezcla descendente correspondientes a una combinación dada de configuraciones de entrada y salida tratando cada canal de entrada como fuentes de sonido virtual cuya posición en el espacio está dada por la posición en el espacio asociada al canal específico, es decir la posición del altavoz

asociado al canal de entrada específico. Cada fuente virtual puede ser reproducida por un algoritmo de distribución en estéreo ("panning”) genérica como la distribución en estéreo de la ley de tangentes en 2D o la distribución en estéreo vectorial basada en amplitud (VBAP) en 3D, véase V. Pulkki: “Virtual Sound Source Positioning Using Vector Base Amplitude Panning”, Journal of the Audio Engineering Society, vol. 45, págs. 456-466, 1997. Otra propuesta 5 para la derivación matemática, es decir automática, de coeficientes de mezcla descendente para una combinación dada de configuraciones de entrada y salida es la ofrecida por A. Ando: “Conversion of Multichannel Sound Signal Maintaining Physical Properties of Sound in Reproduced Sound Field”, IEEE Transactions on Audio, Speech, and Language Processing, vol. 19, no. 6, agosto de 2011.

10 [0032] En consecuencia, las técnicas de mezcla descendente existentes se basan principalmente en tres

estrategias para la derivación de coeficientes de mezcla descendente. La primera estrategia es un mapeo directo de los canales de entrada descartados con canales de salida en una posición azimutal igual o comparable. No se da importancia a los desplazamientos de elevación. Por ejemplo, una práctica común es renderizar los canales de altura directamente con los canales horizontales en una posición azimutal igual o comparable, si la capa de altura no

15 está presente en la configuración de los canales de salida. Una segunda estrategia consiste en el uso de algoritmos de distribución en estéreo genérica, que trata los canales de entrada como fuentes virtuales de sonido y conservan la información de azimut mediante la introducción de fuentes fantasma en la posición de los canales de entrada desechados. No se da importancia a los desplazamientos de elevación. En los procedimientos de la técnica actual la distribución en estéreo se utiliza sólo si no hay ningún altavoz de salida disponible en la posición de salida deseada,

20 por ejemplo en el ángulo azimutal deseado. Una tercera estrategia es la incorporación de conocimiento experto para la derivación de coeficientes de mezcla descendente óptimos en el sentido empírico, artístico o psicoacústico. Se puede emplear una aplicación separada o combinada de diferentes estrategias.

[0033] Realizaciones de la invención proporcionan una solución técnica que permite mejorar u optimizar un

25 proceso de mezcla descendente de tal manera que se puedan obtener señales de salida con mezcla descendente de mayor calidad que sin utilizar esta solución. En realizaciones, la solución puede mejorar la calidad de la mezcla descendente en casos en que la diversidad espacial inherente a la configuración de los canales de entrada se perdería durante la mezcla descendente sin aplicar la solución propuesta.

30 [0034] Para ello, realizaciones de la invención permiten conservar la diversidad espacial que es inherente a la

configuración de canales de entrada y que no se preserva en la estrategia de mezcla descendente estricta (DMX). En las situaciones de mezcla descendente en las cuales el número de canales acústicos es reducido, realizaciones de la invención apuntan principalmente a reducir la pérdida de diversidad y envolvente, que ocurre implícitamente al mapear de un número mayor a uno menor de canales.

35

[0035] Los inventores se dieron cuenta de que, según la configuración específica, con frecuencia se reduce considerablemente o se pierde por completo la diversidad espacial inherente y la envolvente espacial de una configuración de canales de entrada en la configuración de los canales de salida. Más aún, si se reproducen simultáneamente eventos auditivos de varios oradores en la configuración de entrada, estos pueden ser más

40 coherentes, condensados y focalizados en la configuración de salida. Esto puede llevar a una impresión espacial perceptualmente más apremiante, que con frecuencia parece ser menos agradable que la configuración de canales de entrada. Realizaciones de la invención tienen por fin la conservación expresa, por primera vez, de la diversidad espacial en la configuración de los canales de salida. Realizaciones de la invención tienen por fin conservar la ubicación percibida de un evento auditivo lo más cerca posible en comparación con el caso en que se usa la

45 configuración original de altavoces de los canales de entrada.

[0036] En consecuencia, las realizaciones de la invención proporcionan una técnica específica para mapear un primer canal de entrada y un segundo canal de entrada, que están asociados a diferentes posiciones de altavoces de una configuración de canales de entrada y que, por lo tanto, comprenden una diversidad espacial, con

50 al menos un canal de salida. En realizaciones de la invención, el primer y segundo canales de entrada están en elevaciones diferentes con respecto a un plano horizontal del oyente. Por consiguiente, se pueden tener en cuenta los desplazamientos de elevación entre el primer canal de entrada y el segundo canal de entrada para mejorar la reproducción de sonido usando los altavoces de la configuración de los canales de salida.

55 [0037] En el contexto de la presente solicitud, la diversidad se puede describir de la siguiente manera. Los

diferentes altavoces de una configuración de canales de entrada dan origen a diferentes canales acústicos desde los altavoces a los oídos, como por ejemplo los oídos del oyente en la posición P. Hay un número de trayectorias acústicas directas y un número de trayectorias acústicas indirectas, también conocidas como reflexiones o reverberación, que surgen de una excitación ambiental de escucha diversa y que suman cambios adicionales de

decorrelación y timbre a las señales percibidas desde los altavoces en diferentes posiciones. Los canales acústicos pueden ser completamente modelados por BRIR, que son característicos por cada sala de audición. La experiencia de escucha de una configuración de canales de entrada depende fuertemente de una combinación característica de diferentes canales de entrada y diversos BRIR, que corresponden a las posiciones específicas de los altavoces. De 5 este modo, la diversidad y envolvente surgen de diversas modificaciones de las señales, que son aplicadas de modo inherente a todas las señales de altavoz por el recinto de acústica.

[0038] Se presenta ahora una fundamentación para la necesidad de estrategias de mezcla descendente que preserven la diversidad espacial de una configuración de canales de entrada. Una configuración de canales de

10 entrada puede utilizar más altavoces que una configuración de los canales de salida o puede usar al menos un altavoz que no esté presente en la configuración de altavoces de salida. Meramente con fines ilustrativos, una configuración de canales de entrada puede utilizar los altavoces LC, CC, RC, ECC tal como se muestra en la figura 5, en tanto que una configuración de los canales de salida puede utilizar sólo los altavoces LC, CC y RC, es decir que no hace uso del altavoz ECC. De este modo, la configuración de canales de entrada puede utilizar un número 15 mayor de capas de reproducción que la configuración de los canales de salida. Por ejemplo, la configuración de canales de entrada puede presentar tanto altavoces horizontales (LC, CC, RC) como de altura (ECC), en tanto que la configuración de salida puede incluir sólo altavoces horizontales (LC, CC, RC). De este modo, el número de canales acústicos de altavoces a oídos se reduce con la configuración de los canales de salida en situaciones con mezcla descendente. Específicamente, las mezclas descendentes 3D (por ejemplo 22.2) a 2D (por ejemplo 5.1) 20 (DMXes) son las más afectadas debido a la falta de diferentes capas de reproducción en la configuración de los canales de salida. Los grados de libertad para obtener una experiencia auditiva similar con la configuración de los canales de salida con respecto a la diversidad y envolvente son reducidos y, por lo tanto, limitados. Realizaciones de la invención proporcionan estrategias de mezcla descendente que mejoran la conservación de la diversidad espacial de una configuración de canales de entrada, donde los aparatos y procedimientos descritos no se limitan a ningún 25 tipo específico de estrategia de mezcla descendente y se pueden aplicar en diversos contextos y aplicaciones.

[0039] En lo sucesivo, se describen realizaciones de la invención con referencia a la situación específica mostrada en la figura 5. Sin embargo, los problemas y soluciones descritos pueden adaptarse fácilmente a otras situaciones con condiciones similares. Sin perder la generalidad, se presumen las siguientes configuraciones de

30 canales de entrada y salida:

Configuración de canales de entrada: cuatro altavoces LC, CC, RC y ECC en las posiciones x1 = (a1, p-i), x2 = (a2, P1), X3 = (a3, P1) y X4 = (a4, P2), donde a2 » a4 o a2 = a4.

35 Configuración de canales de salida: tres altavoces en la posición X1 = (ai, P1), X2 = (a2, P1) y X3 = (a3, P1), es decir que el altavoz en la posición X4 se desecha en la mezcla descendente. a representa el ángulo azimutal y p representa el ángulo de elevación.

Como se ha explicado anteriormente, una técnica de DMX simple daría prioridad a la conservación de la información 40 de azimut direccional y sólo omitiría el desplazamiento de elevación. De este modo, las señales del altavoz ECC en la posición x4 pasarían simplemente al altavoz CC en la posición x2. Sin embargo, al hacerlo se perderían algunas características. En primer lugar, se pierden las diferencias de timbre debido a diferentes BRIR, que se aplican de modo inherente en las posiciones de reproducción x2 y x4. En segundo lugar, se pierde la diversidad espacial de las señales de entrada, que se reproducen en diferentes posiciones x2 y x4. En tercer lugar, se pierde una decorrelación 45 inherente de las señales de entrada debido a las diferentes trayectorias de propagación acústica desde las posiciones x2 y x4 a los oídos del oyente.

[0040] Realizaciones de la invención y ejemplos adicionales tienen por fin la conservación o emulación de una o más de las características descritas mediante la aplicación de las estrategias explicadas en el presente

50 documento por separado o en combinación para el proceso de mezcla descendente.

[0041] Las figuras 6a y 6b muestran vistas esquemáticas que explican un aparato 10 para implementar una estrategia en la cual se mapea un primer canal de entrada 12 y un segundo canal de entrada 14 con el mismo canal de salida 16, donde el procesamiento del segundo canal de entrada se lleva a cabo mediante la aplicación de al

55 menos uno de un filtro de ecualización y un filtro de decorrelación al segundo canal de entrada. Este procesamiento está indicado en la figura 6a por el bloque 18.

[0042] Es evidente para los expertos en la materia que los aparatos explicados y descritos en la presente solicitud pueden ser implementados por medio de ordenadores o procesadores respectivos configurados y/o

programados para obtener la funcionalidad descrita. Como alternativa, los aparatos pueden ser implementados en forma de otras estructuras de hardware programadas tales como matrices de puertas programables in situ y similares.

5 [0043] El primer canal de entrada 12 de la figura 6a puede estar asociado al altavoz central CC en la

dirección x2 y el segundo canal de entrada 14 puede estar asociado al altavoz central elevado ECC en la posición x4

(en la configuración de canales de entrada, respectivamente). El canal de salida 16 puede estar asociado al altavoz central ECC en la posición x2 (en la configuración de los canales de salida). La figura 6b ilustra que el canal 14 asociado al altavoz en la posición x4 se mapea con el primer canal de salida 16 asociado al altavoz CC en la

10 posición x2 y que este mapeo comprende el procesamiento 18 del segundo canal de entrada 14, es decir el

procesamiento de la señal de audio asociada al segundo canal de entrada 14. El procesamiento del segundo canal de entrada comprende la aplicación de al menos uno de un filtro de ecualización y un filtro de decorrelación al segundo canal de entrada a fin de conservar las diferentes características entre el primer y segundo canales de entrada en la configuración de canales de entrada. El filtro de ecualización y/o el filtro de decorrelación pueden estar 15 configurados para conservar las características referentes a las diferencias de timbre debidas a los diferentes BRIR, que se aplican de manera inherente en las diferentes posiciones de altavoces x2 y x4 asociados al primer y segundo canales de entrada. El filtro de ecualización y/o el filtro de decorrelación están configurados para conservar la diversidad espacial de las señales de entrada, que se reproducen en posiciones diferentes de tal manera que la diversidad espacial del primer y segundo canales de entrada se mantenga perceptible pese a que el primer y 20 segundo canales de entrada se mapean con el mismo canal de salida. Un filtro de decorrelación está configurado para preservar una decorrelación inherente de las señales de entrada debido a las diferentes trayectorias de propagación acústica desde los altavoces en diferentes posiciones asociadas al primer y segundo canales de entrada hasta los oídos del oyente. Se aplica un filtro de ecualización al segundo canal de entrada, es decir la señal de audio asociada al segundo canal de entrada en la posición x4, si se le somete a mezcla descendente hacia el 25 altavoz CC en la posición x2. El filtro de ecualización compensa los cambios de timbre de los diferentes canales acústicos y se le puede derivar basándose en el conocimiento experto y/o en datos de BRIR medidas o similares. Por ejemplo, se presume que la configuración de canales de entrada incluye un canal de Voz de Dios (VoG) en una elevación de 90°. Si la configuración de los canales de salida sólo incluye altavoces en una capa y el canal VoG es desechado como por ejemplo con una configuración de salida 5.1, una técnica sencilla y directa consiste en distribuir 30 el canal VoG a todos los altavoces de salida para conservar la información direccional del canal VoG al menos en el punto de sonido óptimo.

[0044] Sin embargo, el altavoz VoG original se percibe de manera bastante diferente debido a una BRIR

diferente. Mediante la aplicación de un filtro de ecualización especializado al canal VoG antes de la distribución a 35 todos los altavoces de salida, se puede compensar la diferencia de timbre. El filtro de ecualización puede estar configurado para ejecutar una ponderación dependiente de la frecuencia del canal de entrada correspondiente para tener en cuenta hallazgos psicoacústicos sobre la percepción direccional de las señales de audio. Un ejemplo de esos hallazgos son las denominadas bandas de Blauert, que representan bandas determinantes de la dirección. La figura 12 muestra tres gráficos 20, 22 y 24 que representan la probabilidad de que se reconozca una dirección 40 específica de las señales de audio. Tal como se puede apreciar en el gráfico 20, las señales de audio procedentes de lo alto pueden ser reconocidas con alta probabilidad en una banda de frecuencia 1200 entre 7 kHz y 10 kHz o. Como se puede apreciar en el gráfico 22, las señales de audio procedentes de atrás pueden ser reconocidas con alta probabilidad en una banda de frecuencia 1202 de aproximadamente 0,7 kHz a aproximadamente 2 kHz y en una banda de frecuencia 1204 de aproximadamente 10 kHz a aproximadamente 12,5 kHz. Como se puede apreciar en el 45 gráfico 24, las señales de audio procedentes de delante pueden ser reconocidas con alta probabilidad en una banda de frecuencia 1206 de aproximadamente 0,3 kHz a 0,6 kHz y en una banda de frecuencia 1208 de aproximadamente 2,5 a aproximadamente 5,5 kHz. Se configura el filtro de ecualización aprovechando este reconocimiento. En otras palabras, el filtro de ecualización puede estar configurado para aplicar coeficientes de ganancia más elevados (incrementar la ganancia) a bandas de frecuencia conocidas por brindar a un usuario la 50 impresión de que el sonido llega de diferentes direcciones, en comparación con las otras bandas de frecuencia. En términos más específicos, en caso de mapearse un canal de entrada con un canal de salida más bajo, se puede incrementar la ganancia de una porción espectral del canal de entrada en la banda de frecuencia 1200 en el intervalo de entre 7 kHz y 10 kHz en comparación con otras porciones espectrales del segundo canal de entrada de tal manera que el oyente pueda tener la impresión de que la señal correspondiente provenga de una posición 55 elevada. Del mismo modo, el filtro de ecualización puede estar configurado para incrementar la ganancia de otras porciones espectrales del segundo canal de entrada como se ilustra en la figura 12. Por ejemplo, en el caso en que un canal de entrada se mapee con un canal de salida dispuesto en una de posición más anterior, las ganancias de las bandas 1206 y 1208 pueden ser incrementadas y, en el caso, de un canal de entrada que se mapea con un canal de salida dispuesto en la posición más posterior las ganancias de las bandas 1202 y 1204 pueden ser

incrementadas. El aparato puede estar configurado para aplicar un filtro de decorrelación al segundo canal de entrada. Por ejemplo, se puede aplicar un filtro de decorrelación/reverberación a la señal de entrada asociada al segundo canal de entrada (asociado al altavoz en la posición x4), si es sometida a mezcla descendente hacia un altavoz en la posición x2. Dicho filtro de decorrelación/reverberación puede ser derivado de mediciones de BRIR o 5 del conocimiento empírico sobre la acústica de la sala o similar. Si se mapea el canal de entrada con múltiples canales de salida, la señal de filtro puede ser reproducida en los múltiples altavoces, donde por cada altavoz se aplican filtros diferentes. El o los filtros puede modelar sólo reflexiones tempranas.

[0045] La figura 8 muestra una vista esquemática de un aparato 30 que comprende un filtro 32, que puede 10 representar un filtro de ecualización o un filtro de decorrelación. El aparato 30 recibe un número de canales de

entrada 34 y emite un número de canales de salida 36. Los canales de entrada 34 representan una configuración de canales de entrada y los canales de salida 36 representan una configuración de canales de salida. Como se muestra en la figura 8, se mapea un tercer canal de entrada 38 directamente con un segundo canal de salida 42 y un cuarto canal de entrada 40 se mapea directamente con un tercer canal de salida 44. El tercer canal de entrada 38 puede 15 ser un canal izquierdo asociado al altavoz izquierdo LC. El cuarto canal de entrada 40 puede ser un canal de entrada derecho asociado al altavoz derecho RC. El segundo canal de salida 42 puede ser un canal izquierdo asociado al altavoz izquierdo LC y el tercer canal de salida 44 puede ser un canal derecho asociado al altavoz derecho RC. El primer canal de entrada 12 puede ser el canal horizontal central asociado al altavoz central CC y el segundo canal de entrada 14 puede ser el canal central de altura asociado al altavoz central elevado ECC. El filtro 32 se aplica al 20 segundo canal de entrada 14, es decir el canal central de altura. El filtro 32 puede ser un filtro de decorrelación o reverberación. Después de la filtración, se dirige el segundo canal de entrada hacia el altavoz horizontal central, es decir el primer canal de salida 16 asociado al altavoz CC en la posición x2. De esa manera, ambos canales de entrada 12 y 14 se mapean con el primer canal de salida 16, como se indica en el bloque 46 de la figura 8. El primer canal de entrada 12 y la versión procesada del segundo canal de entrada 14 pueden ser sumados en el bloque 46 y 25 pueden ser enviados al altavoz asociado al canal de salida 16, es decir el altavoz horizontal central CC en el ejemplo descrito. El filtro 32 puede ser un filtro de decorrelación o un filtro de reverberación a fin de modelar el efecto ambiental adicional percibido cuando están presentes canales acústicos separados. La decorrelación puede ofrecer el beneficio adicional de que se pueden reducir las alteraciones de cancelación de DMX mediante esta notificación. El filtro 32 puede ser un filtro de ecualización y puede estar configurado para ejecutar una ecualización del timbre. 30 Como alternativa, se puede aplicar un filtro de decorrelación y un filtro de reverberación a fin de aplicar la ecualización de timbre antes de someter a la señal del altavoz elevado a mezcla descendente. El filtro 32 puede estar configurado para combinar ambas funcionalidades, es decir la ecualización de timbre y la decorrelación. El filtro de decorrelación puede ser implementado en forma de filtro de reverberación que introduce reverberaciones en el segundo canal de entrada. El filtro de decorrelación puede estar configurado para convolucionar el segundo canal de 35 entrada con una secuencia de ruido en caída exponencial. Se puede usar cualquier filtro de decorrelación que decorrelacione el segundo canal de entrada a fin de preservar la impresión de un oyente de que la señal del primer canal de entrada y el segundo canal de entrada provienen de altavoces en diferentes posiciones.

[0046] La figura 7a ilustra una vista esquemática de un aparato 50 de acuerdo con otra realización. El aparato 40 50 está configurado para recibir el primer canal de entrada 12 y el segundo canal de entrada 14. El aparato 50 está

configurado para mapear el primer canal de entrada 12 directamente con el primer canal de salida 16. El aparato 50 está configurado asimismo para generar una fuente fantasma mediante la distribución en estéreo entre el segundo y tercer canales de salida, que pueden ser el segundo canal de salida 42 y el tercer canal de salida 44. Esto está indicado en la figura 7a por el bloque 52. De esa manera se genera una fuente fantasma que tiene un ángulo 45 azimutal correspondiente al ángulo azimutal del segundo canal de entrada.

[0047] Al considerar el escenario de la figura 5, el primer canal de entrada 12 puede estar asociado al altavoz horizontal central CC, el segundo canal de entrada 14 puede estar asociado al altavoz central elevado ECC, el primer canal de salida 16 puede estar asociado al altavoz central CC, el segundo canal de salida 42 puede estar

50 asociado al altavoz izquierdo LC y el tercer canal de salida 44 puede estar asociado al altavoz derecho RC. De este modo, en la realización mostrada en la figura 7a, se coloca una fuente fantasma en la posición x2 mediante la distribución en estéreo de los altavoces en las posiciones x1 y x3 en lugar de aplicar directamente la correspondiente señal al altavoz en la posición x2. De este modo, se realiza la distribución en estéreo entre altavoces en las posiciones x1 y x3 aunque haya otro altavoz en la posición x2, que está más próxima a la posición x4 que las 55 posiciones x1 y x3. En otras palabras, la distribución en estéreo entre altavoces en las posiciones x1 y x3 se lleva a cabo aunque las desviaciones del ángulo azimutal Da entre los respectivos canales 42, 44 y el canal 14 sean mayores que la desviación del ángulo azimutal entre los canales 14 y 16, que es de 0°; ver la figura 7b. Haciendo esto se preserva la diversidad espacial introducida por los altavoces en las posiciones x2 y x4 mediante el uso de un altavoz aparte en la posición x2 correspondiente a la señal asignada originariamente al canal de entrada

correspondiente y una fuente fantasma en la misma posición. La señal de la fuente fantasma corresponde a la señal del altavoz en la posición X4 de la configuración de canales de entrada original.

[0048] La figura 7b muestra esquemáticamente el mapeo del canal de entrada asociado al altavoz en la 5 posición x4 mediante la distribución en estéreo 52 entre los altavoces en las posiciones x1 y x3.

[0049] En las realizaciones descritas con respecto a las figuras 7a y 7b, se presume que una configuración de canales de entrada presenta una capa de altura y una horizontal que incluye un altavoz central de altura y un altavoz horizontal central. Más aun, se presume que la configuración de los canales de salida sólo presenta una

10 capa horizontal que incluye un altavoz horizontal central y altavoces horizontales izquierdo y derecho, que pueden generar una fuente fantasma en la posición del altavoz horizontal central. Como se explicara, en una estrategia simple común, el canal de entrada central de altura se reproduciría con el altavoz de salida horizontal central. Por el contrario, de acuerdo con la realización de la invención descrita, se distribuye en estéreo intencionadamente el canal de entrada central de altura entre los altavoces horizontales izquierdo y derecho de salida. De esa manera, se 15 preserva la diversidad espacial del altavoz central de altura y el altavoz horizontal central de la configuración de canales de entrada mediante el uso del altavoz horizontal central y una fuente fantasma alimentada por el canal de entrada central de altura.

[0050] En realizaciones de la invención, además de la distribución en estéreo, se puede aplicar un filtro de 20 ecualización para compensar los posibles cambios de timbre debidos a diferentes BRIR.

[0051] En la figura 9 se ilustra una realización de un aparato 60 que implementa la estrategia de distribución en estéreo. En la figura 9, los canales de entrada y los canales de salida corresponden a los canales de entrada y el canal de salida mostrados en la figura 8 y se omite una descripción repetida de los mismos. El aparato 60 está

25 configurado para generar una fuente fantasma mediante la distribución en estéreo entre el segundo y tercer canales de salida 42 y 44, como se muestra en la figura 9 por los bloques 62.

[0052] En realizaciones de la invención, se puede efectuar la distribución en estéreo usando algoritmos de distribución en estéreo comunes, tales como los algoritmos de distribución en estéreo genérico como la distribución

30 en estéreo por ley de tangentes en 2D o la distribución en estéreo vectorial basada en la amplitud en 3D; véase V. Pulkki: “Virtual Sound Source Positioning Using Vector Base Amplitude Panning”, Journal of the Audio Engineering Society, vol. 45, págs. 456-466, 1997, y no es necesario describirlo en más detalle en el presente documento. Las ganancias de distribución en estéreo de la ley de distribución en estéreo aplicada determinan las ganancias que se aplican al mapear los canales de entrada con los canales de salida. Las respectivas señales obtenidas se suman al 35 segundo y tercer canales de salida 42 y 44, ver los bloques sumadores 64 en la figura 9. De este modo, se mapea el segundo canal de entrada 14 con el segundo y tercer canales de salida 42 y 44 distribuyendo en estéreo a fin de generar una fuente fantasma en la posición x2, el primer canal de entrada 12 se mapea directamente con el primer canal de salida 16, y también se mapean directamente el tercer y cuarto canales de entrada 38 y 40 con el segundo y tercer canales de salida 42 y 44.

40

[0053] En realizaciones alternativas, el bloque 62 puede ser modificado para dar lugar también a la funcionalidad de un filtro de ecualización además de la funcionalidad de distribución en estéreo. Por consiguiente, se pueden compensar los posibles cambios de timbre debidos a diferentes BRIR además de preservar la diversidad espacial mediante la estrategia de distribución en estéreo.

45

[0054] La figura 10 muestra un sistema para generar una matriz de DMX, en la cual se puede materializar la presente invención. El sistema comprende conjuntos de reglas que describen mapeos potenciales de los canales de entrada y salida, bloque 400, y un selector 402 que selecciona las reglas más apropiadas para una determinada combinación de una configuración de canales de entrada 404 y una combinación de configuraciones de los canales

50 de salida 406 basándose en los conjuntos de reglas 400. El sistema puede comprender una interfaz apropiada para recibir información sobre la configuración de los canales de entrada 404 y la configuración de los canales de salida 406. La configuración de los canales de entrada define los canales presentes en una disposición de entrada, donde cada canal de entrada tiene una dirección o posición asociada al mismo. La configuración de los canales de salida define los canales presentes en la configuración de salida, donde cada canal de salida tiene una dirección o posición 55 asociada. El selector 402 envía las reglas seleccionadas 408 a un evaluador 410. El evaluador 410 recibe las reglas seleccionadas 408 y evalúa las reglas seleccionadas 408 para derivar coeficientes de DMX 412 sobre la base de las reglas seleccionadas 408. Se puede generar una matriz de DMX 414 a partir de los coeficientes de mezcla descendente derivados. El evaluador 410 puede estar configurado para derivar la matriz de mezcla descendente de los coeficientes de mezcla descendente. El evaluador 410 puede recibir información sobre la configuración de los

canales de entrada y la configuración de los canales de salida, tal como información sobre la geometría de la configuración de salida (por ejemplo, las posiciones de los canales) e información sobre la geometría de la configuración de entrada (por ejemplo las posiciones de los canales) y tener en cuenta la información al derivar los coeficientes de DMX. Como se muestra en la figura 11, el sistema puede ser implementado en una unidad de 5 procesamiento de señales 420 que comprende un procesador 422 programado o configurado para actuar como selector 402 y evaluador 410 y una memoria 424 configurada para almacenar al menos parte de los conjuntos 400 de reglas de mapeo. Otra parte de las reglas de mapeo puede ser verificada por el procesador sin acceder a las reglas almacenadas en la memoria 422. En ambos casos, las reglas son enviadas al procesador para ejecutar los procedimientos descritos. La unidad de procesamiento de señales puede incluir una interfaz de entrada 426 para 10 recibir las señales de entrada 228 asociadas a los canales de entrada y una interfaz de salida 428 para emitir las señales de salida 234 asociadas a los canales de salida.

[0055] Algunas de las reglas 400 pueden ser diseñadas de manera tal que la unidad de procesamiento de

señales 420 implemente una realización de la invención. En la tabla 1 se enumeran ejemplos de reglas para mapear 15 un canal de entrada con uno o más canales de salida.

Tabla 1: Reglas de Mapeo

Entrada (Origen): Salida (Destino) Ganancia Índice de EQ

CH: M 000 CH M L030, CH M R030 1,0 0 (comp.)

CH: M L060 CH M L030, CH M L110 1,0 0 (comp.)

CH: M L060 CH M L030 0,8 0 (comp.)

CH: M R060 CH M R030, CH M R110, 1,0 0 (comp.)

CH: M R060 CH M R030, 0,8 0 (comp.)

CH: M L090 CH M L030, CH M L110 1,0 0 (comp.)

CH: M L090 CH M L030 0,8 0 (comp.)

CH: M R090 CH M R030, CH M R110 1,0 0 (comp.)

CH: M R090 CH M R030 0,8 0 (comp.)

CH: M L110 CH M L135 1,0 0 (comp.)

CH: M L110 CH M L030 0,8 0 (comp.)

CH: M R110 CH M R135 1,0 0 (comp.)

CH: M R110 CH M R030 0,8 0 (comp.)

CH: M L135 CH M L110 1,0 0 (comp.)

CH: M L135 CH M L030 0,8 0 (comp.)

CH: M R135 CH M R110 1,0 0 (comp.)

CH: M R135 CH M R030 0,8 0 (comp.)

CH: M 180 CH M R135 CH M L135 1,0 0 (comp.)

CH: M 180 CH M R110 CH M L110 1,0 0 (comp.)

CH: M 180 CH M R030, CH M _L030 0,6 0 (comp.)

CH: U 000 CH U L030, CH U R030 1,0 0 (comp.)

CH: U 000, CH M L030, CH M R030 0,85 0 (comp.)

CH: U L045 CH U L030 1,0 0 (comp.)

CH: U L045 CH M L030 0,85 1

CH: U R045 CH U R030 1,0 0 (comp.)

CH: U R045 CH M R030 0,85 1

CH: U L030 CH U L045 1,0 0 (comp.)

CH: U L030 CH M L030 0,85 1

CH: U R030 CH U R045 1,0 0 (comp.)

CH: U R030 CH M R030 0,85 1

CH: U L090 CH U L030, CH U L110 1,0 0 (comp.)

CH: U L090 CH U L030, CH U L135 1,0 0 (comp.)

CH: U L090 CH U L045 0,8 0 (comp.)

CH: U L090 CH U L030 0,8 0 (comp.)

CH: U L090 CH M L030, CH M L110 0,85 2

CH: U L090 CH M L030 0,85 2

CH: U R090 CH U R030, CH U R110 1,0 0 (comp.)

CH: U R090 CH U R030, CH U R135 1,0 0 (comp.)

CH: U R090 CH U R045 0,8 0 (comp.)

CH U R090: CH U R030 0,8 0 (comp.)

CH U R090: CH M R030, CH M R110 0,85 2

CH U R090: CH M R030 0,85 2

CH U L110: CH U L135 1,0 0 (comp.)

CH U L110: CH U L030 0,8 0 (comp.)

CH U L110: CH M L110 0,85 2

CH U L110: CH M L030 0,85 2

CH U R110: CH U R135 1,0 0 (comp.)

CH U R110: CH U R030 0,8 0 (comp.)

CH U R110: CH M R110 0,85 2

CH U R110: CH M R030 0,85 2

CH U L135: CH U L110 1,0 0 (comp.)

CH U L135: CH U L030 0,8 0 (comp.)

CH U L135: CH M L110 0,85 2

CH U L135: CH M L030 0,85 2

CH U R135: CH U R110 1,0 0 (comp.)

CH U R135: CH U R030 0,8 0 (comp.)

CH U R135: CH M R110 0,85 2

CH U R135: CH M R030 0,85 2

CH U 180: CH U R135, CH U L135 1,0 0 (comp.)

CH U 180: CH U R110, CH U L110 1,0 0 (comp.)

CH U 180: CH M 180 0,85 2

CH U 180: CH M R110, CH M L110 0,85 2

CH U 180: CH U R030, CH U L030 0,8 0 (comp.)

CH U 180: CH M R030, CH M L030 0,85 2

CH T 000: ALL U 1,0 3

CH T 000: ALL M 1,0 4

CH L 000: CH M 000 1,0 0 (comp.)

CH L 000: CH M L030, CH M R030 1,0 0 (comp.)

CH L 000: CH M L030, CH M R060 1,0 0 (comp.)

CH L 000: CH M L060, CH M R030 1,0 0 (comp.)

CH L L045: CH M L030 1,0 0 (comp.)

CH L R045: CH M R030 1,0 0 (comp.)

CH LFE1: CH LFE2 1,0 0 (comp.)

CH LFE1: CH M L030, CH M R030 1,0 0 (comp.)

CH LFE2: CH LFE1 1,0 0 (comp.)

CH LFE2: CH M L030, CH M R030 1,0 0 (comp.)

[0056] Los términos usados en la tabla 1 correspondientes a los respectivos canales deben ser interpretados de la siguiente manera. Las letras “CH” significa “Canal”. La letra “M” representa “plano horizontal del oyente”, es decir un ángulo de elevación de 0°. Este es el plano en el cual están situados los altavoces en la configuración

5 normal 2D tal como estéreo o 5.1. La letra “L” representa un plano inferior, es decir un ángulo de elevación < 0°. La letra “U” representa a plano superior, es decir un ángulo de elevación > 0°, tal como 30° como altavoz superior en una configuración 3D. La letra “T” representa el canal superior, es decir un ángulo de elevación de 90°, que también se conoce como canal “la voz de Dios”. Situado después de uno de los términos M/L/U/T está un término correspondiente a izquierdo (L) o derecho (R) seguido por el ángulo azimutal. Por ejemplo, CH_M_L030 y 10 CH_M_R030 representan el canal izquierdo y derecho de una configuración estéreo convencional. El ángulo azimutal y el ángulo de elevación correspondientes a cada canal están indicados en la tabla 1, excepto por los canales LFE y el último canal vacío.

[0057] La tabla 1 muestra una matriz de reglas en la cual una o más reglas están asociadas a cada canal de 15 entrada (canal de origen). Como se puede ver en la tabla 1, cada regla define uno o más canales de salida (canales

de destino), con los cuales se ha de mapear el canal de entrada. Además, cada regla define el valor de ganancia G en su tercera columna. Cada regla define asimismo un índice EQ que indica si se debe aplicar un filtro de ecualización o no, y en caso afirmativo, qué filtro de ecualización específico (índice EQ 1 a 4) se debe aplicar. El mapeo del canal de entrada con un canal de salida se realiza con la ganancia G dada en la columna 3 de la Tabla 1. 20 El mapeo del canal de entrada con dos canales de salida (indicado en la segunda columna) se realiza aplicando

distribución en estéreo entre los dos canales de salida, donde las ganancias de distribución en estéreo gi y g2 que surgen como resultado de la aplicación de la ley de distribución en estéreo se multiplican además por la regla respectiva (columna tres de la tabla 1). Se aplican reglas especiales para el canal superior. De acuerdo con una primera regla, se mapea el canal superior con todos los canales de salida del plano superior, lo que está indicado 5 por ALL_U, y de acuerdo con una segunda regla (con menos prioridad), el canal superior se mapea con todos los canales de salida del plano horizontal del oyente, indicado por ALL_M.

[0058] Al considerar las reglas indicadas en la tabla 1, las reglas que definen el mapeo del canal CH_U_000 con los canales izquierdo y derecho representan una implementación de una realización de la invención. Además,

10 las reglas que definen qué ecualización se ha de aplicar representan implementaciones de realizaciones de la invención.

[0059] Como se puede apreciar en la tabla 1, se aplica uno de los filtros ecualizadores 1 a 4 si se mapea un canal de entrada elevado con uno o más canales inferiores. Los valores de ganancia del ecualizador Geq se pueden

15 determinar de la siguiente manera sobre la base de las frecuencias centrales normalizadas dadas en la tabla 2 y basándose en los parámetros consignados en la tabla 3.

Tabla 2: Frecuencias Centrales Normalizadas de las Bandas de 77 Bancos de Filtros

Frecuencia Normalizada [0, 1]______________

0,00208330_____________________________

0,00587500_____________________________

0,00979170_____________________________

0,01354200_____________________________

0,01691700_____________________________

0,02008300_____________________________

0,00458330_____________________________

0,00083333_____________________________

0,03279200_____________________________

0,01400000_____________________________

0,01970800_____________________________

0,02720800_____________________________

0,03533300_____________________________

0,04283300_____________________________

0,04841700_____________________________

0,02962500_____________________________

0,05675000_____________________________

0,07237500_____________________________

0,08800000_____________________________

0,10362000_____________________________

0,11925000_____________________________

0,13487000_____________________________

0,15050000_____________________________

0,16612000_____________________________

0,18175000_____________________________

0,19737000_____________________________

0,21300000_____________________________

0,22862000_____________________________

0,24425000_____________________________

0,25988000_____________________________

0,27550000_____________________________

0,29113000_____________________________

0,30675000_____________________________

0,32238000_____________________________

0,33800000_____________________________

0,35363000_____________________________

0,36925000_____________________________

0,38488000_____________________________

0,40050000

0,41613000

0,43175000

0,44738000

0,46300000

0,47863000

0,49425000

0,50987000

0,52550000

0,54112000

0,55675000

0,57237000

0,58800000

0,60362000

0,61925000

0,63487000

0,65050000

0,66612000

0,68175000

0,69737000

0,71300000

0,72862000

0,74425000

0,75987000

0,77550000

0,79112000

0,80675000

0,82237000

0,83800000

0,85362000

0,86925000

0,88487000

0,90050000

0,91612000

0,93175000

0,94737000

0,96300000

0,97454000

0,99904000

Tabla 3: Parámetros del Ecualizador

Ecualizador: Pf [Hz] Pq Pg[dB] g [dB]

Geq,1: 12000 0,3 -2 1,0

GeQ,2: 12000 0,3 -3,5 1,0

GeQ,3: 200, 1300, 600 0,3, 0,5, 1,0 -6,5, 1,8, 2,0 0,7

GeQ,4: 5000, 1100 1,0, 0,8 4,5, 1,8 -3,1

GeQ,5: 35 0,25 -1,3 1,0

[0060] Geq consiste en valores de ganancia por banda de frecuencia k y el índice de ecualizador e. Cinco

5 ecualizadores predefinidos son combinaciones de diferentes filtros de pico. Como se puede ver en la tabla 3, los ecualizadores Geq,1, Geq,2 y Geq,5 incluyen un solo filtro de pico, el ecualizador Geq,3 incluye tres filtros de pico y el ecualizador Geq,4 incluye dos filtros de pico. Cada ecualizador es una cascada en serie de uno o más filtros de pico y una ganancia:

JEQ,e

= 102(5

vnu

'J ífl.m ^,«3

H — Í

donde banda(k) es la frecuencia central normalizada de la banda de frecuencia j, especificada en la tabla 4, fs es la frecuencia de muestreo y la función pico() corresponde a G negativo

VT-<?-G) =

b4 +: (¡M f2bz + f4

M: -G 1010 2 J/2fr2 + /4

Ecuación 1

10

y por el contrario

%f,Q,G) =

H: G )/V + r

: (¡M f2bz + f4

Ecuación 2

5

imagen1

imagen2

imagen3

imagen4

imagen5

imagen6

[0061] Los parámetros correspondientes a los ecualizadores están especificados en la tabla 3 En las 15 ecuaciones anteriores 1 y 2, b está dado por banda(k) fs/2, Q está dado por Pq para el respectivo filtro de pico (1 a

n), G está dado por Pg para el respectivo filtro de pico, y f está dado por Pf para el respectivo filtro de pico.

[0062] Como ejemplo, los valores de ganancia del ecualizador Geq,4 correspondientes al ecualizador que tiene el índice 4 se calculan con los parámetros de filtro tomados de la fila pertinente de la tabla 3. La tabla 3

20 enumera dos conjuntos de parámetros correspondientes a los filtros de pico para Geq,4, es decir conjuntos de parámetros correspondientes a n = 1 y n = 2. Los parámetros son la frecuencia de los picos Pf en Hz, el factor de calidad del filtro de pico Pq, la ganancia Pg (en dB) que se aplica a la frecuencia de los picos y una ganancia general g en dB que se aplica a la cascada de los dos filtros de pico (cascada de filtros para los parámetros n = 1 y n = 2).

25 [0063]

De este modo -3.1

G= 10 20 ■ pico(banda(k)

-34 (banda{k)

= 10 20 ■ -pico I-----------------—

fs/2. pf,u pq,v pg,i) ■ pico(banda{k) ■

■fs

*>pi

f.2> PQZ> Pgz)

. 5000,1,0,45j ■ pico (bcmdafa) ■ 2 Q,8,1,8^

- 3.1

= 10 2(5 '

b4 +: / 4.5 10 w , 5QG02fr2 + 5QCQ4

\ fc4 +: 5ÜÜÜ2h2 + 5ÜÜÜ4

b4+ \: |ll002¿2+ 110Q4

J¿4 +: ( i 110Ü2b2+ 11ÜÜ4

VO, 82 “)

30

[0064] La definición del ecualizador tal como se indicó anteriormente define ganancias Geq,4 de fase cero de

modo independiente por cada banda de frecuencia k. Cada banda k está especificada por su banda de frecuencia(k) central normalizada donde 0<=banda<=1. Nótese que la banda de frecuencia normalizada=1 corresponde a la

frecuencia no normalizada fs/2, donde fs denota la frecuencia de muestreo. Por lo tanto bandct(_k) • fs/2 denota

la

35 frecuencia central no normalizada de la banda k en Hz.

imagen7

[0065] De este modo, se pueden usar filtros ecualizadores diferentes en realizaciones de la invención que se

han descrito. Sin embargo, es obvio que la descripción de estos filtros de ecualización sólo tiene fines ilustrativos y que se pueden usar otros filtros de ecualización o filtros de decorrelación en otras realizaciones.

5 [0066] La tabla 4 ilustra canales ejemplificativos con su respectivo ángulo azimutal y ángulo de elevación

asociados.

Tabla 4: Canales con los correspondientes ángulos azimutal y de elevación

Canal: Azimut [gradosl Elevación [gradosl

CH M 000: 0 0

CH M L030: +30 0

CH M R030: -30 0

CH M L060: +60 0

CH M R060: -60 0

CH M L090: +90 0

CH M R090: -90 0

CH M Li 10: + 110 0

CH M Rii0: -110 0

CH M Li35: + 135 0

CH M Ri35: -135 0

CH M 180: 180 0

CH U 000: 0 +35

CH U L045: +45 +35

CH U R045: -45 +35

CH U L030: +30 +35

CH U R030: -30 +35

CH U L090: +90 +35

CH U R090: -90 +35

CH U L110: + 110 +35

CH U R110: -110 +35

CH U L135: + 135 +35

CH U R135: -135 +35

CH U 180: 180 +35

CH T 000: 0 +90

CH L 000: 0 -15

CH L L045: +45 -15

CH L R045: -45 -15

CH LFE1: n/a n/a

CH LFE2: n/a n/a

CH EMPTY: n/a n/a

10 [0067] En realizaciones de la invención, la distribución en estéreo entre dos canales de destino se puede

realizar mediante la aplicación de distribución en estéreo basada en la amplitud por la ley de tangentes. En la distribución en estéreo de un canal de origen con un primer y segundo canales de destino, se calcula un coeficiente de ganancia Gi correspondiente al primer canal de destino y se calcula un coeficiente de ganancia G2 correspondiente al segundo canal de destino:

15

Gi = (columna de valores de ganancia de la tabla 4) * gi

y

20

G2 = (columna de valores de ganancia de la tabla 4) * g2.

[0068] Las ganancias gi y g2 se calculan aplicando la distribución en estéreo basada en amplitud por la ley de

tangentes de la siguiente manera:

se despliegan los ángulos azimutales del canal de destino para que sean positivos los ángulos azimutales de los canales de destino son ai y a2 (ver la tabla 4).

el ángulo azimutal del canal de origen (objetivo de distribución en estéreo) es aSrc.

imagen8

9

tan cD-tan ¡¡¡410 tan ED4tan o;41(}_1D

[0069]

En otras realizaciones, se pueden aplicar diferentes leyes de distribución en estéreo.

5

[0070] En principio, las realizaciones de la invención tienen por fin modelar un mayor número de canales

10 acústicos en la configuración de canales de entrada por medio de mapeos de canal cambiados y modificaciones de las señales en la configuración de los canales de salida. En comparación con las estrategias simples que con frecuencia se consideran más opresivas, menos diversas y menos envolventes que la configuración de canales de entrada, se puede mejorar y tornar más agradables la diversidad espacial y la experiencia auditiva en general mediante el empleo de realizaciones de la invención.

15 [0071] En otras palabras, en realizaciones de la invención se mezclan dos o más canales de entrada entre sí

en una aplicación de mezcla descendente, en la cual se aplica un módulo de procesamiento a una de las señales de entrada para preservar las diferentes características de las diferentes trayectorias de transmisión desde los canales original de entrada a los oídos del oyente. El módulo de procesamiento puede incluir filtros que modifican las características de la señal, por ejemplo filtros de ecualización o filtros de decorrelación. En particular, los filtros 20 ecualizadores pueden compensar la pérdida de diferentes timbres de los canales de entrada con diferentes elevaciones asignadas a los mismos. En realizaciones de la invención, el módulo de procesamiento puede dirigir al menos una de las señales de entrada hacia múltiples altavoces de salida para generar una trayectoria de transmisión diferente hacia el oyente, preservando de esa manera la diversidad espacial de los canales de entrada. En realizaciones de la invención, se pueden aplicar modificaciones de filtro y direccionamiento por separado o en 25 combinación. En realizaciones de la invención, el módulo de procesamiento puede ser reproducido a través de uno o múltiples altavoces.

[0072] Si bien se han descrito algunos aspectos en el contexto de un aparato, es obvio que estos aspectos

también representan una descripción del procedimiento correspondiente, en el cual un bloque o dispositivo 30 corresponde a una etapa del procedimiento o a una característica de una etapa del procedimiento. De manera análoga, los aspectos descritos en el contexto de una etapa del procedimiento también representan una descripción de un bloque o punto correspondiente o de una característica de un aparato correspondiente. Algunas o todas las etapas del procedimiento pueden ser ejecutadas por medio de (o utilizando) un aparato de hardware, como por ejemplo, un microprocesador, un ordenador programable o un circuito electrónico. En algunas realizaciones, una 35 cualquiera o más de las etapas más importantes del procedimiento pueden ser ejecutadas por ese tipo de aparato. En realizaciones de la invención, los procedimientos descritos en el presente documento son implementados por un procesador o implementados por un ordenador.

[0073] Dependiendo de ciertos requisitos de implementación, realizaciones de la invención pueden ser

40 implementadas en hardware o en software. La implementación se puede realizar usando un medio de almacenamiento digital, por ejemplo un disco blando, un DVD, un Blue-Ray, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tiene almacenadas en la misma señales de control legibles electrónicamente, que cooperan (o tienen capacidad para cooperar) con un sistema informático programable de tal manera que se ejecute el procedimiento respectivo. Por lo tanto, el medio de almacenamiento digital puede ser 45 legible por un ordenador

[0074] En general, realizaciones de la presente invención pueden ser implementadas en forma de producto programa informático con un código de programa, siendo el código de programa operativo para ejecutar uno de los procedimientos al ejecutarse el programa informático en un ordenador. El código de programa puede ser

50 almacenado, por ejemplo, en un portador legible por una máquina.

[0075] Otras realizaciones comprenden el programa informático para ejecutar uno de los procedimientos en el presente documento descritos, almacenado en un portador legible por una máquina.

55 [0076] En otras palabras, una realización del procedimiento de la invención consiste, por lo tanto, en un

programa informático que consta de un código de programa para ejecutar uno de los procedimientos descritos en el presente documento al ejecutarse el programa informático en un ordenador.

[0077] Otra forma de realización comprende un medio de procesamiento, por ejemplo un ordenador o un 5 dispositivo lógico programable, programado para, configurado para o adaptado para ejecutar uno de los

procedimientos descritos en el presente documento.

[0078] Otra forma de realización comprende un ordenador en el que se ha instalado el programa informático para ejecutar uno de los procedimientos descritos en el presente documento.

10

[0079] En algunas realizaciones, se puede usar un dispositivo lógico programable (por ejemplo una matriz de puertas programables in situ) para ejecutar algunas o todas las funcionalidades de los procedimientos descritos en el presente documento. En algunas realizaciones, una matriz de puertas programables in situ puede cooperar con un microprocesador para ejecutar uno de los procedimientos descritos en el presente documento. Por lo general, los

15 procedimientos son ejecutados preferentemente por cualquier aparato de hardware.

[0080] Las realizaciones descritas anteriormente son meramente ilustrativas de los principios de la presente invención. Se entiende que las modificaciones y variaciones de las disposiciones y detalles descritos en el presente documento han de ser evidentes para los expertos en la materia. Por lo tanto, sólo es intención limitarse al alcance

20 de las siguientes reivindicaciones de patente y no a los detalles específicos presentados a la manera de descripción y explicación de las realizaciones presentadas en el presente documento.

Claims

REIVINDICACIONES

1. Aparato (10; 30; 50; 60) para mapear un primer canal de entrada (12) y un segundo canal de entrada (14) de una configuración de canales de entrada con canales de salida (16, 42, 44) de una configuración de canales

5 de salida, en el que cada canal de entrada y cada canal de salida tiene una dirección en la cual está situado un altavoz asociado con respecto a una posición central del oyente (P), en el que los primer y segundo canales de entrada (12, 14) tienen diferentes ángulos de elevación con respecto a un plano horizontal del oyente (300), en el que el aparato está configurado para:

mapear el primer canal de entrada (12) con un primer canal de salida (16) de la configuración de canales de 10 salida; y

pese a que una desviación del ángulo azimutal entre una dirección del segundo canal de entrada (14) y una dirección del primer canal de salida (16) es menor que una desviación del ángulo azimutal entre una dirección del segundo canal de entrada (14) y un segundo canal de salida (42) y/o es menor que una desviación del ángulo azimutal entre la dirección del segundo canal de entrada (14) y la dirección de un tercer canal de salida (44), 15 mapear el segundo canal de entrada (14) con los segundo y tercer canales de salida (42, 44) mediante distribución en estéreo (52, 62) entre los segundo y tercer canales de salida (42, 44) para generar una fuente fantasma en la posición del altavoz asociado con el primer canal de salida.
2. Aparato de la reivindicación 1, configurado para procesar el segundo canal de entrada (14) aplicando 20 al menos uno de un filtro de ecualización y un filtro de decorrelación al segundo canal de entrada (14).
3. Procedimiento para mapear un primer canal de entrada (12) y un segundo canal de entrada (14) de una configuración de canales de entrada con canales de salida de una configuración de canales de salida, en el que cada canal de entrada y cada canal de salida tiene una dirección en la cual está situado un altavoz asociado con

25 respecto a una posición central del oyente (P), en el que los primer y segundo canales de entrada (12, 14) tienen diferentes ángulos de elevación con respecto a un plano horizontal del oyente (300), que comprende:

mapear el primer canal de entrada (12) con un primer canal de salida (16) de la configuración de canales de salida; y

pese a que una desviación del ángulo azimutal entre una dirección del segundo canal de entrada (14) y una 30 dirección del primer canal de salida (16) es menor que una desviación del ángulo azimutal entre una dirección del segundo canal de entrada (14) y un segundo canal de salida (42) y/o es menor que una desviación del ángulo azimutal entre la dirección del segundo canal de entrada (14) y la dirección de un tercer canal de salida (44), mapear el segundo canal de entrada (14) con los segundo y tercer canales de salida (42, 44) mediante distribución en estéreo (52, 62) entre los segundo y tercer canales de salida (42, 44 para generar una fuente 35 fantasma en la posición del altavoz asociado con el primer canal de salida.
4. Programa informático para ejecutar, cuando es ejecutado en un ordenador o un procesador, el procedimiento de la reivindicación 3.

40