ES2688387T3 - Procedimiento y unidad de procesamiento de señales para mapear una pluralidad de canales de entrada de una configuración de canales de entrada con canales de salida de una configuración de canales de salida - Google Patents

Procedimiento y unidad de procesamiento de señales para mapear una pluralidad de canales de entrada de una configuración de canales de entrada con canales de salida de una configuración de canales de salida Download PDF

Info

Publication number
ES2688387T3
ES2688387T3 ES16187406.0T ES16187406T ES2688387T3 ES 2688387 T3 ES2688387 T3 ES 2688387T3 ES 16187406 T ES16187406 T ES 16187406T ES 2688387 T3 ES2688387 T3 ES 2688387T3
Authority
ES
Spain
Prior art keywords
channels
output
input
channel
configuration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16187406.0T
Other languages
English (en)
Inventor
Jürgen HERRE
Fabian KÜCH
Michael Kratschmer
Achim Kuntz
Christoph Faller
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2688387T3 publication Critical patent/ES2688387T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/308Electronic adaptation dependent on speaker or headphone connection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)
  • Time-Division Multiplex Systems (AREA)

Abstract

Procedimiento para mapear una pluralidad de canales de entrada de una configuración de canales de entrada (404) con los canales de salida de una configuración de canales de salida (406), procedimiento que comprende: producir una serie de reglas (400) asociadas a cada canal de entrada de la pluralidad de canales de entrada, en los que las reglas definen diferentes mapeos entre el canal de entrada asociado y una serie de canales de salida; por cada canal de entrada de la pluralidad de canales de entrada, acceder (500) a una regla asociada al canal de entrada, determinar (502) si la serie de canales de salida definida en la regla a la que se ha accedido está presente en la configuración de los canales de salida (406) y seleccionar (402, 504) la regla a la que se ha accedido si la serie de canales de salida definida en la regla a la que se ha accedido está presente en la configuración de los canales de salida (406); y mapear (508) los canales de entrada con los canales de salida según la regla seleccionada, caracterizado porque una regla de la serie de reglas asociadas al canal de entrada de la configuración de canal de entrada que comprende una dirección posterior central define un mapeo de ese canal de entrada con dos de los canales de salida, uno se ubica del lado izquierdo de una dirección frontal central y otro se ubica del lado derecho de la dirección frontal central, en el que la regla se define además utilizando un coeficiente de ganancia inferior a uno si un ángulo de estos dos canales de salida relativo a la dirección posterior central es más de 90°.

Description

DESCRIPCIÓN
Procedimiento y unidad de procesamiento de señales para mapear una pluralidad de canales de entrada de una configuración de canales de entrada con canales de salida de una configuración de canales de salida 5
[0001] La presente invención se relaciona con procedimientos y unidades de procesamiento de señales para mapear una pluralidad de canales de entrada de una configuración de canales de entrada con los canales de salida de una configuración de canales de salida, y, en particular, procedimientos y aparato adecuados para la conversión de formato de mezcla descendente entre diferentes configuraciones de canales de altavoces.
10
[0002] Las herramientas de codificación de audio espacial son muy conocidas en la técnica y han sido normalizadas, por ejemplo, en la norma surround MPEG. La codificación de audio espacial se inicia con una pluralidad de entradas originales, por ejemplo, cinco o siete canales de entrada, que se identifican por su ubicación en una configuración de reproducción, por ejemplo, como un canal izquierdo, un canal central, un canal derecho, un canal
15 contorno izquierdo, un canal contorno derecho y un canal de intensificación de efectos de baja frecuencia (LFE). Un codificador de audio espacial puede derivar uno o más canales de mezcla descendente de los canales originales y, además puede derivar datos paramétricos relacionados con indicios espaciales tales como diferencias de nivel entre canales en los valores de coherencia de canales, diferencias de fase entre canales, diferencias de tiempo entre canales, etc. Dichos uno o más canales de mezcla descendente se transmiten junto con la información lateral
20 paramétrica que indica los indicios espaciales a un decodificador de audio espacial para decodificar los canales de mezcla descendente y los datos paramétricos asociados a fin de obtener, en última instancia, canales de salida que son una versión aproximada de los canales de entrada originales. La ubicación de los canales en la configuración de salida puede ser fija, por ejemplo, un formato 5.1, un formato 7.1, etc.
25 [0003] Además, las herramientas de codificación de objetos de audio espacial son muy conocidas en la técnica
y han sido normalizadas, por ejemplo, en la norma MPEG SAOc (SAOC = codificación de objetos de audio espacial). A diferencia de la codificación de audio espacial que parte de los canales originales, la codificación de objetos de audio espacial parte de objetos de audio que no están automáticamente dedicados a una determinada configuración de renderización y reproducción. Por el contrario, la ubicación de los objetos de audio en la escena de reproducción es
30 flexible y puede ser ajustada por un usuario, por ejemplo, introduciendo cierta información de renderización en un decodificador para codificación de objetos de audio espacial. Por otro lado, o además, se puede transmitir información de renderización en forma de información lateral adicional o metadatos; la información de renderización puede incluir información sobre en qué posición de la configuración de reproducción se deben colocar ciertos objetos de audio (por ejemplo en función del tiempo). Para obtener una determinada compresión de datos, se codifica un número de objetos
35 de audio utilizando un codificador SAOC que calcula, a partir de los objetos de entrada, uno o más canales de transporte mediante la mezcla descendente de los objetos según cierta información de mezcla descendente. Más aun, el codificador SAOC calcula información lateral paramétrica que representa indicios entre objetos tales como diferencias de nivel de los objetos (OLD), valores de coherencia de los objetos, etc. Como en SAC (sAc = Codificación de audio espacial), se calculan los datos paramétricos entre objetos con respecto a teselas individuales en
40 tiempo/frecuencia. Para una trama determinada (por ejemplo, 1.024 o 2.048 muestras) de la señal de audio se tiene en cuenta una pluralidad de bandas de frecuencia (por ejemplo 24, 32 o 64 bandas) de manera que se suministran datos paramétricos por cada trama y cada banda de frecuencia. Por ejemplo, cuando una pieza de audio tiene 20 tramas y cuando cada trama está subdividida en 32 bandas de frecuencia, el número de teselas de tiempo/frecuencia es 640.
45
[0004] Un formato de reproducción deseada, es decir, una configuración de los canales de salida (configuración de altavoces de salida), puede diferir de una configuración de los canales de entrada, en la que el número de canales de salida es generalmente diferente del número de canales de entrada. Por consiguiente, puede ser necesaria la conversión de formato para mapear los canales de entrada de la configuración de los canales de entrada con los
50 canales de salida de la configuración de los canales de salida.
[0005] Los documentos de la técnica anterior US2012/093323 A1, WO 2013/006338 A2 y US8050434 B1, describen una pluralidad de conjuntos de reglas de mapeo de canales de mezcla descendente para un mapeo flexible de una pluralidad de configuraciones de canales de entrada con salida.
55
[0006] El objetivo subyacente de la presente invención es proporcionar una estrategia aprobada para mapear canales de entrada de una configuración de canales de entrada con canales de salida de una configuración de canales de salida de manera flexible.
[0007] Este objetivo se alcanza mediante un procedimiento de la reivindicación 1, un programa informático de
la reivindicación 19, una unidad de procesamiento de señales de la reivindicación 20 y un decodificador de audio de la reivindicación 22.
5 [0008] Las realizaciones de la invención proporcionan un procedimiento para mapear una pluralidad de canales
de entrada de una configuración de canales de entrada con los canales de salida de una configuración de canales de salida, comprendiendo el procedimiento:
producir una serie de reglas asociadas a cada canal de entrada de la pluralidad de canales de entrada, en la que las 10 reglas que integran una serie definen diferentes mapeos entre el canal de entrada y una serie de canales de salida asociados;
por cada canal de entrada de la pluralidad de canales de entrada, acceder a una regla asociada al canal de entrada, determinar si la serie de canales de salida definidos en la regla a la que se ha tenido acceso está presente en la 15 configuración de los canales de salida, y seleccionar la regla a la que se ha tenido acceso si la serie de canales de salida definida en la regla a la que se ha tenido acceso está presente en la configuración de los canales de salida y
mapear los canales de entrada con los canales de salida según la regla elegida,
20 en el que una serie de reglas asociadas al canal de entrada que comprende una dirección posterior central define un mapeo del canal de entrada con dos canales de salida, uno se ubica en el lado izquierdo de una dirección frontal central y otro se ubica en el lado derecho de la dirección frontal central, en el que la regla se define además utilizando un coeficiente de ganancia inferior a uno si un ángulo de los dos canales de salida relativo a la dirección posterior central es más de 90°.
25
[0009] Las realizaciones de la invención proporcionan un programa informático para poner en práctica el citado procedimiento al ejecutarse aquel en un ordenador o un procesador. Las realizaciones de la invención proporcionan una unidad de procesamiento de señales que comprende un procesador configurado o programado para ejecutar dicho procedimiento. Las realizaciones de la invención proporcionan un decodificador de audio que comprende esa
30 unidad de procesamiento de señales.
[0010] Las realizaciones de la invención se basan en una novedosa estrategia, en la cual una serie de reglas que describen los mapeos de los canales de entrada y salida potenciales está asociada a cada canal de entrada de una pluralidad de canales de entrada y en la cual se selecciona una regla de una serie de reglas para una determinada
35 configuración de canales de entrada y salida. En consecuencia, las reglas no se asocian a una configuración de los canales de entrada o a una configuración específica de los canales de entrada. Por consiguiente, para una configuración dada de los canales de entrada y una configuración específica de los canales de salida, por cada uno de una pluralidad de canales de entrada presentes en la configuración dada de canales de entrada, se accede a la serie de reglas asociada para determinar cuál de las reglas coincide con la configuración dada de canales de salida. 40 Las reglas pueden definir uno o más coeficientes para aplicar a los canales de entrada directamente o pueden definir un procedimiento que se ha de aplicar para derivar los coeficientes que se han de aplicar a los canales de entrada. Sobre la base de los coeficientes se puede generar una matriz de coeficientes, tal como una matriz de mezcla descendente (DMX) que se puede aplicar a los canales de entrada de la configuración dada de canales de entrada para mapearlos con los mismos canales de salida de la configuración dada de canales de salida. Dado que la serie 45 de reglas está asociada a los canales de entrada en lugar de a una configuración de los canales de entrada o a una configuración específica de canales de entrada y salida, la estrategia de la invención se puede utilizar para diferentes configuraciones de canales de entrada y diferentes configuraciones de canales de salida de manera flexible.
[0011] En las realizaciones de la invención, los canales representan canales de audio, en los que cada canal
50 de entrada y cada canal de salida tiene una dirección en la cual está ubicado un altavoz asociado con respecto a una
posición central del oyente.
[0012] A continuación se describirán las realizaciones de la presente invención con respecto a los dibujos anexos, en los cuales:
55
Fig. 1 ilustra una visión general de un codificador de audio 3D de un sistema de audio 3D;
Fig. 2 ilustra una visión general de un decodificador de audio 3D de un sistema de audio 3D;
Fig. 3 ilustra un ejemplo de implementación de un conversor de formato que se puede implementar en el decodificador de audio 3D de la Fig. 2;
Fig. 4 ilustra una vista superior esquemática de una configuración de altavoces;
5
Fig. 5 ilustra una vista posterior esquemática de otra configuración de altavoces;
Fig. 6a ilustra un diagrama de bloques de una unidad de procesamiento de señales para mapear los canales de entrada de una configuración de canales de entrada con los canales de salida de una configuración de canales de 10 salida;
Fig. 6b ilustra una unidad de procesamiento de señales según una realización de la invención;
Fig. 7 ilustra un procedimiento para mapear canales de entrada de una configuración de canales de entrada con los 15 canales de salida de una configuración de canales de salida; y
Fig. 8 ilustra un ejemplo de la etapa de mapeo en más detalle.
[0013] Antes de describir las realizaciones de la estrategia de la invención en forma más detallada, se presenta 20 una visión general de un sistema de códec de audio 3D en el cual se puede implementar la estrategia de la invención.
[0014] Las Figs. 1 y 2 ilustran los bloques algorítmicos de un sistema de audio 3D de conformidad con las realizaciones. Más específicamente, la Fig. 1 ilustra una visión general de un codificador de audio 3D 100. El codificador de audio 100 recibe en un circuito de prerrenderización/mezcla 102, que se puede incluir opcionalmente,
25 señales de entrada, más específicamente una pluralidad de canales de entrada que envían al codificador de audio 100 una pluralidad de señales de canales 104, una pluralidad de señales de objeto 106 y sus correspondientes metadatos de objeto 108. Las señales de objeto 106 procesadas por el prerrenderizador/mezclador 102 (véase las señales 110) pueden ser enviadas a un codificador SAOC 112 (SAOC = Codificación de objetos de audio espacial). El codificador SAOC 112 genera los canales de transporte de SAOC 114 provistos a las entradas de un codificador 30 USAC 116 (USAC = Codificación Unificada de Voz y Audio). Además, la SAOC-SI de señal 118 (SAOC- SI = información lateral de SAOC) también es enviada a las entradas del codificador USAC 116. El codificador USAC 116 recibe además señales de objeto 120 directamente del prerrenderizador/mezclador, así como las señales de canales y señales de objeto prerrenderizadas 122. La información de metadatos de objeto 108 se aplica a un codificador de OAM 124 (OAM = metadatos de objeto) que envía la información comprimida de metadatos de objeto 35 126 al codificador USAC. El codificador USAC 116, sobre la base de las señales de entrada antes mencionadas, genera una señal de salida comprimida MP4, como se indica en 128.
[0015] La Fig. 2 ilustra una visión general de un decodificador de audio 3D 200 del sistema de audio 3D. La señal codificada 128 (MP4) generada por el codificador de audio 100 de la Fig. 1 es recibida en el decodificador de
40 audio 200, más específicamente en un decodificador de USAC 202. El decodificador USAC 202 decodifica la señal recibida 128 en las señales de canales 204, las señales de objeto prerrenderizadas 206, las señales de objeto 208, y las señales de canales de transporte de SAOC 210. Asimismo, la información comprimida de metadatos de objeto 212 y la SAOC-SI de señal 214 es emitida por el decodificador USAC. Las señales de objeto 208 son enviadas a un renderizador de objetos 216 que emite las señales de objeto renderizadas 218. Las señales de canales de transporte 45 de SAOC 210 son provistas al decodificador SAOC 220 que emite las señales de objeto renderizadas 222. La meta información de objeto comprimida 212 es enviada a un decodificador OAM 224 que envía las respectivas señales de control al renderizador de objetos 216 y al decodificador SAOC 220 para generar las señales de objeto renderizadas 218 y las señales de objeto renderizadas 222. El decodificador comprende además un mezclador 226 que recibe, como se ilustra en la Fig. 2, las señales de entrada 204, 206, 218 y 222 para emitir las señales de canales 228. Las 50 señales de canales pueden ser enviadas directamente a un altavoz, por ejemplo, un altavoz de 32 canales, como se indica en 230. Por otro lado, las señales 228 pueden ser enviadas a un circuito de conversión de formato 232 que recibe, como entrada de control, una señal de distribución de la reproducción que indica la forma en que las señales de canales 228 se deben convertir. En la realización expuesta en la Fig. 2, se presume que la conversión se debe realizar de tal manera que se pueda enviar las señales a un sistema de altavoces 5.1 como se indica en 234. Asimismo, 55 las señales de canal 228 son enviadas a un renderizador binaural 236 que genera dos señales de salida, por ejemplo para un auricular, como se indica en 238.
[0016] El sistema de codificación/decodificación ilustrado en las Figs. 1 y 2 se puede basar en el códec MPEG- D USAC para la codificación de señales de canal y de objeto (véase las señales 104 y 106). Para aumentar la eficiencia en la codificación de una gran cantidad de objetos, se puede emplear la tecnología MPEG SAOC. Tres tipos de
renderizadores pueden ejecutar las tareas de renderización de objetos a canales, renderización de canales a auriculares o la renderización de canales a una configuración diferente de altavoces (véase la Fig. 2, números de referencia 230, 234 y 238). Cuando las señales de objeto son explícitamente transmitidas o codificadas paramétricamente usando SAOC, la correspondiente información de metadatos de objeto 108 es comprimida (véase 5 la señal 126) y multiplexada en el flujo de bits de audio 3D 128.
[0017] Las Figs. 1 y 2 ilustran los bloques algorítmicos correspondientes a la totalidad del sistema de audio 3D
que se describe a continuación con más detalle.
10 [0018] Se puede incluir opcionalmente el prerrenderizador/mezclador 102 para convertir un canal más una
escena de entrada de objeto en una escena de canal antes de la codificación. Funcionalmente, es idéntico al renderizador/mezclador de objetos que se describe más adelante en detalle. La prerrenderización de objetos puede ser ventajosa para garantizar una entropía de señal determinística a la entrada del codificador que es básicamente independiente del número de señales de objeto activas simultáneamente. Con la prerrenderización de objetos, no es 15 necesaria la transmisión de metadatos de objeto. Se renderizan señales de objeto discretas a la distribución de canales cuyo codificador está configurado para usar. Los pesos de los objetos correspondientes a cada canal se obtienen de los metadatos de objeto (OAM) asociados.
[0019] El codificador USAC 116 es el códec de núcleo para las señales de altavoces-canales, señales de objeto 20 discretas, señales de mezcla descendente de objetos y señales prerrenderizadas. Se basa en la tecnología MPEG-D
USAC. Se encarga de la codificación de las señales enumeradas anteriormente generando información de canales y objetos basada en la información geométrica y semántica de la asignación de canales de entrada y objetos. Esta información de mapeo describe cómo se mapean los canales de entrada y objetos con elementos de canales de USAC, como elementos de pares de canales (CPE), elementos de canales individuales (SCE), efectos de baja 25 frecuencia (LFE) y elementos de cuatro canales (QCE) y CPE, SCE y LFE, y la información correspondiente se transmite al decodificador. Todas las cargas útiles adicionales como los datos de SAOC 114, 118 o los metadatos de objeto 126 se tienen en cuenta en el control de tasa del codificador. La codificación de objetos es posible de maneras diferentes, dependiendo de los requisitos de tasa/distorsión y los requisitos de interactividad impuestos al renderizador. De conformidad con las realizaciones, son posibles las siguientes variantes de codificación de objetos:
30
• Objetos prerrenderizados: Las señales de objeto son prerrenderizadas y mezcladas con las señales de 22.2 canales antes de la codificación. La cadena de codificación subsiguiente ve 22.2 señales de canales.
• Formas de onda discretas de objetos: Los objetos son enviados al codificador como formas de onda monofónicas. El codificador utiliza elementos de canal individual (SCE) para transmitir los objetos además de las señales de canales.
35 Los objetos decodificados son renderizados y mezclados del lado del receptor. Se transmite información comprimida de metadatos de objeto al receptor/renderizador.
• Formas de onda paramétricas de objetos: Las propiedades de los objetos y su relación mutua se describen por medio de parámetros de SAOC. La mezcla descendente de las señales de objeto se codifica con la USAC. La información paramétrica se transmite conjuntamente. Se elige el número de canales de mezcla descendente dependiendo del
40 número de objetos y la tasa de datos en general. Se transmite información comprimida de metadatos de objeto al renderizador de SAOc.
[0020] El codificador SAOC 112 y el decodificador SAOC 220 para señales de objeto se pueden basar en la tecnología MPEG SAOC. El sistema tiene capacidad para recrear, modificar y renderizar un número de objetos de
45 audio basados en un número más pequeño de canales transmitidos y datos paramétricos adicionales, tales como OLD, IOC (Coherencia Entre Objetos), DMG (Ganancias de Mezcla Descendente). Los datos paramétricos adicionales exhiben una tasa de datos significativamente más baja que la necesaria para transmitir individualmente todos los objetos, lo que aporta gran eficiencia a la codificación. El codificador SAOC 112 toma como entrada las señales de objeto/canales como formas de onda monofónicas y emite la información paramétrica (que está incluida en el flujo de 50 bits de audio 3D 128) y los canales de transporte de SAOC (que se codifican utilizando elementos de canal único y se transmiten). El decodificador SAOC 220 reconstruye las señales de objeto/canales procedentes de los canales de transporte de SAOC decodificados 210 y la información paramétrica 214, y genera la escena de audio de salida sobre la base de la distribución de reproducción, la información de metadatos de objeto descomprimida y, opcionalmente, sobre la base de la información de interacción con el usuario.
55
[0021] El códec de metadatos de objeto (véase codificador de OAM 124 y decodificador de OAM 224) se incluye para que, por cada objeto, los metadatos asociados que especifican la posición geométrica y el volumen de los objetos en el espacio 3D sean codificados de manera eficiente mediante la cuantificación de las propiedades de los objetos en tiempo y espacio. Los metadatos de objeto comprimidos cOAM 126 se transmiten al receptor 200 en forma de
información lateral.
[0022] El renderizador de objetos 216 utiliza los metadatos de objeto comprimidos para generar formas de onda de objetos según el formato de reproducción dado. Cada objeto es renderizado a un determinado canal de salida 218
5 según sus metadatos. La salida de este bloque es el resultado de la suma de los resultados parciales. Si se decodifica tanto el contenido basado en los canales como los objetos discretos/paramétricos, las formas de onda basadas de los canales y las formas de onda de objetos renderizados son mezcladas por el mezclador 226 antes de emitir las formas de onda obtenidas 228 o antes de alimentarlas a un módulo post-procesador como el módulo renderizador binaural 236 o el módulo renderizador de altavoces 232.
10
[0023] El módulo renderizador binaural 236 produce una mezcla descendente binaural del material de audio multicanal de tal manera que cada canal de entrada esté representado por una fuente de sonido virtual. El procesamiento se lleva a cabo trama por trama en el dominio de QMF (Banco de Filtros de Cuadratura en Espejo), y la binauralización se basa en respuestas a los impulsos binaurales del recinto medidas.
15
[0024] El renderizador de altavoces 232 realiza la conversión entre la configuración de canales transmitida 228 y el formato de reproducción deseado. También se puede denominar "conversor de formato". El conversor de formato realiza las conversiones a números menores de canales de salida, es decir, que crea mezclas descendentes.
20 [0025] En la Fig. 3 se ilustra una implementación posible de un conversor de formato 232. En las realizaciones
de la invención, la unidad de procesamiento de señales es ese tipo de conversor de formato. El conversor de formato 232, al que también se hace referencia como renderizador de altavoces, convierte entre la configuración de canales transmisores y el formato de reproducción deseado mediante el mapeo de los canales transmisores (entrada) de la configuración de canales de transmisión (entrada) a los canales (salida) del formato de reproducción deseado
25 (configuración de canales de salida). El conversor de formato 232 ejecuta en general las conversiones a un número más bajo de canales de salida, es decir, ejecuta un procedimiento de mezcla descendente (DMX) 240. El dispositivo de mezcla descendente 240, que opera preferentemente en el dominio QMF, recibe las señales de salida del mezclador 228 y emite las señales del altavoz 234. Se puede incluir un configurador 242, al que también se hace referencia como controlador, que recibe, como entrada de control, una señal 246 indicativa de la distribución de salida
30 del mezclador (configuración de canales de entrada), es decir, se determina la distribución de cuyos datos representados por la señal de salida del mezclador 228, y la señal 248 indicativa de la distribución de reproducción deseada (configuración de canales de salida). Basándose en esta información, el controlador 242 genera, preferentemente de manera automática, matrices de mezcla descendente correspondientes a la combinación dada de formatos de entrada y salida y aplica estas matrices al dispositivo de mezcla descendente 240. El conversor de formato
35 232 da lugar a las configuraciones normales de altavoces, como así también a configuraciones aleatorias con posiciones no estándar de altavoces.
[0026] Las realizaciones de la presente invención se relacionan con la implementación del renderizador de altavoces 232, es decir, con procedimientos y unidades de procesamiento de señales para implementar la
40 funcionalidad del renderizador de altavoces 232.
[0027] Se hace referencia ahora a las Figs. 4 y 5. La Fig. 4 ilustra una configuración de altavoces que representa un formato 5.1 que comprende seis altavoces que representan un canal izquierdo LC, un canal central CC, un canal derecho RC, un canal izquierdo de sonido envolvente LSC, un canal derecho de sonido envolvente LRC y un canal de
45 intensificación de baja frecuencia LFC. La Fig. 5 ilustra otra configuración de altavoces que comprende altavoces que representan un canal izquierdo LC, un canal central CC, un canal derecho RC y un canal central elevado ECC.
[0028] En lo sucesivo, no se hace referencia al canal de intensificación de baja frecuencia puesto que no es importante la posición exacta del altavoz (subwoofer) asociado al canal de intensificación de baja frecuencia.
50
[0029] Los canales están dispuestos en direcciones específicas con respecto a una posición central del oyente P. La dirección de cada canal está definida por un ángulo azimutal a y un ángulo de elevación p, véase la Fig. 5. El ángulo azimutal representa el ángulo del canal en un plano horizontal del oyente 300 y puede representar la dirección del canal respectivo con respecto a una dirección central frontal 302. Como se puede ver en la Fig. 4, la dirección
55 frontal central 302 se puede definir como la dirección supuesta de visualización de un oyente situado en la posición central del oyente P. Una dirección posterior central 304 comprende un ángulo azimutal de 180° con respecto a la dirección frontal central 300. Todos los ángulos azimutales a la izquierda de la dirección frontal central entre la dirección frontal central y la dirección posterior central están a la izquierda de la dirección frontal central y todos los ángulos azimutales a la derecha de la dirección frontal central entre la dirección frontal central y la dirección posterior central
están a la derecha de la dirección frontal central. Los altavoces situados delante de una línea virtual 306, que es ortogonal a la dirección frontal central 302 y pasa por la posición central del oyente, son altavoces delanteros y los altavoces situados detrás de la línea virtual 306 son los altavoces traseros. En el formato 5.1, el ángulo azimutal a del canal LC está 30° a la izquierda, a de CC está a 0°, el a de RC está 30° a la derecha, a de LSC está 110° a la izquierda 5 y a de RSC está 110° a la derecha.
[0030] El ángulo de elevación p de un canal define el ángulo entre el plano horizontal del oyente 300 y la dirección de una línea de conexión virtual entre la posición central del oyente y el altavoz asociado al canal. En la configuración expuesta en la Fig. 4, todos los altavoces están dispuestos dentro del plano horizontal del oyente 300 y,
10 por lo tanto, todos los ángulos de elevación son de cero. En la Fig. 5, los ángulos de elevación p del canal ECC pueden ser 30°. Un altavoz situado exactamente por encima de la posición central del oyente tendría un ángulo de elevación de 90°. Los altavoces dispuestos por debajo del plano horizontal del oyente 300 tienen ángulos de elevación negativos.
[0031] La posición de un canal específico en el espacio (es decir, la posición del altavoz asociado al canal 15 específico) está dada por el ángulo azimutal, el ángulo de elevación y la distancia del altavoz desde la posición central
del oyente.
[0032] Las aplicaciones de mezcla descendente renderizan una serie de canales de entrada a una serie de canales de salida en la que el número de canales de entrada, es, en general, mayor que el número de canales de
20 salida. Se puede mezclar uno o más canales de entrada en conjunto al mismo canal de salida. Al mismo tiempo, se puede renderizar uno o más canales de entrada en más de un canal de salida. Este mapeo de los canales de entrada al canal de salida está determinado por una serie de coeficientes de mezcla descendente (o de lo contrario formulado en forma de matriz de mezcla descendente). La elección de los coeficientes de mezcla descendente afecta significativamente la calidad del sonido emitido. Las malas elecciones pueden llevar a una mezcla desequilibrada o a 25 una mala reproducción espacial de la escena de sonido de entrada.
[0033] Para obtener buenos coeficientes de mezcla descendente, un experto (por ejemplo un ingeniero de sonido) puede afinar los coeficientes a mano, teniendo en cuenta su conocimiento experto. Sin embargo, hay múltiples razones contra la sintonización manual en algunas aplicaciones. El número de configuraciones de canales
30 (disposiciones de canales) en el mercado está aumentando, lo que demanda nuevos esfuerzos de afinación por cada nueva configuración. Debido al creciente número de configuraciones, la optimización manual individual de las matrices de DMX por cada combinación posible de configuraciones de canales de entrada y salida se torna imposible de poner en práctica. Han de surgir nuevas configuraciones del lado de la producción, que demandan nuevas matrices de DMX de/para las configuraciones existentes u otras nuevas configuraciones. Las nuevas configuraciones pueden surgir una 35 vez que se ha puesto en efecto la aplicación de mezcla descendente, por lo que ya no es posible la afinación manual. En situaciones típicas de aplicación (por ejemplo escuchar con altavoces en un salón) las disposiciones de altavoces que cumplen con las normas (por ejemplo 5.1 surround según ITU-R BS 775) son en realidad excepciones a la regla. Las matrices de DMX para esas disposiciones de altavoces fuera de la norma no se pueden optimizar en forma manual, puesto que no se las conoce durante el diseño del sistema.
40
[0034] Los sistemas existentes o propuestos anteriormente para determinar las matrices de DMX comprenden el empleo de matrices de mezcla descendente afinadas a mano en muchas aplicaciones de mezcla descendente. Los coeficientes de mezcla descendente de estas matrices no se derivan de manera automática, sino que son optimizados por un ingeniero de sonido para producir la mejor calidad de mezcla descendente. El ingeniero de sonido puede tener
45 en cuenta las diferentes propiedades de los diferentes canales de entrada durante el diseño de los coeficientes de DMX (por ejemplo diferentes tratamientos para el canal central, canales de sonido envolvente, etc.). Sin embargo, como ya se ha esbozado, la derivación manual de los coeficientes de mezcla descendente correspondientes a todas las combinaciones posibles de configuraciones de canales de entrada y salida es prácticamente inviable y hasta imposible si se agregan nuevas configuraciones de entrada y/o salida en una etapa posterior al procedimiento de 50 diseño.
[0035] Una posibilidad sencilla de derivar automáticamente los coeficientes de mezcla descendente correspondientes a una combinación dada de configuraciones de entrada y salida es tratar cada canal de entrada como fuentes de sonido virtual cuya posición en el espacio está dada por la posición en el espacio asociada al canal
55 específico (es decir, la posición del altavoz asociada al canal de entrada específico). Cada fuente virtual puede ser reproducida por un algoritmo de paneo genérico similar al paneo de la ley de tangentes en 2D o paneo de amplitud basado en vectores en 3D, véase V. Pulkki: "Virtual Sound Source Positioning Using Vector Base Amplitude Panning", Journal of the Audio Engineering Society, vol. 45, págs. 456-466, 1997. Las ganancias de paneo de la ley de paneo aplicada pueden determinar de esa manera las ganancias que se aplican al mapear los canales de entrada con los
canales de salida, es decir, que las ganancias de paneo son los coeficientes de mezcla descendente deseados. Aunque los algoritmos de paneo genérico permiten derivar automáticamente las matrices de DMX, la calidad del sonido de mezcla descendente obtenido por lo general es baja por diversas razones:
5 - El paneo se aplica por cada posición de canal de entrada que no esté presente en la configuración de salida. Esto lleva a la situación en que las señales de entrada se distribuyen de manera coherente con mucha frecuencia por un número de canales de salida. Esto no es conveniente, puesto que deteriora la reproducción de sonidos envolventes como la reverberación. Además, en el caso de los componentes de sonido discretos en la señal de entrada la reproducción como fuentes fantasma causa cambios perjudiciales en el ancho y la coloración de la fuente.
10
- El paneo genérico no tiene en cuenta las diferentes propiedades de diferentes canales, por ejemplo no permite optimizar los coeficientes de mezcla descendente correspondientes al canal central de modo que difiere de otros canales. La optimización diferente de la mezcla descendente de canales diferentes según la semántica del canal permitiría, en general, dar lugar a una calidad más elevada de la señal de salida.
15
- El paneo genérico no tiene en cuenta el conocimiento psicoascústico que sería necesario para diferentes algoritmos de paneo para los canales frontales, los canales laterales, etc. Más aun, el paneo genérico da origen a ganancias de paneo para la renderización en altavoces ampliamente espaciados que no dan lugar a una reproducción correcta de la escena espacial de sonido en la configuración de salida.
20
- El paneo genérico que incluye el paneo por altavoces verticalmente espaciados no lleva a buenos resultados, puesto que no tiene en cuenta los efectos psicoacústicos (los indicios de percepción espacial vertical difieren de los indicios horizontales).
25 - El paneo genérico no tiene en cuenta que los oyentes orientan por lo general su cabeza en una dirección preferida ("hacia delante", pantalla), por consiguiente produce resultados subóptimos.
[0036] Otra propuesta para la derivación matemática (es decir, automática) de los coeficientes de DMX correspondientes a una combinación dada de configuraciones de canales de entrada y salida es la presentada por A.
30 Ando: "Conversion of Multichannel Sound Signal Maintaining Physical Properties of Sound in Reproduced Sound Field", IEEE Transactions on Audio, Speech, and Language Processing, Vol. 19, n.° 6, agosto de 2011. Esta derivación también se basa en una fórmula matemática que no tiene en cuenta la semántica de la configuración de los canales de entrada y salida. Por consiguiente, comparte los mismos problemas que la ley de tangentes o la estrategia de paneo VBAp.
35
[0037] Las realizaciones de la invención proporcionan una novedosa estrategia para la conversión de formato entre diferentes configuraciones de canales de altavoces que se puede realizar en forma de procedimiento de mezcla descendente que mapea un número de canales de entrada con un número de canales de salida, en el que el número de canales de salida es generalmente menor que el número de canales de entrada, y en el que las posiciones de los
40 canales de salida pueden ser diferentes de las posiciones de los canales de entrada. Las realizaciones de la invención se dirigen a novedosas estrategias para mejorar el rendimiento de dichas implementaciones de mezcla descendente.
[0038] Si bien las realizaciones de la invención se describen en conexión con la codificación de audio, se debe tener en cuenta que las novedosas estrategias relacionadas con la mezcla descendente también se pueden aplicar a
45 aplicaciones de mezcla descendente en general, es decir, a aplicaciones que, por ejemplo no tienen que ver con la codificación de audio.
[0039] Las realizaciones de la invención se relacionan con un procedimiento y una unidad (sistema) de procesamiento de señales para generar automáticamente coeficientes de DMX o matrices de DMX que se pueden
50 aplicar en una aplicación de mezcla descendente, por ejemplo para el procedimiento de mezcla descendente antes descrito con referencia a las Figs. 1 a 3. Los coeficientes de DMX se derivan dependiendo de las configuraciones de canales de entrada y salida. Se puede tomar una configuración de los canales de entrada y una configuración de los canales de salida como datos de entrada y se pueden derivar los coeficientes de DMX optimizados (o una matriz de DMX optimizada) de los datos de entrada. En la siguiente descripción, la expresión coeficientes de mezcla 55 descendente se relaciona con los coeficientes estáticos de mezcla descendente, es decir, los coeficientes de mezcla descendente que no dependen de las formas de onda de las señales de audio de entrada. En una aplicación de mezcla descendente, se pueden aplicar otros coeficientes (por ejemplo ganancias dinámicas, variables en el tiempo) por ejemplo para conservar la potencia de las señales de entrada (la denominada técnica de mezcla descendente activa). Las realizaciones del sistema descrito para la generación automática de las matrices de DMX dan como resultado
señales de salida DMX de gran calidad para determinadas configuraciones de canales de entrada y salida.
[0040] En las realizaciones de la invención, el mapeo de un canal de entrada con uno o más canales de salida
incluye la derivación de al menos un coeficiente que se ha de aplicar al canal de entrada por cada canal de salida con 5 el cual se mapea el canal de entrada. Al menos dicho coeficiente puede incluir un coeficiente de ganancia, es decir, un valor de ganancia, que se ha de aplicar a la señal de entrada asociada al canal de entrada, y/o un coeficiente de retardo, es decir, un valor de retardo que se ha de aplicar a la señal de entrada asociada al canal de entrada. En las realizaciones de la invención, el mapeo puede incluir la derivación de coeficientes selectivos de frecuencia, es decir, coeficientes diferentes para bandas de frecuencia diferentes de los canales de entrada. En las realizaciones de la
10 invención, el mapeo de los canales de entrada con los canales de salida incluye la generación de una o más matrices de coeficientes a partir de los coeficientes. Cada matriz define un coeficiente que se ha de aplicar a cada canal de entrada de la configuración de los canales de entrada por cada canal de salida de la configuración de los canales de salida. En el caso de los canales de salida, con los cuales no se mapea el canal de entrada, el coeficiente respectivo de la matriz de coeficientes es cero. En las realizaciones de la invención, se pueden generar matrices de coeficientes
15 separadas para coeficientes de ganancia y coeficientes de retardo. En las realizaciones de la invención, se puede generar una matriz de coeficientes por cada banda de frecuencia en caso de que los coeficientes no sean selectivos de la frecuencia. En las realizaciones de la invención, el mapeo puede incluir además la aplicación de coeficientes derivados a las señales de entrada asociadas a los canales de entrada.
20 [0041] La Fig. 6 ilustra un sistema para la generación automática de una matriz de DMX. El sistema comprende
series de reglas que describen los mapeos potenciales de los canales de entrada y salida, bloque 400, y un selector 402 que selecciona las reglas más apropiadas para una determinada combinación de una configuración de canales de entrada 404 y una combinación de configuraciones de los canales de salida 406 basándose en las series de reglas 400. El sistema puede comprender una interfaz apropiada para recibir información sobre la configuración de los
25 canales de entrada 404 y la configuración de los canales de salida 406.
[0042] La configuración de los canales de entrada define los canales presentes en una disposición de entrada, en la que cada canal de entrada tiene una dirección o posición asociada al mismo. La configuración de los canales de salida define los canales presentes en la configuración de salida, en la que cada canal de salida tiene una dirección o
30 posición asociada.
[0043] El selector 402 envía las reglas seleccionadas 408 a un evaluador 410. El evaluador 410 recibe las reglas seleccionadas 408 y evalúa las reglas seleccionadas 408 para derivar coeficientes de DMX 412 sobre la base de las reglas seleccionadas 408. Se puede generar una matriz de DMX 414 a partir de los coeficientes de mezcla
35 descendente derivados. El evaluador 410 puede estar configurado para derivar la matriz de mezcla descendente de los coeficientes de mezcla descendente. El evaluador 410 puede recibir información sobre la configuración de los canales de entrada y la configuración de los canales de salida, como por ejemplo información sobre la geometría de la configuración de salida (por ejemplo las posiciones de los canales) e información sobre la geometría de la configuración de entrada (por ejemplo las posiciones de los canales) y tener en cuenta la información al derivar los
40 coeficientes de DMX.
[0044] Como se ilustra en la Fig. 6b, el sistema puede ser implementado en una unidad de procesamiento de señales 420 que comprende un procesador 422 programado o configurado para actuar como selector 402 y evaluador 410 y una memoria 424 configurada para almacenar al menos parte de las series 400 de reglas de mapeo. Otra parte
45 de las reglas de mapeo puede ser verificada por el procesador sin acceder a las reglas almacenadas en la memoria 424. En ambos casos, las reglas son enviadas al procesador para ejecutar los procedimientos descritos. La unidad de procesamiento de señales puede incluir una interfaz de entrada 426 para recibir las señales de entrada 228 asociadas a los canales de entrada y una interfaz de salida 428 para emitir las señales de salida 234 asociadas a los canales de salida.
50
[0045] Se debe tener en cuenta que las reglas se aplican en general a los canales de entrada, no a la configuración de los canales de entrada, de tal manera que cada regla pueda ser utilizada para una multitud de configuraciones de canales de entrada que comparten el mismo canal de entrada al cual está destinada la regla específica.
55
[0046] Las series de reglas incluyen una serie de reglas que describe las posibilidades de mapeo de cada canal de entrada con uno o varios canales de salida. En el caso de algunos canales de entrada, la serie de reglas puede incluir sólo un canal único, aunque por lo general, la serie de reglas ha de incluir una pluralidad (multitud) de reglas para la mayoría o todos los canales de entrada. La serie de reglas puede ser cargada por un diseñador del sistema
que incorpora conocimientos especializados en la mezcla descendente al cargar la serie de reglas. Por ejemplo, el diseñador puede incorporar sus conocimientos acerca de la psicoacústica o sus intenciones artísticas.
[0047] Potencialmente pueden existir diferentes reglas de mapeo por cada canal de entrada. Las diferentes 5 reglas de mapeo definen, por ejemplo, diferentes posibilidades de renderización de un canal de entrada teniendo en
cuenta los canales de salida dependiendo de la lista de canales de salida que estén disponibles en el caso específico de uso. En otras palabras, por cada canal de entrada puede existir una multitud de reglas, cada una de las cuales define, por ejemplo, el mapeo del canal de entrada contra una serie diferente de altavoces de salida, en la que la serie de altavoces de salida también puede consistir en sólo un altavoz o incluso puede estar vacía.
10
[0048] La razón probablemente más común para tener múltiples reglas para un canal de entrada en la serie de
reglas de mapeo es que los diferentes canales de salida disponibles (determinados por las diferentes configuraciones posibles de los canales de salidas) requieren diferentes mapeos del canal de entrada individual con los canales de salida disponibles. Por ejemplo una regla puede definir el mapeo de un canal de entrada específico a un altavoz de
15 salida específico que está disponible en una configuración de canales de salida pero no en otra configuración de los canales de salida.
[0049] En consecuencia, como se ilustra en la Fig. 7, en una realización del procedimiento, con respecto a un
canal de entrada, se accede a una regla de la serie de reglas asociada, etapa 500. Se determina si la serie de canales
20 de salida definida en las reglas a las que se ha tenido acceso está disponible en la configuración de los canales de salida, etapa 502. Si la serie de canales de salida está disponible en la configuración de los canales de salida, se selecciona la regla a la que se ha accedido, etapa 504. Si la serie de canales de salida no está disponible en la configuración de los canales de salida, el procedimiento retorna a la etapa 500 y se accede a la siguiente regla. Las etapas 500 y 502 se realizan en forma iterativa hasta que se encuentre una regla que define una serie de canales de 25 salida compatibles con la configuración de los canales de salida. En las realizaciones de la invención, el procedimiento iterativo se puede detener al encontrarse una regla que define una serie vacía de canales de salida de manera que el canal de entrada correspondiente no se mapee en absoluto (o, en otras palabras, se mapee con un coeficiente cero).
[0050] Las etapas 500, 502 y 504 se ejecutan por cada canal de entrada de la pluralidad de canales de entrada 30 de la configuración de los canales de entrada, como se indica en el bloque 506 de la Fig. 7. La pluralidad de canales
de entrada puede incluir todos los canales de entrada de la configuración de los canales de entrada o puede incluir una subserie de al menos dos de los canales de entrada de la configuración de los canales de entrada. Luego, se mapean los canales de entrada con los canales de salida según las reglas seleccionadas.
35 [0051] Como se ilustra en la Fig. 8 el mapeo de los canales de entrada con los canales de salida puede
comprender la evaluación de las reglas seleccionadas para derivar coeficientes que se han de aplicar a las señales de audio de entrada asociadas a los canales de entrada, bloque 520. Los coeficientes se pueden aplicar a las señales de entrada para generar señales de audio de salida asociadas a los canales de salida, flecha 522 y bloque 524. Por otro lado, se puede generar una matriz de DMX a partir de los coeficientes, bloque 526, y se puede aplicar la matriz 40 de DMX a las señales de entrada, bloque 524. Seguidamente, se pueden transmitir las señales de audio de salida los altavoces asociados a los canales de salida, bloque 528.
[0052] Por consiguiente, la selección de las reglas para una determinada configuración de entrada/salida comprende derivar una matriz de DMX correspondiente a una configuración dada de entrada y salida mediante la
45 selección de ingresos apropiados de la serie de reglas que describen de qué manera mapear cada canal de entrada sobre los canales de salida que están disponibles en la configuración dada de canales de salida. En particular, el sistema selecciona sólo las reglas de mapeo que son válidas para la configuración de salida dada, es decir, que describen los mapeos con los canales de altavoces que están disponibles en la configuración dada de canales de salida para el caso de uso específico. Las reglas que describen los mapeos con canales de salida que no existen en 50 la configuración de salida en cuestión son descartadas como inválidas y, por ende, no se las puede seleccionar como reglas apropiadas para la configuración de salida dada.
[0053] A continuación se describe un ejemplo de múltiples reglas para un canal de entrada correspondiente al mapeo de un canal central elevado (es decir, un canal en un ángulo azimutal de 0 grados y ángulos de elevación superiores a 0 grados) con diferentes altavoces de salida. Una primera regla correspondiente al canal central elevado
55 puede definir un mapeo directo con el canal central en el plano horizontal (es decir, con un canal en un ángulo azimutal de 0 grados y ángulos de elevación de 0 grados). Una segunda regla correspondiente al canal central elevado puede definir un mapeo de la señal de entrada con los canales frontales izquierdo y derecho (por ejemplo los dos canales de un sistema de reproducción estereofónica o los canales izquierdo y derecho de un sistema de reproducción de sonido envolvente 5.1) como fuente fantasma. Por ejemplo, la segunda regla puede mapear el canal de entrada con los
canales frontales izquierdo y derecho con iguales ganancias de tal manera que la señal reproducida sea percibida como fuente fantasma en la posición central.
[0054] Si un canal de entrada (posición de altavoz) de la configuración de los canales de entrada está presente 5 también en la configuración de los canales de salida, se puede mapear directamente el canal de entrada con el mismo
canal de salida. Esto se puede reflejar en la serie de reglas de mapeo mediante el agregado de una regla de mapeo directo uno a uno como primera regla. Se puede tratar la primera regla antes de la selección de las reglas de mapeo. El tratamiento fuera de la determinación de las reglas de mapeo evita la necesidad de especificar una regla de mapeo individual por cada canal de entrada (por ejemplo el mapeo de la entrada frontal izquierda en un azimut de 30 grados 10 con la salida frontal izquierda en un azimut de 30 grados) en una memoria o base de datos que almacena las reglas de mapeo restantes. Este mapeo directo individual se puede tratar, por ejemplo, de tal manera que si es posible un mapeo directo individual correspondiente a un canal de entrada (es decir, si existe el canal de salida pertinente), se mapea directamente el canal de entrada específico con el mismo canal de salida sin iniciar una búsqueda en la serie de reglas de mapeo restante para este canal de entrada específico.
15
[0055] En las realizaciones de la invención, se asigna prioridad a las reglas. Durante la selección de las reglas, el sistema da preferencia a las reglas de mayor prioridad sobre las reglas de menor prioridad. Esto se puede implementar mediante una iteración a través de la lista de reglas en orden de prioridad por cada canal de entrada. Por cada canal de entrada el sistema puede realizar un bucle a través de la lista ordenada de reglas potenciales
20 correspondientes al canal de entrada en cuestión hasta encontrar una regla de mapeo válida apropiada, deteniéndose así en la regla de mapeo apropiada de la mayor prioridad y seleccionando la misma. Otra posibilidad de implementación de la asignación de prioridades puede ser la asignación de términos de costo a cada regla, lo que refleja el impacto en la calidad de la aplicación de las reglas de mapeo (costo más elevado por menor calidad). A continuación, el sistema puede ejecutar un algoritmo de búsqueda que minimice los términos de costo seleccionando 25 las mejores reglas. El uso de términos de costo también permite minimizar en forma global los términos de costo si las selecciones de las reglas para diferentes canales de entrada pueden interactuar entre sí. Una minimización global del término de costo garantiza la obtención de la mayor calidad de salida.
[0056] La asignación de prioridades a las reglas puede ser definida por un arquitecto del sistema, por ejemplo 30 cargando la lista de reglas de mapeo potenciales en un orden de prioridad o asignando términos de costo a las reglas
individuales. La asignación de prioridades puede reflejar la calidad de sonido que se puede obtener de las señales de salida: se supone que las reglas de prioridad más alta transmiten sonido de mayor calidad, por ejemplo, una mejor imagen espacial, una mejor envolvencia que las reglas de prioridad más baja. Potencialmente se pueden tener en cuenta otros aspectos en la asignación de prioridades a las reglas, por ejemplo aspectos de complejidad. Dado que 35 diferentes reglas dan lugar a diferentes matrices de DMX, en última instancia pueden llevar a diferentes complejidades informáticas o requisitos de memoria en el procedimiento de DMX que aplica la matriz de DMX generada.
[0057] Las reglas de mapeo seleccionadas (como por ejemplo por el selector 402) determinan las ganancias de DMX, incorporando potencialmente información geométrica. Es decir, que una regla para determinar los valores de
40 ganancia de DMX puede dar valores de ganancia de DMX que dependen de la posición asociada a los canales de altavoces.
[0058] Las reglas de mapeo pueden definir directamente una o varias ganancias de DMX, es decir, coeficientes de ganancia, en forma de valores numéricos. Por otro lado, las reglas pueden definir las ganancias, por ejemplo, en
45 forma indirecta especificando que se ha de aplicar una ley de paneo específica, por ejemplo un paneo por la ley de tangentes o VBAP. En ese caso, las ganancias de DMX dependen de datos geométricos tales como la posición o la dirección con respecto al oyente, del canal de entrada, como así también de la posición o la dirección con respecto al oyente, del canal de salida o los canales de salida. Las reglas pueden definir las ganancias de DMX dependiendo de la frecuencia. La dependencia de la frecuencia puede ser reflejada por diferentes valores de ganancia 50 correspondientes a diferentes frecuencias o bandas de frecuencia o como parámetros paramétricos del ecualizador, por ejemplo parámetros para filtros de tipo de control de tonos (shelving) o secciones de segundo orden, que describen la respuesta de un filtro que se ha de aplicar a la señal al mapear un canal de entrada con uno o varios canales de salida.
55 [0059] En las realizaciones de la invención, las reglas se implementan para definir directa o indirectamente los
coeficientes de mezcla descendente como ganancias de mezcla descendente que se han de aplicar a los canales de entrada. Sin embargo, los coeficientes de mezcla descendente no se limitan a las ganancias de mezcla descendente, sino que también pueden incluir otros parámetros que se aplican al mapear los canales de entrada con los canales de salida. Las reglas de mapeo se pueden implementar para definir directa o indirectamente los valores de retardo que
se pueden aplicar para renderizar los canales de entrada por la técnica de paneo con retardo en lugar de la técnica de paneo en amplitud. Además, se puede combinar el paneo con retardo y amplitud. En este caso las reglas de mapeo permitirían determinar los valores de ganancia y retardo en forma de coeficientes de mezcla descendente.
5 [0060] En las realizaciones de la invención, por cada canal de entrada se evalúa la regla seleccionada y se
transfieren las ganancias derivadas (y/u otros coeficientes) para mapear con los canales de salida a la matriz de DMX. Se puede inicializar la matriz de DMX con ceros al comienzo, de tal manera que la matriz de DMX se llene, potencialmente de manera escasa, con valores no cero al evaluar las reglas seleccionadas para cada canal de entrada.
10 [0061] Las reglas de las series de reglas pueden estar configuradas para implementar diferentes conceptos al
mapear los canales de entrada con los canales de salida. A continuación se discuten las reglas específicas o clases de reglas y los conceptos genéricos de mapeo que pueden subyacer en las reglas.
[0062] En general, las reglas permiten incorporar conocimiento experto en la generación automática de 15 coeficientes de mezcla descendente para obtener coeficientes de mezcla descendente de mejor calidad que los que
se obtendrían de generadores de coeficientes matemáticos de mezcla descendente genéricos como las soluciones basadas en VBAP. El conocimiento experto puede ser el resultado del conocimiento sobre psicoacústica que refleja la percepción humana del sonido con más precisión que las formulaciones matemáticas como las leyes de paneo genérico. El conocimiento experto incorporado puede reflejar correctamente la experiencia en el diseño de soluciones 20 de mezcla descendente o puede reflejar intentos artísticos de mezcla descendente.
[0063] Se pueden implementar reglas para reducir el paneo excesivo: Con frecuencia una gran cantidad de reproducción paneada de canales de entrada es perjudicial. Se pueden diseñar reglas de mapeo de tal manera que acepten los errores de reproducción direccional, es decir, que una fuente de sonido puede ser renderizada en una
25 posición errónea para reducir a cambio la cantidad de paneo. Por ejemplo una regla puede mapear un canal de entrada con un canal de salida en una posición ligeramente errónea en lugar de panear el canal de entrada a la posición correcta en dos o más canales de salida.
[0064] Se pueden implementar reglas para tener en cuenta la semántica del canal en cuestión. Los canales 30 con diferente significado, como por ejemplo canales que transmiten contenido específico pueden tener reglas afinadas
de manera diferente asociadas a ellos. Un ejemplo son las reglas para mapear el canal central con los canales de salida: El contenido sonoro del canal central frecuentemente difiere significativamente del contenido de otros canales. Por ejemplo en las películas el canal central se utiliza predominantemente para reproducir diálogos (es decir, como "canal de diálogos"), por lo que se pueden implementar reglas referentes al canal central con la intención de que la 35 percepción de la voz emane de una fuente de sonido cercana con poca distancia espacial de la fuente y color de sonido natural. De esa manera una regla de mapeo central puede dar lugar a una mayor desviación de la posición de la fuente reproducida que las reglas para otros canales para evitar la necesidad de paneo (es decir, renderización de la fuente fantasma). Esto garantiza la reproducción de los diálogos de la película en forma de fuentes discretas con poca extensión y más color de sonido natural que las fuentes fantasma.
40
[0065] Otras reglas semánticas pueden interpretar los canales frontales izquierdo y derecho como partes de los pares de canales estéreo. Esas reglas pueden apuntar a la reproducción de la imagen de sonido estereofónico de tal manera que esté centrada. Si los canales frontales izquierdo y derecho se mapean contra una configuración de salida asimétrica, asimetría derecha-izquierda, las reglas pueden aplicar términos de corrección (por ejemplo
45 ganancias de corrección) que garantizan una reproducción balanceada, es decir, centrada, de la imagen de sonido estereofónico.
[0066] Otro ejemplo que hace uso de la semántica de canales son las reglas para canales de sonido envolvente que con frecuencia se utilizan para generar campos de sonido ambiente envolventes (por ejemplo reverberación de
50 ambiente) que no evocan la percepción de fuentes de sonido con una posición de fuente distinta. Por consiguiente, la posición exacta de la reproducción de este contenido de sonido no es importante habitualmente. Se puede definir, por consiguiente, una regla de mapeo que tiene en cuenta la semántica de los canales de sonido envolvente con sólo bajas demandas sobre la precisión espacial.
55 [0067] Se pueden implementar reglas para reflejar la intención de conservar una diversidad inherente a la
configuración de los canales de entrada. Dichas reglas pueden reproducir, por ejemplo, un canal de entrada en forma de fuente fantasma incluso si hay un canal de salida discreto disponible en la posición de esa fuente fantasma. Esta introducción deliberada de paneo en la que sería posible una solución libre de paneo puede ser ventajosa si el canal de salida discreto y la fuente fantasma son alimentados con los canales de entrada que son diferentes (por ejemplo
espacialmente) en la configuración de los canales de entrada: El canal de salida discreto y la fuente fantasma se perciben de manera diferente, conservando así la diversidad de los canales de entrada en cuestión.
[0068] Un ejemplo de regla para conservar la diversidad es el mapeo de un canal central elevado con un canal 5 frontal izquierdo y derecho como fuente fantasma en la posición central en el plano horizontal, incluso si el altavoz
central en el plano horizontal está físicamente disponible en la configuración de salida. El mapeo de este ejemplo se puede aplicar para conservar la diversidad de los canales de entrada si al mismo tiempo se está mapeando otro canal con el canal central en el plano horizontal. Sin la regla de conservación de la diversidad ambos canales de entrada, el canal central elevado y el otro canal de entrada, se reproducirían por la misma trayectoria de señal, es decir, a través 10 del altavoz físico central en el plano horizontal, perdiendo así la diversidad de los canales de entrada.
[0069] Además de hacer uso de una fuente fantasma como se explicara anteriormente, se puede obtener una conservación o emulación de las características de diversidad espacial inherentes a la configuración de los canales de entrada mediante las reglas implementando las siguientes estrategias. 1. Las reglas pueden definir un filtro de
15 ecualización aplicado a una señal de entrada asociada a un canal de entrada en una posición elevada (ángulos de elevación más altos) si se mapea el canal de entrada con un canal de salida en una posición más baja (ángulos de elevación más bajos). El filtro de ecualización puede compensar los cambios de timbre de los diferentes canales acústicos y se puede derivar basándose en el conocimiento empírico experto y/o los datos de BRIR medidos o similares. 2. Las reglas pueden definir un filtro de descorrelación/reverberación aplicado a una señal de entrada 20 asociada a un canal de entrada en una posición elevada si el mapeo del canal de entrada con un canal de salida está en una posición más baja. El filtro se puede derivar de mediciones de BRIR o del conocimiento empírico sobre la acústica del ambiente o similar. La regla puede definir que la señal filtrada sea reproducida por múltiples altavoces, en la que se puede aplicar un filtro diferente a cada altavoz. El filtro puede modelar asimismo las reflexiones tempranas.
25 [0070] En las realizaciones de la invención, el selector puede tener en cuenta cómo se mapean otros canales
de entrada con uno o más canales de salida al seleccionar una regla para un canal de entrada. Por ejemplo, el selector puede seleccionar una primera regla que mapea el canal de entrada con un primer canal de salida si no se mapea ningún otro canal de entrada con ese canal de salida. En caso de mapearse otro canal de entrada con ese canal de salida, el selector puede seleccionar otra regla que mapea el canal de entrada con uno o más canales de salida 30 adicionales con la intención de conservar la diversidad inherente a la configuración de los canales de entrada. Por ejemplo, el selector puede aplicar las reglas implementadas para conservar la diversidad espacial inherente en la configuración de los canales de entrada en caso de que también se mapee otro canal de entrada con el mismo o los mismos canales de salida y puede aplicar otra regla adicional.
35 [0071] Las reglas pueden ser implementadas en forma de reglas para conservar el timbre. En otras palabras,
las reglas pueden ser implementadas para tener en cuenta el hecho de que los diferentes altavoces de la disposición de salida son percibidos con diferente coloración por el oyente. Una razón es la coloración introducida por los efectos acústicos de la cabeza, los pabellones auriculares y el torso del oyente. La coloración depende del ángulo de incidencia del sonido que llega a los oídos del oyente, es decir, que la coloración del sonido difiere según las diferentes posiciones 40 de los altavoces. Dichas reglas pueden tener en cuenta la diferente coloración del sonido correspondiente a la posición del canal de entrada y la posición del canal de salida con la cual se mapea el canal de entrada y derivar información de ecualización que compensa las diferencias de coloración inconvenientes, es decir, el cambio de timbre perjudicial. Para ello, las reglas pueden incluir una regla ecualizadora junto con una regla de mapeo que determina el mapeo de un canal de entrada con la configuración de salida, puesto que las características de ecualización dependen 45 habitualmente de los canales de entrada y salida específicos en cuestión. En otras palabras, puede haber una regla de ecualización asociada a algunas de las reglas de mapeo, en el que ambas reglas juntas pueden ser interpretadas como una regla.
[0072] Las reglas de ecualización pueden dar origen a la información de ecualización que se puede reflejar, 50 por ejemplo por coeficientes de mezcla descendente dependientes de la frecuencia o que puede ser reflejada por
ejemplo por datos paramétricos correspondientes a filtros de ecualización que se aplican a las señales para obtener el efecto de conservación de timbre deseado. Un ejemplo de regla de conservación de timbre es una regla que describe el mapeo de un canal central elevado con el canal central en el plano horizontal. La regla de conservación de timbre definiría un filtro de ecualización que se aplica en el procedimiento de mezcla descendente para compensar la 55 coloración diferente de la señal que es percibida por el oyente al reproducir una señal por un altavoz montado en la posición elevada del canal central a diferencia de la coloración percibida correspondiente a una reproducción de la señal por un altavoz en la posición del canal central en el plano horizontal.
[0073] Las realizaciones de la invención proporcionan una alternativa de la regla de mapeo genérica. Se puede
emplear una regla de mapeo genérica, por ejemplo un paneo genérico VBAP de las posiciones de la configuración de entrada, que se aplica si no se encuentra ninguna otra regla más avanzada para un determinado canal de entrada y una configuración dada de los canales de salida. Esta regla de mapeo genérica garantiza que siempre se encuentre un mapeo válido de entrada/salida para todas las configuraciones posibles y que por cada canal de entrada se 5 satisfaga al menos una calidad de renderización básica. Se debe tener en cuenta que, en general, se pueden mapear otros canales de entrada utilizando reglas más refinadas que la regla alternativa de tal manera que la calidad general de los coeficientes de mezcla descendente generados sea más elevada (y al menos tan elevada) como la calidad de los coeficientes generados por una solución matemática genérica como VBAP. En las realizaciones de la invención, la regla de mapeo genérica puede definir el mapeo del canal de entrada con uno o ambos canales de salida de una 10 configuración de canales estéreo con un canal de salida izquierdo y un canal de salida derecho.
[0074] En las realizaciones de la invención, el procedimiento descrito, es decir, la determinación de reglas de
mapeo a partir de una serie de reglas de mapeo potenciales, y la aplicación de las reglas seleccionadas mediante la construcción con éstas de una matriz de DMX que se puede aplicar en un procedimiento de DMX, se puede modificar 15 de tal manera que las reglas de mapeo seleccionadas puedan ser aplicadas en un procedimiento de dMx directamente sin la formulación intermedia de una matriz de DMX. Por ejemplo las ganancias de mapeo (es decir, las ganancias de DMX) determinadas por las reglas seleccionadas se pueden aplicar directamente en un procedimiento de DMX sin la formulación intermedia de una matriz de DMX.
20 [0075] La forma en la cual se aplican los coeficientes o la matriz de mezcla descendente a las señales de
entrada asociadas a los canales de entrada es clara para los expertos en la materia. La señal de entrada es procesada mediante la aplicación del coeficiente o los coeficientes derivados y la señal procesada es enviada al altavoz asociado al canal (o canales) de salida con el cual se mapea el canal de entrada. Si se mapean dos o más canales de entrada con el mismo canal de salida, se suman las respectivas señales y se envían al altavoz asociado al canal de salida.
25
[0076] En una realización ventajosa se puede implementar el sistema de la siguiente manera. Se da una lista ordenada de reglas de mapeo. La orden refleja la asignación de prioridades a las reglas de mapeo. Cada regla de mapeo determina el mapeo de un canal de entrada con uno o más canales de salida, es decir, que cada regla de mapeo determina en cuál de los altavoces de salida se renderiza un canal de entrada. Las reglas de mapeo definen
30 explícitamente las ganancias de mezcla descendente en forma numérica. Por otro lado, indican que se tiene que evaluar una ley de paneo correspondiente a los canales de entrada y salida en cuestión, es decir, que se debe evaluar la ley de paneo según las posiciones espaciales (por ejemplo los ángulos azimutales) de los canales de entrada y salida en cuestión. Las reglas de mapeo pueden especificar además que se ha de aplicar un filtro de ecualización al canal de entrada en cuestión al ejecutar el procedimiento de mezcla descendente. El filtro ecualizador puede ser 35 estipulado por un índice de parámetros de filtro que determina qué filtro de una lista de filtros se debe aplicar. El sistema puede generar una serie de coeficientes de mezcla descendente correspondiente a una configuración dada de canales de entrada y salida de la siguiente manera. Por cada canal de entrada de la configuración de los canales de entrada: a) iterar los elementos de la lista de reglas de mapeo respetando el orden de la lista, b) por cada regla que describe un mapeo del canal de entrada en cuestión, determinar si la regla es aplicable (válida), es decir, determinar 40 si el o los canales de salida que la regla de mapeo considera para la renderización están disponibles en la configuración de los canales de salida en cuestión, c) la primera regla válida que se encuentra para el canal de entrada en cuestión determina el mapeo del canal de entrada al canal (o canales) de salida, d) una vez encontrada una regla válida, la iteración termina respecto del canal de entrada en cuestión, e) evalúa la regla seleccionada para determinar los coeficientes de mezcla descendente correspondientes al canal de entrada en cuestión. La evaluación de la regla puede 45 conllevar el cálculo de las ganancias de paneo y/o puede implicar la determinación de una especificación de filtro.
[0077] La estrategia de la invención para derivar los coeficientes de mezcla descendente es ventajosa, ya que ofrece la posibilidad de incorporar conocimiento experto al diseño de mezcla descendente (como principios psicoacústicos, el tratamiento semántico de los canales diferentes, etc.). En comparación con las estrategias
50 puramente matemáticas (como la aplicación genérica de VBAP) da lugar entonces a señales de salida de mezcla descendente de calidad más elevada al aplicar los coeficientes de mezcla descendente derivados a la aplicación de mezcla descendente. En comparación con los coeficientes de mezcla descendente afinados en forma manual, el sistema permite derivar automáticamente coeficientes para grandes números de combinaciones de configuración de entrada/salida sin necesidad de un experto afinador, reduciendo así los costos. También permite derivar coeficientes 55 de mezcla descendente en aplicaciones en las que ya se ha activado la implementación de mezcla descendente, habilitando así aplicaciones de mezcla descendente de gran calidad en las que las configuraciones de entrada/salida pueden cambiar después del procedimiento de diseño, es decir, cuando no es posible la afinación experta de los coeficientes.
[0078] En lo sucesivo se describe, en forma más detallada, una realización específica no limitante de la invención. La realización se describe con referencia a un conversor de formato que podría implementar la conversión de formato 232 ilustrada en la Fig. 2. El conversor de formato descrito a continuación comprende un número de características específicas, debe aclararse que algunas de las características son opcionales y, por lo tanto, podrían
5 ser omitidas. En lo sucesivo, se describe la manera en la que el conversor se inicializa para implementar la invención.
[0079] La parte siguiente de la memoria descriptiva se refiere a las Tablas 1 a 6, que se pueden encontrar al final de la memoria descriptiva. Los rótulos utilizados en las tablas correspondientes a los respectivos canales deben ser interpretados de la siguiente manera. Las letras "CH" significa "Canal". La letra "M" representa "plano horizontal
10 del oyente", es decir, un ángulo de elevación de 0°. Este es el plano en el cual están situados los altavoces en la configuración normal 2D tal como estéreo o 5.1. La letra "L" representa un plano inferior, es decir, un ángulo de elevación < 0°. La letra "U" representa un plano superior, es decir, un ángulo de elevación > 0°, como por ejemplo 30° como altavoz superior en una configuración 3D. La letra "T" representa el canal superior, es decir, un ángulo de elevación de 90°, que también se conoce como canal "la voz de Dios". Situado después de uno de los rótulos M/L/U/T
15 es un rótulo correspondiente a izquierdo (L) o derecho (R) seguido por el ángulo azimutal. Por ejemplo, CH_M_L030 y CH_M_R030 representan el canal izquierdo y derecho de una configuración estéreo convencional. El ángulo azimutal y el ángulo de elevación correspondientes a cada canal están indicados en la Tabla 1, excepto por los canales LFE y el último canal vacío.
20 [0080] Una configuración de los canales de entrada y una configuración de los canales de salida puede incluir
cualquier combinación de los canales indicados en la Tabla 1.
[0081] En la Tabla 2 se exponen los formatos a modo de ejemplo de entrada/salida, es decir, las configuraciones de canales de entrada y las configuraciones de canales de salida. Los formatos de entrada/salida
25 indicados en la Tabla 2 son formatos estándar y las designaciones de los mismos han de ser reconocidas por los expertos en la materia.
[0082] La Tabla 3 ilustra una matriz de reglas en la cual una o más reglas están asociadas a cada canal de entrada (canal de origen). Como se puede ver en la Tabla 3, cada regla define uno o más canales de salida (canales
30 de destino), con los cuales se ha de mapear el canal de entrada. Además, cada regla define el valor de ganancia G en su tercera columna. Cada regla define asimismo un índice EQ que indica si se debe aplicar un filtro de ecualización o no, y en caso afirmativo, qué filtro de ecualización específico (índice EQ 1 a 4) se debe aplicar. El mapeo del canal de entrada con un canal de salida se realiza con la ganancia G dada en la columna 3 de la Tabla 3. El mapeo del canal de entrada con dos canales de salida (indicado en la segunda columna) se realiza aplicando paneo entre los dos
35 canales de salida, en los que las ganancias de paneo g1 y g2 que surgen como resultado de la aplicación de la ley de paneo se multiplican además por la ganancia determinada por la regla respectiva (columna tres de la Tabla 3). Se aplican reglas especiales para el canal superior. Según una primera regla, se mapea el canal superior con todos los canales de salida del plano superior, lo que está indicado por ALL_U, y según una segunda (con menos prioridad) regla, el canal superior se mapea con todos los canales de salida del plano horizontal del oyente, indicado por ALL_M.
40
[0083] La Tabla 3 no incluye la primera regla asociada a cada canal, es decir, un mapeo directo con un canal que tiene la misma dirección. Esta primera regla es verificada por el sistema/algoritmo antes de acceder a las reglas expuestas en la Tabla 3. Por consiguiente, para los canales de entrada, para los cuales existe un mapeo directo, no es necesario que el algoritmo acceda a la Tabla 3 para encontrar una regla compatible, sino que aplica la regla de
45 mapeo directa al derivar un coeficiente de uno para mapear directamente el canal de entrada con el canal de salida. En esos casos, la siguiente descripción es válida para los canales para los cuales no se satisface la primera regla, es decir, para los cuales no existe un mapeo directo. En unas realizaciones alternativas, se incluye la regla de mapeo directo en la tabla de reglas y no se verifica antes de acceder a la tabla de reglas.
50 [0084] La Tabla 4 ilustra frecuencias centrales normalizadas de 77 bandas de filtros utilizadas en los filtros
ecualizadores predefinidos, como se explica en forma más detallada a continuación. La Tabla 5 ilustra los parámetros de ecualizador utilizados en los filtros de ecualizador predefinidos.
[0085] La Tabla 6 ilustra en cada fila los canales que se consideran por encima/debajo de los demás.
55
[0086] El conversor de formato se inicializa antes de procesar las señales de entrada, como por ejemplo las muestras de audio emitidas por un decodificador de núcleo tal como el decodificador de núcleo del codificador 200 ilustrado en la Fig. 2. Durante una fase de inicialización, se evalúan las reglas asociadas a los canales de entrada y se derivan los coeficientes que se han de aplicar a los canales de entrada (es decir, las señales de entrada asociadas
a los canales de entrada).
[0087] En la fase de inicialización el conversor de formato puede generar automáticamente los parámetros de mezcla descendente (como una matriz de mezcla descendente) correspondiente a la combinación dada de formatos
5 de entrada y salida. Puede aplicar un algoritmo que selecciona para cada altavoz de entrada la regla de mapeo más apropiada de una lista de reglas que ha sido diseñada para incorporar consideraciones psicoacústicas. Cada regla describe el mapeo de un canal de entrada con uno o varios canales de altavoces de salida. Los canales de entrada se mapean con un único canal de salida, o se panean con dos canales de salida, o bien (en el caso del canal de la "voz de Dios") se distribuyen por un número mayor de canales de salida. Se puede seleccionar el mapeo óptimo para 10 cada canal de entrada dependiendo de la lista de altavoces de salida que están disponibles en el formato de salida deseado. Cada mapeo define ganancias de mezcla descendente correspondientes al canal de entrada en cuestión, como así también potencialmente un ecualizador que se aplica al canal de entrada en cuestión. Las configuraciones de salida con posiciones de altavoz no habituales se pueden señalizar en el sistema obteniendo las desviaciones azimutales y de elevación con respecto a una disposición de altavoces normal. Además, se tienen en cuenta las 15 variaciones de distancia de las posiciones objetivo de los altavoces. La mezcla descendente real de las señales de audio se puede realizar en una representación de subbandas de QMF de las señales.
[0088] Se puede hacer referencia a las señales de audio que se alimentan en el conversor de formato como señales de entrada. Las señales de audio que son el resultado del procedimiento de conversión de formato se pueden
20 denominar señales de salida. Las señales de entrada audio del conversor de formato pueden ser señales de salida de audio del decodificador del núcleo. Los vectores y matrices están indicados por símbolos en negrita. Los elementos de vectores o elementos de matrices están indicados en forma de variables en cursiva suplementadas por índices que indican la fila/columna del elemento de vector/matriz del vector/matriz.
25 [0089] La inicialización del conversor de formato se puede llevar a cabo antes de la realización del
procesamiento de las muestras de audio emitidas por el decodificador del núcleo. La inicialización puede tener en cuenta, como parámetros de entrada, la velocidad de muestreo de los datos de audio a procesar, un parámetro que señaliza la configuración de los canales de los datos de audio a procesar con el conversor de formato, un parámetro que señaliza la configuración de los canales del formato de salida deseado y opcionalmente parámetros que señalizan 30 una desviación de las posiciones de los altavoces de salida con respecto a una disposición de altavoces estándar (funcionalidad de configuración aleatoria). La inicialización puede devolver el número de canales de la configuración de altavoces de entrada, el número de canales de la configuración de altavoces de salida, una matriz de mezcla descendente y parámetros de filtro ecualizador que se aplican en el procesamiento de las señales de audio del conversor de formato y valores recortados de ganancia y retardo para compensar por variaciones de distancia de los 35 altavoces.
[0090] En detalle, la inicialización puede tener en cuenta los siguientes parámetros de entrada:
Parámetros de entrada
format_in
formato de entrada, véase la Tabla 2.
format_out
formato de salida, véase la Tabla 2.
fs
velocidad de muestreo de las señales de entrada asociadas a los canales de entrada (frecuencia en Hz)
razi.A
por cada canal de salida c, se especifica un ángulo azimutal, que determina la desviación con respecto al ázimut del altavoz de formato convencional.
rele,A
por cada canal de salida c, se especifica un ángulo de elevación, que determina la desviación con respecto a la elevación del altavoz de formato convencional.
trimA
por cada canal de salida c, se especifica la distancia del altavoz hasta la posición central de escucha en metros.
Nmaxdelay
El retardo máximo que se puede utilizar para el recorte [muestras]
40
[0091] El formato de entrada y el formato de salida corresponden a la configuración de los canales de entrada y la configuración de los canales de salida. razi,A y rele,A representan parámetros que señalizan una desviación de las posiciones de los altavoces (ángulo azimutal y ángulos de elevación) con respecto a una disposición de altavoces estándar que subyace en las reglas, en la que A es un índice de canales. Los ángulos de los canales según la
45 configuración estándar están expuestos en la Tabla 1.
[0092] En las realizaciones de la invención en las cuales se deriva sólo una matriz de coeficientes de ganancia, el único parámetro de entrada puede ser format_in y format_out. Los demás parámetros de entrada son opcionales
dependiendo de las características implementadas, en las que se puede utilizar fs en la inicialización de uno o más filtros de ecualización en el caso de los coeficientes selectivos de la frecuencia, se pueden utilizar razi,A y rele,A para tener en cuenta las desviaciones de las posiciones de los altavoces y se puede utilizar trimA y Nmaxdelay para tener en cuenta la distancia del altavoz respectivo a una posición central del oyente.
5
[0093] En las realizaciones del conversor, se pueden verificar las siguientes condiciones y si no se cumplen las condiciones, se considera que la inicialización ha fallado y se indica error. Los valores absolutos de razi,A y rele,A no deben exceder los 35 y 55 grados, respectivamente. El ángulo mínimo entre cualquier par de altavoces (sin canales LFE) no ha de ser inferior a 15 grados. Los valores de razi,A deben ser tales que el ordenamiento por ángulos azimutales
10 de los altavoces horizontales no cambie. Del mismo modo, el ordenamiento de los altavoces superiores e inferiores no debe cambiar. Los valores de rele,A deben ser tales que el ordenamiento por ángulos de elevación de los altavoces que están por encima o debajo del otro (aproximadamente) no cambie. Para verificarlo, se puede aplicar el siguiente procedimiento:
15 • Por cada fila de la Tabla 6, que contiene dos o tres canales del formato de salida, se realiza:
◦ Ordenamiento de los canales por elevación sin aleatorización.
◦ Ordenamiento de los canales por elevación pero considerando la aleatorización.
◦ Si los dos ordenamientos difieren, se devuelve error de inicialización.
20
[0094] El término "aleatorización" significa que se tienen en cuenta las desviaciones entre los canales de la situación real y los canales estándar, es decir, que las desviaciones razic y relec se aplican a la configuración estándar de canales de salida.
25 [0095] Las distancias de los altavoces en trimA deben ser de entre 0,4 y 200 metros. La relación entre la mayor
y la menor distancia de los altavoces no debe exceder 4. El mayor retardo de recorte calculado no debe ser mayor
que Nmaxdelay.
[0096] Si se cumplen las condiciones citadas, la inicialización del conversor es satisfactoria.
30
[0097] En las realizaciones, la inicialización del conversor de formato devuelve los siguientes parámetros de salida:
Parámetros de salida
Nin
número de canales de entrada
Nout
número de canales de salida
Mdmx
matriz de mezcla descendente [ganancias lineales]
Ieq
vector que contiene el índice EQ por cada canal de entrada
Geq
matriz que contiene los valores de ganancia de ecualizador correspondientes a todos los índices EQ y bandas de frecuencia
Tg,A
ganancia de recorte [lineal] por cada canal de salida A
Td,A
retardo de recorte [muestras] por cada canal de salida A
35
[0098] La siguiente descripción hace uso de parámetros intermedios según se define a continuación en aras
de la claridad. Cabe señalar que una implementación del algoritmo puede omitir la introducción de los parámetros intermedios.
S
vector de los canales de origen del conversor [índices de canales de entrada]
D
vector de los canales de destino del conversor [índices de canales de salida]
G
vector de ganancias del conversor [lineal]
E
vector de índices EQ del conversor
[0099] Los parámetros intermedios describen los parámetros de mezcla descendente de manera orientada al
mapeo, es decir, en forma de series de parámetros Si, Di, Gi, Ei por mapeo i.
[0100] De más está decir que, en las realizaciones de la invención, el conversor no emite todos los parámetros 45 de salida citados, según los cuales se implementan las características.
[0101] En cuanto a las disposiciones de altavoces aleatorias, es decir, configuraciones de salida que contienen
altavoces en posiciones (direcciones de canales) que se desvían del formato de salida deseado, las desviaciones de las posiciones se señalizan especificando los ángulos de desvío de las posiciones de los altavoces en forma de parámetros de entrada razi,A y rele,A. El pre-procesamiento se lleva a cabo aplicando razi,A y rele,A a los ángulos de la disposición estándar. Más específicamente hablando, los ángulos azimutales y de elevación de los canales de la Tabla 5 1 se modifican sumando razi,A y rele,A a los canales correspondientes.
[0102] Nin señaliza el número de canales de la configuración de canales de entrada (altavoces). Este número
puede ser obtenido de la Tabla 2 para el parámetro de entrada dado format_in. Nout señaliza el número de canales de la configuración de canales de salida (altavoces). Este número puede ser obtenido de la Tabla 2 para el parámetro de 10 salida dado format out.
[0103] Los vectores de parámetros S, D, G, E definen el mapeo de los canales de entrada con los canales de
salida. Por cada mapeo i de un canal de entrada con un canal de salida con una ganancia de mezcla descendente no cero, estos pueden definir la ganancia de mezcla descendente, como así también un índice de ecualizador que indica 15 qué curva de ecualización se debe aplicar al canal de entrada en cuestión en el mapeo i.
[0104] Considerando un caso en el cual el formato de entrada Format_5_1 se convierte a Format_2_0, se
obtendría la siguiente matriz de mezcla descendente (considerando un coeficiente 1 correspondiente al mapeo directo, Tabla 2 y Tabla 5, y en el que IN1=CH_M_L030, IN2=CH_M_R030, IN3=CH_M_000, IN4=CH_M_L110, 20 IN5=CH_M_R110, OUT1=CH_M_L030, y OUT2=CH_M_R030):
(OUT 1 \ \OUT2J
(i
o
o i
Vf°'8
— o V2
o,8
\ Í,N1\
IN2 ,N3
vINí/
25
[0105] El vector izquierdo indica los canales de salida, la matriz representa la matriz de mezcla descendente y
el vector derecho indica los canales de entrada.
[0106] Por consiguiente, la matriz de mezcla descendente incluye seis entradas diferentes de cero y, por lo tanto, i oscila de 1 a 6 (orden arbitrario siempre que se utilice el mismo orden en cada vector). Si se cuentan las entradas de la matriz de mezcla descendente de izquierda a derecha y de arriba hacia abajo a partir de la primera fila,
30 los vectores S, D, G y E de este ejemplo serían:
S = (IN1, IN3, IN4, IN2, IN3, IN5)
D = (OUT1, OUT1, OUT 1, OUT2, OUT2, OUT2)
G = (1, 1/V2, 0,8, 1, 1/V2, 0,8)
35 E = (0, 0, 0, 0, 0, 0)
[0107] En consecuencia, la i.a entrada de cada vector está relacionada con el i.° mapeo entre un canal de entrada y un canal de salida por lo que los vectores otorgan, por cada canal, una serie de datos que incluyen el canal de entrada en cuestión, el canal de salida en cuestión, el valor de ganancia que se ha de aplicar y qué ecualizador se
40 ha de aplicar.
[0108] Para compensar las diferentes distancias de los altavoces respecto de una posición central del oyente, se puede aplicar Tg,A y/o Td,A a cada canal de salida.
45 [0109] Los vectores S, D, G, E se inicializan con el siguiente algoritmo:
- En primer lugar, se inicializa el contador de mapeo: i = 1
- Si el canal de entrada existe también en el formato de salida (por ejemplo, si el canal de entrada en cuestión es 50 CH_M_R030 y el canal CH_M_R030 existe en el formato de salida, entonces:
Si = índice del canal de origen en la entrada (Ejemplo: el canal CH_M_R030 del Format_5_2_1 está en el segundo lugar según la Tabla 2, es decir, que tiene el índice 2 en este formato)
Di = índice del mismo canal en la salida 55 Gi = 1
E¡ = 0
i = i+1
5 [0110] Por consiguiente, en primer lugar se tratan los mapeos directos y se asocia un coeficiente de ganancia
de 1 y un índice de ecualizador de cero a cada mapeo directo. Después de cada mapeo directo, i se incrementa en uno, i = i + 1.
[0111] Por cada canal de entrada para el cual no existe un mapeo directo, se busca y selecciona la primera 10 anotación de este canal en la columna de entrada (columna de origen) de la Tabla 3, para el cual existe o existen el o
los canales de la correspondiente fila de la columna de salida (columna de destino). En otras palabras, se busca y selecciona la primera anotación de este canal que define uno o más canales de salida en el que todos los cuales están presentes en la configuración de los canales de salida (dada por format_out). En el caso de las reglas específicas esto puede significar que, como por ejemplo en el caso del canal de entrada CH_T_000, que define que el canal de entrada 15 asociado se mapea con todos los canales de salida que tengan una elevación específica, esto puede significar que se selecciona la primera regla que define uno o más canales de salida con la elevación específica, que están presentes en la configuración de salida.
[0112] Por consiguiente, el algoritmo procede de la siguiente manera:
20
- O bien (es decir, si el canal de entrada no existe en el formato de salida)
se busca la primera anotación de este canal en la columna Origen de la Tabla 3, para la cual existen los canales de la fila correspondiente de la columna Destino. El destino ALL_U se debe considerar válido (es decir, que existen los canales de salida pertinentes) si el formato de salida contiene al menos un canal "CH_U_". El destino ALL_M se debe 25 considerar válido (es decir, que existen los canales de salida pertinentes) si el formato de salida contiene al menos un canal "CH_M_".
[0113] De esa manera, se selecciona una regla por cada canal de entrada. Seguidamente se evalúa la regla de la siguiente manera para derivar los coeficientes que se han de aplicar a los canales de entrada.
30
- Si la columna de destino contiene ALL_U, entonces:
Por cada canal de salida x con "CH_U_" en su nombre se hace:
35 Si = índice de canal de origen en la entrada Di = índice de canal x en la salida
Gi = (columna de valores de ganancia)/raíz(número de canales "CH_U_")
Ei = columna de valores de EQ
40 i = i + 1
- O bien, si la columna de destino contiene ALL_M, entonces:
Por cada canal de salida x con "CH_M_" en su nombre, se hace:
45
Si = índice de canal de origen en la entrada Di = índice de canal x en la salida
Gi = (columna de valores de ganancia)/raíz(número de canales "CH_M_") Ei = columna de valores de EQ 50
i = i + 1
- O bien si hay un canal en la columna Destino, entonces:
55 Si = índice de canal de origen en la entrada Di = índice de canal de destino en la salida Gi = columna de valores de ganancia Ei = columna de valores de EQ
i = i + 1
- O bien (dos canales en la columna Destino)
5 Si = índice de canal de origen en la entrada Di = índice del primer canal de destino en la salida Gi = (columna de valores de ganancia) * g1 Ei = columna de valores de EQ
10 i = i + 1
Si = Si-1
Di = índice de segundo canal de destino en la salida Gi = (columna de valores de ganancia) * g2 15 Ei = Ei-1
i = i + 1
[0114] Las ganancias g1 y g2 se calculan aplicando el paneo en amplitud por la ley de tangentes de la siguiente
20 manera:
25
replegar ángulos azimutales del canal los ángulos azimutales de los canales el ángulo azimutal del canal de origen
centro 2
°^ = (^centro-^src )-sgn(<x 2-«i) b i
-i =■
1+0'
-.9 2 =■
'1+02
con
de destino para que sean positivos de destino son a1 y a2 (véase la Tabla 1). (objetivo de paneo) es asrc.
tana0-tana+10 10 tan «o+tan a+10910
30 [0115] Mediante el algoritmo precedente, se derivan los coeficientes de ganancia (Gi) que se han de aplicar a
los canales de entrada. Además, se determina si se debe aplicar un ecualizador y, en caso de ser así, qué ecualizador se debe aplicar, (Ei).
[0116] Los coeficientes de ganancia Gi se pueden aplicar directamente a los canales de entrada o se pueden
35 sumar a una matriz de mezcla descendente que se puede aplicar a los canales de entrada, es decir, a las señales de entrada asociadas a los canales de entrada.
[0117] El algoritmo descrito es meramente ilustrativo. En otras realizaciones, se pueden derivar coeficientes de las reglas o basar en las reglas y se pueden sumar a la matriz de mezcla descendente sin definir los vectores
40 específicos antes descritos.
[0118] Los valores de ganancia del ecualizador Geq se pueden determinar de la siguiente manera:
Geq consiste en valores de ganancia por banda de frecuencia k y el índice de ecualizador e. Cinco ecualizadores predefinidos son combinaciones de diferentes filtros de pico. Como se puede ver en la Tabla 5, los ecualizadores 45 Geq,1, Geq,2 y Geq,5 incluyen un solo filtro de pico, el ecualizador Geq,3 incluye tres filtros de pico y el ecualizador Geq,4 incluye dos filtros de pico. Cada ecualizador es una cascada en serie de uno o más filtros de pico y una ganancia:
N
Gl¡Q,e = 102o?pico(banda(k) • fs/2,PLn, PQ,n, Pb,u)
n= 1
50 en el que banda(k) es la frecuencia central normalizada de la banda de frecuencia j, especificada en la Tabla 4, fs es la frecuencia de muestreo y la función pico() corresponde a G negativo
y por el contrario 5
píco(b,f,Q,G) =
b' + (Q2-2)
f2b2 + f4
b‘ + (4-2'
f2b2 + f4
píco(b,f,Q,G) =
b4 + P"<r - 2R F2b2 + f4
b4 + (-2-2)f2b2+f4
Ecuación 1
Ecuación 2
[0119] Los parámetros correspondientes a los ecualizadores están especificados en la Tabla 5. En las 10 Ecuaciones anteriores 1 y 2, b está dado por banda(k) fs/2, Q está dado por Pq para el respectivo filtro de pico (1 a n),
G está dado por Pg para el respectivo filtro de pico, y f está dado por Pf para el respectivo filtro de pico.
[0120] Por ejemplo, los valores de ganancia del ecualizador Geq,4 correspondientes al ecualizador que tiene el índice 4 se calculan con los parámetros de filtro tomados de la fila pertinente de la Tabla 5. La Tabla 5 enumera dos
15 series de parámetros correspondientes a los filtros de pico para Geq,4, es decir, series de parámetros correspondientes a n=1 y n=2. Los parámetros son la frecuencia de los picos Pf en Hz, el factor de calidad del filtro de pico Pq, la ganancia Pg (en dB) que se aplica a la frecuencia de los picos y una ganancia general g en dB que se aplica a la cascada de los dos filtros de pico (cascada de filtros para los parámetros n=1 y n=2).
20 [0121] Por consiguiente
GEq,4 = 10 20 • píco{banda(k) •fs/2,Pfx, Pq-, PgX) •píco(banda(k) •fs/2,Pf:¿, Pq¿, Pg.2) = 10~ • píco(banda(k) • fs/2.5000,1.0,4.5) • píco(banda(k) • fs/2,1100,0.8,1.8)
-3.1
= 10 20 •
b4 + [/—°-2] 50002b2 + 50004
b4 + 1-^-2] 11002b2 + 11004
1 0,82 1
b4 + (-2- 2) 50002b2 + 50004
b4 + (-/--2)l1002b2 + 11004 V0.82 J
[0122] La definición del ecualizador antes citada define ganancias de fase cero Geq,4 de modo independiente
por cada banda de frecuencia k. Cada banda k está especificada por su banda de frecuencia(k) central normalizada en la que 0<=banda<=1. Nótese que la banda de frecuencia normalizada=1 corresponde a la frecuencia no 25 normalizada fs/2, en la que fs denota la frecuencia de muestreo. Por lo tanto banda(k) • fs/2 denota la frecuencia central no normalizada de la banda k en Hz.
30
[0123] Los retardos por recorte Td,A en las muestras por cada canal de salida A y las ganancias por recorte Tg,A
(valor de ganancia lineal) por cada canal de salida A se calculan en función de las distancias de los altavoces en trimA:
35
Td,c = retorno | -
|-
trímA - max trímn
T=
*g.c
\ 340 /
V ¡fs
1 trímA
max trím„
en la que
max trímn
n
representa el máximo trimA de todos los canales de salida.
[0124] Si el Td,A más grande excede Nmaxdeiay, la inicialización puede fallar y se puede producir en retorno un
error.
5 [0125] Las desviaciones de la disposición de salida de una configuración estándar pueden ser tenidas en
cuenta de la siguiente manera.
[0126] Las desviaciones del azimut razi,A (desviaciones del azimut) se tienen en cuenta simplemente aplicando razi,A a los ángulos de la configuración estándar como se explicara anteriormente. Por consiguiente, se utilizan los
10 ángulos modificados al panear un canal de entrada con dos canales de salida. Por consiguiente, razi,A se toma en cuenta al mapear un canal de entrada con dos o más canales de salida en la ejecución del paneo que se define en la respectiva regla. En realizaciones alternativas, las respectivas reglas pueden definir los respectivos valores de ganancia directamente (es decir, que el paneo se ha realizado de antemano). En esas realizaciones, se puede adaptar el sistema para recalcular los valores de ganancia sobre la base de los ángulos aleatorizados.
15
[0127] Las desviaciones de la elevación rele,A pueden ser tenidas en cuenta en un post-procesamiento de la siguiente manera. Una vez calculados los parámetros de salida, se pueden modificar con respecto a los ángulos de elevación aleatorios específicos. Esta etapa sólo tiene que ser ejecutada si no todos los rele,A son cero.
20 - Por cada elemento i de Di, se realiza lo siguiente:
- si el canal de salida con el índice Di es un canal horizontal por definición (es decir, si el rótulo del canal de salida contiene el rótulo "_M_"), y
si este canal de salida es ahora un canal de altura (elevación en el intervalo de 0,60 grados) y 25 si el canal de entrada con el índice Si es un canal de altura (es decir, si el rótulo contiene "_U_"), entonces
• h = min (elevación del canal de salida aleatorizado, 35)/35
• Gcomp = h • q gk + (1 — h)
• Define un nuevo ecualizador con un nuevo índice e, en el que
30 GEQ,e = Gcomp ' (h + (1 — h) • G¡=q,e1')
• Ei = e
o bien si el canal de entrada con el índice Si es un canal horizontal (el rótulo contiene "_M_")
• h = min (elevación de canal de salida aleatorizado, 35)/35
35 • Define un nuevo ecualizador con un nuevo índice e, en el que GE<,e = h • GEq,5 + (1 — h) • G=q g
• Ei = e
h es un parámetro de elevación normalizada que indica la elevación de un canal de salida ("_M_") nominalmente 40 horizontal debido a una compensación de elevación aleatorio de la configuración rele,A. En el caso de compensación de elevación cero h=0 sigue y efectivamente no se aplica ningún post-procesamiento.
[0128] La tabla de reglas (Tabla 3) aplica, en general, una ganancia de 0,85 al mapear un canal de entrada superior ("_U_" en el rótulo del canal) con uno o varios canales de salida horizontales ("_M_" en el o los rótulos de
45 canal). En caso de que el canal de salida se eleve debido a un compensación de elevación aleatorio de la configuración rele,A, la ganancia de 0,85 se compensa parcial (0<h<1) o totalmente (h=1) incrementando las ganancias del ecualizador en el factor Gcomp que aproxima 1/0,85 para que h se aproxime a h=1,0. Del mismo modo, las definiciones del ecualizador se desvanecen hacia una curva plana de EQ (GE<e = Gcomp) para que h se aproxime a h=1,0.
50 [0129] En caso de que un canal de entrada horizontal se mapee con un canal de salida que se eleva debido a
una compensación de elevación aleatoria de la configuración rele,A, el ecualizador G=q5 se aplica parcial (0<h<1) o totalmente (h=1).
[0130] Mediante este procedimiento, se modifican los valores de ganancia diferentes de 1 y los ecualizadores,
55 que se aplican debido al mapeo de un canal de entrada con un canal de salida más bajo, en caso de que el canal de salida aleatorizado esté más elevado que el canal de salida de la disposición.
[0131] Según la descripción que antecede, se aplica directamente la compensación de ganancia al ecualizador.
En una estrategia alternativa, se pueden modificar los coeficientes de mezcla descendente Gi. En esa estrategia alternativa, el algoritmo para la aplicación de la compensación de ganancia sería el siguiente:
- si el canal de salida con el índice Di es un canal horizontal por definición (es decir, si el rótulo del canal
de salida contiene el rótulo "_M_") y
si este canal de salida es ahora un canal de altura (elevación en el intervalo de 0,60 grados) y 10 si el canal de entrada con el índice Si es un canal de altura (es decir, si el rótulo contiene "_U_"), entonces
• h = min (elevación del canal de salida aleatorizado, 35)/35
• Gi = h Gi /0,85 + (1-h) Gi
• Define nuevo ecualizador con un nuevo índice e, en el que
1 5 :iBQ,e = h + (1 — h) • :eQ,E¡
• Ei = e o bien si canal de entrada con el índice Si es un canal horizontal (el rótulo contiene "_M_")
• h = min (elevación de canal de salida aleatorizado, 35)/35
• Define nuevo ecualizador con un nuevo índice e, en el que
20 :EQ,e = h • :EQ, 5 + (1 — h):EQ,e
• Ei = e
[0132] Por ejemplo, digamos que Di es el índice de canal del canal de salida correspondiente al i.° mapeo de
25 un canal de entrada con un canal de salida. Por ejemplo en el caso del formato de salida FORMAT_5_1 (véase la Tabla 2), Di = 3 se referiría al canal central CH_M_000. Considérese rele,A = 35 grados (es decir, rele,A del canal de salida correspondiente al i.° mapeo) para un canal de salida Di que es nominalmente un canal de salida horizontal con elevación de 0 grados (es decir, un canal con el rótulo "CH_M_"). Después de aplicar rele,A al canal de salida (sumando rele,A al respectivo ángulo de la disposición estándar tal como el definido en la Tabla 1) el canal de salida Di tiene ahora 30 una elevación de 35 grados. Si se mapea un canal de entrada superior (con el rótulo "CH_U") con este canal de salida Di, los parámetros correspondientes a este mapeo obtenidos de la evaluación de las reglas según lo descrito anteriormente se modifican de la siguiente manera:
El parámetro de elevación normalizado se calcula en términos de h = min(35,35)/35 = 35/35 = 1,0. Por consiguiente
35
Gi,post-procesado = Gi,antes post-procesamiento / 0,85.
[0133] Se define un nuevo índice e (por ejemplo e=6) no utilizado para el ecualizador modificado G|q,6 que se calcula según G|q,6 = 1,0 + (1,0 - 1,0)C|Q,e = 1,0 + 0 = 1,0. G|q,6 se puede atribuir a la regla de mapeo estableciendo Ei = e = 6.
40
[0134] Por consiguiente, en el caso del mapeo del canal de entrada con el canal de salida Di elevado (anteriormente horizontal) las ganancias se han incrementado en un factor de 1/0,85 y el ecualizador ha sido reemplazado por una curva de ecualizador con ganancia constante = 1,0 (es decir, con una respuesta plana de frecuencia). Este es el resultado pretendido, puesto que se ha mapeado un canal superior con un canal de salida
45 efectivamente superior (el canal de salida nominalmente horizontal se volvió, en efecto, en un canal de salida superior debido a la aplicación de la compensación de elevación aleatorio de la disposición de 35 grados).
[0135] Por consiguiente, en las realizaciones de la invención, el procedimiento y la unidad de procesamiento de señales están configurados para tener en cuenta las desviaciones del ángulo azimutal y el ángulo de elevación de
50 los canales de salida con respecto a una disposición estándar (en la que las reglas han sido diseñadas sobre la base de la disposición estándar). Las desviaciones tenidas en cuenta modificando el cálculo de los respectivos coeficientes y/o recalculando o modificando coeficientes que han sido calculados antes o que están definidos taxativamente en las reglas. Por consiguiente, las realizaciones de la invención pueden tratar con diferentes disposiciones de salida que se desvíen de las disposiciones estándar.
55
[0136] Los parámetros de salida de inicialización Nin, Nout, Tg,A, Td,A, Geq se pueden derivar según lo descrito anteriormente. El resto de los parámetros de salida de inicialización Mdmx, Ieq se pueden derivar reordenando los parámetros intermedios de la representación orientada al mapeo (enumerada mapeando contra i) con una
representación orientada a los canales como se define a continuación:
- Inicializa Mdmx como matriz cero Nout x Nin.
5 - Por cada i (i en orden ascendente) se realiza:
Mdmx,a,b = Gi en el que A = Di, B=Si (A, B que son los índices de canales)
Ieq,a = Ei en el que A = Si
10 en el que Mdmx,a,b denota el elemento de la matriz en la A.a fila y la B.a columna de Mdmx e Ieq,a denota el A.° elemento del vector Ieq.
[0137] Se pueden derivar diferentes reglas específicas y el orden de prioridad de las reglas destinadas a transmitir una mejor calidad de sonido de la Tabla 3. A continuación se presentan los ejemplos.
15
[0138] Una regla que define el mapeo del canal de entrada con uno o más canales de salida con una desviación de dirección menor con respecto al canal de entrada en un plano de escucha horizontal tiene mayor prioridad que una regla que define el mapeo del canal de entrada con uno o más canales de salida con una mayor desviación de la dirección con respecto al canal de entrada en el plano horizontal del oyente. Por consiguiente, la dirección de los
20 altavoces en la disposición de entrada se reproduce de la manera más exacta posible. Una regla que define el mapeo de un canal de entrada con uno o más canales de salida que tienen el mismo ángulo de elevación que el canal de entrada tiene mayor prioridad que una regla que define el mapeo del canal de entrada con uno o más canales de salida que tienen un ángulo de elevación diferente del ángulo de elevación del canal de entrada. Por consiguiente, se tiene en cuenta el hecho de que las señales que parten de las diferentes elevaciones son percibidas por un usuario 25 de manera diferente.
[0139] Una regla de una serie de reglas asociadas a un canal de entrada que tiene una dirección diferente de una dirección frontal central puede definir el mapeo del canal de entrada con dos canales de salida situados del mismo lado de la dirección central frontal que el canal de entrada y que están situados a ambos lados de la dirección del
30 canal de entrada, y otra regla con menor prioridad de esa serie de reglas define el mapeo del canal de entrada con un único canal de salida situado del mismo lado de la dirección frontal central que el canal de entrada. Una regla de una serie de reglas asociadas a un canal de entrada que tiene un ángulo de elevación de 90° define el mapeo del canal de entrada con todos los canales de salida disponibles con un primer ángulo de elevación más bajo que el ángulo de elevación del canal de entrada, y otra regla con menor prioridad de esa serie de reglas define el mapeo del canal de 35 entrada con todos los canales de salida disponibles con un segundo ángulo de elevación más bajo que el primer ángulo de elevación. Una regla de una serie de reglas asociadas a un canal de entrada que comprende una dirección frontal central puede definir el mapeo del canal de entrada con dos canales de salida, uno situado a la izquierda de la dirección frontal central y uno situado a la derecha de la dirección frontal central. Por consiguiente, se pueden diseñar reglas para canales específicos para poder tener en cuenta las propiedades y/o semántica específica de los canales 40 específicos. De conformidad con la descripción de la invención, una regla de una serie de reglas asociadas a un canal de entrada que comprende una dirección posterior central define el mapeo del canal de entrada con dos canales de salida, uno situado en el lado izquierdo de una dirección frontal central y uno situado en el lado derecho de la dirección frontal central, en el que la regla define además el uso de un coeficiente de ganancia inferior a uno si un ángulo de los dos canales de salida relativos a la dirección posterior central es más de 90°. Una regla de una serie de reglas 45 asociadas a un canal de entrada que comprende una dirección diferente de una dirección frontal central puede definir el uso de un coeficiente de ganancia inferior a uno en el mapeo del canal de entrada con un único canal de salida situado del mismo lado de la dirección frontal central que el canal de entrada, en el que un ángulo del canal de salida con respecto a una dirección frontal central es inferior a un ángulo del canal de entrada con respecto a la dirección frontal central. Por consiguiente, se puede mapear un canal con uno o más canales situados más adelante para reducir 50 la perceptibilidad de una renderización espacial no ideal del canal de entrada. Más aun, puede ser útil para reducir la cantidad de sonido ambiente en la mezcla descendente, que es una característica ventajosa. El sonido ambiente puede estar presente predominantemente en los canales posteriores.
[0140] Una regla que define el mapeo de un canal de entrada que tiene un ángulo de elevación con uno o más 55 canales de salida que tienen un ángulo de elevación más bajo que el ángulo de elevación del canal de entrada puede
definir el uso de un coeficiente de ganancia inferior a uno. Una regla que define el mapeo de un canal de entrada que tiene un ángulo de elevación con uno o más canales de salida que tienen un ángulo de elevación más bajo que el ángulo de elevación del canal de entrada puede definir la aplicación de un procesamiento selectivo de la frecuencia utilizando un filtro ecualizador. Por consiguiente, se puede tener en cuenta que los canales elevados se perciben, en
general, de manera diferente de los canales horizontales o inferiores al mapear un canal de entrada con uno o más canales de salida.
[0141] En general, los canales de entrada que se mapean con canales de salida que se desvían de la posición
5 del canal de entrada pueden ser atenuados, más cuando mayor sea la percepción de la reproducción obtenida del canal de entrada mapeado de la reproducción obtenida del canal mapeado que se desvía de la percepción del canal de entrada, es decir, que se puede atenuar un canal de entrada dependiendo del grado de imperfección de la reproducción a través de los altavoces disponibles.
10 [0142] Se puede obtener un procesamiento selectivo de la frecuencia utilizando un filtro ecualizador. Por
ejemplo, los elementos de una matriz de mezcla descendente pueden ser modificados de manera dependiente de la frecuencia. Por ejemplo, esa modificación se puede obtener empleando diferentes factores de ganancia para diferentes bandas de frecuencia de tal manera que se obtenga el efecto de la aplicación de un filtro ecualizador.
15 [0143] Para resumir, en las realizaciones de la invención se da una serie de reglas con orden de prioridad que
describen mapeos de los canales de entrada con los canales de salida. Puede ser definida por un diseñador del sistema en la etapa de diseño del sistema, reflejando el conocimiento experto sobre la mezcla descendente. La serie se puede implementar en forma de lista ordenada. Por cada canal de entrada de la configuración de los canales de entrada el sistema selecciona una regla apropiada de la serie de reglas de mapeo dependiendo de la configuración 20 de los canales de entrada y la configuración de los canales de salida de la situación de uso dada. Cada regla seleccionada determina el coeficiente (o coeficientes) de mezcla descendente de un canal de entrada a uno o varios canales de salida. El sistema puede iterar a través de los canales de entrada de la configuración dada de canales de entrada y compilar una matriz de mezcla descendente a partir de los coeficientes de mezcla descendente derivados mediante la evaluación de las reglas de mapeo seleccionadas para todos los canales de entrada. La selección de las 25 reglas tiene en cuenta la asignación de prioridad de las reglas, por consiguiente la optimización de la eficiencia del sistema por ejemplo para obtener la calidad de salida más elevada de la mezcla descendente al aplicar los coeficientes de mezcla descendente derivados. Las reglas de mapeo pueden tener en cuenta los principios psicoacústicos o artísticos que no se reflejan en los algoritmos de mapeo puramente matemáticos como VBAP. Las reglas de mapeo pueden tener en cuenta la semántica del canal, por ejemplo aplicar un tratamiento diferente para el canal central o un 30 par de canales izquierdo/derecho. Las reglas de mapeo pueden reducir la cantidad de paneo dando cuenta de errores de ángulo en la renderización. Las reglas de mapeo pueden introducir deliberadamente fuentes fantasmas (por ejemplo mediante renderización de VBAP) incluso si hubiera un único altavoz de salida correspondiente. La intención de hacerlo sería conservar la diversidad inherente en la configuración de los canales de entrada.
Si bien se han descrito algunos aspectos en el contexto de un aparato, es obvio que estos aspectos también 35 representan una descripción del procedimiento correspondiente, en el cual un bloque o dispositivo corresponde a una etapa del procedimiento o a una característica de una etapa del procedimiento. De manera análoga, los aspectos descritos en el contexto de una etapa del procedimiento también representan una descripción de un bloque o ítem correspondiente o de una característica de un aparato correspondiente. Algunas o todas las etapas del procedimiento pueden ser ejecutadas por medio de (o utilizando) un aparato de hardware, como por ejemplo, un microprocesador, 40 un ordenador programable o un circuito electrónico. En algunas realizaciones, una cualquiera o más de las etapas más importantes del procedimiento pueden ser ejecutadas por ese tipo de aparato. En las realizaciones de la invención, los procedimientos descritos en esta solicitud son implementados por un procesador o implementados por un ordenador.
Dependiendo de ciertos requisitos de implementación, las realizaciones de la invención pueden ser implementadas en 45 hardware o en software. La implementación se puede realizar empleando un medio de almacenamiento no transitorio, tal como un medio de almacenamiento digital, por ejemplo un disquete, un DVD, un Blu-Ray, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tiene almacenadas en la misma señales control legibles electrónicamente, que cooperan (o tienen capacidad para cooperar) con un sistema informático programable de tal manera que se ejecute el procedimiento respectivo. Por lo tanto, el medio de almacenamiento digital puede ser 50 legible por un ordenador.
[0144] En general, las realizaciones de la presente invención pueden ser implementadas en forma de producto
programa informático con un código de programa, en el que el código de programa cumple la función de ejecutar uno de los procedimientos al ejecutarse el programa informático en un ordenador. El código de programa puede ser 55 almacenado, por ejemplo, en un portador legible por una máquina.
Otras realizaciones comprenden el programa informático para ejecutar uno de los procedimientos descritos en esta solicitud, almacenado en un portador legible por una máquina.
En otras palabras, una realización del procedimiento de la invención consiste, por lo tanto, en un programa informático que consta de un código de programa para realizar uno de los procedimientos descritos en esta solicitud al ejecutarse
el programa informático en un ordenador.
[0145] Otra realización comprende un medio de procesamiento, por ejemplo un ordenador o un dispositivo lógico programable, configurado o adaptado para ejecutar uno de los procedimientos descritos en esta solicitud.
5 Otra realización comprende un ordenador en el que se ha instalado el programa informático para ejecutar uno de los procedimientos descritos en esta solicitud.
[0146] En algunas realizaciones, se puede utilizar un dispositivo lógico programable (por ejemplo una matriz de puertas programables en el campo) para ejecutar algunas o todas las funcionalidades de los procedimientos
10 descritos en esta solicitud. En algunas realizaciones, una matriz de puertas programables en el campo puede cooperar con un microprocesador para ejecutar uno de los procedimientos descritos en esta solicitud. Por lo general, los procedimientos son ejecutados preferentemente por cualquier aparato de hardware.
Las realizaciones precedentemente descritas son meramente ilustrativas de los principios de la presente invención. Se entiende que las modificaciones y variaciones de las disposiciones y detalles descritos en esta solicitud han de ser 15 evidentes para los expertos en la materia.
Tabla 1: Canales con ángulos azimutales y de elevación correspondientes
Canal
Ázimut [grados] Elevación [grados]
CH M 000
0 0
CH M L030
+30 0
CH M R030
-30 0
CH M L060
+60 0
CH M R060
-60 0
CH M L090
+90 0
CH M R090
-90 0
CH M L110
+ 110 0
CH M R110
-110 0
CH M L135
+ 135 0
CH M R135
-135 0
CH M 180
180 0
CH U 000
0 +35
CH U L045
+45 +35
CH U R045
-45 +35
CH U L030
+30 +35
CH U R030
-30 +35
CH U L090
+90 +35
CH U R090
-90 +35
CH U L110
+ 110 +35
CH U R110
-110 +35
CH U L135
+ 135 +35
CH U R135
-135 +35
CH U 180
180 +35
CH T 000
0 +90
CH L 000
0 -15
CH L L045
+45 -15
CH L R045
-45 -15
CH LFE1
n/a n/a
CH LFE2
n/a n/a
CH EMPTY
n/a n/a
Tabla 2: Formatos con número de canales y ordenamiento de canales correspondientes
Formato de Entrada/salida
Número de Canales Canales (con ordenamiento)
FORMAT 2 0
2 CH M L030, CH M R030
FORMAT_5_1
6 CH M L030, CH M R030, CH M 000, CH LFE1, CH M L110, CH M R110
FOR MAT_5_2_ 1
8 CH M L030, CH M R030, CH M 000, CH LFE1, CH M L110, CH M R110, CH U L030, CH U R030
FORMAT_7_1
8 CH M L030, CH M R030, CH M 000, CH LFE1, CH M L110, CH M R110, CH M L135, CH M R135
FORMAT_7_1_ALT
8 CH M L030, CH M R030, CH M 000, CH LFE1, CH M L110, CH M R110, CH M L060, CH M R060
FORMAT_8_1
9 CH M L030, CH M R030, CH U 000, CH LFE1, CH M L110, CH M R110, CH U L030, CH U R030, CH L 000
FORMAT_10_1
11 CH M L030, CH M R030, CH M 000, CH LFE1, CH M L110, CH M R110, CH U L030, CH U R030, CH U L110, CH U R110, CH T 000
FORMAT 22 2
24 CH M L060, CH M R060, CH M 000,
FORMAT 9 1
10
FORMAT 9 0
FORMAT 11 1
9
12
FORMAT 12 1
13
FORMAT 4 4 0
FORMAT 4 4 T 0
FORMAT 14 0
8
9
14
FORMAT 15 1
16
CH_LFE1, CH_M_L135, CH_M_R135, CH_M_L030, CH_M_R030, CH_M_180, CH_LFE2, CH_M_L090, CH_M_R090, CH_U_L045, CH_U_R045, CH_U_000, CH_T_000, CH_U_L135, CH_U_R135, CH_U_L090, CH_U_R090, CH_U_180, CH L 000, CH L L045, CH L R045 CH_M_L030, CH_M_R030, CH_M_000, CH_LFE1, CH_M_L110, CH_M_R110, CH_U_L030, CH_U_R030, CH_U_L110,
CH U R110_______________________
CH_M_L030, CH_M_R030, CH_M_000, CH_M_L110, CH_M_R110, CH_U_L030, CH U R030, CH U L110, CH U R110 CH_M_L030, CH_M_R030, CH_M_000, CH_LFE1, CH_M_L110, CH_M_R110, CH_U_L030, CH_U_R030, CH_U_L110, CH U R110, CH T 000, CH U 000 CH_M_L030, CH_M_R030, CH_M_000, CH_LFE2, CH_M_L135, CH_M_R135, CH_U_L030, CH_U_R030, CH_U_L135, CH_U_R135, CH_T_000, CH_M_L090,
CH M R090_______________________
CH_M_L030, CH_M_R030, CH_M_L110, CH_M_R110, CH_U_L030, CH_U_R030,
CH U L110, CH U R110____________
CH_M_L030, CH_M_R030, CH_M_L110, CH_M_R110, CH_U_L030, CH_U_R030, CH U L110, CH U R110, CH T 000 CH_M_L030, CH_M_R030, CH_M_000, CH_M_L135, CH_M_R135, CH_U_000, CH_U_L045, CH_U_R045, CH_U_L090, CH_U_R090, CH_U_L135, CH_U_R135,
CH U 180, CH T 000,______________
CH_M_L030, CH_M_R030, CH_M_000, CH_M_L060, CH_M_R060, CH_M_L110, CH_M_R110, CH_M_L135, CH_M_R135, CH_U_L030, CH_U_R030, CH_U_L045, CH_U_R045, CH_U_L110, CH_U_R110, CH_LFE1
Tabla 3: Matriz de Reglas del Conversor.
Entrada (Origen)
Salida (Destino) Ganancia Índice EQ
CH M 000
CH M L030, CH M R030 1,0 0 (comp.)
CH M L060
CH M L030, CH M L110 1,0 0 (comp.)
CH M L060
CH M L030 0,8 0 (comp.)
CH M R060
CH M R030, CH M R110, 1,0 0 (comp.)
CH M R060
CH M R030, 0,8 0 (comp.)
CH M L090
CH M L030, CH M L110 1,0 0 (comp.)
CH M L090
CH M L030 0,8 0 (comp.)
CH M R090
CH M R030, CH M R110 1,0 0 (comp.)
CH M R090
CH M R030 0,8 0 (comp.)
CH M L110
CH M L135 1,0 0 (comp.)
CH M L110
CH M L030 0,8 0 (comp.)
CH M R110
CH M R135 1,0 0 (comp.)
CH M R110
CH M R030 0,8 0 (comp.)
CH M L135
CH M L110 1,0 0 (comp.)
CH M L135
CH M L030 0,8 0 (comp.)
CH M R135
CH M R110 1,0 0 (comp.)
CH M R135
CH M R030 0,8 0 (comp.)
CH M 180
CH M R135, CH M L135 1,0 0 (comp.)
CH M 180
CH M R110, CH M L110 1,0 0 (comp.)
CH M 180
CH M R030, CH M L030 0,6 0 (comp.)
CH U 000
CH U L030, CH U R030 1,0 0 (comp.)
CH U 000,
CH M L030, CH M R030 0,85 0 (comp.)
CH U L045
CH U L030 1,0 0 (comp.)
CH U L045
CH M L030 0,85 1
CH U R045
CH U R030 1,0 0 (comp.)
CH U R045
CH M R030 0,85 1
CH U L030
CH U L045 1,0 0 (comp.)
CH U L030
CH M L030 0,85 1
CH U R030
CH U R045 1,0 0 (comp.)
CH U R030
CH M R030 0,85 1
CH U L090
CH U L030, CH U L110 1,0 0 (comp.)
CH U L090
CH U L030, CH U L135 1,0 0 (comp.)
CH U L090
CH U L045 0,8 0 (comp.)
CH U L090
CH U L030 0,8 0 (comp.)
CH U L090
CH M L030, CH M L110 0,85 2
CH U L090
CH M L030 0,85 2
CH U R090
CH U R030, CH U R110 1,0 0 (comp.)
CH U R090
CH U R030, CH U R135 1,0 0 (comp.)
CH U R090
CH U R045 0,8 0 (comp.)
CH U R090
CH U R030 0,8 0 (comp.)
CH U R090
CH M R030, CH M R110 0,85 2
CH U R090
CH M R030 0,85 2
CH U L110
CH U L135 1,0 0 (comp.)
CH U L110
CH U L030 0,8 0 (comp.)
CH U L110
CH M L110 0,85 2
CH U L110
CH M L030 0,85 2
CH U R110
CH U R135 1,0 0 (comp.)
CH U R110
CH U R030 0,8 0 (comp.)
CH U R110
CH M R110 0,85 2
CH U R110
CH M R030 0,85 2
CH U L135
CH U L110 1,0 0 (comp.)
CH U L135
CH U L030 0,8 0 (comp.)
CH U L135
CH M L110 0,85 2
CH U L135
CH M L030 0,85 2
CH U R135
CH U R110 1,0 0 (comp.)
CH U R135
CH U R030 0,8 0 (comp.)
CH U R135
CH M R110 0,85 2
CH U R135
CH M R030 0,85 2
CH U 180
CH U R135, CH U L135 1,0 0 (comp.)
CH U 180
CH U R110, CH U L110 1,0 0 (comp.)
CH U 180
CH M 180 0,85 2
CH U 180
CH M R110, CH M L110 0,85 2
CH U 180
CH U R030, CH U L030 0,8 0 (comp.)
CH U 180
CH M R030, CH M L030 0,85 2
CH T 000
ALL U 1,0 3
CH T 000
ALL M 1,0 4
CH L 000
CH M 000 1,0 0 (comp.)
CH L 000
CH M L030, CH M R030 1,0 0 (comp.)
CH L 000
CH M L030, CH M R060 1,0 0 (comp.)
CH L 000
CH M L060, CH M R030 1,0 0 (comp.)
CH L L045
CH M L030 1,0 0 (comp.)
CH L R045
CH M R030 1,0 0 (comp.)
CH LFE1
CH LFE2 1,0 0 (comp.)
CH LFE1
CH M L030, CH M R030 1,0 0 (comp.)
CH LFE2
CH LFE1 1,0 0 (comp.)
CH LFE2
CH M L030, CH M R030 1,0 0 (comp.)
Tabla 4: Frecuencias Centrales Normalizadas de las Bandas ^ de 77 Bancos de Filtros
Frecuencia Normalizada [0, 11______
0,00208330____________________
0,00587500____________________
0,00979170____________________
0,01354200____________________
0,01691700____________________
0,02008300____________________
0,00458330____________________
0,00083333____________________
0,03279200____________________
0,01400000____________________
0,01970800____________________
0,02720800____________________
0,03533300____________________
0,04283300____________________
0,04841700____________________
0,02962500____________________
0,05675000____________________
0,07237500____________________
0,08800000____________________
0,10362000____________________
0,11925000____________________
0,13487000____________________
0,15050000____________________
0,16612000____________________
0,18175000____________________
0,19737000____________________
0,21300000____________________
0,22862000____________________
0,24425000____________________
0,25988000____________________
0,27550000____________________
0,29113000____________________
0,30675000____________________
0,32238000____________________
0,33800000____________________
0,35363000____________________
0,36925000____________________
0,38488000____________________
0,40050000____________________
0,41613000____________________
0,43175000____________________
0,44738000____________________
0,46300000____________________
0,47863000____________________
0,49425000____________________
0,50987000____________________
0,52550000____________________
0,54112000____________________
0,55675000
0,57237000
0,58800000
0,60362000
0,61925000
0,63487000
0,65050000
0,66612000
0,68175000
0,69737000
0,71300000
0,72862000
0,74425000
0,75987000
0,77550000
0,79112000
0,80675000
0,82237000
0,83800000
0,85362000
0,86925000
0,88487000
0,90050000
0,91612000
0,93175000
0,94737000
0,96300000
0,97454000
0,99904000
Tabla 5: Parámetros del Ecualizador
Ecualizador
Pf [Hz] Pq Pg[dB] 9 [dB]
Geq,1
12000 0,3 -2 1,0
GeQ,2
12000 0,3 -3,5 1,0
GeQ,3
200,1300, 600 0,3, 0,5, 1,0 -6,5, 1,8, 2,0 0,7
GeQ,4
5000, 1100 1,0, 0,8 4,5, 1,8 -3,1
GeQ,5
35 0,25 -1,3 1,0
Tabla 6: Cada fila enumera los canales que se consideran en una posición superior/inferior entre sí
CH L 000
CH M 000 CH U 000
CH L L045
CH M L030 CH U L030
CH L L045
CH M L030 CH U L045
CH L L045
CH M L060 CH U L030
CH L L045
CH M L060 CH U L045
CH L R045
CH M R030 CH U R030
CH L R045
CH M R030 CH U R045
CH L R045
CH M R060 CH U R030
CH L R045
CH M R060 CH U R045
CH M 180
CH U 180
CH M L090
CH U L090
CH M L110
CH U L110
CH M L135
CH U L135
CH M L090
CH U L110
CH M L090
CH U L135
CH M L110
CH U L090
CH M L110
CH U L135

Claims (21)

  1. REIVINDICACIONES
    1. Procedimiento para mapear una pluralidad de canales de entrada de una configuración de canales de entrada (404) con los canales de salida de una configuración de canales de salida (406), procedimiento que
    5 comprende:
    producir una serie de reglas (400) asociadas a cada canal de entrada de la pluralidad de canales de entrada, en los que las reglas definen diferentes mapeos entre el canal de entrada asociado y una serie de canales de salida; por cada canal de entrada de la pluralidad de canales de entrada, acceder (500) a una regla asociada al canal de 10 entrada, determinar (502) si la serie de canales de salida definida en la regla a la que se ha accedido está presente en la configuración de los canales de salida (406) y seleccionar (402, 504) la regla a la que se ha accedido si la serie de canales de salida definida en la regla a la que se ha accedido está presente en la configuración de los canales de salida (406); y
    mapear (508) los canales de entrada con los canales de salida según la regla seleccionada, caracterizado porque 15
    una regla de la serie de reglas asociadas al canal de entrada de la configuración de canal de entrada que comprende una dirección posterior central define un mapeo de ese canal de entrada con dos de los canales de salida, uno se ubica del lado izquierdo de una dirección frontal central y otro se ubica del lado derecho de la dirección frontal central, en el que la regla se define además utilizando un coeficiente de ganancia inferior a uno si un ángulo de estos dos 20 canales de salida relativo a la dirección posterior central es más de 90°.
  2. 2. Procedimiento de la reivindicación 1, que comprende no seleccionar la regla a la que se ha accedido si la serie de canales de salida definida en la regla a la que se ha accedido no está presente en la configuración de los canales de salida (406) y repetir las etapas de acceder, determinar y seleccionar con respecto a al menos otra regla
    25 asociada al canal de entrada.
  3. 3. Procedimiento de una de las reivindicaciones 1 o 2, en el cual las reglas definen al menos uno de un coeficiente de ganancia que se ha de aplicar al canal de entrada, un coeficiente de retardo que se ha de aplicar al canal de entrada, una ley de paneo que se ha de aplicar para mapear un canal de entrada con dos o más canales de
    30 salida, y una ganancia dependiente de la frecuencia que se ha de aplicar al canal de entrada.
  4. 4. Procedimiento de una de las reivindicaciones 1 a 3, que comprende acceder a las reglas de las series de reglas en un orden específico hasta que se determine que la serie de canales de salida definida en una regla a la que se ha accedido está presente en la configuración de los canales de salida (406) por lo que la asignación de
    35 prioridad a las reglas está dada por el orden específico.
  5. 5. Procedimiento de una de las reivindicaciones 1 a 4, en el que una regla de las series de reglas que supuestamente deben producir sonido de calidad más elevada tiene mayor prioridad que una regla de las series de reglas que supuestamente transmiten sonido de menor calidad.
    40
  6. 6. Procedimiento de una de las reivindicaciones 1 a 5, en el que, en las series de reglas, la regla con mayor prioridad define el mapeo directamente entre el canal de entrada y un canal de salida de la configuración de los canales de salida, que tienen la misma dirección, comprendiendo el procedimiento, por cada canal de entrada, comprobar si un canal de salida que comprende la misma dirección que el canal de entrada está presente en la configuración de
    45 los canales de salida (406) antes de acceder a una memoria (422) que almacena las otras reglas de la serie de reglas asociadas a cada canal de entrada.
  7. 7. Procedimiento de una de las reivindicaciones 1 a 6, en el que, en las series de reglas, la regla de menor prioridad define el mapeo del canal de entrada con uno o ambos canales de salida de una configuración estéreo de
    50 canales de salida que constan de un canal de salida izquierdo y un canal de salida derecho.
  8. 8. Procedimiento de una de las reivindicaciones 1 a 7, en el que una regla de una serie de reglas asociadas a un canal de entrada de la configuración de los canales de entrada que tiene una dirección diferente de una dirección frontal central define el mapeo del canal de entrada con dos canales de salida de la configuración de los canales de
    55 salida situados en el mismo lado de la dirección frontal central que el canal de entrada y situado a ambos lados de la dirección del canal de entrada, y otra regla de menor prioridad de esa serie de reglas define el mapeo del canal de entrada con un único canal de salida de la configuración de los canales de salida situado en el mismo lado de la dirección frontal central que el canal de entrada.
  9. 9. Procedimiento de una de las reivindicaciones 1 a 8, en el que una regla de una serie de reglas asociadas a un canal de entrada de la configuración de los canales de entrada que comprende una dirección frontal central define el mapeo del canal de entrada con dos canales de salida de la configuración de los canales de salida, uno situado a la izquierda de la dirección frontal central y uno situado a la derecha de la dirección frontal central.
    5
  10. 10. Procedimiento de una de las reivindicaciones 1 a 9, en el que una regla de una serie de reglas asociadas a un canal de entrada de la configuración de los canales de entrada que tiene una dirección diferente de una dirección frontal central define el uso de un coeficiente de ganancia inferior a uno en el mapeo del canal de entrada con un único canal de salida de la configuración de los canales de salida situado en el mismo lado de la dirección frontal central
    10 que el canal de entrada, en el que un ángulo del único canal de salida con respecto a una dirección frontal central es menor que un ángulo del canal de entrada con respecto a la dirección frontal central.
  11. 11. Procedimiento de una de las reivindicaciones 1 a 10, en el que una regla de la serie de reglas que define el mapeo de un canal de entrada de la configuración de los canales de entrada que tiene un ángulo de elevación con
    15 uno o más canales de salida de la configuración de los canales de salida que tienen un ángulo de elevación más bajo que el ángulo de elevación del canal de entrada define el uso de un coeficiente de ganancia inferior a uno.
  12. 12. Procedimiento de una de las reivindicaciones 1 a 11, en el que una regla de la serie de reglas que define el mapeo de un canal de entrada de la configuración de los canales de entrada que tiene un ángulo de elevación con
    20 uno o más canales de salida de la configuración de los canales de salida que tienen un ángulo de elevación más bajo que el ángulo de elevación del canal de entrada define la aplicación de un procesamiento selectivo de la frecuencia.
  13. 13. Procedimiento de una de las reivindicaciones 1 a 12, que comprende recibir señales de audio de entrada asociadas a los canales de entrada, en el que el mapeo (508) de los canales de entrada con los canales de salida
    25 comprende evaluar (410, 520) las reglas seleccionadas para derivar los coeficientes que se han de aplicar a las señales de audio de entrada y aplicar (524) los coeficientes a las señales de audio de entrada para generar señales de audio de salida asociadas a los canales de salida, y transmitir (528) las señales de audio de salida a los altavoces asociados a los canales de salida.
    30 14. Procedimiento de la reivindicación 13, que comprende generar una matriz de mezcla descendente (414)
    y aplicar la matriz de mezcla descendente (414) a las señales de audio de entrada.
  14. 15. Procedimiento de la reivindicación 13 o 14, que comprende aplicar retardos por recorte y ganancias por recorte a las señales de audio de salida a fin de reducir o compensar las diferencias entre distancias de los respectivos
    35 altavoces de la posición central del oyente en la configuración de los canales de entrada (404) y la configuración de los canales de salida (406).
  15. 16. Procedimiento de una de las reivindicaciones 13 a 15, que comprende tener en cuenta una desviación entre un ángulo horizontal de un canal de salida de una configuración de salida real y un ángulo horizontal de un canal
    40 de salida específico de la configuración de los canales de salida definido en la serie de reglas al evaluar una regla de la serie de reglas que define el mapeo de un canal de entrada de la configuración de los canales de entrada con uno o dos canales de salida de la configuración de los canales de salida que incluyen el canal de salida específico, en el que los ángulos horizontales representan ángulos dentro de un plano horizontal del oyente con respecto a una dirección frontal central.
    45
  16. 17. Procedimiento de una de las reivindicaciones 13 a 16, que comprende modificar un coeficiente de ganancia, que se define en una regla de la serie de reglas que define el mapeo de un canal de entrada de la configuración de los canales de entrada que tiene un ángulo de elevación con uno o más canales de salida de la configuración de los canales de salida que tienen ángulos de elevación más bajos que el ángulo de elevación del canal
    50 de entrada, para tener en cuenta una desviación entre un ángulo de elevación de un canal de salida de una configuración de salida real y un ángulo de elevación de un canal de salida definido en esa regla.
  17. 18. Procedimiento de una de las reivindicaciones 13 a 17, que comprende modificar un procesamiento selectivo de la frecuencia definido en una regla de la serie de reglas que define el mapeo de un canal de entrada de
    55 la configuración de los canales de entrada que tiene un ángulo de elevación con uno o más canales de salida de la configuración de los canales de salida que tienen ángulos de elevación más bajos que el ángulo de elevación del canal de entrada, para tener en cuenta una desviación entre un ángulo de elevación de un canal de salida de una configuración de salida real y un ángulo de elevación de un canal de salida definido en esa regla.
  18. 19. Programa informático para poner en práctica, al ejecutarse en un ordenador o un procesador, el procedimiento de una de una de las reivindicaciones 1 a 18.
  19. 20. Una unidad de procesamiento de señales (420) que comprende un procesador (422) configurado o 5 programado para ejecutar un procedimiento según una de las reivindicaciones 1 a 18.
  20. 21. La unidad de procesamiento de señales de la reivindicación 20, que además comprende:
    una interfaz de señales de entrada (426) para recibir señales de entrada (228) asociadas a los canales de entrada de 10 la configuración de los canales de entrada (404), y
    una interfaz de señales de salida (428) para emitir señales de audio de salida asociadas a la configuración de los canales de salida (406).
  21. 22. Un decodificador de audio que comprende una unidad de procesamiento de señales según la 15 reivindicación 20 o 21.
    CO
    imagen1
    FIG. 1
    altavoz 32 can
    CO
    202
    7
    \
    204
    t
    lecodificador
    USAC
    mp4
    —j—*
    \
    128
    T
    canales
    206
    objetos pre-renderizados
    208
    J objetos
    objetos renderizados
    J^enderizadoj______
    * je
    * objetos
    -------j-
    OAM compr,
    /canales de 21 transporte
    Decodificador
    om
    Y
    V
    210
    SAOC-SI --------7------
    ------P*
    218'
    •216 ■—224
    222
    Decodificador
    SAOC
    opcional
    (
    * —»
    mezclador
    7-objetos \ renderizados
    220
    228
    canales
    renderizador
    auricular -'i
    binaural
    . *) VoQC
    >238
    por ejemplo altavoz 51
    ■23¿
    conversión
    -------* I
    de formato
    :
    232
    distribución de reproducción
    FIG. 2
    214
    200
    dominio QMF directo procesamiento en renderízador binaural, conversor de formato, decodificador STOC, decodificador USAC en modo SBR
    mezfador señales de salida
    imagen2
    distribución de
    salida del ------------
    mezclador
    240
    /
    \
    __________________¿_________
    mezclador descendente
    (operando en el dominio
    QMF)
    ; j
    i i
    señales de
    244-
    242
    (
    \
    controlador para configurar el mezclador descendente
    altavoz
    248
    t
    \
    distribución de reproducción
    FIG. 3
    imagen3
    geometría de la disposición de salida (por ej. posiciones de los canales
    imagen4
    FIG. 6A
    imagen5
    imagen6
    FIG. 6B
    imagen7
    / ¿ Están Y / disponibles \ canales de salida definidos en \ la regla? /
    seleccionar regia
    Mapear los canales de entrada con ios canales
    de salida según las reglas seleccionadas
    FIG. 7
    Acceder (siguiente)
    regla
    de sene de reglas
    imagen8
    Evaluar las reglas seleccionadas
    para derivar coeficientes para
    aplicar a las señales de audio de
    520
    entrada asociadas a los canales
    de entrada
    lGenerar una mam? de
    mezcla descendente
    526—H
    la partir de los
    'coeficientes
    Aplicar los coeficientes (matriz
    de mezcla descendente) a las
    señales de entrada para generar
    524
    sena es de audio de salida
    asociadas a los canales de salida
    Transmitir las señales
    de aua O de salida a.
    528
    los altavoces
    asociados a los
    canales de salida
    FIG. 8
ES16187406.0T 2013-07-22 2014-07-15 Procedimiento y unidad de procesamiento de señales para mapear una pluralidad de canales de entrada de una configuración de canales de entrada con canales de salida de una configuración de canales de salida Active ES2688387T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP13177360 2013-07-22
EP13177360 2013-07-22
EP13189249.9A EP2830332A3 (en) 2013-07-22 2013-10-18 Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration
EP13189249 2013-10-18

Publications (1)

Publication Number Publication Date
ES2688387T3 true ES2688387T3 (es) 2018-11-02

Family

ID=48874133

Family Applications (5)

Application Number Title Priority Date Filing Date
ES14738861.5T Active ES2649725T3 (es) 2013-07-22 2014-07-15 Aparato, procedimiento y programa informático para mapear primer y segundo canales de entrada con al menos un canal de salida
ES14738862.3T Active ES2645674T3 (es) 2013-07-22 2014-07-15 Procedimiento y unidad de procesamiento de señales para mapear una pluralidad de canales de entrada de una configuración de canales de entrada con canales de salida de una configuración de canales de salida
ES16187406.0T Active ES2688387T3 (es) 2013-07-22 2014-07-15 Procedimiento y unidad de procesamiento de señales para mapear una pluralidad de canales de entrada de una configuración de canales de entrada con canales de salida de una configuración de canales de salida
ES19162579T Active ES2925205T3 (es) 2013-07-22 2014-07-15 Aparato y procedimiento para la correspondencia de un primer y un segundo canal de entrada con al menos un canal de salida
ES17184927T Active ES2729308T3 (es) 2013-07-22 2014-07-15 Aparato y procedimiento para la correspondencia de un primer y un segundo canal de entrada con al menos un canal de salida

Family Applications Before (2)

Application Number Title Priority Date Filing Date
ES14738861.5T Active ES2649725T3 (es) 2013-07-22 2014-07-15 Aparato, procedimiento y programa informático para mapear primer y segundo canales de entrada con al menos un canal de salida
ES14738862.3T Active ES2645674T3 (es) 2013-07-22 2014-07-15 Procedimiento y unidad de procesamiento de señales para mapear una pluralidad de canales de entrada de una configuración de canales de entrada con canales de salida de una configuración de canales de salida

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES19162579T Active ES2925205T3 (es) 2013-07-22 2014-07-15 Aparato y procedimiento para la correspondencia de un primer y un segundo canal de entrada con al menos un canal de salida
ES17184927T Active ES2729308T3 (es) 2013-07-22 2014-07-15 Aparato y procedimiento para la correspondencia de un primer y un segundo canal de entrada con al menos un canal de salida

Country Status (20)

Country Link
US (6) US9936327B2 (es)
EP (8) EP2830332A3 (es)
JP (2) JP6130599B2 (es)
KR (3) KR101858479B1 (es)
CN (4) CN107040861B (es)
AR (4) AR097004A1 (es)
AU (3) AU2014295309B2 (es)
BR (2) BR112016000990B1 (es)
CA (3) CA2918843C (es)
ES (5) ES2649725T3 (es)
HK (1) HK1248439B (es)
MX (2) MX355273B (es)
MY (1) MY183635A (es)
PL (5) PL3133840T3 (es)
PT (5) PT3518563T (es)
RU (3) RU2672386C1 (es)
SG (3) SG11201600475VA (es)
TW (2) TWI562652B (es)
WO (2) WO2015010962A2 (es)
ZA (1) ZA201601013B (es)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP3057096B1 (en) * 2013-10-09 2019-04-24 Sony Corporation Encoding device and method, decoding device and method, and program
CN106303897A (zh) 2015-06-01 2017-01-04 杜比实验室特许公司 处理基于对象的音频信号
KR20240050483A (ko) 2015-06-17 2024-04-18 삼성전자주식회사 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
WO2017085562A2 (en) * 2015-11-20 2017-05-26 Dolby International Ab Improved rendering of immersive audio content
EP3179744B1 (en) * 2015-12-08 2018-01-31 Axis AB Method, device and system for controlling a sound image in an audio zone
JP2019518373A (ja) * 2016-05-06 2019-06-27 ディーティーエス・インコーポレイテッドDTS,Inc. 没入型オーディオ再生システム
GB201609089D0 (en) * 2016-05-24 2016-07-06 Smyth Stephen M F Improving the sound quality of virtualisation
CN106604199B (zh) * 2016-12-23 2018-09-18 湖南国科微电子股份有限公司 一种数字音频信号的矩阵处理方法及装置
WO2018144850A1 (en) * 2017-02-02 2018-08-09 Bose Corporation Conference room audio setup
US10979844B2 (en) 2017-03-08 2021-04-13 Dts, Inc. Distributed audio virtualization systems
GB2561844A (en) * 2017-04-24 2018-10-31 Nokia Technologies Oy Spatial audio processing
BR112019023170A2 (pt) 2017-05-03 2020-06-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Processador de áudio, sistema, método e programa de computador para renderização de áudio
TWI687919B (zh) * 2017-06-15 2020-03-11 宏達國際電子股份有限公司 音頻訊號處理方法、音頻定位系統以及非暫態電腦可讀取媒體
DK3425928T3 (da) * 2017-07-04 2021-10-18 Oticon As System omfattende hørehjælpesystemer og systemsignalbehandlingsenhed og fremgangsmåde til at generere et forbedret elektrisk audiosignal
JP6988904B2 (ja) * 2017-09-28 2022-01-05 株式会社ソシオネクスト 音響信号処理装置および音響信号処理方法
KR102511818B1 (ko) 2017-10-18 2023-03-17 디티에스, 인코포레이티드 3d 오디오 가상화를 위한 오디오 신호 사전 설정
JP7102024B2 (ja) * 2018-04-10 2022-07-19 ガウディオ・ラボ・インコーポレイテッド メタデータを利用するオーディオ信号処理装置
CN109905338B (zh) * 2019-01-25 2021-10-19 晶晨半导体(上海)股份有限公司 一种串行数据接收器的多级均衡器增益的控制方法
US11568889B2 (en) 2019-07-22 2023-01-31 Rkmag Corporation Magnetic processing unit
JP2021048500A (ja) * 2019-09-19 2021-03-25 ソニー株式会社 信号処理装置、信号処理方法および信号処理システム
KR102283964B1 (ko) * 2019-12-17 2021-07-30 주식회사 라온에이엔씨 인터콤시스템 통신명료도 향상을 위한 다채널다객체 음원 처리 장치
GB2594265A (en) * 2020-04-20 2021-10-27 Nokia Technologies Oy Apparatus, methods and computer programs for enabling rendering of spatial audio signals
TWI742689B (zh) * 2020-05-22 2021-10-11 宏正自動科技股份有限公司 影音處理裝置、影音播放系統及其影音處理方法
CN112135226B (zh) * 2020-08-11 2022-06-10 广东声音科技有限公司 Y轴音频再生方法以及y轴音频再生系统
RU207301U1 (ru) * 2021-04-14 2021-10-21 Федеральное государственное бюджетное образовательное учреждение высшего образования "Санкт-Петербургский государственный институт кино и телевидения" (СПбГИКиТ) Усилительно-преобразовательное устройство
US20220386062A1 (en) * 2021-05-28 2022-12-01 Algoriddim Gmbh Stereophonic audio rearrangement based on decomposed tracks
WO2022258876A1 (en) * 2021-06-10 2022-12-15 Nokia Technologies Oy Parametric spatial audio rendering
KR102671956B1 (ko) * 2022-12-06 2024-06-05 주식회사 라온에이엔씨 인터콤용 실감음향 오디오출력장치

Family Cites Families (83)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4308423A (en) 1980-03-12 1981-12-29 Cohen Joel M Stereo image separation and perimeter enhancement
US4748669A (en) * 1986-03-27 1988-05-31 Hughes Aircraft Company Stereo enhancement system
JPS6460200A (en) * 1987-08-31 1989-03-07 Yamaha Corp Stereoscopic signal processing circuit
GB9103207D0 (en) * 1991-02-15 1991-04-03 Gerzon Michael A Stereophonic sound reproduction system
JPH04281700A (ja) * 1991-03-08 1992-10-07 Yamaha Corp 多チャンネル再生装置
JP3146687B2 (ja) 1992-10-20 2001-03-19 株式会社神戸製鋼所 高耐食性表面改質TiまたはTi基合金部材
JPH089499B2 (ja) 1992-11-24 1996-01-31 東京窯業株式会社 焼成マグネシア・ドロマイトれんが
JP2944424B2 (ja) * 1994-06-16 1999-09-06 三洋電機株式会社 音響再生回路
US6128597A (en) * 1996-05-03 2000-10-03 Lsi Logic Corporation Audio decoder with a reconfigurable downmixing/windowing pipeline and method therefor
US6421446B1 (en) 1996-09-25 2002-07-16 Qsound Labs, Inc. Apparatus for creating 3D audio imaging over headphones using binaural synthesis including elevation
JP4304401B2 (ja) 2000-06-07 2009-07-29 ソニー株式会社 マルチチャンネルオーディオ再生装置
US7660424B2 (en) * 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US20040062401A1 (en) * 2002-02-07 2004-04-01 Davis Mark Franklin Audio channel translation
TW533746B (en) * 2001-02-23 2003-05-21 Formosa Ind Computing Inc Surrounding sound effect system with automatic detection and multiple channels
ES2271654T3 (es) 2002-08-07 2007-04-16 Dolby Laboratories Licensing Corporation Conversion espacial de canales de audio.
EP1566076B1 (en) * 2002-11-20 2011-03-23 Koninklijke Philips Electronics N.V. Audio based data representation apparatus and method
JP3785154B2 (ja) * 2003-04-17 2006-06-14 パイオニア株式会社 情報記録装置、情報再生装置及び情報記録媒体
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
WO2005086139A1 (en) 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding
JP4936894B2 (ja) 2004-08-27 2012-05-23 パナソニック株式会社 オーディオデコーダ、方法及びプログラム
CN101010726A (zh) 2004-08-27 2007-08-01 松下电器产业株式会社 音频解码器、方法以及程序
CN1989563B (zh) * 2005-02-01 2011-06-22 松下电器产业株式会社 再现装置、程序和再现方法
US8050915B2 (en) * 2005-07-11 2011-11-01 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signals using hierarchical block switching and linear prediction coding
KR100619082B1 (ko) * 2005-07-20 2006-09-05 삼성전자주식회사 와이드 모노 사운드 재생 방법 및 시스템
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US20070080485A1 (en) 2005-10-07 2007-04-12 Kerscher Christopher S Film and methods of making film
EP1974347B1 (en) 2006-01-19 2014-08-06 LG Electronics Inc. Method and apparatus for processing a media signal
TWI342718B (en) 2006-03-24 2011-05-21 Coding Tech Ab Decoder and method for deriving headphone down mix signal, receiver, binaural decoder, audio player, receiving method, audio playing method, and computer program
US8712061B2 (en) * 2006-05-17 2014-04-29 Creative Technology Ltd Phase-amplitude 3-D stereo encoder and decoder
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
FR2903562A1 (fr) * 2006-07-07 2008-01-11 France Telecom Spatialisation binaurale de donnees sonores encodees en compression.
WO2008046530A2 (en) * 2006-10-16 2008-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
US8050434B1 (en) * 2006-12-21 2011-11-01 Srs Labs, Inc. Multi-channel audio enhancement system
RU2394283C1 (ru) * 2007-02-14 2010-07-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства для кодирования и декодирования объектно-базированных аудиосигналов
AU2008215231B2 (en) * 2007-02-14 2010-02-18 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
US8290167B2 (en) * 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
TWM346237U (en) * 2008-07-03 2008-12-01 Cotron Corp Digital decoder box with multiple audio source detection function
US8483395B2 (en) 2007-05-04 2013-07-09 Electronics And Telecommunications Research Institute Sound field reproduction apparatus and method for reproducing reflections
US20080298610A1 (en) * 2007-05-30 2008-12-04 Nokia Corporation Parameter Space Re-Panning for Spatial Audio
JP2009077379A (ja) * 2007-08-30 2009-04-09 Victor Co Of Japan Ltd 立体音響再生装置、立体音響再生方法及びコンピュータプログラム
CN101889307B (zh) * 2007-10-04 2013-01-23 创新科技有限公司 相位-幅度3d立体声编码器和解码器
JP2009100144A (ja) * 2007-10-16 2009-05-07 Panasonic Corp 音場制御装置、音場制御方法およびプログラム
EP2258120B1 (en) * 2008-03-07 2019-08-07 Sennheiser Electronic GmbH & Co. KG Methods and devices for reproducing surround audio signals via headphones
US8306233B2 (en) * 2008-06-17 2012-11-06 Nokia Corporation Transmission of audio signals
US8315396B2 (en) * 2008-07-17 2012-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
CA2732079C (en) * 2008-07-31 2016-09-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Signal generation for binaural signals
CN102273233B (zh) * 2008-12-18 2015-04-15 杜比实验室特许公司 音频通道空间转换
EP2214161A1 (en) 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal
JP4788790B2 (ja) * 2009-02-27 2011-10-05 ソニー株式会社 コンテンツ再生装置、コンテンツ再生方法、プログラム、及びコンテンツ再生システム
AU2013206557B2 (en) 2009-03-17 2015-11-12 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
BRPI1004215B1 (pt) 2009-04-08 2021-08-17 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para upmixagem de sinal de áudio downmix utilizando uma atenuação de valor de fase
US8477970B2 (en) * 2009-04-14 2013-07-02 Strubwerks Llc Systems, methods, and apparatus for controlling sounds in a three-dimensional listening environment
KR20100121299A (ko) 2009-05-08 2010-11-17 주식회사 비에스이 다기능 마이크로 스피커
WO2010131431A1 (ja) * 2009-05-11 2010-11-18 パナソニック株式会社 音響再生装置
ES2524428T3 (es) 2009-06-24 2014-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador de señales de audio, procedimiento para decodificar una señal de audio y programa de computación que utiliza etapas en cascada de procesamiento de objetos de audio
TWI413110B (zh) * 2009-10-06 2013-10-21 Dolby Int Ab 以選擇性通道解碼的有效多通道信號處理
EP2326108B1 (en) 2009-11-02 2015-06-03 Harman Becker Automotive Systems GmbH Audio system phase equalizion
WO2011072729A1 (en) 2009-12-16 2011-06-23 Nokia Corporation Multi-channel audio processing
KR101673232B1 (ko) 2010-03-11 2016-11-07 삼성전자주식회사 수직 방향 가상 채널을 생성하는 장치 및 그 방법
WO2011152044A1 (ja) * 2010-05-31 2011-12-08 パナソニック株式会社 音響再生装置
KR102033071B1 (ko) * 2010-08-17 2019-10-16 한국전자통신연구원 멀티 채널 오디오 호환 시스템 및 방법
WO2012031605A1 (en) * 2010-09-06 2012-03-15 Fundacio Barcelona Media Universitat Pompeu Fabra Upmixing method and system for multichannel audio reproduction
US8903525B2 (en) * 2010-09-28 2014-12-02 Sony Corporation Sound processing device, sound data selecting method and sound data selecting program
KR101756838B1 (ko) 2010-10-13 2017-07-11 삼성전자주식회사 다채널 오디오 신호를 다운 믹스하는 방법 및 장치
US20120093323A1 (en) * 2010-10-14 2012-04-19 Samsung Electronics Co., Ltd. Audio system and method of down mixing audio signals using the same
KR20120038891A (ko) 2010-10-14 2012-04-24 삼성전자주식회사 오디오 시스템 및 그를 이용한 오디오 신호들의 다운 믹싱 방법
EP2450880A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
TWI517028B (zh) * 2010-12-22 2016-01-11 傑奧笛爾公司 音訊空間定位和環境模擬
US9313597B2 (en) * 2011-02-10 2016-04-12 Dolby Laboratories Licensing Corporation System and method for wind detection and suppression
EA201370199A1 (ru) 2011-03-04 2014-07-30 СЁД МИЛЛЕНИУМ МЕТАЛС, ЭлЭлСи Композиция алюминий-углерод
WO2012140525A1 (en) * 2011-04-12 2012-10-18 International Business Machines Corporation Translating user interface sounds into 3d audio space
US9031268B2 (en) * 2011-05-09 2015-05-12 Dts, Inc. Room characterization and correction for multi-channel audio
TWI651005B (zh) * 2011-07-01 2019-02-11 杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
TWM416815U (en) * 2011-07-13 2011-11-21 Elitegroup Computer Sys Co Ltd Output/input module for switching audio source and audiovisual playback device thereof
EP2560161A1 (en) 2011-08-17 2013-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Optimal mixing matrices and usage of decorrelators in spatial audio processing
TWI479905B (zh) * 2012-01-12 2015-04-01 Univ Nat Central Multi-channel down mixing device
EP2645749B1 (en) 2012-03-30 2020-02-19 Samsung Electronics Co., Ltd. Audio apparatus and method of converting audio signal thereof
KR101915258B1 (ko) * 2012-04-13 2018-11-05 한국전자통신연구원 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
US9516446B2 (en) * 2012-07-20 2016-12-06 Qualcomm Incorporated Scalable downmix design for object-based surround codec with cluster analysis by synthesis
WO2014036085A1 (en) * 2012-08-31 2014-03-06 Dolby Laboratories Licensing Corporation Reflected sound rendering for object-based audio
RU2635884C2 (ru) * 2012-09-12 2017-11-16 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для предоставления улучшенных характеристик направленного понижающего микширования для трехмерного аудио
KR101407192B1 (ko) * 2012-09-28 2014-06-16 주식회사 팬택 사운드 출력을 제어하는 휴대 단말 및 사운드 출력 제어 방법
US8638959B1 (en) 2012-10-08 2014-01-28 Loring C. Hall Reduced acoustic signature loudspeaker (RSL)

Also Published As

Publication number Publication date
US20160142853A1 (en) 2016-05-19
EP3025518B1 (en) 2017-09-13
US9936327B2 (en) 2018-04-03
AU2014295310B2 (en) 2017-07-13
EP2830335A2 (en) 2015-01-28
AU2014295310A1 (en) 2016-02-11
US20200396557A1 (en) 2020-12-17
JP6227138B2 (ja) 2017-11-08
MX2016000911A (es) 2016-05-05
SG11201600475VA (en) 2016-02-26
EP3258710A1 (en) 2017-12-20
CA2918843C (en) 2019-12-03
BR112016000999B1 (pt) 2022-03-15
CN105556992B (zh) 2018-07-20
ES2729308T3 (es) 2019-10-31
AU2014295309B2 (en) 2016-10-27
EP3025518A2 (en) 2016-06-01
KR20160061977A (ko) 2016-06-01
PT3258710T (pt) 2019-06-25
EP2830335A3 (en) 2015-02-25
BR112016000999A2 (es) 2017-07-25
US11272309B2 (en) 2022-03-08
EP2830332A2 (en) 2015-01-28
KR101858479B1 (ko) 2018-05-16
EP3133840A1 (en) 2017-02-22
AR109897A2 (es) 2019-02-06
CA2918811A1 (en) 2015-01-29
CA2968646A1 (en) 2015-01-29
KR20170141266A (ko) 2017-12-22
CA2918843A1 (en) 2015-01-29
SG10201605327YA (en) 2016-08-30
RU2672386C1 (ru) 2018-11-14
MX2016000905A (es) 2016-04-28
CN107040861A (zh) 2017-08-11
US20190075419A1 (en) 2019-03-07
RU2635903C2 (ru) 2017-11-16
EP3025519B1 (en) 2017-08-23
PL3518563T3 (pl) 2022-09-19
JP6130599B2 (ja) 2017-05-17
TW201513686A (zh) 2015-04-01
SG11201600402PA (en) 2016-02-26
AR096996A1 (es) 2016-02-10
PT3518563T (pt) 2022-08-16
US20160134989A1 (en) 2016-05-12
PT3025519T (pt) 2017-11-21
PL3258710T3 (pl) 2019-09-30
US10798512B2 (en) 2020-10-06
PL3025518T3 (pl) 2018-03-30
CN105556992A (zh) 2016-05-04
EP3518563A2 (en) 2019-07-31
AR116606A2 (es) 2021-05-26
WO2015010962A2 (en) 2015-01-29
EP3518563A3 (en) 2019-08-14
CA2968646C (en) 2019-08-20
EP3133840B1 (en) 2018-07-04
ES2925205T3 (es) 2022-10-14
EP3258710B1 (en) 2019-03-20
CN105556991B (zh) 2017-07-11
EP3025519A2 (en) 2016-06-01
JP2016527805A (ja) 2016-09-08
TW201519663A (zh) 2015-05-16
PT3025518T (pt) 2017-12-18
ES2645674T3 (es) 2017-12-07
WO2015010961A2 (en) 2015-01-29
RU2016105608A (ru) 2017-08-28
JP2016527806A (ja) 2016-09-08
EP2830332A3 (en) 2015-03-11
RU2016105648A (ru) 2017-08-29
PL3133840T3 (pl) 2019-01-31
US10154362B2 (en) 2018-12-11
AR097004A1 (es) 2016-02-10
EP4061020A1 (en) 2022-09-21
PT3133840T (pt) 2018-10-18
CN106804023A (zh) 2017-06-06
BR112016000990A2 (es) 2017-07-25
EP3518563B1 (en) 2022-05-11
TWI562652B (en) 2016-12-11
US10701507B2 (en) 2020-06-30
CN107040861B (zh) 2019-02-05
MX355273B (es) 2018-04-13
AU2017204282A1 (en) 2017-07-13
WO2015010961A3 (en) 2015-03-26
US11877141B2 (en) 2024-01-16
CN106804023B (zh) 2019-02-05
CA2918811C (en) 2018-06-26
PL3025519T3 (pl) 2018-02-28
TWI532391B (zh) 2016-05-01
HK1248439B (zh) 2020-04-09
ZA201601013B (en) 2017-09-27
KR20160034962A (ko) 2016-03-30
MX355588B (es) 2018-04-24
KR101803214B1 (ko) 2017-11-29
RU2640647C2 (ru) 2018-01-10
MY183635A (en) 2021-03-04
BR112016000990B1 (pt) 2022-04-05
WO2015010962A3 (en) 2015-03-26
CN105556991A (zh) 2016-05-04
AU2014295309A1 (en) 2016-02-11
US20210037334A1 (en) 2021-02-04
US20180192225A1 (en) 2018-07-05
ES2649725T3 (es) 2018-01-15
AU2017204282B2 (en) 2018-04-26
KR101810342B1 (ko) 2018-01-18

Similar Documents

Publication Publication Date Title
ES2688387T3 (es) Procedimiento y unidad de procesamiento de señales para mapear una pluralidad de canales de entrada de una configuración de canales de entrada con canales de salida de una configuración de canales de salida
ES2610223T3 (es) Aparato y método para proveer funciones mejoradas de mezcla descendente guiada para audio 3D
ES2773293T3 (es) Aparato y método para la renderización de audio empleando una definición de distancia geométrica
ES2734378T3 (es) Mezcla ascendente espacial controlada por renderizador
TW201521013A (zh) 解碼及編碼下混矩陣之方法、呈現音訊內容之方法、用於下混矩陣之編碼器及解碼器、音訊編碼器及音訊解碼器
BR112016016008B1 (pt) Método para renderizar um sinal de áudio