ES2773623T3 - Aparato y procedimiento para la generación de una pluralidad de canales de audio - Google Patents

Aparato y procedimiento para la generación de una pluralidad de canales de audio Download PDF

Info

Publication number
ES2773623T3
ES2773623T3 ES15700180T ES15700180T ES2773623T3 ES 2773623 T3 ES2773623 T3 ES 2773623T3 ES 15700180 T ES15700180 T ES 15700180T ES 15700180 T ES15700180 T ES 15700180T ES 2773623 T3 ES2773623 T3 ES 2773623T3
Authority
ES
Spain
Prior art keywords
loudspeaker
speaker
installation
imaginary
speakers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15700180T
Other languages
English (en)
Inventor
Christian Borss
Christian Ertel
Johannes Hilpert
Achim Kuntz
Michael Fischer
Florian Schuh
Bernhard Grill
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2773623T3 publication Critical patent/ES2773623T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/308Electronic adaptation dependent on speaker or headphone connection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

Aparato para la generación de una pluralidad de canales de audio (12; 12-1; 12-2) para una primera instalación de altavoz (14; 14-1) que comprende un determinador de altavoz imaginario (18; 18-1) para la determinación de una posición de al menos un altavoz imaginario (22; 22a-d) no contenido en la primera instalación de altavoz (14; 14-1) a fin de obtener una segunda instalación de altavoz (24; 24-1; 24-2; 24-3) que contiene al menos un altavoz imaginario (22; 22a-d) y al menos parcialmente altavoces de la instalación del primer altavoz, donde la posición del al menos un altavoz imaginario (22; 22a-d) es una posición predefinida, se determina de tal manera que las distancias entre los altavoces de la primera y/o la segunda instalación de altavoz (14; 14-1; 24; 24-1; 24-2; 24-3) sean equidistantes o correspondan a un formato de audio o estándar; un calculador de distribución de energía (26; 26-1); un procesador (28; 28-1) configurado para generar una matriz de distribución de energía (D); un renderizador (38; 38-1) para la generación de la pluralidad de canales de audio (12; 12-1; 12-2) usando la información de mezcla descendente (36) para una mezcla descendente desde la segunda instalación de altavoces (24; 24-1; 24-2; 24-3) hasta la primera instalación de altavoces (14; 14-1) caracterizado porque el calculador de distribución de energía (26-1) está configurado para calcular la distribución de energía de cada altavoz en la segunda instalación de altavoz (24; 24-1; 24-2; 24-3) a otros altavoces en la segunda configuración de altavoz (24; 24-1; 24-2; 24-3), donde la distribución de energía representa una cantidad o una parte de la energía de cada altavoz en la segunda instalación de altavoz (24; 24-1; 24-2; 24-3) que se distribuye a los otros altavoces en la segunda instalación de altavoz (24; 24-1; 24-2; 24-3); la matriz de distribución de energía (D) comprende elementos (dxy) que son inferiores o iguales a 1 y que representan la distribución de energía de cada altavoz en la segunda instalación de altavoz (24; 24-1; 24-2; 24-3) a los otros altavoces en la segunda instalación de altavoz (24; 24-1; 24-2; 24-3); y el procesador (28; 28-1) está configurado además para calcular una enésima potencia (Dn) de la matriz de distribución de energía (D), donde la enésima potencia (Dn) de la matriz de distribución de energía (D) conduce los elementos (dxy) que representan la distribución de energía de los altavoces en la segunda instalación de altavoz (24; 24-1; 24-2; 24-3) al menos a un altavoz imaginario (22; 22a-d) que se va a disminuir, donde n es un entero; y para obtener la información de mezcla descendente (36) basada en la enésima potencia (Dn) de la matriz de distribución de energía (D) ignorando los elementos que han disminuido o convergido en un umbral definido.

Description

DESCRIPCIÓN
Aparato y procedimiento para la generación de una pluralidad de canales de audio
[0001] La invención se refiere a un aparato y un procedimiento para la generación de una pluralidad de canales de audio para una instalación de altavoces.
[0002] El hardware y software de codificación y decodificación de audio espacial son bien conocidos en la técnica, y son, por ejemplo, estandardizados en el estándar MPEG-Surround Standard (Estándar Envolvente del Grupo de Expertos en Imágenes en Movimiento). Los sistemas de audio espacial comprenden una cantidad de altavoces y respectivos canales de audio, por ejemplo, un canal izquierdo, un canal central, un canal derecho, un canal envolvente izquierdo, un canal envolvente derecho y un canal de mejoramiento de baja frecuencia. Cada uno de los canales habitualmente es reproducido por un respectivo altavoz. La colocación de los altavoces en la instalación de salida típicamente es fija, y es, por ejemplo, dependiente de un formato 5.1, un formato 7.1 o similar. Según el respectivo formato, se define una posición del altavoz. Algunas instalaciones definen una posición de altavoz sobre una posición del oyente. Este altavoz además es referido como una “Voz de Dios” (VoG, conforme a sus siglas en inglés). Algunos formatos podrían definir también un altavoz con una posición debajo del oyente. Respectivamente, este altavoz puede ser referido como “Voz del Infierno” (VoH, conforme a sus siglas en inglés). Para la generación de los canales de audio que definen las señales de audio para los altavoces de la instalación de altavoces, puede usarse un procedimiento de panning (envío de una señal de sonido en un medio estéreo o multicanal) de amplitud de base de vector (VBAP, conforme a sus siglas en inglés). VBAP utiliza un conjunto de vectores unitarios N h, ..., I n que apuntan a los altavoces del conjunto de altavoces. En el caso de que el conjunto de altavoces esté configurado para reproducir una escena acústica tridimensional, el grupo de altavoces se denota como un conjunto de altavoces 3D. Una dirección de panning proporcionada por un vector de unidad cartesiana p es definida por una combinación lineal de dichos vectores de altavoces.
Figure imgf000002_0001
donde g ndenota el factor de escala que se aplica a l n . En Ü3, se forma un espacio de vector mediante 3 bases de vector. En consecuencia, (1) puede ser resuelto generalmente por una inversión de matriz, si el número de altavoces activos y, por lo tanto, el número de factores de escala no cero, se limita a 3. En la práctica, esto se realiza definiendo una red de triángulos entre los altavoces, y mediante la selección de aquellos tripletes para el área en medio. Esto puede conducir a una solución para los factores de escala que se va a aplicar en términos de:
Figure imgf000002_0002
donde { n . , n 2, n 3} denota el triplete activo de altavoz. Finalmente, una normalización, que garantiza las señales de salida normalizadas por potencia, logra las ganancias de panning finales a 1, ..., aN:
Figure imgf000002_0003
[0003] El renderizador de objeto incluido en el decodificador MPEG-H utiliza VBAP para renderizar objetos de audio para una configuración determinada de altavoz. Si una instalación de altavoz no incluye un altavoz T0 (“Voz de Dios”), como una instalación de altavoz 9.1, entonces los objetos con una elevación mayor que 35° con respecto a una posición del oyente son limitados a una elevación de 35°, el ángulo de elevación por defecto de los altavoces superiores. Aunque es una solución práctica, esta solución claramente no es óptima, ya que puede cambiar una escena acústica reproducida.
[0004] En una instalación de altavoz 9.1, es decir, una instalación de altavoz según el formato 9.1, la alternativa de dividir el hemisferio superior en dos triángulos logrará una asimetría, y un objeto directamente sobre el oyente será reproducido a continuación por dos altavoces opuestos. En consecuencia, un objeto de audio que, por ejemplo, se mueve de la derecha frontal superior a la izquierda posterior superior sonará de manera diferente que si se moviera de la izquierda frontal superior hacia la derecha posterior superior a pesar de la simetría de la instalación de altavoz. Una solución para este dilema es usar el panning a modo de N, donde todos los altavoces superiores están involucrados para los objetos en el hemisferio superior. La extensión del panning VBAP desde tres altavoces hasta N altavoces se denomina panning a modo de N. Una relación de proximidad puede ser proporcionada por un gráfico que es especificado por los bordes de los triángulos que serán calculados, por ejemplo, por un decodificador de MPEG. Los triángulos pueden obtenerse, por ejemplo, formando uno o más poliedros con N vértices. Un vértice puede ser formado por un altavoz. Los triángulos pueden ser formados a partir de las superficies exteriores de los poliedros.
[0005] El procedimiento de panning VBAP requiere una apropiada triangulación para todos los ángulos sólidos. En el soporte lógico de referencia actual MPEG-H 3D, la triangulación es precalculada y proporcionada en una forma tabulada para una cantidad fija de instalaciones de altavoces. Esto actualmente limita las instalaciones de altavoces soportadas a las instalaciones determinadas, o instalaciones que difieren solo por pequeños desplazamientos.
[0006] Los formatos de audio que definen posiciones de altavoces guían al usuario, por ejemplo, el oyente, a colocar los altavoces en dichas posiciones definidas. Tales requisitos pueden ser difíciles de cumplir, por ejemplo, en los casos donde los altavoces son definidos para ser dispuestos alrededor de un oyente como un círculo, o sobre un recorrido circular. Algunos usuarios, en especial, los usuarios que viven en pisos, requieren la adaptación de dichas instalaciones, ya que una sala de estar con la instalación de altavoces es rectangular en lugar de circular, y los usuarios prefieren ubicar los altavoces cerca de las paredes, en lugar de en el medio de una habitación.
[0007] Por lo tanto, por ejemplo, existe la necesidad de conceptos de decodificación de audio, que permitan una instalación de altavoces más flexible.
[0008] Es un objetivo de la presente invención proporcionar un concepto para un aparato y un procedimiento para la codificación de audio más flexibles.
Este objetivo es resuelto por el objeto del asunto de las reivindicaciones independientes.
[0010] Otras modificaciones convenientes de la presente invención son el objeto de las reivindicaciones dependientes.
[0011] Las realizaciones de la presente invención se refieren a un aparato según la reivindicación 1.
[0012] Los inventores han hallado que, mediante la determinación de las posiciones de altavoces virtuales, es decir, imaginarios, los datos de audio tales como datos de audio 3D de una película formateada para un formato definido, pueden ser procesados como si la instalación real (primera instalación) coincidiera con una configuración definida con respecto a una cantidad de altavoces y/o posiciones de los altavoces. Para el control de los altavoces reales, la segunda instalación imaginaria es mezclada descendentemente según la distribución de energía, de tal modo que la primera instalación (aquella implementada en la realidad) puede ser controlada como si fuera la segunda instalación (aquella definida por un formato, por ejemplo).
[0013] Esto permite una adaptación de canales de audio definidos por el respectivo formato, por ejemplo, a una instalación real de altavoces implementados en el hogar de un oyente.
[0014] El procesador está configurado para generar una matriz de distribución de energía sobre la base de la distribución de energía. Los elementos de la matriz de distribución de energía pueden representar la distribución de energía del altavoz imaginario a otro altavoz. El procesador está configurado para calcular una potencia de la matriz de distribución de energía. Una potencia de la matriz de distribución de energía conduce a los elementos de la matriz obtenida a disminuir o converger hacia un umbral definido de tal modo que dichos elementos puedan ser ignorados para el procesamiento posterior. Como resultado, se obtiene una información de mezcla descendente sobre la base de la potencia de la matriz de distribución de energía. La información de mezcla descendente indica la manera de controlar los altavoces de la primera instalación de altavoces, que simula la segunda instalación de altavoces.
[0015] Otras realizaciones de la presente invención se refieren a un aparato que además comprende un calculador de distribución de energía que comprende un estimador de proximidad. El estimador de proximidad está configurado para determinar al menos un altavoz que está próximo al altavoz imaginario. El calculador de distribución de energía está configurado para calcular la distribución de energía del altavoz imaginario al menos a un vecino del altavoz imaginario.
[0016] Mediante la determinación del vecino de un altavoz imaginario, el respectivo altavoz imaginario puede disponerse en cualquier ubicación, de tal modo que la segunda instalación de altavoz pueda estar configurada para ser implementada según una instalación predefinida, tal como un cierto formato. Un beneficio adicional es que la pluralidad de canales de audio pueden ser generados para una primera instalación de altavoz variable, cuando se repite la estimación de proximidad. De este modo, la misma instalación real de altavoz puede, por ejemplo, ser adaptada para reproducir una señal de multicanal 5.1 en un momento, y una señal de multicanal 7.1, en otro momento.
[0017] Otras realizaciones se refieren a un aparato donde el estimador de proximidad está configurado para determinar al menos dos altavoces que son vecinos del altavoz imaginario, y donde el calculador de distribución de energía está configurado para calcular la distribución de energía, de tal modo que la distribución de energía entre los al menos dos altavoces vecinos del altavoz imaginario es igual, es decir, la energía es distribuida de manera uniforme, dentro de una tolerancia predefinida. La tolerancia predefinida puede ser, por ejemplo, una desviación de 0,1%, 1% o 10% de un valor distribuido uniforme.
[0018] Mediante el cálculo de una energía distribuida de manera uniforme entre los vecinos, puede garantizarse una convergencia de la potencia de la matriz de distribución de energía, de tal modo que puede obtenerse un resultado único de la información de mezcla descendente.
[0019] Otras realizaciones de la presente invención se refieren a un aparato, donde el estimador de proximidad está configurado para determinar al menos dos altavoces que son vecinos del altavoz imaginario, y donde al menos uno de los al menos dos altavoces que son vecinos del altavoz imaginario es un altavoz imaginario. Una ventaja es que la información de mezcla descendente puede obtenerse incluso si la primera instalación de altavoz difiere por más de un altavoz de la segunda instalación de altavoz.
[0020] Otras realizaciones de la presente invención se refieren a un aparato, donde el aparato es parte de una unidad de conversión de formato de un decodificador de audio, de tal modo que una cantidad de canales proporcionados por el decodificador de audio, por ejemplo, para el control de la primera instalación de altavoz, es mezclada descendentemente, de un número más alto o máximo (por ejemplo, un número máximo soportado por un estándar tal como MPEG-H) de canales de audio, a un formato respectivo de un número realmente presente de altavoces.
[0021] Otras realizaciones se refieren a un aparato donde el aparato es parte de un renderizador de objetos de un decodificador de audio, y donde el aparato comprende un instrumento de panning de tal modo que el renderizador de objetos es adaptado para proporcionar una cantidad de canales de audio según la primera instalación de altavoces.
[0022] Otras realizaciones se refieren a un aparato donde el aparato está configurado para proporcionar una información de validez de la primera instalación de altavoz.
[0023] Una ventaja de esta realización es que el aparato respectivamente a la información de validez puede indicar si la primera instalación de altavoz, por ejemplo, implementada por un usuario, por ejemplo, en el hogar, puede ser proporcionada con canales de audio apropiados o, por ejemplo, si los altavoces deben ser recolocados para cumplir con los requisitos tales como la tolerancia de una posición de altavoz.
[0024] Otras realizaciones se refieren a un sistema de audio que comprende un aparato para la generación de una pluralidad de canales de audio para una instalación de altavoces, y una pluralidad de altavoces según la pluralidad de canales de audio proporcionada por el aparato.
[0025] Una ventaja de la realización es que un sistema de audio, por ejemplo, para la implementación de una escena acústica 3D, puede ser implementado.
[0026] Otras realizaciones de la presente invención se refieren a un procedimiento para la generación de la pluralidad de canales de audio para la primera instalación de altavoz y para un programa informático.
[0027] Las realizaciones de la presente invención se describirán en más detalle con referencia a las figuras adjuntas, en las cuales:
la Fig. 1 muestra un diagrama de bloques esquemático de un aparato para la generación de una pluralidad de canales de audio para una primera instalación de altavoz según una realización de la presente invención;
la Fig. 2 muestra un diagrama esquemático de una segunda instalación de altavoz ejemplar que comprende altavoces reales que forman una primera instalación de altavoces y altavoces imaginarios según una realización de la presente invención;
la Fig. 3 muestra un diagrama esquemático del segundo altavoz de la Fig. 2 proyectado en un plano bidimensional en una vista en perspectiva desde arriba;
la Fig. 4a muestra una vista en perspectiva de la primera instalación de altavoces 14-1 con respecto a la posición 42 según una realización de la presente invención;
la Fig. 4b muestra una vista superior de la configuración de la Fig. 4a;
la Fig. 5a muestra una vista en perspectiva esquemática de la primera instalación de altavoz de la Fig. 4a con altavoces imaginarios adicionales que forman una forma circular que forma una segunda instalación de altavoz según una realización de la presente invención;
la Fig. 5b muestra una vista superior sobre el escenario de la Fig. 5a y representa la forma redonda del círculo 48; la Fig. 6 muestra una vista en perspectiva sobre una segunda instalación de altavoz que comprende la primera instalación de altavoz y los altavoces imaginarios. Una posición de un altavoz imaginario se ubica en una superficie de esfera de cálculo según una realización de la presente invención;
la Fig.7 muestra el diagrama esquemático de la segunda instalación de altavoz según la Fig. 2 donde se representa una capa que es ortogonal a una capa plana para clarificar relaciones de proximidad de altavoces según una realización de la presente invención;
la Fig. 8 muestra un diagrama esquemático de bloques de un decodificador de audio tal como puede usarse para la decodificación de señales MP4 a fin de obtener una pluralidad de señales de audio que representan dos opciones para un aparato según una realización de la presente invención;
la Fig. 9 muestra un diagrama de bloques esquemático del aparato referenciado como la opción 1 en la Fig. 8; la Fig. 10 muestra un diagrama esquemático de bloques del bloque de conversión de formato 1720 referenciado como la opción 2 en la Fig.8; y
la Fig. 11 muestra un diagrama de bloques esquemático de un sistema de audio.
[0028] Los elementos iguales o equivalentes con igual o equivalente funcionalidad se denotan en la siguiente descripción mediante números de referencia iguales o equivalentes, incluso si aparecen en diferentes figuras.
[0029] En la siguiente descripción, se exponen una cantidad de detalles a fin de proporcionar una explicación completa de las realizaciones de la presente invención. Sin embargo, será evidente para los expertos en la materia que las realizaciones de la presente invención pueden ser llevadas a la práctica sin estos detalles específicos. En otros casos, se muestran estructuras y dispositivos bien conocidos en forma de diagrama de bloques, en lugar de en detalle, a fin de evitar el oscurecimiento de las realizaciones de la presente invención. Además, los rasgos de las diferentes realizaciones que se describen a continuación pueden combinarse entre sí, a menos que se observe específicamente lo contrario.
[0030] La Fig. 1 muestra un diagrama de bloques esquemático de un aparato 10 para la generación de una pluralidad de canales de audio 12 para una primera instalación de altavoz 14. La primera instalación de altavoces 14 comprende una cantidad de altavoces 16a-c. Los altavoces 16a-c pueden ubicarse, por ejemplo, en una habitación de audición, y pueden ser parte de un sistema de reproducción, por ejemplo, como parte de un cine o una aplicación de cine en casa. La primera instalación de altavoz 14 sí existe en la realidad. El aparato 10 comprende un determinador de altavoz imaginario 18 para la determinación de una posición de un altavoz imaginario 22 no contenido en la primera instalación de altavoces 14. El determinador de altavoz imaginario 18 está configurado para obtener una segunda instalación de altavoz 24 que contiene el altavoz imaginario 22. La segunda instalación de altavoz 24 comprende algunos o la totalidad de los altavoces 16a-c de la primera instalación de altavoces 14. El determinador de altavoz imaginario 18 puede estar configurado para determinar la posición del altavoz imaginario 22 de tal modo que el altavoz imaginario se ubica en una posición según una posición definida por un formato donde un altavoz debe estar ubicado, pero, en realidad, no lo está. La determinación realizada por el determinador de altavoz imaginario 18 puede ser controlada, de tal modo que la cantidad de altavoces co-apropiados por las instalaciones 14 y 24, o co-ubicados en ellas, se maximiza, o de tal modo que la media de distancia entre los altavoces vecinos más cercanos de las dos instalaciones 14 y 24 sea minimizada, o pueda ser controlable de forma manual por el usuario.
[0031] El aparato 10 comprende un calculador de distribución de energía 26 para el cálculo de una distribución de energía desde el altavoz imaginario 22 hasta los otros altavoces en la segunda instalación de altavoz. De forma alternativa o adicional, el determinador de altavoz imaginario 18 puede estar configurado para determinar la posición del altavoz imaginario 22 de tal modo que el altavoz imaginario 22 se ubica cerca de un altavoz 16a-c “desplazado”, de manera que el altavoz imaginario puede corregir el efecto acústico resultante del desplazamiento.
[0032] Cuando, por ejemplo, la primera instalación de altavoz 14 implementa parcialmente una configuración de altavoz o una instalación de altavoz según un formato de audio tal como 5.1, 7.1, 9.1, 11.2 o similar, el altavoz imaginario 22 puede ser un altavoz que falta en la primera instalación de altavoces 14 con respecto al formato que va a ser implementado.
[0033] La distribución de energía representa una cantidad o una porción de la energía del altavoz imaginario 22 que es distribuida hasta los otros altavoces en la segunda instalación de altavoz 24. En otras palabras, la distribución de energía representa la energía del altavoz imaginario 22 cuando se comparte entre el resto de los altavoces de la segunda instalación de altavoz 24.
[0034] El aparato 10 comprende además un procesador 28. El procesador 28 está configurado para repetir la distribución de energía indicada por el bloque 32 a fin de obtener una información de mezcla descendente 36 como es indicado por M en el bloque 34. La información de mezcla descendente puede usarse para la mezcla descendente de canales de audio de la segunda instalación de altavoz 24 a la primera instalación de altavoz 14. En otras palabras, la información de mezcla descendente 36 permite el control de los altavoces 16a-c de la primera instalación de altavoces 14 para obtener una escena acústica que, al menos de forma parcial, se obtiene cuando el altavoz imaginario 22 es un altavoz real.
[0035] El aparato 10 comprende un renderizador 38 para la generación de la pluralidad de canales de audio 12 usando la información de mezcla descendente 36. El renderizador 38 está configurado para aplicar la información de mezcla descendente 38 a una señal de entrada, o un grupo de señales de entrada 39, por ejemplo, una cantidad de canales de audio que corresponden a, o están dedicados a ser reproducidos por la segunda instalación de altavoz 24. El renderizador 38 está configurado para obtener una mezcla descendente 36 de la segunda instalación de altavoz 24 a la primera instalación de altavoz 14 mediante el uso de la información de mezcla descendente 36. En otras palabras, el renderizador 38 está configurado para determinar la pluralidad de canales de audio 12 mediante la mezcla descendente de canales de audio 39 (imaginarios) de una instalación imaginaria 24 a canales de audio 12 reales para la primera instalación 14 real.
[0036] Una ventaja de esta realización es que una escena acústica puede ser generada al menos de forma parcial por los altavoces 16a-c, que se obtendría cuando los altavoces 16a-c coinciden con una instalación más extensa. De este modo, una escena acústica de un formato, por ejemplo, un formato 3D, puede realizarse, incluso si faltan uno o más altavoces, por ejemplo, los altavoces envolventes, en la primera configuración de altavoz real 14.
[0037] Una tarea que debe ser resuelta con el aparato 10 puede ser, por ejemplo, una renderización de objetos de audio 3D en configuraciones de altavoces arbitrarias, incluso si son configuraciones 3D inválidas con respecto a un cierto formato. Aunque mediante el uso de altavoces imaginarios no se produce sonido desde direcciones que no comprenden altavoz real, se proporciona una solución determinista para el control de los altavoces (por ejemplo, automáticamente) que puede considerarse una solución razonable. Por ejemplo, esto es aplicable en el caso en el que se reproduce un canal izquierdo envolvente con una mayor parte a través del canal izquierdo frontal, a continuación, a través del canal derecho frontal, cuando el altavoz izquierdo envolvente no está presente. Por lo tanto, el aparato y el procedimiento presentados son adecuados para MPEG-H en términos de una solución alternativa.
[0038] De forma alternativa o adicional, una cantidad de al menos un altavoz imaginario adicional de la segunda instalación de altavoz 24 y/o posiciones del altavoz imaginario 22 y/o el altavoz imaginario adicional pueden determinarse según una posición predefinida que puede estar contenida, por ejemplo, en una forma tabular o una base de datos. De forma alternativa o adicional, la posición del altavoz imaginario 22 y/o de al menos un altavoz imaginario adicional puede ser determinada de tal modo que las distancias entre los altavoces de la primera o la segunda instalación de altavoz 14 y/o 24 sean sustancialmente equidistantes o correspondan a un formato de audio o estándar.
[0039] En otras palabras, el aparato 10 comprende los siguientes componentes para el uso de un instrumento de panning VBAP o un procedimiento de panning comparable:
1. Un componente que determina posiciones de altavoces que faltan o requeridas.
2. Un componente que determina vecinos de dichos altavoces imaginarios.
3. Un componente que realiza una mezcla descendente usando el procedimiento de “distribución de energía” y que, como opción, realiza una normalización de energía.
[0040] En otras palabras, por ejemplo, si una escena acústica, por ejemplo, almacenada en un almacenamiento de datos, tal como un CD, comprende seis canales de audio, y la primera instalación de altavoz comprende 2 altavoces, el aparato puede estar configurado para determinar los altavoces que faltan.
[0041] La “matriz de distribución de energía” M puede considerarse una contribución sustancial, y define la distribución de la respectiva energía a los respectivos vecinos. No se requiere que la matriz de distribución de energía contenga columnas con valores constantes. Como una alternativa, una implementación con otros valores también es posible. Puede preferirse definir los valores de una columna de tal modo que los valores puedan ser sumados a un valor de 1. Una base para la matriz de distribución de energía puede ser, por ejemplo, el gráfico de distribución de energía que se representa en la Fig. 3.
[0042] La Fig. 2 muestra un diagrama esquemático de una segunda instalación de altavoz ejemplar 24-1 que comprende los altavoces 16a y 16b que forman una primera instalación de altavoces 14-1. La segunda instalación de altavoz 24-1 comprende cuatro altavoces imaginarios 22a-d. La segunda instalación de altavoz 24-1 puede ser un resultado determinado por un determinador de altavoz imaginario que puede ser el determinador de altavoz imaginario 18 y puede ser una posible instalación de altavoz para la reproducción de una escena acústica 3D con respecto a una posición 42 de un oyente. Cuando la primera instalación de altavoz 14-1 es, por ejemplo, una configuración estéreo, por ejemplo, en una pared frontal con respecto a la posición 42, el altavoz 16a puede ser denotado como un altavoz izquierdo, y el altavoz 16b, como un altavoz derecho de la configuración estéreo. El determinador de altavoz imaginario puede estar configurado para implementar un preestablecimiento, tal como un formato de audio. Cuando las posiciones de los altavoces 16a y 16b coinciden con posiciones predefinidas del formato de audio, posiblemente, dentro de un intervalo de tolerancia, entonces el determinador de altavoz imaginario puede estar configurado para determinar posiciones de los altavoces imaginarios 22a-d al hacer coincidir las ubicaciones de los altavoces 16a y 16b con las ubicaciones predefinidas. Las ubicaciones no ocupadas por los altavoces 16a y 16b pueden ser determinadas como ubicaciones de los altavoces imaginarios 22a-d. Una tolerancia puede ser un valor absoluto tal como 5 cm, 50 cm o 5 m, o un valor relativo tal como 1%, 10% o 30% del espacio de la primera o segunda instalación de altavoz 14­ 1 o 24-1.
[0043] La segunda instalación de altavoz 24-1 puede comprender un altavoz superior imaginario (Voz de Dios - VoG) 22a, un altavoz inferior que se ubica debajo de la posición 42 (Voz del Infierno - VoH) 22b, un altavoz izquierdo envolvente (SL, conforme a sus siglas en inglés) imaginario 22c y un altavoz derecho envolvente (SR, conforme a sus siglas en inglés) imaginario 22d. Los altavoces imaginarios 22a-d se marcan con una “I”. Alternativamente, la primera y/o la segunda instalación de altavoz 14-1 y/o 24-1 pueden comprender un número diferente de altavoces reales o imaginarios 16a-b y/o 22a-d. Los altavoces reales y/o imaginarios pueden ubicarse en ubicaciones que difieren de las representadas.
[0044] Por ejemplo, las instalaciones envolventes planas, por ejemplo, instalaciones sin un altavoz de Voz de Dios y Voz del Infierno, pueden definirse con todos los altavoces dentro de una capa plana 44. Debido a circunstancias tales como el carácter de la sala de audición, o, por ejemplo, la presencia de otros objetos, tales como una pantalla de TV o una ventana, los altavoces 16a, 16b y/o 22c-d pueden ubicarse además dentro de una tolerancia descrita por una capa superior 46a y/o una capa inferior 46b que definen una limitación superior y/o inferior de una tolerancia en la cual pueden ubicarse los altavoces 16a, 16b y/o 22c y 22d. Las capas 46a y 46b pueden ser definidas, por ejemplo, por un ángulo máximo con respecto a la posición 42 a los altavoces 16a/16b y/o 22c y 22d. Por ejemplo, los altavoces 16a y 16b pueden comprender, independientemente, un ángulo a inferior o igual a 5 grados, inferior o igual a 10 grados, inferior o igual a 20 grados o inferior o igual a 45°. Los altavoces 16a y 22c se disponen en la capa 44, el altavoz 16b se dispone en la capa 46a, el altavoz 22d se dispone en la capa 46b. De forma alternativa o adicional, los altavoces pueden disponerse entre las capas 46a y 44 y/o entre 44 y 46b. En otras palabras, la primera y/o segunda instalación de altavoces 14-1 y/o 24-1 pueden disponerse en capas diferentes también cuando se refieren como instalaciones planas.
[0045] El altavoz imaginario 22b (VoH) se ubica directamente bajo la posición 42. El altavoz imaginario 22a (VoG) se dispone dentro de un hemisferio superior definido por un espacio sobre la posición 42. El altavoz imaginario 22a se ubica enfrente de la posición 42 con respecto a los altavoces frontales 16a y 16b. En otras palabras, y con respecto a la posición 42, el altavoz imaginario 22a se dispone en un primer lateral de un plano geométrico (capa 44), y el altavoz imaginario 22b se dispone a lo largo de un segundo lateral del plano geométrico opuesto al primer lateral del plano geométrico. El plano geométrico puede estar configurado para separar una proximidad de altavoces. Por ejemplo, los altavoces 16a, 16b, 22c y 22d son vecinos de los altavoces imaginarios 22a y 22b (y viceversa). Separados por el plano geométrico (capa 44) que incluye las limitaciones 46a y 46b, los altavoces imaginarios 22a y 22b pueden describirse como “no vecinos”.
[0046] Las flechas entre los altavoces imaginarios 22a-d representan una posible distribución de energía desde los altavoces imaginarios 22a-d hacia altavoces adyacentes de la segunda instalación 24-1 que son vecinos de los respectivos altavoces 22a-d. La distribución de energía es realizada por un calculador de distribución de energía tal como el calculador de distribución de energía 26. En otras palabras, la energía de cada uno de los altavoces imaginarios 22a-d es distribuida hacia y entre los respectivos vecinos de cada uno de los altavoces imaginarios 22ad. Un diagrama esquemático de los altavoces proyectados en un plano bidimensional se representa en la siguiente Fig. 3.
[0047] La Fig. 3 muestra un diagrama esquemático de la segunda instalación de altavoz 24-1 que incluye la primera instalación 14-1 proyectada en un plano bidimensional en una vista en perspectiva desde arriba. La Fig. 3 representa los vecinos de cada uno de los altavoces imaginarios 22a-d por medio de una conexión mediante errores que indican la distribución de energía desde cada uno de los altavoces imaginarios 22a-d hacia sus vecinos. Los vecinos de los altavoces imaginarios pueden ser determinados por un estimador de proximidad que puede ser parte de un calculador de distribución de energía tal como el calculador de distribución de energía 26 o, por ejemplo, puede ser parte de un determinador de altavoz imaginario tal como el determinador de altavoz imaginario 18. Alternativamente, el estimador de proximidad puede disponerse entre el determinador de altavoz imaginario y el calculador de distribución de energía.
[0048] El altavoz izquierdo envolvente imaginario (SL) 22c tiene cuatro vecinos: el altavoz izquierdo frontal (FL, conforme a sus siglas en inglés) 16a, el altavoz VoG 22a, el altavoz derecho envolvente (SR) 22d y el altavoz VoH 22b. La energía de cada uno de los altavoces imaginarios 22a-d se distribuye desde los altavoces imaginarios 22a-d hasta sus vecinos, donde la distribución de energía puede ser representada por los coeficientes de distribución de energía dxy donde x indica la fuente de la energía distribuida, e y indica el altavoz receptor de la energía distribuida. El altavoz izquierdo frontal 16a es denotado con el índice 1, el altavoz derecho frontal es denotado con el índice 2, el altavoz VoG 22a es denotado con el índice 3, el altavoz VoH 22b es denotado con el índice 4, el altavoz izquierdo envolvente 22c es denotado con el índice 5 y el altavoz derecho envolvente 22d es denotado con 6.
[0049] Cada uno de los coeficientes de distribución de energía dxy puede ser determinado independientemente por el calculador de distribución de energía. Según una realización, los coeficientes de distribución de energía son determinados o calculados según una distancia entre dos altavoces adyacentes. Según una realización alternativa, la distribución de energía, y por lo tanto, los coeficientes de distribución de energía dxy se calculan uniformemente distribuidos. Como cada uno de los altavoces imaginarios 22a-d tiene cuatro vecinos dentro de la instalación ejemplar, esto puede lograr coeficientes de distribución de energía iguales de %, por ejemplo.
[0050] En otras palabras, iniciado a partir de este gráfico de proximidad, puede construirse un gráfico dirigido ponderado que puede ser denotado como gráfico de distribución de energía. Los pesos, es decir, los coeficientes de distribución de energía dxy de este gráfico, describen la porción de energía de sonido que se redistribuye desde los nodos imaginarios (altavoz) 22a-d hasta sus vecinos.
[0051] Un calculador de distribución de energía, por ejemplo, el calculador de distribución de energía 26 representado en la Fig. 1, puede estar configurado para distribuir los coeficientes de distribución de energía en una matriz de distribución de energía, por ejemplo, denotada como D. Según el gráfico de proximidad descrito con anterioridad, los altavoces están ejemplarmente distribuidos por el orden FL, FR, VoG, VoH, SL, SR. La matriz de distribución de energía resultante D puede formarse como:
Figure imgf000008_0001
0 0 0. 25 0. 25 0 0.25
-0 0 0.25 0.25 0.25 0
donde una cantidad de columnas y filas corresponden a los índices 1-6. La instalación estéreo representada en la primera instalación de altavoz 14-1 puede ser transformada en una instalación de altavoz 3D válida, mediante la adición de los altavoces imaginarios 22a-d.
[0052] Los índices dxy se establecen para este ejemplo en % y, en consecuencia, 0,25. Cuando se considera la tercera columna de la matriz D que representa el altavoz imaginario 22a que es un vecino de los altavoces 16a, 16b, 22c y 22d con los índices 1, 2, 5 y 6, la matriz D muestra valores de 0,25 en las líneas 1, 2, 5 y 6.
[0053] Alternativamente, los vecinos de los altavoces imaginarios pueden ser definidos por los bordes de la triangulación que pueden obtenerse a partir de la envolvente convexa. En el caso de una instalación envolvente plana completa, todos los vecinos de los altavoces imaginarios son altavoces existentes, y la correspondiente columna de la matriz de mezcla descendente puede tener valores constantes 1 /V Ñ para cada vecino donde N denota el número de vecinos.
[0054] La distribución de energía puede usarse, por ejemplo, para calcular la manera en que un altavoz imaginario 22a-d que no se presenta en la instalación de altavoz real, puede ser compensado por otros altavoces.
[0055] Un procesador de un aparato según una realización, por ejemplo, el procesador 28, está configurado para repetir la distribución de energía. El procesador está configurado para repetir la distribución de energía, como los altavoces imaginarios, por ejemplo, 22c-d, pueden ser calculados para la compensación parcial del altavoz imaginario 22a, es decir, la energía del altavoz imaginario 22a es asignada o reasignada parcialmente a los altavoces imaginarios 22c-d y a los altavoces reales 16a y 16b. La energía asignada o reasignada a los altavoces imaginarios 22c-d es redistribuida, por ejemplo, por el procesador 28, a sus vecinos, de tal modo que mediante la repetición de la distribución de energía, la energía de los altavoces imaginarios 22a-d es asignada o reasignada a los altavoces reales 16a y 16b. Esto significa que los altavoces imaginarios 22c-d “reciben” energía del altavoz imaginario 22a, que debe ser redistribuida.
[0056] La repetición puede ser realizada, por ejemplo, mediante el cálculo de una potencia de matriz D. El procesador 28 está configurado a fin de obtener una información de mezcla descendente para una mezcla descendente de la segunda instalación de altavoz 24-1 a la primera instalación de altavoz 14-1. Para obtener la información de mezcla descendente, el procesador puede estar configurado para calcular una raíz cuadrada (operador-sqrt [raíz cuadrada]) de la potencia n de D, que puede expresarse mediante:
M = sqrt(Dn) , ( 5 )
donde D denota la matriz de distribución de energía con los pesos de distribución dxy como elementos; n denota el número de iteraciones, es decir, repeticiones, y sqrt(^) denota la raíz cuadrada a modo de elemento y M denota un resultado, que puede ser denotado como matriz de mezcla descendente.
[0057] Por ejemplo, después de 20 iteraciones, es decir, repeticiones, y, por lo tanto, n = 20, esto puede lograr la siguiente matriz de mezcla descendente:
i 0 0.707 0.707 0.775 0.632
0 1 0.707 0.707 0.632 0.775
Figure imgf000009_0001
M / 0 0 í) 0 0 -
donde las líneas 3, 4, 5 y 6 comprenden valores de 0, donde los valores han sido redondeados de forma descendente. Las líneas 1 y 2 representan la información para los altavoces con índice 1 (16a) e índice 2 (16b) cuando se opera de tal modo que se emula una presencia de los altavoces imaginarios 22a-d.
[0058] En otras palabras, estableciendo los coeficientes de distribución de energía dxy en la inversa del número de vecinos, se logra la preservación de energía, y al mismo tiempo, puede garantizarse la convergencia del algoritmo.
[0059] El procesador puede estar configurado para determinar la potencia n de la matriz de distribución de energía D para un valor fijo de n. Alternativamente, el procesador puede estar configurado para calcular iterativamente la potencia de D. El procesador, por ejemplo, puede estar configurado para multiplicar D con D y, más tarde, multiplicar el resultado con D, etc., para obtener iterativamente una potencia en crecimiento iterativo de D y aplicar a continuación el operador-sqrt. Cuando se calcula la potencia de la matriz de distribución de energía para una dimensión fija de la potencia, puede obtenerse una reproducibilidad de diferentes segundas instalaciones de altavoces, que incluyen la resultante información de mezcla descendente. Alternativamente, cuando se calcula iterativamente la potencia de la matriz de distribución de energía D, los elementos de la matriz resultante o el resultado del operador-sqrt pueden compararse, por ejemplo, contra un cierto valor de umbral, y en el caso de que los elementos estén por debajo de este cierto valor de umbral, los valores pueden establecerse en cero. El valor de umbral puede ser, por ejemplo, 0,05, 0,1 ó 0,2, o cualquier otro valor adecuado. Tal procedimiento puede conducir a un tiempo computacional más corto, y a un menor esfuerzo computacional, ya que el procedimiento puede ser detenido en cuanto se logre un resultado apropiado.
[0060] En otras palabras, el cálculo de la potencia n de la matriz de distribución de energía puede ser implementado por una aplicación de la distribución de energía para n veces. La raíz cuadrada cambia los valores de energía a valores de atenuación, que pueden ser aplicados a los valores de señales en términos de coeficientes de mezcla descendente. La iteración, implementada por el cálculo de la potencia de la matriz de distribución de energía, puede dirigirse a un resultado en el cual todas las líneas que corresponden a altavoces imaginarios se convierten a 0.
[0061] En otras palabras, en cada etapa de iteración, el algoritmo implementado por el procesador es adaptado para redistribuir aquellas porciones de energía según los pesos proporcionados. Esto se repite hasta que la cantidad total de energía de los nodos imaginarios es inferior al umbral determinado. La raíz cuadrada de los nodos que recogen la energía redistribuida para los altavoces existentes finalmente produce los elementos de la matriz de mezcla descendente M. Un renderizador, que puede ser el renderizador 38, puede estar configurado para aplicar la información de mezcla descendente, tal como la matriz de mezcla descendente M y/o la información de mezcla descendente 39 para la mezcla descendente de un número más alto de canales de audio a una cantidad de altavoces reales.
[0062] El objeto de la matriz de mezcla descendente pude considerarse como la eliminación de los altavoces imaginarios agregados, y la restricción de las ganancias calculadas a los altavoces existentes. Por ejemplo, si una determinada instalación de altavoz no contiene ni altavoces de altura ni altavoces posteriores, a continuación, el altavoz imaginario añadido sobre el oyente también será un vecino de los altavoces posteriores imaginarios, y viceversa.
[0063] VBAP requiere para todas las direcciones de panning 3 vectores de base independientes que logran ganancias de panning positivas. Esto significa que el origen del sistema de coordenadas generado por los tres vectores debe estar dentro del poliedro, y no puede ser parte de su superficie. Por lo tanto, mediante la verificación de si la distancia de todos los triángulos está por encima de un cierto umbral, puede realizarse una verificación de validez, si una determinada instalación de altavoz es una instalación válida 3D. El renderizador puede estar configurado para soportar nuevas instalaciones de altavoces con posiciones arbitrarias de altavoces, mediante la implementación de dicha verificación de validez y una estrategia para tratar las instalaciones de altavoces no válidas. Por ejemplo, el renderizador puede indicar una reubicación de un altavoz real de tal modo que el altavoz reubicado permita una posición válida de altavoces imaginarios.
[0064] Una instalación de altavoz plana o una instalación sin ningún altavoz posterior claramente no es una instalación de 3D válida. El renderizador puede estar configurado para proporcionar un procedimiento de mejor esfuerzo para soportar tales instalaciones, mediante la realización de la mezcla descendente. Al añadir tal altavoz imaginario no existente sobre la parte superior y la parte inferior de la instalación 14-1 de la Fig. 2, una instalación plana podría tornarse una instalación de 3D válida. Al colocar tal altavoz no existente en la posición que falta y al realizar la mezcla descendente de este hasta sus vecinos, puede obtenerse una estrategia para el control de la primera instalación 14-1.
[0065] La Fig. 4a muestra una vista en perspectiva de la primera instalación de altavoces 14-1 con respecto a la posición 42. Las siguientes figuras 5 y 6 explicarán posibles procedimientos del determinador de altavoz imaginario para la implementación de la determinación de la posición de altavoces imaginarios.
[0066] La Fig. 4b muestra una vista superior de la configuración de la Fig. 4a.
[0067] La Fig. 5a muestra una vista en perspectiva esquemática de la primera instalación de altavoz 14-1 de la Fig. 5a con los altavoces imaginarios 22b y 22d formando en total una segunda instalación de altavoz 24-2. Una posición de los altavoces imaginarios 22b y 22d puede ser obtenida por un determinador de altavoz imaginario, tal como el determinador de altavoz imaginario 18, por ejemplo, al formar un círculo 48 que comprende ambos altavoces, 16a y 16b, de la primera instalación de altavoz 14-1. Como algunos formatos como 7.1 definen posiciones de altavoces en un círculo con la posición 42 dentro del círculo, esta puede ser una solución apropiada para definir la posición de los altavoces imaginarios 22b y 22d.
[0068] La Fig. 5b muestra una vista superior en el escenario de la Fig. 5a, y representa la forma redonda del círculo 48. Un determinador de altavoz imaginario, por ejemplo, como parte de un renderizador de objetos para la renderización de objetos acústicos dentro de la escena acústica que va a ser reproducida, puede estar configurado para implementar un algoritmo de triangulación además de triangulaciones seleccionadas manualmente para las instalaciones determinadas. Por ejemplo, la triangulación Delaunay puede ofrecer una buena solución para este problema, ya que corresponde al gráfico dual de los diagramas de Voronoi. De forma alternativa o adicional, el determinador de altavoz imaginario puede estar configurado para determinar la posición de los altavoces imaginarios 22b y 22d mediante la consideración de un ángulo p1 y/o p2 entre la respectiva posición de los altavoces imaginarios 22b y 22d y la posición 42 y/o un ángulo de referencia 49, tal como 0°. En consecuencia, pueden implementarse las configuraciones tales como 60° desde una posición de centro (0°).
[0069] La Fig. 6 muestra una vista en perspectiva sobre una segunda instalación de altavoz 24-3 que comprende la primera instalación de altavoz 14-1, los altavoces imaginarios 22b, 22d y 22a. Los altavoces imaginarios 22b y 22d son iguales, con respecto a su posición, a lo descrito en las Figs. 5a y 5b. Una posición del altavoz imaginario 22a puede encontrarse, por ejemplo, mediante el cálculo de una superficie de esfera 52 sobre la base del círculo 48. La superficie de esfera 52 puede calcularse, por ejemplo, mediante el cálculo de una envolvente convexa de los altavoces 16a, 16b, 22c y 22d o la primera instalación de altavoz 14-1 (conjunto de vértices proporcionados). La envolvente convexa puede ser determinada, por ejemplo, por el algoritmo “QuickHull” que tiene una complejidad computacional promedio de O(N*log(N)) y una peor complejidad de O(N2), como se describe en [1], donde O denota un grado de complejidad. El algoritmo QuickHull está adaptado para proporcionar información referida a vecinos de altavoces. Realizaciones alternativas usan otros algoritmos tales como el algoritmo Devide and Conquor o el algoritmo Gift Wrap.
[0070] El algoritmo QuickHull es bastante simple, y puede ser adicionalmente simplificado debido a que todos los vértices, es decir, altavoces, están ubicados sobre una superficie de esfera. Un algoritmo simple permite una inclusión en tramas existentes, tal como un soporte lógico de referencia. Mediante la utilización de un algoritmo de triangulación, los triángulos requeridos según los formatos MPEG pueden ser obtenidos al formar un poliedro donde todas las superficies son subdivididas en triángulos, si es necesario. Como todos los vértices, es decir, las posiciones de altavoces, se ubican dentro de tolerancias sobre una superficie de esfera, puede encontrarse la solución de Delaunay mediante el cálculo de la envolvente convexa del conjunto de vértices proporcionados.
[0071] Un aparato para la generación de una pluralidad de canales de audio según una realización de la presente invención está configurado para determinar una validez de las posiciones de los altavoces de la primera instalación de altavoz 14-1. Por ejemplo, cuando la primera instalación de altavoz comprende más de dos altavoces, el determinador de altavoz imaginario puede estar configurado para determinar si la totalidad de los altavoces se disponen dentro de una cierta tolerancia sobre un recorrido circular, o si los altavoces están dispuestos dentro de una cierta tolerancia en una capa con respecto a la posición 42.
[0072] En otras palabras, por ejemplo, la propiedad de círculo vacío según la triangulación de Delaunay puede ser una condición suficiente para la triangulación. Esta condición requiere que ningún otro vértice, es decir, altavoz, se ubique dentro de la circunferencia circunscrita de cualquier triángulo. Como los vértices se ubican sobre una superficie de esfera, un vértice que incumple esta condición se ubicará fuera de la superficie considerada, y la envolvente no será convexa en esta área. En consecuencia, un algoritmo de envolvente convexa como el algoritmo Quickhull cumple con la condición de suficiente “círculo vacío” de la triangulación de Delaunay, que puede proporcionar información acerca de la validez de la instalación de altavoz. Además, el determinador de altavoz imaginario o, por ejemplo, el estimador de proximidad, puede estar configurado para determinar posiciones de altavoces imaginarios o relaciones de proximidad o vecindad según la triangulación de Delaunay y/o un algoritmo que proporciona una envolvente convexa.
[0073] El algoritmo de QuickHull puede usarse, por ejemplo, para aplicar un panning a modo de N para instalaciones 3D con o sin una Voz de Dios. Mediante el uso del algoritmo QuickHull, un procedimiento de triangulación para instalaciones de altavoces 3D arbitrarias puede proporcionarse, y pueden soportarse instalaciones de altavoces arbitrarias (e incluso, no válidas) usando el procedimiento de distribución de energía propuesto.
[0074] Para objetos de audio sobre la capa de altavoz superior, por ejemplo, pueden usarse uno o la totalidad de altavoces elevados, en lugar de limitar la elevación como se implementa en el modelo de referencia 0 (RM0), en el caso de que la instalación no comprenda Voz de Dios. Esto puede realizarse mediante el panning a modo de N. Una complejidad computacional añadida puede ser insignificantemente pequeña.
[0075] En consecuencia, una instalación de altavoz 3D arbitraria puede ser soportada, por ejemplo, si un respectivo renderizador de objetos para la renderización de objetos acústicos incluye un algoritmo de triangulación además de la triangulación seleccionada de forma manual para las instalaciones determinadas. Las instalaciones determinadas pueden ser definidas por el respectivo formato reproducido por la instalación de altavoces.
[0076] La Fig. 7 muestra el diagrama esquemático de la segunda instalación de altavoz 24-1 según la Fig. 2, donde se representa una capa 54 que es ortogonal con respecto a la capa 44. Los altavoces 16a y 16b se disponen en un primer lateral del plano geométrico 54. Los altavoces imaginarios 22b y 22d se disponen en un lateral del plano geométrico 54 opuesto al primer lateral. El altavoz imaginario 22a se dispone a lo largo del primer lateral del plano geométrico 54.
[0077] Mediante la disposición de los altavoces imaginarios en un lateral del plano geométrico 54 opuesto al lateral de los altavoces 16a y/o 16b, puede reproducirse una escena acústica tridimensional en la posición de oyente predefinida 42. En términos simplificados, la segunda instalación de altavoz 24-1 emula los altavoces enfrente del oyente (altavoces 16a y 16b), detrás del oyente (altavoces 22b y 22d), debajo del oyente (altavoz 22b) y desde arriba (altavoz 22a).
[0078] La Fig. 8 muestra un diagrama esquemático de bloques de un decodificador de audio como puede usarse para la decodificación de señales MP4 a fin de obtener una pluralidad de señales de audio 12-1.
[0079] Un post-procesador 1700 puede ser implementado como un renderizador binaural 1710 o un conversor de formato 1720. Alternativamente, una salida directa de datos 1205, es decir, los canales de audio, puede además ser implementada como se ilustra en 1730. Por lo tanto, se prefiere realizar el procesamiento en el decodificador sobre la mayor cantidad de canales, tales como 22.2 ó 32, a fin de tener flexibilidad y, a continuación, post-procesar, si se requiere un formato menor.
[0080] El procesador de objetos 1200 puede comprender un decodificador SAOC (SAC = Codificación Espacial de Audio) 1800, y el decodificador SAOC está configurado para la decodificación de uno o más canales de transporte que salen del decodificador núcleo y datos paramétricos asociados, y el uso de metadatos descomprimidos a fin de obtener la pluralidad de objetos de audio renderizados. Para este fin, la salida de OAM está conectada a la caja 1800.
[0081] Adicionalmente, el procesador de objetos 1200 está configurado para renderizar objetos decodificados que salen del decodificador núcleo, que no están codificados en los canales de transporte SAOC, pero que están individualmente codificados en elementos típicos de canales únicos como es indicado por el renderizador de objetos 1210. Adicionalmente, el decodificador comprende una interfaz de salida que corresponde a la salida 1730, para dar salida a una salida del mezclador a los altavoces.
[0082] El procesador de objetos 1200 puede comprender un decodificador de codificación de objeto de audio espacial 1800, para la decodificación de uno o más canales de transporte e información lateral paramétrica asociada que representa objetos de audio codificado o canales de audio codificado, donde el decodificador de codificación de objeto de audio espacial está configurado para la transcodificación de la información paramétrica asociada y los metadatos descomprimidos, en información lateral paramétrica transcodificada utilizable para la renderización directa del formato de salida, como, por ejemplo se define en una versión anterior de SAOC. El post-procesador 1700 está configurado para el cálculo de canales de audio del formato de salida, usando los canales de transporte decodificados y la información lateral paramétrica transcodificada. El procesamiento realizado por el post-procesador puede ser similar al procesamiento de Envolvente MPEG Surround, o puede ser cualquier otro procesamiento, tal como el procesamiento BCC o similar.
[0083] El procesador de objetos 1200 puede comprender un decodificador de codificación de objeto de audio espacial 1800 configurado para la mezcla ascendente directa y la renderización de señales de canal para el formato de salida usando los canales de transporte decodificados (por el decodificador núcleo) y la información lateral paramétrica.
[0084] El procesador de objetos 1200 comprende adicionalmente el mezclador 1220 que recibe, como entrada, datos que salen del decodificador USAC 1300 directamente cuando existen objetos pre-renderizados mezclados con canales. Además, el mezclador 1220 recibe datos del renderizador de objetos que realiza la renderización de objetos sin decodificación SAOC. Además, el mezclador recibe datos de salida del decodificador SAOC, es decir, objetos renderizados SAOC.
[0085] El mezclador 1220 está conectado a la interfaz de salida 1730, el renderizador binaural 1710 y el conversor de formato 1720. El renderizador binaural 1710 está configurado para renderizar los canales de salida en dos canales binaurales usando funciones de transferencia relacionados con la cabeza, o respuestas de impulsos de espacio binaural (BRIR, conforme a sus siglas en inglés). El conversor de formato 1720 está configurado para convertir los canales de salida en un formato de salida que tiene una menor cantidad de canales que los canales de salida (datos) 1205 del mezclador, y el conversor de formato 1720 requiere información sobre la disposición de reproducción tal como altavoces 5.1 o similares.
[0086] En la opción 1 y como se describirá en la siguiente Fig. 9, un aparato para la generación de la pluralidad de canales de audio 12-1 puede ser, por ejemplo, parte del renderizador de objetos 1210. Como una opción 2 y como se describirá en la siguiente Fig. 10, un aparato para la generación de una pluralidad de canales de audio 12-2 puede ser, por ejemplo, parte de un bloque de conversión de formato 1720, por ejemplo, para la mezcla descendente de la cantidad de canales 1205 hasta la pluralidad de canales de audio 12-2. Cuando se aplica la opción 1, la pluralidad de canales de audio 12-1 puede obtenerse en una salida del mezclador 1220. La salida puede ser, por ejemplo, un conector capaz de ser conectado con un sistema de altavoz que comprende una pluralidad de altavoces.
[0087] Cuando se aplica la opción 2, la pluralidad de canales de audio 12-2 pueden ser obtenidos, por ejemplo, en una salida del bloque de conversión de formato 1720. El bloque de conversión de formato 1720 puede ser implementado como un aparato, por ejemplo, que comprende un interruptor, que permite una selección de formato que saldrá sobre la base de los canales 1205, por ejemplo, un formato 5.1. El bloque de conversión de formato 1720 puede estar conectado con el mezclador 1220 de tal modo que una entrada del bloque de conversión de formato 1720 puede ser una máxima cantidad de canales, por ejemplo, 32, de un estándar o una familia de formatos tales como MPEG.
[0088] En otras palabras, esto permite dejar la sintaxis de corriente de bits sin cambios, solo cambiando el procesamiento de señal dentro del decodificador. El modelo de referencia 0 (RM0) puede extenderse mediante las siguientes nuevas características:
la Fig. 9 muestra un diagrama de bloques esquemático del aparato 10-1 referenciado como la opción 1 en la Fig. 8. El aparato 10-1 está configurado para recibir datos o información referidos a los objetos que van a ser reproducidos dentro de una escena acústica. Un instrumento de panning 56 del aparato 10-1 está configurado para calcular coeficientes de panning sobre la base de los datos referidos a los objetos. Una cantidad de coeficientes de panning puede ser igual a una cantidad de altavoces determinada para reproducir la escena acústica según un estándar o formato de audio. Por ejemplo, con respecto al formato 5.1, esta puede ser una cantidad de seis altavoces. En otras palabras, los coeficientes de panning denotan un factor de escala para el sonido irradiado por un objeto, donde los coeficientes de panning están adaptados para la escala de señales de altavoz, por ejemplo, con respecto a un nivel de presión de sonido, a fin de implementar una posición o una dirección de un objeto con respecto a una posición de un oyente.
[0089] Un determinador de altavoz imaginario 18-1 que puede ser el determinador de altavoz imaginario 18 está configurado para determinar una posición de uno o más altavoces imaginarios. Por ejemplo, cuando se hace referencia a la Fig. 8, una decisión de altavoces que van a ser representados por los altavoces imaginarios puede obtenerse cuando se selecciona una experiencia de audición específica, por ejemplo, representada por un formato específico. Sobre esta base, pueden considerarse una cantidad de altavoces conectados al mezclador o al decodificador. Cada altavoz que va a ser implementado según el formato, pero no conectado al mezclador o al decodificador, puede seleccionarse como un altavoz imaginario.
[0090] Un calculador de distribución de energía 26-1, que puede ser el calculador de distribución de energía 26, está configurado para calcular una distribución de energía desde el altavoz imaginario o los altavoces imaginarios hasta los otros altavoces en la segunda instalación de altavoz obtenida. Un procesador 28-1, que puede ser el procesador 28, está configurado para repetir la distribución de energía a fin de obtener una información de mezcla descendente, por ejemplo, mediante el cálculo de la matriz de mezcla descendente M para una mezcla descendente desde la segunda instalación de altavoz hasta la primera instalación de altavoz. Por lo tanto, una cantidad de coeficientes de panning puede ser mayor que la cantidad de los canales de audio 12-1. El procesador 28-1 está configurado para dar salida a factores de ponderación a un renderizador 38-1, por ejemplo, el renderizador 38. El renderizador 38-1 está configurado para generar la pluralidad de canales de audio 12-1 según los factores de ponderación y el sonido o ruido del respectivo objeto. La señal de ruido o sonido puede ser proporcionada, por ejemplo, como una monoseñal. En consecuencia, el renderizador 38-1 está configurado para generar la pluralidad de canales de audio 12-1 sobre la base de la información de mezcla descendente y los coeficientes de panning, donde una relación funcional puede ser representada al menos parcialmente por los factores de ponderación.
[0091] Una ventaja de esta realización es que al implementar el aparato para la generación de la pluralidad de canales de audio 12-1 dentro del renderizador de objetos 1210, la pluralidad de canales de audio 12-1 puede obtenerse de un modo tal que coincide con la instalación del soporte físico implementado. Una cantidad de canales de audio no requeridos, por ejemplo 26, cuando un número máximo de canales de audio es 32 y un número requerido de canales de audio es 6, puede omitirse durante el procesamiento, de manera que puede reducirse el esfuerzo de computación.
[0092] La Fig. 10 muestra un diagrama esquemático de bloques del bloque de conversión de formato 1720 representado en la Fig. 8, que comprende el aparato 10-2 para la generación de la pluralidad de canales de audio 12­ 2. El aparato 10-2 está configurado para la mezcla descendente de una cantidad de canales 1205 hasta una cantidad de la pluralidad de canales de audio 12-2.
[0093] Una ventaja de esta realización es que el bloque de conversión de formato 1720 puede estar adjuntado o incluido a un decodificador, por ejemplo, un decodificador como se representa en la Fig. 8, mientras que el decodificador en sí mismo permanece sin cambios, y se realiza la mezcla descendente de las señales de audio decodificadas y los canales de audio según un formato de salida requerido sobre la base de los canales 1205 que salen del decodificador.
[0094] La Fig. 11 muestra un diagrama de bloques esquemático de un sistema de audio 110 que comprende un aparato 112 que puede ser o comprender, por ejemplo, el aparato 10, el aparato 10-1 o el aparato 10-2. El sistema de audio 110 comprende dos altavoces 16a y 16b. El aparato 112 está configurado para generar la pluralidad de canales de audio de tal manera que la cantidad de dos altavoces 16a y 16b emulan una presencia de cinco altavoces 16a, 16b y 22a-c en la posición 42.
[0095] Otras realizaciones muestran sistemas de audio con una cantidad diferente de altavoces tal como 6, 10, 13 ó 32 o más, y un aparato para la generación de una pluralidad de señales de altavoz (canales de audio) según la cantidad de altavoces. La pluralidad de altavoces está configurada para recibir la pluralidad de canales de audio y proporcionar una pluralidad de señales acústicas sobre la base de la pluralidad de canales de audio. La cantidad de canales de audio puede ser igual a la cantidad de altavoces que se va a controlar.
[0096] Esto permite la renderización de objetos, al igual que la definida instalación de altavoces, por ejemplo, incluyendo una verificación de validez, y, además, en instalaciones 3D arbitrarias. Esto puede realizarse, por ejemplo, mediante la integración del algoritmo QuickHull, por ejemplo, en el soporte lógico de referencia, tal como el modelo de referencia MPEG-H 3D (RM) 0. El procedimiento de distribución de energía permite una renderización de objetos en instalaciones arbitrarias, que pueden ser, pero no necesariamente, instalaciones 3D válidas. Esto incluye las siguientes etapas:
1. El cómputo de ganancias VBAP (factores de ponderación) para la instalación de altavoz extendida con altavoces imaginarios adicionales.
2. La aplicación de la matriz de mezcla descendente computada durante la inicialización.
3. La aplicación de una normalización de energía a las ganancias VBAP con mezcla descendente.
[0097] Este procedimiento puede ser aplicado además por el conversor de formato, por ejemplo, como último recurso, cuando no hay regla del correspondiente formato que se aplique a la instalación determinada (arbitraria). Esto puede sumar la propiedad beneficiosa de que el renderizador ya puede producir señales para cualquier instalación determinada. El procedimiento puede ser implementado, por ejemplo, por código de programación en un lenguaje de programación, tal como C.
[0098] En otras palabras, el aparato 10 puede estar configurado para obtener señales de audio adecuadas (canales de audio) sobre la base de corrientes de datos MPEG-H sobre la base de objetos, para cualquier instalación de altavoces que pueda ser instalación de 3D no válida según un formato respectivo. Cuando se hace referencia a la fórmula 2, el número de coeficientes g es sometido a la mezcla descendente. Los coeficientes g también pueden ser denotados como coeficientes VBAP.
[0099] Las posiciones de altavoces reales y altavoces imaginarios pueden ser determinadas dentro de tolerancias, como se describió de manera ejemplar en la Fig. 2. Tales umbrales se aplican además para ubicaciones o posiciones en otros planos geométricos y/o envolventes, tales como envolventes convexas.
[0100] Aunque se han descrito algunos aspectos en el contexto de un aparato, es claro que estos aspectos representan además una descripción del correspondiente procedimiento, donde un bloque o dispositivo corresponde a una etapa de procedimiento o a una característica de una etapa de procedimiento. De forma análoga, los aspectos descritos en el contexto de una etapa de procedimiento representan además una descripción de un correspondiente bloque o elemento o característica de un aparato correspondiente.
[0101] Dependiendo de ciertos requisitos de implementación, las realizaciones de la invención pueden ser implementadas en soporte físico o soporte lógico. La implementación puede realizarse usando un medio de almacenamiento digital, por ejemplo, un disquete, un DVD (disco versátil digital), un CD (disco compacto, conforme a sus siglas en inglés), una ROM (memoria de solo lectura, conforme a sus siglas en inglés), una p Ro M (memoria de solo lectura programable, conforme a sus siglas en inglés), una EPROM (memoria de solo lectura programable de borrado, conforme a sus siglas en inglés), una EEPROM (memoria de solo lectura programable de borrado electrónico, conforme a sus siglas en inglés) o una memoria FLASH, que tiene señales de control electrónicamente legibles allí almacenadas, que cooperan (o son capaces de cooperar) con un sistema informático programable de tal manera que se lleve a cabo el respectivo procedimiento.
[0102] Algunas realizaciones según la invención comprenden un soporte de datos que tiene señales de control electrónicamente legibles, que son capaces de cooperar con un sistema informático programable, de manera que se lleve a cabo uno de los procedimientos que se describen en esta invención.
[0103] En general, las realizaciones de la presente invención pueden ser implementadas como un producto de programa informático con un código de programa, donde el código de programa es operativo para llevar a cabo uno de los procedimientos cuando se ejecuta el producto de programa informático en un ordenador. El código de programa puede ser almacenado, por ejemplo, en un soporte legible por máquina.
[0104] Otras realizaciones comprenden el programa informático para llevar a cabo uno de los procedimientos que se describen en esta invención, almacenado en un soporte legible por máquina.
[0105] En otras palabras, una realización del procedimiento de la invención, por lo tanto, es un programa informático que tiene un código de programa para la realización de uno de los procedimientos que se describen en esta invención, cuando se ejecuta el programa informático en un ordenador.
[0106] Una realización adicional del procedimiento de la invención es, por lo tanto, un soporte de datos (o un medio de almacenamiento digital, o un medio legible por ordenador) que comprende, allí grabado, el programa informático para llevar a cabo uno de los procedimientos que se describen en esta invención.
[0107] Una realización adicional del procedimiento de la invención es, por lo tanto, una corriente de datos o una secuencia de señales que representan el programa informático para llevar a cabo uno de los procedimientos que se describen en esta invención. La corriente de datos o la secuencia de señales, por ejemplo, puede estar configurada para ser transferida por medio de una conexión de comunicación de datos, por ejemplo, por medio de Internet.
[0108] Una realización adicional comprende un medio de procesamiento, por ejemplo, un ordenador, o un dispositivo lógico programable, configurado o adaptado para llevar a cabo uno de los procedimientos que se describen en esta invención.
[0109] Una realización adicional comprende un ordenador que tiene allí instalado el programa informático para llevar a cabo uno de los procedimientos que se describen en esta invención.
[0110] En algunas realizaciones, puede usarse un dispositivo lógico programable (por ejemplo, una matriz de puertas programables de campo) o un circuito integrado, para realizar algunas o la totalidad de las funcionalidades de los procedimientos que se describen en esta invención. En algunas realizaciones, una matriz de puertas programables de campo puede cooperar con un microprocesador a fin de llevar a cabo uno de los procedimientos que se describen en esta invención. En general, los procedimientos son llevados a cabo, preferentemente, por cualquier aparato de soporte físico.
[0111] Las realizaciones descritas con anterioridad son meramente ilustrativas de los principios de la presente invención. Se entiende que las modificaciones y variaciones de las disposiciones y los detalles que se describen en esta invención serán evidentes para los expertos en la técnica. Por lo tanto, se tiene la intención de limitación solo por el alcance de las reivindicaciones de patente inminentes, y no por los detalles específicos presentados a modo de descripción y explicación de las realizaciones de esta invención.
Bibliografía
[0112]
[1] Barber, C. Bradford; Dobkin, David P.; Huhdanpaa, H., “The quickhull algorithm for convex hulls,” ACM Transactions on Mathematical Software, vol. 22, no 4, pp. 469-483, 1996.

Claims (16)

REIVINDICACIONES
1. Aparato para la generación de una pluralidad de canales de audio (12; 12-1; 12-2) para una primera instalación de altavoz (14; 14-1) que comprende un determinador de altavoz imaginario (18; 18-1) para la determinación de una posición de al menos un altavoz imaginario (22; 22a-d) no contenido en la primera instalación de altavoz (14; 14-1) a fin de obtener una segunda instalación de altavoz (24; 24-1; 24-2; 24-3) que contiene al menos un altavoz imaginario (22; 22a-d) y al menos parcialmente altavoces de la instalación del primer altavoz, donde la posición del al menos un altavoz imaginario (22; 22a-d) es una posición predefinida, se determina de tal manera que las distancias entre los altavoces de la primera y/o la segunda instalación de altavoz (14; 14-1; 24; 24-1; 24-2; 24-3) sean equidistantes o correspondan a un formato de audio o estándar;
un calculador de distribución de energía (26; 26-1);
un procesador (28; 28-1) configurado para generar una matriz de distribución de energía (D);
un renderizador (38; 38-1) para la generación de la pluralidad de canales de audio (12; 12-1; 12-2) usando la información de mezcla descendente (36) para una mezcla descendente desde la segunda instalación de altavoces (24; 24-1; 24-2; 24-3) hasta la primera instalación de altavoces (14; 14-1) caracterizado porque
el calculador de distribución de energía (26-1) está configurado para calcular la distribución de energía de cada altavoz en la segunda instalación de altavoz (24; 24-1; 24-2; 24-3) a otros altavoces en la segunda configuración de altavoz (24; 24-1; 24-2; 24-3), donde la distribución de energía representa una cantidad o una parte de la energía de cada altavoz en la segunda instalación de altavoz (24; 24-1; 24-2; 24-3) que se distribuye a los otros altavoces en la segunda instalación de altavoz (24; 24-1; 24-2; 24-3);
la matriz de distribución de energía (D) comprende elementos (dxy) que son inferiores o iguales a 1 y que representan la distribución de energía de cada altavoz en la segunda instalación de altavoz (24; 24-1; 24-2; 24-3) a los otros altavoces en la segunda instalación de altavoz (24; 24-1; 24-2; 24-3); y
el procesador (28; 28-1) está configurado además para
calcular una enésima potencia (Dn) de la matriz de distribución de energía (D), donde la enésima potencia (Dn) de la matriz de distribución de energía (D) conduce los elementos (dxy) que representan la distribución de energía de los altavoces en la segunda instalación de altavoz (24; 24-1; 24-2; 24-3) al menos a un altavoz imaginario (22; 22a-d) que se va a disminuir, donde n es un entero; y para obtener la información de mezcla descendente (36) basada en la enésima potencia (Dn) de la matriz de distribución de energía (D) ignorando los elementos que han disminuido o convergido en un umbral definido.
2. Aparato según la reivindicación 1, donde el exponente n de la enésima potencia (Dn) es un valor predefinido.
3. Aparato según la reivindicación 1, donde el procesador (28; 28-1) está configurado además para calcular iterativamente la potencia (Dn) de la matriz de distribución de energía (D), donde una serie de etapas de iteración se basa en un valor de los elementos (dxy) de la potencia (Dn) de la matriz de distribución de energía (D).
4. Aparato según una de las reivindicaciones anteriores, donde el calculador de distribución de energía (26; 26-1) comprende un estimador de proximidad para la determinación de una relación de proximidad de al menos un altavoz imaginario (22; 22a-d) en la segunda instalación de altavoz (24; 24-1; 24-2; 24-3) al menos a un altavoz de la segunda instalación de altavoz (24; 24-1; 24-2; 24-3) que es un vecino del al menos un altavoz imaginario (22; 22ad), y donde el calculador de distribución de energía (26; 26-1) está configurado para calcular la distribución de energía del al menos un altavoz imaginario (22; 22ad) al menos a un vecino del al menos un altavoz imaginario (22; 22a-d).
5. Aparato según la reivindicación 4, donde el estimador de proximidad está configurado para determinar una relación de proximidad del al menos un altavoz imaginario (22; 22a-d) en la segunda instalación de altavoz al menos a dos altavoces en la segunda instalación de altavoz (24; 24 -1; 24-2; 24-3) que son vecinos del al menos un altavoz imaginario (22; 22a-d) y donde el calculador de distribución de energía (26; 26-1) está configurado para calcular la distribución de energía de tal manera que la distribución de energía entre los al menos dos altavoces vecinos del al menos un altavoz imaginario (22; 22a-d) sea igual dentro de una tolerancia predefinida.
6. Aparato según una de las reivindicaciones 4 ó 5, donde el estimador de proximidad está configurado para determinar una relación de proximidad del al menos un altavoz imaginario (22; 22a-d) en la segunda instalación de altavoz (24; 24-1; 24-2; 24-3) al menos a dos altavoces que son vecinos del al menos un altavoz imaginario (22; 22a-d), y donde al menos uno de los al menos dos altavoces que son vecinos del al menos un altavoz imaginario (22; 22a-d) es un altavoz imaginario adicional (22; 22a-d).
7. Aparato según una de las reivindicaciones anteriores donde el al menos un altavoz imaginario (22; 22ad) está dispuesto en un lateral de un plano geométrico (44) que comprende los altavoces (16a-c) de la primera instalación de altavoz (14; 14-1) dentro de una tolerancia predefinida (46a; 46b) y una posición de oyente predefinida (42).
8. Aparato según una de las reivindicaciones anteriores, donde al menos un altavoz imaginario (22; 22ad) está dispuesto a lo largo de un segundo lateral de un plano geométrico (54) que comprende una posición de oyente predefinida (42) que se opone a un primer lateral del plano geométrico (54), donde un altavoz de la primera instalación de altavoz (14; 14-1) está dispuesto en el primer lateral del plano geométrico (54).
9. Unidad de conversión de formato (1720) que comprende el aparato según una de las reivindicaciones anteriores, donde la unidad de conversión de formato (1720) está configurada para dar salida a la pluralidad de canales de audio (12; 12-1; 12-2) sobre la base de canales de entrada que comprenden una pluralidad de canales de datos (1205), y donde una cantidad de canales de datos (1205) es mayor que una cantidad de la pluralidad de canales de audio (12; 12-1; 12-2).
10. Aparato según una de las reivindicaciones 1-8, donde el aparato comprende un instrumento de panning (56) para la generación de coeficientes de panning para la segunda instalación de altavoz (24; 24-1; 24-2), y donde el renderizador (38; 38-1) está configurado para generar la pluralidad de canales de audio (12; 12-1; 12-2) sobre la base de la información de mezcla descendente (36) y los coeficientes de panning.
11. Renderizador de objetos (1210) que comprende el aparato según la reivindicación 10, donde el renderizador de objetos (1210) está configurado para emitir la pluralidad de canales de audio (12; 12-1; 12-2) en función de la información de posición de los objetos de audio y donde un número de coeficientes de panning es mayor que un número de la pluralidad de canales de audio (12; 12-1; 12-2) de tal manera que el objeto de audio se renderiza en la primera instalación de altavoz (14; 14-1).
12. Aparato según una de las reivindicaciones anteriores, donde el determinador de altavoz imaginario (18; 18-1) está configurado para calcular una envolvente convexa (52) sobre la base de una posición de altavoces (16a-c) de la primera instalación de altavoz (14; 14-1), y para determinar la posición del al menos un altavoz imaginario (22; 22a-d) según un algoritmo QuickHull, donde la posición del al menos un altavoz imaginario (22; 22a-d) y la posición de los altavoces (16a-c) de la primera instalación de altavoz (14; 14-1) se disponen en la envolvente convexa (52) dentro de un umbral predefinido.
13. Aparato según la reivindicación 12, donde el aparato está configurado para proporcionar una información de validez de la primera instalación de altavoz (14; 14-1) que indica que una posición de cada altavoz (16a-c) en la primera instalación de altavoz (14; 14-1) se dispone en la envolvente convexa (52) dentro de un umbral predefinido, o que indica que una posición de al menos un altavoz en la primera instalación de altavoz (14; 14-1) se dispone fuera de la envolvente convexa (52) dentro de un umbral predefinido.
14. Sistema de audio, que comprende:
un aparato (10; 10-1; 10-2) según una de las reivindicaciones 1-13; y
una pluralidad de altavoces (16a-c) según la pluralidad de canales de audio (12; 12-1; 12-2);
donde la pluralidad de altavoces (16a-c) está configurada para recibir la pluralidad de canales de audio (12; 12-1; 12­ 2) y para proporcionar una pluralidad de señales acústicas sobre la base de la pluralidad de canales de audio (12; 12­ 1; 12-2).
15. Procedimiento para la generación de una pluralidad de canales de audio (12; 12-1; 12-2) para una primera instalación de altavoz (14; 14-1), que comprende la determinación de una posición de un altavoz imaginario (22; 22a-d) no contenido en la primera instalación de altavoz (14; 14-1) para obtener una segunda instalación de altavoz (24; 24-1; 24-2; 24-3) que contiene el al menos un altavoz imaginario (22; 22a-d) y al menos parcialmente altavoces de la primera instalación de altavoz, donde la posición del al menos un altavoz imaginario (22; 22a-d) es una posición predefinida, se determina de tal manera que las distancias entre los altavoces de la primera y/o la segunda instalación de altavoz (14; 14-1; 24; 24-1; 24-2; 24-3) sean equidistantes o correspondan a un formato de audio o estándar; la generación de una matriz de distribución de energía (D);
la generación de la pluralidad de canales de audio (12; 12-1; 12-2) mediante el uso de una información de mezcla descendente (36) para una mezcla descendente desde la segunda instalación de altavoz (24; 24-1; 24-2; 24-3) hasta la primera instalación de altavoz (14; 14-1) caracterizado por el cálculo de la distribución de energía de cada altavoz en la segunda instalación de altavoz (24; 24-1; 24-2; 24-3) a otros altavoces en la segunda instalación de altavoz (24; 24 -1; 24-2; 24-3), donde la distribución de energía representa una cantidad o una parte de la energía de cada altavoz en la segunda instalación de altavoz (24; 24-1; 24-2; 24-3) que se distribuye a los otros altavoces en la segunda instalación de altavoz (24; 24-1; 24-2; 24-3), comprendiendo la matriz de distribución de energía (D) elementos (dxy) que son inferiores o iguales a 1 y que representan la distribución de energía de cada altavoz en la segunda instalación de altavoz (24; 24-1; 24-2; 24-3) a los otros altavoces en la segunda instalación de altavoz (24; 24-1; 24-2; 24-3); el cálculo de una enésima potencia (Dn) de la matriz de distribución de energía (D) donde la enésima potencia (Dn) de la matriz de distribución de energía (D) conduce a los elementos (dxy) que representan la distribución de energía de los altavoces en la segunda instalación de altavoz (24; 24-1; 24-2; 24-3) para que disminuya al menos un altavoz imaginario (22; 22a-d), donde n es un número entero; y la obtención de la información de mezcla descendente (36) basada en la enésima potencia (Dn) de la matriz de distribución de energía (D) ignorando los elementos que han disminuido o convergido en un umbral definido.
16. Programa informático que tiene un código de programa para realizar, cuando se ejecuta en un ordenador, un procedimiento según la reivindicación 15.
Ċ
ES15700180T 2014-01-07 2015-01-05 Aparato y procedimiento para la generación de una pluralidad de canales de audio Active ES2773623T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP14150362.3A EP2892250A1 (en) 2014-01-07 2014-01-07 Apparatus and method for generating a plurality of audio channels
PCT/EP2015/050043 WO2015104237A1 (en) 2014-01-07 2015-01-05 Apparatus and method for generating a plurality of audio channels

Publications (1)

Publication Number Publication Date
ES2773623T3 true ES2773623T3 (es) 2020-07-13

Family

ID=49955911

Family Applications (2)

Application Number Title Priority Date Filing Date
ES19203003T Active ES2975074T3 (es) 2014-01-07 2015-01-05 Aparato y procedimiento para generar una pluralidad de canales de audio
ES15700180T Active ES2773623T3 (es) 2014-01-07 2015-01-05 Aparato y procedimiento para la generación de una pluralidad de canales de audio

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES19203003T Active ES2975074T3 (es) 2014-01-07 2015-01-05 Aparato y procedimiento para generar una pluralidad de canales de audio

Country Status (18)

Country Link
US (6) US9729995B2 (es)
EP (4) EP2892250A1 (es)
JP (1) JP6228689B2 (es)
KR (1) KR101806060B1 (es)
CN (1) CN105934955B (es)
AR (1) AR099037A1 (es)
AU (1) AU2015205696B2 (es)
BR (1) BR112016015028B1 (es)
CA (1) CA2934811C (es)
ES (2) ES2975074T3 (es)
MX (1) MX352097B (es)
MY (1) MY188021A (es)
PL (1) PL3092823T3 (es)
PT (1) PT3092823T (es)
RU (1) RU2676948C2 (es)
SG (1) SG11201605560UA (es)
TW (1) TWI558231B (es)
WO (1) WO2015104237A1 (es)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2892250A1 (en) 2014-01-07 2015-07-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a plurality of audio channels
CN106303897A (zh) * 2015-06-01 2017-01-04 杜比实验室特许公司 处理基于对象的音频信号
US9854375B2 (en) * 2015-12-01 2017-12-26 Qualcomm Incorporated Selection of coded next generation audio data for transport
US10419866B2 (en) 2016-10-07 2019-09-17 Microsoft Technology Licensing, Llc Shared three-dimensional audio bed
WO2018202642A1 (en) * 2017-05-04 2018-11-08 Dolby International Ab Rendering audio objects having apparent size
EP3619922B1 (en) 2017-05-04 2022-06-29 Dolby International AB Rendering audio objects having apparent size
US20190250878A1 (en) * 2018-02-15 2019-08-15 Disney Enterprises, Inc. Remote control for an audio monitoring system
ES2913426T3 (es) * 2018-03-13 2022-06-02 Nokia Technologies Oy Reproducción de sonido espacial usando sistemas de altavoz de múltiples canales
US10904687B1 (en) * 2020-03-27 2021-01-26 Spatialx Inc. Audio effectiveness heatmap
CN115226001B (zh) * 2021-11-24 2024-05-03 广州汽车集团股份有限公司 声能量补偿方法、装置及计算机设备

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5889867A (en) * 1996-09-18 1999-03-30 Bauck; Jerald L. Stereophonic Reformatter
JP2001028799A (ja) * 1999-05-10 2001-01-30 Sony Corp 車載用音響再生装置
US8054980B2 (en) * 2003-09-05 2011-11-08 Stmicroelectronics Asia Pacific Pte, Ltd. Apparatus and method for rendering audio information to virtualize speakers in an audio system
EP1825713B1 (en) * 2004-11-22 2012-10-17 Bang & Olufsen A/S A method and apparatus for multichannel upmixing and downmixing
EP1696702B1 (en) * 2005-02-28 2015-08-26 Sony Ericsson Mobile Communications AB Portable device with enhanced stereo image
CN101185117B (zh) * 2005-05-26 2012-09-26 Lg电子株式会社 解码音频信号的方法和装置
JP2007116365A (ja) * 2005-10-19 2007-05-10 Sony Corp マルチチャンネル音響システム及びバーチャルスピーカ音声生成方法
US8515105B2 (en) * 2006-08-29 2013-08-20 The Regents Of The University Of California System and method for sound generation
JP4561785B2 (ja) * 2007-07-03 2010-10-13 ヤマハ株式会社 スピーカアレイ装置
FR2922404B1 (fr) * 2007-10-10 2009-12-18 Goldmund Monaco Sam Methode pour creer un environnement audio avec n haut-parleurs
ES2875416T3 (es) * 2008-12-11 2021-11-10 Fraunhofer Ges Forschung Aparato para generar una señal de audio multicanal
EP2360681A1 (en) * 2010-01-15 2011-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
JP2011211312A (ja) * 2010-03-29 2011-10-20 Panasonic Corp 音像定位処理装置及び音像定位処理方法
US9377941B2 (en) * 2010-11-09 2016-06-28 Sony Corporation Audio speaker selection for optimization of sound origin
KR102394141B1 (ko) * 2011-07-01 2022-05-04 돌비 레버러토리즈 라이쎈싱 코오포레이션 향상된 3d 오디오 오서링과 렌더링을 위한 시스템 및 툴들
TWI543642B (zh) * 2011-07-01 2016-07-21 杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
EP2645749B1 (en) * 2012-03-30 2020-02-19 Samsung Electronics Co., Ltd. Audio apparatus and method of converting audio signal thereof
EP3629605B1 (en) * 2012-07-16 2022-03-02 Dolby International AB Method and device for rendering an audio soundfield representation
US9826328B2 (en) * 2012-08-31 2017-11-21 Dolby Laboratories Licensing Corporation System for rendering and playback of object based audio in various listening environments
EP2892250A1 (en) 2014-01-07 2015-07-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a plurality of audio channels

Also Published As

Publication number Publication date
US10595153B2 (en) 2020-03-17
PL3092823T3 (pl) 2020-06-01
BR112016015028A2 (pt) 2020-06-09
PT3092823T (pt) 2020-02-25
MY188021A (en) 2021-11-10
AR099037A1 (es) 2016-06-22
MX2016008877A (es) 2016-10-04
SG11201605560UA (en) 2016-08-30
EP3618460B1 (en) 2024-02-28
EP3618460A1 (en) 2020-03-04
US20160316309A1 (en) 2016-10-27
KR20160106148A (ko) 2016-09-09
CA2934811A1 (en) 2015-07-16
TWI558231B (zh) 2016-11-11
US11785414B2 (en) 2023-10-10
CN105934955A (zh) 2016-09-07
RU2676948C2 (ru) 2019-01-11
US9729995B2 (en) 2017-08-08
EP3092823A1 (en) 2016-11-16
RU2016132133A (ru) 2018-02-09
ES2975074T3 (es) 2024-07-03
TW201534144A (zh) 2015-09-01
US20170318408A1 (en) 2017-11-02
JP2017507621A (ja) 2017-03-16
US11438723B2 (en) 2022-09-06
EP2892250A1 (en) 2015-07-08
US10904693B2 (en) 2021-01-26
CN105934955B (zh) 2018-01-16
US20210136511A1 (en) 2021-05-06
US20200204941A1 (en) 2020-06-25
WO2015104237A1 (en) 2015-07-16
EP3618460C0 (en) 2024-02-28
EP3092823B1 (en) 2019-11-27
MX352097B (es) 2017-11-08
EP4351173A2 (en) 2024-04-10
US20190045321A1 (en) 2019-02-07
JP6228689B2 (ja) 2017-11-08
KR101806060B1 (ko) 2017-12-07
AU2015205696A1 (en) 2016-07-21
AU2015205696B2 (en) 2017-12-14
BR112016015028B1 (pt) 2022-11-29
EP4351173A3 (en) 2024-06-19
CA2934811C (en) 2018-06-26
US20220377493A1 (en) 2022-11-24
US10097945B2 (en) 2018-10-09

Similar Documents

Publication Publication Date Title
ES2773623T3 (es) Aparato y procedimiento para la generación de una pluralidad de canales de audio
Cuevas-Rodríguez et al. 3D Tune-In Toolkit: An open-source library for real-time binaural spatialisation
EP2954703B1 (en) Determining renderers for spherical harmonic coefficients
ES2472456T3 (es) Método y dispositivo para decodificar una representación de un campo ac�stico de audio para reproducción de audio
ES2922639T3 (es) Método y dispositivo para la reproducción mejorada de campo sonoro de señales de entrada de audio codificadas espacialmente
ES2659179T3 (es) Ajuste por segmentos de señal de audio espacial a diferente configuración de altavoces de reproducción
BR112021011170A2 (pt) Aparelho e método para reproduzir uma fonte sonora espacialmente estendida ou aparelho e método para gerar um fluxo de bits a partir de uma fonte sonora espacialmente estendida
BR112020000759A2 (pt) aparelho para gerar uma descrição modificada de campo sonoro de uma descrição de campo sonoro e metadados em relação a informações espaciais da descrição de campo sonoro, método para gerar uma descrição aprimorada de campo sonoro, método para gerar uma descrição modificada de campo sonoro de uma descrição de campo sonoro e metadados em relação a informações espaciais da descrição de campo sonoro, programa de computador, descrição aprimorada de campo sonoro
TW202332290A (zh) 使用空間擴展音源之呈現器、解碼器、編碼器、方法及位元串流
Tarzan et al. Assessment of sound spatialisation algorithms for sonic rendering with headphones