ES2833424T3 - Aparato y método para panoramización de amplitud de atenuación de bordes - Google Patents

Aparato y método para panoramización de amplitud de atenuación de bordes Download PDF

Info

Publication number
ES2833424T3
ES2833424T3 ES14781537T ES14781537T ES2833424T3 ES 2833424 T3 ES2833424 T3 ES 2833424T3 ES 14781537 T ES14781537 T ES 14781537T ES 14781537 T ES14781537 T ES 14781537T ES 2833424 T3 ES2833424 T3 ES 2833424T3
Authority
ES
Spain
Prior art keywords
audio output
speaker
speaker positions
pan
output signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14781537T
Other languages
English (en)
Inventor
Christian Borss
Bernhard Grill
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2833424T3 publication Critical patent/ES2833424T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/308Electronic adaptation dependent on speaker or headphone connection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

Aparato para generar cuatro o más señales de salida de audio, que comprende: un determinador de ganancia de panoramización (110), y un procesador de señal (120), en el que el determinador de ganancia de panoramización (110) está configurado para determinar un subconjunto adecuado a partir de un conjunto de cinco o más posiciones de altavoz, de modo que el subconjunto adecuado comprende cuatro o más de las cinco o más posiciones de altavoz, en el que el determinador de ganancia de panoramización (110) está configurado para determinar el subconjunto adecuado dependiendo de una posición de panoramización y dependiendo de las cinco o más posiciones de altavoz, en el que el determinador de ganancia de panoramización (110) está configurado para determinar una ganancia de panoramización para cada una de las cuatro o más señales de salida de audio determinando dicha ganancia de panoramización dependiendo de la posición de panoramización y dependiendo de las cuatro o más posiciones de altavoz del subconjunto adecuado, y en el que el procesador de señal (120) está configurado para generar cada señal de salida de audio de las cuatro o más señales de salida de audio dependiendo de la ganancia de panoramización para dicha señal de salida de audio y dependiendo de una señal de entrada de audio, en el que cada posición de altavoz de las cuatro o más posiciones de altavoz del subconjunto adecuado está asociada con exactamente una de las cuatro o más señales de salida de audio, y en el que cada una de las cuatro o más señales de salida de audio está asociada con exactamente una de las cuatro o más posiciones de altavoz del subconjunto adecuado, en el que el determinador de ganancia de panoramización (110) está configurado para determinar, para cada señal de salida de audio de las cuatro o más señales de salida de audio, un grupo de posiciones de altavoz asociadas, que está asociado con dicha señal de salida de audio, dependiendo de la posición de altavoz de cada una de las cuatro o más señales de salida de audio y dependiendo de la posición de panoramización, de modo que dicho grupo de posiciones de altavoz asociadas comprende la posición de altavoz que está asociada con dicha señal de salida de audio y al menos dos posiciones de altavoz adicionales de las cuatro o más posiciones de altavoz del subconjunto adecuado, en el que al menos una de las cuatro o más posiciones de altavoz del subconjunto adecuado no está comprendida por dicho grupo de posiciones de altavoz asociadas, en el que el determinador de ganancia de panoramización (110) está configurado para calcular, para cada señal de salida de audio de las cuatro o más señales de salida de audio, la ganancia de panoramización para dicha señal de salida de audio dependiendo de la posición de panoramización y dependiendo de las posiciones de altavoz del grupo de las posiciones de altavoz asociadas que está asociado con dicha señal de salida de audio, y en el que el grupo de posiciones de altavoz asociadas que está asociado con una primera de las cuatro o más señales de salida de audio no es igual al grupo de posiciones de altavoz asociadas que está asociado con una segunda diferente de las cuatro o más señales de salida de audio.

Description

DESCRIPCIÓN
Aparato y método para panoramización de amplitud de atenuación de bordes
La presente invención se refiere al procesamiento de señales de audio y, en particular, a un aparato y a un método para la panoramización de amplitud con atenuación de bordes para configuraciones de altavoces 3D.
Después de la progresión del sonido estéreo al sonido envolvente 5.1, el cambio hacia el audio 3D puede considerarse como la siguiente etapa en la evolución de los sistemas de sonido de cine en casa y películas. Un mayor número de altavoces puede ampliar el área de escucha y mejorar la resolución espacial del campo de sonido reproducido. Sin embargo, un mayor número de altavoces también significa una mayor demanda, porque es necesario colocar más altavoces donde se supone que deben estar. En un entorno doméstico como una sala de estar, puede resultar difícil colocarlos según la memoria descriptiva. En la práctica, la ubicación y el número de altavoces implicados es un compromiso entre la calidad del sonido, los costes, la estética, las limitaciones espaciales y también los aspectos domésticos/sociales (véase [20]).
Las escenas de audio basadas en objetos no requieren una configuración de altavoz específica como el contenido basado en canales y, por lo tanto, tienen menos exigencias en la ubicación de los altavoces. El proceso de renderización implica un método de panoramización en el que la señal de sonido del objeto se reproduce mediante más de un altavoz (véase [7]).
Según la técnica anterior, para crear acontecimientos auditivos entre los altavoces de una configuración de altavoces 3D, la panoramización de amplitud de base vectorial (VBAP) es un método ampliamente utilizado, que puede considerarse una extensión del teorema de la tangente (véanse [17], [5]). Si bien este enfoque ha demostrado su idoneidad para el uso diario, no es ideal en todas las situaciones.
A continuación, el VBAP se describe brevemente. El VBAP utiliza un conjunto de N vectores unitarios I1,... , In que apuntan a los altavoces del conjunto de altavoces 3D. Una dirección de panoramización dada por un vector unitario cartesiano p se define por una combinación lineal de esos vectores de altavoz según la fórmula (1):
Figure imgf000002_0001
donde gn indica el factor de escala que se aplica a ln. En R 3, un espacio vectorial está formado por 3 bases vectoriales.
La fórmula (1) generalmente puede resolverse mediante una inversión de matriz, si el número de altavoces activos y, por lo tanto, el número de factores de escala distintos de cero se limita a 3. Prácticamente, esto se hace definiendo una malla de triángulos entre los altavoces y eligiendo esos tripletes para el área intermedia. Esto conduce a la solución
Figure imgf000002_0002
donde {m, ri2, 03} indica el triplete de altavoces activos.
Finalmente, una normalización que asegura señales de salida con potencia normalizada da como resultado las ganancias de panoramización finales a1, ..., aN:
Figure imgf000002_0003
El VBAP presenta propiedades particulares. Los conceptos basados en la aritmética vectorial del VBAP están relacionados con el campo sonoro creado por los altavoces implicados. El vector base que corresponde a un determinado altavoz, por ejemplo, el vector de velocidad de Gerzon (véase [9]), coincide con la velocidad de las partículas que puede medirse en condiciones de campo libre en la posición del oyente. Una combinación lineal de los campos de sonido creados por dos o más altavoces da como resultado la combinación lineal de la velocidad de las partículas.
El VBAP reproduce en condiciones de campo libre la velocidad de las partículas en el punto óptimo que resulta desde una fuente de sonido en la posición de panoramización.
Como el sistema auditivo humano detecta la presión del sonido en lugar de la velocidad de las partículas (véase [4]) y, además, implica filtrado direccional y procesos cognitivos, en realidad no existe una relación directa entre la aritmética vectorial subyacente y la localización humana.
Sin embargo, la localización de suma funciona bastante bien para ángulos pequeños entre altavoces dispuestos horizontalmente en el área frontal o trasera [6]. Para ángulos significativamente mayores de 90°, altavoces a los lados, o posiciones de altavoz dispuestas verticalmente, la localización de la suma es menos convincente (véanse [21], [10], [15]).
La figura 19 ilustra las ganancias de panoramización de VBAP para una configuración de sonido envolvente 5.1 común (véase [13]). Entre los dos altavoces traseros a 110° y 250°, se observan curvas bastante planas y una baja diferencia de nivel para un amplio intervalo angular. Para un intervalo angular donde la localización de la suma no funciona realmente, el VBAP da como resultado diferencias de nivel aún más pequeñas que para un ángulo de apertura más pequeño donde la localización de la suma está funcionando. La razón de este comportamiento es el gran ángulo de apertura entre las bases vectoriales.
En la figura 20, se representa un método de VBAP generalizado que utiliza un altavoz imaginario (gris claro) y una mezcla descendente.
Para una configuración de altavoz 3D, el VBAP siempre usa 3 vectores de base dependiendo de la triangulación elegida. Si la configuración 3D consiste en dos o más capas de altura apiladas una encima de la otra con altavoces en los mismos ángulos azimutales, entonces no hay preferencia por una determinada triangulación. Para cada sección entre dos altavoces de una capa, hay dos posibilidades de subdividir el rectángulo entre los altavoces de la capa media y superior en dos triángulos. Esta elección arbitraria introduce una asimetría incluso para configuraciones perfectamente simétricas. Para ilustrar esta propiedad, tomemos una configuración 5.1 como un ejemplo que se ha ampliado con cuatro altavoces de altura por encima de los altavoces M30, M-30, M110 y M-110, es decir, U30, U-30, U110 y U-110 [14]. Entre los altavoces de sonido envolvente de la capa media y superior, la subdivisión en los dos triángulos puede definirse o bien por la diagonal M110 ^ U-110 o bien por la diagonal U110 ^ M-110. Lo mismo ocurre con el área por encima de/entre los altavoces de la capa superior. Cualquiera que sea la elección que se haga, rompe la simetría izquierda-derecha. Como consecuencia, un objeto de audio que se mueve desde la parte superior frontal derecha hasta la parte superior trasera izquierda sonaría diferente que si se moviera desde la parte superior frontal izquierda hasta la parte superior trasera derecha, a pesar de la simetría de la configuración del altavoz.
Akio Ando eta l.: "Audio Engineering Society Convention Paper Sound intensity based three-dimensional panning", 10 de mayo de 2009, da a conocer que un equipo de panoramización tridimensional (3D) es esencial para la producción de contenido de audio 3D, y propone un nuevo método que utiliza la intensidad del sonido en lugar del vector de presión de sonido y muestra que tanto la panoramización de amplitud de base de vector convencional como un método anterior se acercan mucho a lograr la coincidencia de la intensidad del sonido. También se propone un nuevo método de panoramización usando cuatro altavoces.
Song Wang et al.: "Sound intensity and particle velocity based three-dimensional panning methods by five loudspeakers", IEEE International Conference on Multimedia and Expo (ICME) 2013, IEEE, 15 de julio de 2013, páginas 1 - 6, describe dos nuevos métodos de panoramización 3D. Un método garantiza que la intensidad de sonido promedio en el tiempo y la presión de sonido de una fuente de sonido virtual en el punto de recepción sean iguales a la intensidad de sonido promedio en el tiempo y la presión de sonido de cinco altavoces en el punto de recepción. Otro método mantiene la dirección de la velocidad de las partículas y la presión del sonido.
El objeto de la presente invención es proporcionar conceptos mejorados para la panoramización de amplitud. El objeto de la presente invención se resuelve mediante un aparato según la reivindicación 1, mediante un método según la reivindicación 9 y mediante un programa informático según la reivindicación 10, mediante un aparato según la reivindicación 11, mediante un método según la reivindicación 12 y mediante un programa informático según la reivindicación 13.
Los conceptos proporcionados proporcionan un concepto basado en requisitos para la panoramización de amplitud.
A continuación, se describen realizaciones de la presente invención con más detalle con referencia a las figuras, en las que:
la figura 1 es un aparato según una realización,
la figura 2 ilustra 17 altavoces en 17 posiciones de altavoz,
la figura 3 ilustra un ejemplo para una determinación de un subconjunto adecuado de posiciones de altavoz según una realización que depende de una primera posición de panoramización,
la figura 4 ilustra otro ejemplo para una determinación de un subconjunto adecuado de posiciones de altavoz según una realización que depende de una segunda posición de panoramización,
la figura 5 ilustra la determinación de dos subconjuntos adecuados de posiciones de altavoz según una realización dependiendo de la primera y la segunda posición de panoramización,
la figura 6 ilustra la determinación de dos subconjuntos adecuados de posiciones de altavoz según una realización dependiendo de la primera y una tercera posición de panoramización,
la figura 7 ilustra cinco posiciones de altavoz y una posición de panoramización,
la figura 8 ilustra una primera subdivisión triangular de un cuerpo definido por un polígono que depende de una primera posición de altavoz según una realización,
la figura 9 ilustra una segunda subdivisión triangular del cuerpo definido por polígono que depende de una segunda posición de altavoz según una realización,
la figura 10 ilustra una tercera subdivisión triangular del cuerpo definido por polígono que depende de una tercera posición de altavoz según una realización,
la figura 11 ilustra una cuarta subdivisión triangular del cuerpo definido por polígono que depende de una cuarta posición de altavoz según una realización,
la figura 12 ilustra una quinta subdivisión triangular del cuerpo definido por polígono que depende de una quinta posición de altavoz según una realización,
la figura 13 ilustra subdivisiones triangulares de otro polígono definido según una realización, en la que el cuerpo definido por polígono es una cuadrícula,
la figura 14 ilustra una subdivisión triangular de un polígono definido adicional según una realización, en la que el cuerpo definido por polígono es un hexágono,
la figura 15 ilustra una subdivisión de un polígono definido adicional según una realización, en la que el cuerpo definido por polígono es un octágono, que se subdivide en cuadrículas,
la figura 16 ilustra una determinación de una ganancia de panoramización basada en distancias según una realización, la figura 17 ilustra una determinación de una ganancia de panoramización basada en distancias según otra realización, la figura 18 ilustra un sistema según una realización,
la figura 19 ilustra las ganancias de panoramización de VBAP para una configuración de sonido envolvente 5.1 común, la figura 20 representa un método de VBAP generalizado utilizando un altavoz imaginario y una mezcla descendente, la figura 21 ilustra triángulos de VBAP en coordenadas esféricas para una configuración 5.1+4,
la figura 22 ilustra ganancias de panoramización para una configuración estéreo,
la figura 23 ilustra una vista desde arriba de una desviación angular entre VBAP y atenuación cruzada lineal, la figura 24 ilustra una subdivisión de un cuerpo definido por polígono en triángulos según una realización, la figura 25 indica trayectorias reproducidas por señales de prueba en una prueba de escucha,
la figura 26 muestra el promedio y el intervalo de confianza del 95% de los resultados de la prueba para una primera prueba de escucha en la que se calificó el timbre,
la figura 27 ilustra un diagrama de diferencia para la primera prueba de escucha donde se calificó el timbre, la figura 28 muestra los resultados de la prueba para una segunda prueba en la que se calificó la precisión de la ubicación y la suavidad del movimiento,
la figura 29 ilustra un diagrama de diferencia para la segunda prueba de escucha donde se calificó la precisión de la ubicación y la suavidad del movimiento,
la figura 30 muestra los resultados de la prueba para una tercera prueba en la que se calificaron la extensión y el enfoque de la fuente,
la figura 31 ilustra un diagrama de diferencia para la tercera prueba de escucha donde se calificaron la extensión y el enfoque de la fuente,
la figura 32 ilustra los resultados para la calidad general, y
la figura 33 ilustra un diagrama de diferencia para los resultados de la calidad general.
La figura 1 ilustra un aparato para generar cuatro o más señales de salida de audio según una realización. El aparato comprende un determinador de ganancia de panoramización 110 y un procesador de señal 120.
El determinador de ganancia de panoramización 110 está configurado para determinar un subconjunto adecuado a partir de un conjunto de cinco o más posiciones de altavoz, de modo que el subconjunto adecuado comprende cuatro o más de las cinco o más posiciones de altavoz, en el que el determinador de ganancia de panoramización 110 está configurado para determinar el subconjunto adecuado dependiendo de una posición de panoramización y dependiendo de las cinco o más posiciones de altavoz.
Además, el determinador de ganancia de panoramización 110 está configurado para determinar una ganancia de panoramización para cada una de las cuatro o más señales de salida de audio determinando dicha ganancia de panoramización dependiendo de la posición de panoramización y dependiendo de las cuatro o más posiciones de altavoz del subconjunto adecuado.
El procesador de señal 120 está configurado para generar cada señal de salida de audio de las cuatro o más señales de salida de audio dependiendo de la ganancia de panoramización para dicha señal de salida de audio y dependiendo de una señal de entrada de audio.
Un subconjunto adecuado de un conjunto de cinco o más posiciones de altavoz es un subconjunto de las cinco o más posiciones de altavoz que no comprende al menos una de las cinco o más posiciones de altavoz.
Tal como se describe, el determinador de ganancia de panoramización está configurado para determinar un subconjunto adecuado a partir de una pluralidad de cinco o más posiciones de altavoz, de modo que el subconjunto comprende al menos cuatro posiciones de altavoz.
Esto se explica con referencia a las figuras 2-6.
La figura 2 ilustra 17 altavoces en 17 posiciones de altavoz 201-217. Las 17 posiciones de altavoz 201-217 definen cinco pentágonos 221, 222, 223, 224 y 225. En particular, el pentágono 221 está definido por un polígono con los vértices 201, 202, 203, 204 y 205. El pentágono 222 está definido por un polígono con los vértices 201,205, 206, 207 y 208. El pentágono 223 está definido por un polígono con los vértices 201,208, 209, 210 y 211. El pentágono 224 está definido por un polígono con los vértices 208, 212, 213, 214 y 209. Y el pentágono 225 está definido por un polígono con los vértices 209, 214, 215, 216 y 217.
En la figura 2 puede suponerse que las posiciones de altavoz son posiciones dentro de un sistema de coordenadas bidimensional.
Por ejemplo, el eje horizontal 231 del sistema de coordenadas bidimensional puede, por ejemplo, indicar un ángulo azimutal 0 de la posición de altavoz, y el eje vertical 232 del sistema de coordenadas puede, por ejemplo, indicar un ángulo de elevación $ del sistema de coordenadas. Por lo tanto, en todas las posiciones de altavoz que se describen solo por un ángulo azimutal o un ángulo de elevación puede haber posiciones (se supone que están) ubicadas en una esfera en el mundo tridimensional real.
O, por ejemplo, el eje horizontal 231 del sistema de coordenadas puede, por ejemplo, indicar un valor de coordenadas de abscisas (eje x) de la posición de altavoz, y el eje vertical 232 del sistema de coordenadas puede, por ejemplo, indicar una ordenada (eje y) de un sistema de coordenadas cartesianas. Por ejemplo, en el mundo de dimensiones reales, todos los altavoces pueden estar ubicados en un plano.
En la figura 2, los cuerpos definidos por los polígonos son convexos. Por ejemplo, el cuerpo definido por el polígono con los vértices 201,202, 203, 204 y 205 es convexo. Además, por ejemplo, el cuerpo definido por el polígono con los vértices 201, 205, 206, 207 y 208 es convexo.
Además, los cinco polígonos que definen los cinco pentágonos no encierran ninguna otra posición de altavoz que no pertenezca al polígono respectivo. Por ejemplo, el polígono con los vértices 201, 202, 203, 204 y 205 no encierra ninguna de las posiciones de altavoz 206 - 217.
En la figura 3, se indica una posición de panoramización 241. La disposición de los altavoces reproducirá ahora una señal de entrada de audio, como si la fuente que emite la señal de entrada de audio estuviera ubicada en la posición de panoramización.
El determinador de ganancia de panoramización 110 de la figura 1 puede, por ejemplo, estar configurado para determinar uno de los polígonos mencionados anteriormente que encierran la posición de panoramización para determinar el subconjunto de posiciones de altavoz. En el ejemplo de la figura 3, este es el polígono (específico de subconjunto) con los vértices 201,202, 203, 204 y 205. Por lo tanto, las posiciones 201,202, 203, 204 y 205 de los altavoces son los (únicos) elementos del subconjunto adecuado de posiciones de altavoz. Viceversa, el polígono que define el subconjunto es específico de subconjunto para el subconjunto y, por lo tanto, puede denominarse polígono específico de subconjunto.
El determinador de ganancia de panoramización está ahora configurado para determinar una ganancia de panoramización para cada una de las señales de salida de audio dependiendo de la posición de panoramización y dependiendo de las posiciones de altavoz del subconjunto (preseleccionado).
Una vez que se han determinado las posiciones de altavoz del subconjunto adecuado, no es necesario considerar más las otras posiciones de altavoz para determinar las ganancias de panoramización.
Las realizaciones se basan en el hallazgo de que para reproducir la señal de entrada de audio como si se originara en la posición de panoramización 241, es suficiente que solo los altavoces 201,202, 203, 204 y 205 emitan una señal de salida. Los otros altavoces no son necesarios.
Como cada señal de salida de audio se genera para una posición de altavoz en particular (o, en otras palabras, para un altavoz que está asociado con, o, por ejemplo, posicionado en, esa posición de altavoz en particular), es suficiente generar solo las señales de salida de audio para los altavoces en las posiciones de altavoz del subconjunto adecuado, para reproducir una señal de salida de audio, como si se emitiera desde la posición de panoramización.
Por tanto, para generar las señales de salida de audio, solo se necesita una ganancia de panoramización para cada una de las señales de salida de audio para reproducir la señal de entrada de audio como si se emitiera desde la posición de panoramización. Además, para determinar la ganancia de panoramización, como la señal de entrada de audio se panoramiza entre los altavoces asociados con las posiciones de altavoz del subconjunto adecuado, solo deben tenerse en cuenta la posición de panoramización y las posiciones de altavoz del subconjunto adecuado.
Por lo tanto, estas realizaciones son ventajosas, ya que solo debe considerarse un número reducido de posiciones de altavoz, lo que reduce la complejidad.
Además, las realizaciones se basan en el hallazgo de que al menos cuatro posiciones de altavoz deben estar en el subconjunto, ya que deberían emplearse al menos cuatro altavoces para representar una señal de entrada de audio en la posición de panoramización. Las realizaciones también se basan en el hallazgo de que una reproducción de la señal de entrada de audio por solo tres altavoces o menos tiene desventajas en comparación con el uso de cuatro o más altavoces, en particular, cuando la posición de panoramización se mueve, tal como se describirá más adelante.
Por lo tanto, el subconjunto es un subconjunto adecuado y, por lo tanto, no comprende todas las posiciones de altavoz existentes, pero también, el subconjunto comprende cuatro o más posiciones de altavoz.
La figura 4 ilustra de nuevo los 17 altavoces en las 17 posiciones de altavoz 201 - 217. En la figura 4, una nueva posición de panoramización se encuentra en la posición 242. La nueva posición de panoramización 242 de la figura 4 es diferente de la antigua posición de panoramización 241 de la figura 3. La razón de esto puede ser, por ejemplo, que en la escena de grabación, una persona que emite ondas sonoras que provocan la señal de entrada de audio puede haberse movido, de modo que en un momento posterior, la posición de panoramización también se mueve de la posición 241 a la posición 242.
O bien, la posición de panoramización 242 puede relacionarse con el mismo punto en el tiempo, pero con otra señal de entrada de audio. Por ejemplo, la posición de panoramización 241 puede relacionarse con una primera señal de entrada de audio que puede comprender la parte de sonido de un violín en una orquesta. La posición de panoramización 242 puede relacionarse con una segunda señal de entrada de audio que puede comprender el puerto de sonido de una trompeta en la orquesta. A continuación, en la escena de reproducción, la posición de panoramización 241 indica que el violín se colocará virtualmente en la posición de panoramización 241, y la posición de panoramización 242 indica que la trompeta se colocará virtualmente en la posición de panoramización 242. Por lo tanto, en una realización, la señal de entrada de audio relacionada con el violín solo es reproducida por los altavoces en las posiciones de altavoz 201, 202, 203, 204 y 205 y la señal de entrada de audio adicional relacionada con la trompeta solo es reproducida por los altavoces en las posiciones de altavoz 208, 212, 213, 214 y 209 (véase la figura 5). Por lo tanto, según una realización, las ganancias de panoramización para amplificar o atenuar la señal de entrada de audio que representa los sonidos del violín solo se calculan para los altavoces en las posiciones de altavoz 201, 202, 203, 204 y 205. Y las ganancias para amplificar o atenuar la señal de entrada de audio adicional que representa los sonidos de la trompeta solo se calculan para los altavoces en las posiciones de altavoz 208, 212, 213, 214 y 209.
En este ejemplo, refiriéndose a la señal de entrada de audio que representa al violín como ais1 y refiriéndose a la señal de entrada de audio que representa la trompeta como ais2, luego se calculan ganancias gu , g2,1, g3,1, g4,1 y gs,1 para los altavoces en las posiciones de altavoz 201, 202, 203, 204 y 205, respectivamente, mediante el determinador de ganancia de panoramización 110, y el procesador de señal 120 aplica las ganancias de panoramización calculadas g1,1, g2,1, g3,1, g4,1 y gs,1 en la señal de entrada de audio ais1 para obtener las señales de salida de audio aos1, aos2, aos3, aos4 y aoss para los altavoces en las posiciones de altavoz 201, 202, 203, 204 y 205, respectivamente, por ejemplo, según:
aos1 = g1(1 ■ aís-j
ao$2 = g2,i • ais-i
Figure imgf000007_0001
Asimismo, las ganancias gs,2, g12,2, g13,2, g14,2 y g9,2 para los altavoces en las posiciones de altavoz 208, 212, 213, 214 y 209, respectivamente, se calculan mediante el determinador de ganancia de panoramización 110, y el procesador de señal 120 aplica las ganancias de panoramización calculadas gs.2, g12,2, g13,2, g14,2 y g9,2 en la señal de entrada de audio ais2 para obtener las señales de salida de audio aose, aos12, aos13, aos14 y aos9 para los altavoces en las posiciones de altavoz 208, 212, 213, 214 y 209, respectivamente, por ejemplo, según:
aosg = gBt2 ' ais2
aos12 = g 12,21 ais2
aos13 = g13i2 ■ ais2
aos14 = 314,2 ’ a¡s2
aosg = g9,2 ■ ais2
En particular, según una realización, la señal de entrada de audio comprende una pluralidad de muestras de entrada de audio. El procesador de señal 120 puede, por ejemplo, estar configurado para generar cada señal de salida de audio de las cuatro o más señales de salida de audio multiplicando cada una de una o más de las muestras de entrada de audio de la señal de entrada de audio con la ganancia de panoramización para dicha señal de salida de audio para obtener una o más muestras de salida de audio de la señal de salida de audio.
O, en otra realización, la señal de entrada de audio comprende una pluralidad de muestras de entrada de audio, y el procesador de señal 120 está configurado para generar cada señal de salida de audio de las cuatro o más señales de salida de audio multiplicando cada una de una o más de las muestras de entrada de audio de la señal de entrada de audio con una raíz cuadrada de la ganancia de panoramización para dicha señal de salida de audio para obtener una o más muestras de salida de audio de la señal de salida de audio.
En algunos casos, el mismo altavoz debe reproducir más de una señal de salida de audio. Por ejemplo, en la figura 6, la posición de panoramización 243 relativa a una señal de entrada de audio ais3 está ubicada dentro de un pentágono definido por el polígono con los vértices 201, 208, 209, 210 y 211. Entonces, las ganancias de panoramización g1,3, gs,3, g9,3, g10,3 y gn ,3 relativas a ais3 son calculadas por el determinador de ganancia de panoramización 110, y el procesador de señal 120 aplica las ganancias de panoramización calculadas g1,3, gs,3, g9,3, g10,3 y gn ,3 en la señal de entrada de audio ais3. Para obtener las señales de salida de audio, el procesador de señal 120 puede, por ejemplo, aplicar las siguientes fórmulas:
aoSi = g1(1 ■ aiSi g1i3- ais3
aos2 = 92,1 ■ ais-t
SOS3 — Q3j ■ ais-?
OOS4 = 94,1 ‘ 3ÍSi
aos5 - 95,1 ■ aiSi
aosa = g8,313ÍS3
8OS9 = g93 ■ 3ÍS3
aosiQ = gf0,3 • aíSj
aosn = g11i3- ais3
Más en general, si una señal de salida de audio debe reproducir porciones de más de una señal de entrada de audio, el procesador de señal 120 puede, por ejemplo, estar configurado para obtener una señal de salida de audio de este tipo aplicando las ganancias respectivas en las respectivas señales de entrada de audio y combinando las señales de entrada de audio respectivamente amplificadas o atenuadas. Por ejemplo, en la figura 1, la ganancia de panoramización calculada gi,i se aplica en aisi para obtener la gi,i ■ aisi amplificada o atenuada y la ganancia de panoramización calculada gi ,3 se aplica en ais3 para obtener la gi ,3 ■ ais3 amplificada o atenuada. Entonces, se combinan gi,i ■ aisi y gi ,3 ■ ais3.
Por lo tanto, los conceptos proporcionados pueden aplicarse a más de una señal de entrada de audio. En consecuencia, según una realización, la señal de entrada de audio puede ser, por ejemplo, una primera señal de entrada de audio, en la que la posición de panoramización es una primera posición de panoramización, en la que la ganancia de panoramización es una primera ganancia de panoramización dependiente de la señal de entrada, y en la que el subconjunto adecuado es un primer subconjunto adecuado.
El determinador de ganancia de panoramización i i0 puede, por ejemplo, estar configurado para determinar uno o más subconjuntos adecuados adicionales a partir de un conjunto de cinco o más posiciones de altavoz, de modo que cada uno de los uno o más subconjuntos adecuados adicionales comprenda cuatro o más de las cinco o más posiciones de altavoz. Además, el determinador de ganancia de panoramización i i0 puede, por ejemplo, estar configurado para determinar cada uno de los uno o más subconjuntos adecuados adicionales dependiendo de una de una o más posiciones de panoramización adicionales y dependiendo de las cinco o más posiciones de altavoz.
Además, el determinador de ganancia de panoramización i i 0 puede, por ejemplo, estar configurado para determinar una o más ganancias de panoramización dependientes de la señal de entrada adicionales para cada una de las cuatro o más señales de salida de audio determinando cada una de las una o más ganancias de panoramización adicionales dependiendo de una de las una o más posiciones de panoramización adicionales y dependiendo de las cuatro o más posiciones de altavoz de uno de los uno o más subconjuntos adecuados adicionales. El procesador de señal 120 puede, por ejemplo, estar configurado para generar cada señal de salida de audio de las cuatro o más señales de salida de audio dependiendo de la primera ganancia de panoramización dependiente de la señal de entrada para dicha señal de salida de audio, dependiendo de la una más ganancias de panoramización dependientes de la señal de entrada adicionales para dicha señal de salida de audio, dependiendo de la señal de entrada de audio, y dependiendo de la una o más señales de entrada de audio adicionales.
Como observación secundaria, se menciona que a continuación, la posición de panoramización a veces también se denomina dirección de panoramización. El término dirección de panoramización se origina en que, por ejemplo, en un azimut, sistema de coordenadas de elevación, la posición de panoramización en el sistema de coordenadas bidimensional es, en la configuración tridimensional real, una información de dirección que apunta desde un punto central, por ejemplo, desde un punto óptimo en la dirección del altavoz.
A continuación, se describe otro aspecto de las realizaciones. Este aspecto se refiere a cómo se realiza la panoramización entre las posiciones de altavoz del subconjunto determinado, por ejemplo, entre las posiciones de altavoz 208, 2 i2 , 2 i3, 2 i4 y 209 de las figuras 4 y 5.
Sin embargo, debe observarse que según algunas realizaciones, no tiene lugar la preselección de un subconjunto. En su lugar, por ejemplo, se generan señales de salida de audio para los altavoces en todas las posiciones de altavoz 208, 2 i2, 2 i3, 2 i4 y 209 para simular que una señal de salida de audio, por ejemplo, una señal de salida de audio ais2 se origina en una posición de panoramización, por ejemplo, una posición de panoramización 242. Además, se cubren tales realizaciones.
La figura 7 ilustra la configuración, mostrando las 5 posiciones de altavoz 208, 212, 213, 214 y 209 de los altavoces y la posición de panoramización 242. Según las realizaciones, para determinar las ganancias de panoramización para obtener señales de salida de audio que se emitirán en las posiciones de altavoz 208, 212, 213, 214 y 209, se aplican los siguientes conceptos:
la figura 8 ilustra la determinación de la ganancia de panoramización para la señal de salida de audio para la posición de altavoz 209. El cuerpo encerrado por el polígono con los vértices 208, 212, 213, 214 y 209 se subdivide en tres triángulos, a saber, un primer triángulo con vértices 209, 208, 212, un segundo triángulo con vértices 209, 212, 213 y un tercero triángulo con vértices 209, 213, 214, de modo que la subdivisión del cuerpo dio como resultado triángulos que tienen la posición de altavoz 209 (para la cual se determina la ganancia de panoramización) como vértice.
Como la posición de panoramización está compuesta por el segundo triángulo con los vértices 209, 212, 213, según las realizaciones, la ganancia de panoramización para la señal de salida de audio para la posición de altavoz 209 se calcula entonces dependiendo de las posiciones de altavoz 209, 212, 213, y no por las posiciones de altavoz 208 y 214 restantes. Esto simplifica el cálculo y ayuda a ahorrar tiempo del procesador en comparación con el uso de todas las posiciones de altavoz al calcular la ganancia de panoramización asociada con la señal de salida de audio que se generará para la posición de altavoz 209.
Así, al subdividir el cuerpo encerrado por el polígono, el determinador de ganancia de panoramización ha determinado un grupo de posiciones de altavoz asociadas que comprenden las posiciones de altavoz 209, 212, 213, en el que el grupo de posiciones de altavoz asociadas está asociado a la señal de salida de audio para el altavoz en la posición de altavoz 209 y determina cuáles de las posiciones de altavoz se tienen en cuenta al calcular la ganancia de panoramización para obtener la señal de salida para (asociada con) la posición de altavoz 209.
Viceversa, el grupo de señales de altavoz asociadas define un triángulo que es específico de grupo para el grupo de señales de altavoz asociadas. Más en general, el triángulo 209, 212, 213 puede considerarse como un polígono específico de grupo con los vértices 209, 212, 213.
Asimismo, la figura 9 ilustra la determinación de la ganancia de panoramización para la señal de salida de audio para la posición de altavoz 208. El cuerpo encerrado por el polígono con los vértices 208, 212, 213, 214 y 209 se subdivide en tres triángulos, a saber, un primer triángulo con vértices 208, 212, 213, un segundo triángulo con vértices 208, 213, 214 y un tercero triángulo con vértices 208, 214, 209, de modo que la subdivisión del cuerpo dio como resultado triángulos que tienen la posición de altavoz 209 (para la cual se determina la ganancia de panoramización) como vértice. Como la posición de panoramización está compuesta por el primer triángulo con los vértices 208, 212, 213, según las realizaciones, la ganancia de panoramización para la señal de salida de audio para la posición de altavoz 208 se calcula entonces dependiendo de las posiciones de altavoz 208, 212, 213, y no por las posiciones de altavoz 209 y 214 restantes. Por lo tanto, al subdividir el cuerpo encerrado por el polígono, el determinador de ganancia de panoramización ha determinado un grupo de posiciones de altavoz asociadas que comprenden las posiciones de altavoz 208, 212, 213, en el que el grupo de posiciones de altavoz asociadas está asociado a la señal de salida de audio para el altavoz en la posición de altavoz 208.
De manera similar, la figura 10 ilustra que el grupo de posiciones de altavoz asociadas, que está asociado con la señal de salida de audio para el altavoz en la posición de altavoz 212, comprende las posiciones de altavoz 212, 213, 214 y se calcula la ganancia panoramización para obtener dicha señal de salida de audio dependiendo de estas posiciones de altavoz 212, 213, 214.
Asimismo, la figura 11 ilustra que el grupo de posiciones de altavoz asociadas, que está asociado con la señal de salida de audio para el altavoz en la posición de altavoz 213, comprende las posiciones de altavoz 213, 208, 212 y se calcula la ganancia de panoramización para obtener dicha señal de salida de audio dependiendo de estas posiciones de altavoz 213, 208, 212.
De manera similar, la figura 12 ilustra que el grupo de posiciones de altavoz asociadas, que está asociado con la señal de salida de audio para el altavoz en la posición de altavoz 214, comprende las posiciones de altavoz 214, 212, 213 y se calcula la ganancia panoramización para obtener dicha señal de salida de audio dependiendo de estas posiciones de altavoz 214, 212, 213. Según las realizaciones, el triángulo que encierra la posición de panoramización define el grupo de posiciones de altavoz asociadas.
Si la posición de panoramización está ubicada exactamente en un borde de dos de los triángulos, algunas realizaciones, por ejemplo, eligen uno de los dos triángulos para calcular la ganancia de panoramización. Otras realizaciones, por ejemplo, calculan una primera ganancia de panoramización intermedia para el primero de los dos triángulos y luego calculan una segunda ganancia de panoramización intermedia para un segundo de los dos triángulos, y luego calculan el promedio de la primera y la segunda ganancia de panoramización intermedia como la ganancia de panoramización final.
Para subdividir el cuerpo definido por el polígono (en este caso el polígono con los bordes 208, 212, 213, 214, 209, que en este caso define un pentágono) es preferible que el cuerpo sea convexo.
Además, se prefiere que el cuerpo definido por el polígono se subdivida en triángulos, de manera que un triángulo no encierre posiciones de altavoz diferentes de las posiciones de altavoz que definen los vértices del triángulo.
Según algunas realizaciones, el polígono con las posiciones de altavoz como vértices, no define un pentágono, sino que define cualquier otro tipo de cuerpo con cuatro o más vértices, por ejemplo, un cuadrícula, un hexágono, etc.
La figura 13 ilustra la subdivisión de un cuadrícula para las señales de salida de audio para altavoces en cada una de las posiciones de altavoz 301,302, 303, 304 y para una posición de panoramización 305.
La figura 14 ilustra la subdivisión de un hexágono con vértices 401,402, 403, 404, 405, 406 para la señal de salida de audio para el altavoz en la posición de altavoz 401 y para una posición de panoramización 407. El grupo de posiciones de altavoz asociadas para la señal de salida de audio para el altavoz en la posición de altavoz 401 comprende las posiciones de altavoz 401, 403 y 404.
Los subcuerpos en los que se subdivide el cuerpo definido por el polígono no tienen que ser triángulos. La figura 15 ilustra un ejemplo según una realización, en la que el octágono con los vértices 501,502, 503, 504, 505, 506, 507 y 508 se subdivide en tres cuadrículas, cuando el grupo de posiciones de altavoz asociadas para la señal de salida de audio para la posición de altavoz 501 se determinará, es decir, una primera cuadrícula con los vértices 401,402, 403 y 404, una segunda cuadrícula con los vértices 401,404, 405 y 406 y una tercera cuadrícula con los vértices 401,406, 407, 408. Como la posición de panoramización 409 está encerrada por la cuadrícula 401, 404, 405, 406, el determinador de ganancia de panoramización calcula la ganancia de panoramización asociada con la posición de altavoz 401 dependiendo de la posición de panoramización 409, y dependiendo de las posiciones de altavoz 401,404, 405, 406 del grupo de posiciones de altavoz asociadas para la señal de salida de audio para la posición de altavoz 401.
En general, el determinador de ganancia de panoramización 110 está configurado para determinar un polígono específico de grupo que encierra la posición de panoramización. Dicho polígono es específico de grupo para el grupo de señales de altavoz asociadas.
Estos conceptos se basan en el hallazgo de que la complejidad se reduce cuando se tienen en cuenta menos de todas las posiciones de altavoz.
Además, estos conceptos se basan en el hallazgo de que, al determinar un factor de ganancia para cada señal de salida de audio para cada una de las posiciones de altavoz, se crea una impresión de sonido más realista en comparación con solo determinar los factores de ganancia y, por lo tanto, las señales de salida de audio para las posiciones de altavoz de un triángulo único. En cambio, las realizaciones determinan factores de ganancia para cada posición de altavoz del subconjunto, aunque solo teniendo en cuenta para cada uno de los factores de ganancia las posiciones de altavoz de un triángulo específico del factor de ganancia.
Sin embargo, como los triángulos correspondientes (o, más generalmente: subcuerpos) para determinar las ganancias de panoramización para las señales de salida de audio difieren para al menos algunas de las señales de salida de audio, esto asegura que todas las posiciones de altavoz se tengan en cuenta para determinar al menos uno de los factores de ganancia. Esto es ventajoso en comparación con tener siempre en cuenta el mismo triángulo para determinar todas las ganancias de panoramización.
A continuación, se describe otro aspecto de la invención. Aquí se explica cómo la ganancia de panoramización para una señal de salida de audio para un altavoz en una posición de altavoz puede determinarse, por ejemplo, dependiendo de la posición de panoramización y dependiendo de las posiciones de altavoz del grupo de posiciones de altavoz asociadas.
La figura 16 ilustra un ejemplo correspondiente que muestra las posiciones de altavoz 501, 502, 503, 504, 505 y la posición de panoramización 506. Como la posición de panoramización 506 se encuentra dentro del triángulo de las posiciones de altavoz 501,503 y 504, solo las posiciones de altavoz 501,503 y 504 pertenecen al grupo de posiciones de altavoz asociadas, y solo se tienen en cuenta estas posiciones de altavoz 501,503, 504 para determinar la ganancia de panoramización para la señal de salida de audio para la posición de altavoz 501 (y no las posiciones de altavoz 502 y 505, que no pertenecen a este grupo de señales de altavoz asociadas).
La línea 511 indica que una primera distancia es la distancia más corta entre la posición de panoramización 507 y una primera línea recta a través de las dos posiciones de altavoz 503, 504 adicionales del grupo de posiciones de altavoz asociadas.
La línea 512 indica una segunda distancia que es la distancia más corta entre la posición de altavoz 501 (para cuya señal de salida de audio se determina la ganancia de panoramización) y una segunda línea recta 515 a través de la posición de panoramización, en el que dicha segunda línea recta es paralela a dicha primera línea recta 510.
El determinador de ganancia de panoramización 110 puede configurarse, por ejemplo, para determinar la ganancia de panoramización dependiendo de la relación de la primera distancia 511 y una suma de la primera distancia 511 y la segunda distancia 512.
Por ejemplo, suponiendo que en la figura 16 la primera distancia 511 es 0,6 y la segunda distancia 512 es 0,2, entonces, la ganancia de panoramización P501 puede, por ejemplo, calcularse para ser
Figure imgf000011_0001
Esto refleja que la posición de altavoz 501 está más cerca de la línea 515 que las posiciones de altavoz 503 y 504 y, por lo tanto, la ganancia de panoramización P501 está más cerca de 1 que de 0.
La figura 17 ilustra otra realización, en la que el grupo de posiciones de altavoz asociadas comprende cuatro posiciones de altavoz 601,602, 603 y 604. La posición de panoramización está indicada por 605. Se determinará la ganancia de panoramización para la señal de salida de audio para la posición de altavoz 601. Pueden emplearse conceptos matemáticos del estado de la técnica para determinar una curva 608 a través de las posiciones de altavoz 602, 603, 604. En la figura 17 se ilustra una línea recta discontinua 610 a través de la posición de altavoz 601 y la posición de panoramización 605. La intersección de la línea recta discontinua 610 y la curva 608 define el punto de intersección 609. Una primera distancia 611 está definida por la distancia entre la posición de panoramización 605 y el punto de intersección 609. Una segunda distancia 612 está definida por la distancia entre la posición de panoramización 605 y la posición de altavoz 601.
De nuevo, el determinador de ganancia de panoramización 110 puede configurarse, por ejemplo, para determinar la ganancia de panoramización dependiendo de la relación de la primera distancia 511 y una suma de la primera distancia 511 y la segunda distancia 512.
Suponiendo que en la figura 17, la primera distancia 611 es 0,25 y que la segunda distancia 612 es 0,3, la ganancia de panoramización puede ser, por ejemplo,
„ = ---- 0-.-2--5----= -- 0-.-2-5-= 0 n.445C5C
601 0.25 0.3 0.55
La ganancia de panoramización P601 está ligeramente por debajo de 0,5 y esto refleja que la posición de altavoz 601 está un poco más alejada de la posición de panoramización 605 que el punto de intersección 609.
Como ya se mencionó, en algunas realizaciones, no se determina ningún grupo de posiciones de altavoz asociadas para determinar cada una de las ganancias de panoramización. En cambio, todas las posiciones de altavoz del subconjunto adecuado se tienen en cuenta para calcular cada ganancia.
En una realización de este tipo, cada posición de altavoz de las cuatro o más posiciones de altavoz del subconjunto adecuado está asociada con exactamente una de las cuatro o más señales de salida de audio, y en el que cada una de las cuatro o más señales de salida de audio está asociada con exactamente una de las cuatro o más posiciones de altavoz del subconjunto adecuado. El determinador de ganancia de panoramización 110 puede, por ejemplo, estar configurado para calcular, para cada señal de salida de audio de las cuatro o más señales de salida de audio, la ganancia de panoramización para dicha señal de salida de audio dependiendo de una posición de panoramización y dependiendo de la posición de altavoz de cada una de las cuatro o más señales de salida de audio.
Pueden determinarse, por ejemplo, diferentes ganancias de panoramización para diferentes puntos en el tiempo. Según tales realizaciones, el determinador de ganancia de panoramización 110 puede, por ejemplo, estar configurado para determinar la ganancia de panoramización para cada señal de salida de audio de las cuatro o más señales de salida de audio para un primer punto en el tiempo como una primera ganancia de panoramización dependiente del tiempo para dicha señal de salida de audio. Además, el determinador de ganancia de panoramización 110 puede configurarse, por ejemplo, para determinar una ganancia de panoramización adicional para cada señal de salida de audio de las cuatro o más señales de salida de audio para un segundo punto diferente en el tiempo como una segunda ganancia de panoramización dependiente del tiempo para dicha señal de salida de audio, siendo dicha segunda ganancia de panoramización dependiente del tiempo diferente de la primera ganancia de panoramización dependiente del tiempo para dicha señal de salida de audio.
Además, pueden determinarse, por ejemplo, diferentes ganancias de panoramización para diferentes frecuencias. Según tales realizaciones, el determinador de ganancia de panoramización 110 puede, por ejemplo, estar configurado para determinar la ganancia de panoramización para cada señal de salida de audio de las cuatro o más señales de salida de audio para una primera frecuencia como una primera ganancia de panoramización dependiente de la frecuencia para dicha señal de salida de audio. Además, el determinador de ganancia de panoramización 110 puede, por ejemplo, estar configurado para determinar una ganancia de panoramización adicional para cada señal de salida de audio de las cuatro o más señales de salida de audio para una segunda frecuencia diferente como una segunda ganancia de panoramización dependiente de la frecuencia para dicha señal de salida de audio, siendo dicha segunda ganancia de panoramización dependiente de la frecuencia diferente de la primera ganancia de panoramización dependiente de la frecuencia para dicha señal de salida de audio.
La figura 18 ilustra un sistema según una realización. El sistema comprende cinco o más altavoces y un aparato tal como se describió anteriormente con referencia a la figura 1. El aparato está indicado por el signo de referencia 100. Además, el sistema de la figura 18 comprende 17 altavoces en las posiciones de altavoz 201 - 217.
Cada uno de los altavoces está asociado con exactamente una posición de altavoz 201 - 217 del conjunto de cinco o más posiciones de altavoz.
Cada una de las cuatro o más señales de salida de audio está asociada con exactamente una posición de altavoz de las posiciones de altavoz 201 - 217 del subconjunto adecuado. Además, cada una de las cuatro o más señales de salida de audio está asociada con exactamente una de las posiciones de altavoz 201 - 217 del subconjunto adecuado.
El sistema está configurado para emitir cada señal de salida de audio de las cuatro o más señales de salida de audio por el altavoz que está asociado con la misma posición de altavoz que dicha señal de salida de audio.
En una realización, el sistema puede, por ejemplo, estar configurado para no emitir ninguna de las cuatro o más señales de salida de audio por cualquiera de los cuatro o más altavoces que no están asociados con la misma posición de altavoz que dicha señal de salida de audio.
Según una realización, el sistema puede, por ejemplo, estar configurado para no emitir ninguna de las cuatro o más señales de altavoz por al menos uno de los cinco o más altavoces.
Tal como ya se mencionó anteriormente, no todas las realizaciones requieren que el determinador de ganancia de panoramización 110 realice una preselección de un subconjunto adecuado de posiciones de altavoz, tal como se describe con referencia a las figuras 3 - 6.
En tales realizaciones, cada posición de altavoz de cuatro o más posiciones de altavoz está asociada con exactamente una de las cuatro o más señales de salida de audio, y en el que cada una de las cuatro o más señales de salida de audio está asociada con exactamente una de las cuatro o más posiciones de altavoz.
Además, en tales realizaciones, el determinador de ganancia de panoramización 110 del aparato de la figura 1 está configurado para determinar, para cada señal de salida de audio de las cuatro o más señales de salida de audio, un grupo de posiciones de altavoz asociadas, que está asociado con dicha señal de salida de audio, dependiendo de la posición de altavoz de cada una de las cuatro o más señales de salida de audio y dependiendo de la posición de panoramización, de modo que dicho grupo de posiciones de altavoz asociadas comprende la posición de altavoz que está asociada con dicha señal de salida de audio y al menos dos posiciones de altavoz adicionales de las cuatro o más posiciones de altavoz, en las que al menos una de las cuatro o más posiciones de altavoz no está comprendida por dicho grupo de posiciones de altavoz asociadas.
Además, en tales realizaciones, el determinador de ganancia de panoramización 110 está configurado para calcular, para cada señal de salida de audio de las cuatro o más señales de salida de audio, la ganancia de panoramización para dicha señal de salida de audio dependiendo de la posición de panoramización y dependiendo de las posiciones de altavoz del grupo de posiciones de altavoz asociadas que está asociado con dicha señal de salida de audio.
Además, en tales realizaciones, el procesador de señal 120 está configurado para generar cada señal de salida de audio de las cuatro o más señales de salida de audio dependiendo de la ganancia de panoramización para dicha señal de salida de audio y dependiendo de una señal de entrada de audio. El grupo de posiciones de altavoz asociadas que está asociado con una primera de las cuatro o más señales de salida de audio no es igual al grupo de posiciones de altavoz asociadas que está asociado con una segunda diferente de las cuatro o más señales de salida de audio.
Cada uno de los conceptos, implementaciones y configuraciones descritos anteriormente con referencia a las figuras 1-17 pueden emplearse en un aparato de este tipo.
A continuación, se presentan con más detalle realizaciones específicas de los conceptos de panoramización basados en polígonos proporcionados para configuraciones de altavoces 3D.
Los conceptos proporcionados se refieren a configuraciones de altavoces 3D, ya que la configuración de altavoces 3D puede proyectarse en el sistema de coordenadas bidimensional descrito anteriormente.
Las realizaciones proporcionan conceptos de panoramización de amplitud con atenuación de bordes (EFAP) para configuraciones de altavoces 3D. Similar a otros métodos de panoramización como la panoramización de amplitud de base vectorial (VBAP), puede utilizarse para crear fuentes fantasma entre las posiciones de altavoz. El método propuesto presenta ganancias de panoramización simétricas para configuraciones de altavoces simétricas, panoramización en N mediante el uso de polígonos en lugar de triángulos y un mejor comportamiento para ángulos de apertura grandes entre altavoces, mientras que implica una complejidad informática que está en el mismo orden de magnitud que el VBAP.
Una solución requeriría el uso de polígonos en lugar de triángulos como límite, lo que daría como resultado una panoramización en N. Si bien el VBAP solo admite triángulos debido a su principio fundamental, puede generalizarse para producir una panoramización en N, tal como se ilustra en la figura 2. Al hacerlo, se agrega un altavoz imaginario [1] en el medio del polígono y entonces se realiza la mezcla descendente de su ganancia de VBAP con sus vecinos, una solución que es más sencilla que las soluciones propuestas anteriormente [2].
En producciones de sonido envolvente, los panoramizadores de balance dual se utilizan ampliamente para posicionar señales mono. Para las producciones en 3D, un panoramizador de este tipo puede ampliarse fácilmente con un control deslizante adicional que agrega información de altura. Sin embargo, controlar la dirección del objeto en el espacio 3D es probablemente más crucial que controlar la extensión de la fuente o el ancho de la fuente auditiva. Por lo tanto, usar un panoramizador de balance dual para controlar el ángulo azimutal y de elevación de un objeto en combinación con un control deslizante para automatizar la extensión de la fuente, es una alternativa que merece la pena. Si se emplea una interfaz de usuario de este tipo, entonces la aritmética vectorial del VBAP da como resultado una propiedad que se ilustra en la figura 21.
La figura 21 ilustra triángulos de VBAP en coordenadas esféricas para una configuración 5.1 4 (cuadrados: posiciones de altavoz).
Los cuadrados marcan las posiciones de altavoz de la configuración que ya se utilizó en el ejemplo anterior. Las líneas continuas resultan de la combinación lineal vectorial de los pares de altavoces que especifican los bordes de los triángulos de VBAP. La aparente distorsión geométrica de los triángulos puede explicarse de la siguiente manera: Los triángulos son las superficies subdivididas del poliedro que está definido por los altavoces en un radio constante. Al proyectar los bordes del triángulo sobre la superficie de la esfera, se obtiene el ángulo azimutal y de elevación como parte de sus coordenadas esféricas. En consecuencia, si el usuario quisiera que un objeto se panoramizara por pares entre el altavoz U110 y U-110 ubicados a 35° de elevación, tendría que seguir una trayectoria que supere los 60° de elevación. Para una trayectoria con elevación constante de 35°, VBAP daría como resultado amplitudes significativas para los canales de altavoces M110 y M-110.
Algunas de las realizaciones proporcionadas tienen como objetivo
1. mantener un enfoque con requisitos de cálculo reducidos (como VBAP)
2. realizado como panoramización de amplitud (como VBAP)
3. en una realización particular, emplear ganancias normalizadas de potencia (como VBAP)
4. realizar soporte nativo para el panoramizador en N definido por polígonos en lugar de triángulos
5. Panoramización por parejas a lo largo del polígono
6. Para ángulos pequeños (< 60°) y 2 altavoces activos, teorema de la tangente aproximado (VBAP 2D)
7. Para ángulos grandes y 2 altavoces activos, lograr una diferencia de nivel suficiente para evitar la panoramización donde la localización de suma no funciona
8. lograr una transición suave de las ganancias entre los altavoces implicados
9. en el que algunas realizaciones realizan el cálculo directamente en el sistema de coordenadas esféricas (véase, por ejemplo, la figura 21).
Se proporcionan conceptos de panoramización que cumplen con estos requisitos. Las consideraciones 2D se amplían para configuraciones 3D.
En primer lugar, se describen las consideraciones 2D.
En el caso 2D, los parámetros direccionales se reducen al ángulo azimutal. Si bien el cuarto objetivo de diseño no es relevante para el caso 2D, el sexto y el séptimo son de especial importancia. Puede encontrarse una solución sencilla que presenta las propiedades deseadas calculando ganancias de atenuación cruzada lineal como resultado intermedio,
Figure imgf000014_0001
donde ao indica el ángulo de apertura entre e par e atavoces mp ca o y an indica el ángulo entre el altavoz respectivo y la dirección de panoramización.
La figura 22 ilustra las ganancias de panoramización para una configuración estéreo (sólido: VBAP; punteado: atenuación cruzada lineal; discontinuo: atenuación cruzada de potencia normalizada). En particular, la figura 22 representa para un ángulo de apertura de 60° estas funciones de atenuación cruzada y las curvas objetivo que están dadas por las ganancias de panoramización VBAP 2D.
Si en una segunda etapa se aplica la normalización de energía (3) a las ganancias de atenuación cruzada lineal, como para VBAP, puede observarse que el resultado se aproxima mucho a las curvas objetivo dadas.
La figura 23 ilustra una vista desde arriba de una desviación angular entre VBAP (+) y atenuación cruzada lineal (□). En particular, la figura 23 ilustra el principio de aproximación subyacente para el ejemplo de 60°. Los altavoces son el límite del intervalo angular mostrado. Las cruces marcan las direcciones objetivo dadas que consisten en un conjunto de posiciones intermedias equiángulas. Si los dos vectores base se multiplican por las correspondientes ganancias de atenuación cruzada, se obtienen los resultados que están marcados por los cuadrados. Las desviaciones angulares entre las direcciones objetivo y el resultado del enfoque de atenuación cruzada se ilustran con líneas continuas. A partir de esta consideración geométrica puede concluirse a) que la aproximación es más cercana cuanto más pequeño es el ángulo de apertura del altavoz y b) que un ángulo de apertura de 60° todavía puede considerarse pequeño.
La ganancia de atenuación cruzada solo depende de la relación entre el ángulo de panoramización y el ángulo de apertura entre los altavoces. Por lo tanto, un ángulo de apertura mayor da como resultado el gráfico de puntos mostrado en la figura 22 escalado a lo largo del eje x (ángulo azimutal). Esta es una propiedad deseada, ya que cumple con el séptimo objetivo de diseño.
La normalización de potencia puede realizarse, por ejemplo, empleando la fórmula:
Figure imgf000014_0002
Ahora, se proporciona un concepto 3D.
Si bien el espacio de parámetros es unidimensional en el caso 2D y solo consiste en el ángulo azimutal, es bidimensional en el caso 3D y está dividido por el ángulo azimutal y de elevación. Al especificar los polígonos de malla/altavoz en este espacio de parámetros, se logra el cumplimiento del noveno objetivo de diseño y se evita la distorsión geométrica que puede observarse para el dominio euclidiano de VBAP. Esto puede hacerse manualmente o por medio de un algoritmo como el algoritmo Quick-Hull que genera una malla triangular [3]. En el último caso, los triángulos pueden combinarse en polígonos, si sus vértices se encuentran dentro del mismo plano o al menos dentro de un cierto intervalo de tolerancia.
La figura 24 ilustra una subdivisión de un cuerpo definido por polígono en triángulos según una realización. En particular, la figura 24 ilustra un diagrama de contorno de la ganancia de panoramización para el altavoz más alto de un polígono a modo de ejemplo. El eje x indica el ángulo azimutal, el eje e indica el ángulo de elevación, los cuadrados indican los vértices del altavoz, las líneas continuas indican el contorno de ganancia, las líneas discontinuas indican los bordes del polígono y las flechas indican vectores normales.
El método de atenuación cruzada lineal puede transferirse al caso 3D definiendo funciones de atenuación cruzada lineal entre los altavoces de un polígono. La figura 24 ilustra esto mediante un diagrama de contorno para el altavoz más alto que es parte de un polígono definido por cinco altavoces. Las direcciones del altavoz, que son los vértices del polígono mostrado por la línea discontinua, están marcadas por cuadrados. La ganancia para el altavoz más alto en función de la dirección de panoramización dentro del polígono se muestra por medio de líneas de contorno sólidas.
Para calcular la ganancia de atenuación cruzada de un altavoz, el polígono primero debe subdividirse en triángulos especificados por el vértice del altavoz y los bordes del polígono. Esta subdivisión se indica en la figura 24 mediante líneas de puntos. El triángulo en el que la dirección de panoramización p = [0p, (pp]Tse encuentra puede determinarse calculando dos coeficientes A y
Figure imgf000015_0001
donde a = [0a, cpa]T indica la dirección del altavoz para la cual se calcula la ganancia de atenuación cruzada, y donde b = [0b, (pt\T y c = [0c, <pc]T indican los vértices restantes del triángulo. La dirección de panoramización p se encuentra dentro del triángulo, si se cumplen todas las condiciones siguientes:
A > 0 p
M > 0 (7)
A f.í < 1
Para este triángulo, se calcula el vector normal, por ejemplo, según
Figure imgf000015_0002
Este vector normal permite entonces calcular la ganancia de atenuación cruzada de la siguiente manera:
Figure imgf000015_0003
Debe observarse que la subdivisión en triángulos y el cálculo de (9), (10) y (11) deben realizarse para cada altavoz del polígono.
Las ganancias finales de panoramización se obtienen entonces aplicando la normalización de energía (3) a las ganancias de atenuación cruzada.
Según una realización, como primera etapa se realiza la atenuación cruzada 2D, por ejemplo, aplicando la fórmula
fifn = 1 - n „ (p - a n )
Y, en algunas realizaciones, como segunda etapa, se realiza la normalización de potencia, por ejemplo, aplicando la fórmula
Figure imgf000015_0004
Una característica especial del sistema de coordenadas utilizado es la existencia de los polos a una elevación de ± 90°. Dado que un polo puede no estar ubicado dentro de un polígono, es necesario aplicar un método como el enfoque de VBAP generalizado para resolver este problema. Al hacerlo, se agrega un vértice adicional a una elevación de ± 90° y los polígonos que contienen los polos se dividen. Después de calcular las ganancias de panoramización para este conjunto ampliado de altavoces, se realiza la mezcla descendente de las ganancias de los altavoces de polos imaginarios con sus vecinos físicos.
Además, como los polos no son puntos en el espacio del parámetro de azimut-elevación, sino líneas, es razonable que el cálculo de las ganancias de atenuación cruzada establezca el ángulo azimutal de los vértices de los polos en el ángulo azimutal de la dirección de panoramización.
Todos los vectores normales, además de los de los vértices de los polos, pueden calcularse previamente, así como las matrices inversas que se necesitan para la determinación del polígono/triángulo en el que se encuentra p. En consecuencia, la complejidad informática para la determinación de las ganancias de panoramización durante el tiempo de ejecución es considerablemente baja.
Si la dirección de panoramización coincide con la posición de uno de los altavoces, solo este altavoz está activo mientras que dos o más altavoces están activos en el medio. La extensión de fuente variable como consecuencia del número variable de altavoces activos puede compensarse por medio de la panoramización de amplitud de dirección múltiple (MDAP) exactamente de la misma manera que se hace para VBAP [18].
Algunos estudios de localización han demostrado que el método de Panoramización de Intensidad de Vector Base (VBIP) [16] basado en el vector de energía de Gerzon [9] da como resultado una desviación más pequeña entre la dirección de panoramización y la ubicación de la fuente percibida, especialmente a frecuencias más altas. Este es un comportamiento que es hasta cierto punto predecible mediante un modelo binaural [8]. En general, ambos métodos pueden combinarse en un método de panoramización dependiente de la frecuencia tal como sugiere Pulkki [19]. El mismo principio puede aplicarse al método propuesto mediante una exponenciación dependiente de la frecuencia de las ganancias de atenuación cruzada (11).
Tal como ya se describió anteriormente, según algunas realizaciones, en lugar de aplicar la ganancia, por ejemplo, la ganancia de la fórmula (11) en las muestras de una señal de entrada de audio, una raíz cuadrada de la ganancia, por ejemplo, una raíz cuadrada de la ganancia de la fórmula (11) puede, por ejemplo, aplicarse a las muestras de la señal de entrada de audio.
Para evaluar el rendimiento de los conceptos de panoramización propuestos, se realizó una prueba de escucha donde se investigaron cuatro trayectorias de objetos diferentes: "frontal derecho" a "frontal superior izquierdo", "posterior derecho" a "superior posterior izquierdo", "frontal izquierdo" a "lateral superior izquierdo" y "lateral izquierdo" a "frontal superior izquierdo". La figura 25 indica estas trayectorias.
La prueba de escucha realizada no fue una prueba de MUSHRA. La señal "Ref" es una referencia con respecto a todas las características de calidad además de la precisión de la ubicación. Las señales de prueba reproducirán una de las trayectorias. Se animó a los participantes a mover levemente la cabeza dentro de un ángulo azimutal/de elevación de ± 30°. Se evaluaron y comentaron el timbre, la precisión de la ubicación/suavidad del movimiento, la extensión/enfoque de la fuente y la calidad general de todas las señales de prueba.
Cada elemento de prueba contenía un solo objeto a velocidad constante que se renderizó con un ángulo de elevación que se interpoló linealmente entre 0° y 35° y un ángulo azimutal que se interpoló linealmente de la siguiente manera: Trayectoria I (frontal): -30° a 30°; trayectoria II (posterior): -110° a 110°; trayectoria III (frontal izquierda): 30° a 90°; y trayectoria IV (frontal izquierda): 90° a 30°.
Para la generación de las señales de prueba, se utilizaron tres tipos de señales mono, que luego se renderizaron a lo largo de las cuatro trayectorias, a saber, 1: "Habla"; 2: "Ruido rosa"; y 3: "Batido".
Para reducir la influencia de la memoria a corto plazo, se eligieron estímulos cortos. La señal de "Habla" fue una oración de 6,7 segundos de una oradora. La señal de "Ruido rosa" contenía 6 segundos de ruido rosa estacionario. La señal "Batido" también duró 6 segundos y contenía el batido de un bloque de madera y una castañuela golpeada a su vez a 160 bpm. Las tres señales de entrada se ajustaron manualmente a un volumen similar.
Cada uno de los 12 elementos de prueba se renderizó utilizando los siguientes conceptos de panoramización, a saber, 1: "efap" (los conceptos propuestos); 2: "vbap A"; y 3: "vbap B".
Todos los métodos implicaron los conjuntos de altavoces mostrados. Las dos variantes de VBAP solo se diferenciaban por la triangulación, es decir, la diagonal dentro de la disposición rectangular de los altavoces, mientras que la diagonal de "vbap A" coincidía con las trayectorias I, II y III.
Debido a la dificultad de proporcionar una referencia adecuada para las señales renderizadas, la señal de entrada reproducida por el altavoz central se utilizó como referencia tonal.
Los participantes de la prueba de escucha realizada, que tuvo lugar en el laboratorio de sonido "Mozart" que cumple con la norma ITU-R BS.1116-1 en Fraunhofer IIS, utilizaron un software MUSHRA convencional que se configuró para omitir las referencias ocultas y los anclajes inferiores (véanse [11], [12]).
En total, se entregaron a los participantes 4 instrucciones de prueba de escucha en forma escrita que solo se diferenciaron por la calidad resaltada. Los altavoces estaban marcados con las mismas etiquetas que también se utilizaron en las instrucciones. Se pidió a los participantes de la prueba que calificaran exclusivamente las características/atributos de calidad "timbre", "precisión de la localización/suavidad del movimiento", "extensión/enfoque de la fuente" y "calidad general" de los estímulos presentados, donde cada prueba se realizó en un día diferente.
La Tabla 1 ilustra el material de prueba utilizado durante la fase de formación.
Tabla 1
Figure imgf000017_0001
A continuación, se presentan los resultados de la prueba.
La figura 26 muestra el promedio y el intervalo de confianza del 95% de los resultados de la prueba para la primera prueba de escucha en la que se calificó el timbre.
Detalla los resultados de todas las combinaciones de señales de entrada ("Rosa", "Habla" y "Batido") y trayectorias (I, II, III y IV). El promedio de todas las condiciones indica que el timbre de la salida de VBAP está ligeramente más cerca de la referencia que la salida del método de EFAP. Esta observación se confirma por el diagrama de diferencias mostrado en la figura 27.
La figura 27 ilustra una diagrama de diferencias para la primera prueba de escucha en la que se calificó el timbre. Los comentarios dados revelaron que la salida de EFAP presentaba un refuerzo de graves ligeramente más fuerte. Este es un comportamiento esperado ya que la suma incoherente, que es la suposición básica para la normalización de potencia, ya no se cumple en bajas frecuencias.
Por tanto, un mayor número de altavoces provoca un mayor efecto de refuerzo de graves que puede compensarse mediante un ecualizador [19].
La figura 28 muestra los resultados de la prueba para una segunda prueba en la que se calificó la precisión de la ubicación y la suavidad del movimiento.
El diagrama de diferencias correspondiente mostrado en la figura 29 revela que el método de EFAP da como resultado un movimiento más suave/una mejor precisión de la ubicación que VBAP.
Algunos sujetos comentaron que las trayectorias de VBAP eran en parte demasiado bajas y luego se movieron rápidamente al altavoz superior al final.
Esta es una observación que puede explicarse por la distorsión geométrica mencionada anteriormente que da como resultado ganancias más fuertes para los altavoces de la capa media.
La figura 30 muestra los resultados de la prueba para la tercera prueba en la que se calificaron la extensión y el enfoque de la fuente.
El diagrama de diferencia correspondiente se muestra en la figura 31. Puede observarse que EFAP funciona igual de bien o ligeramente peor que VBAP con respecto a la extensión de la fuente. Esta observación puede explicarse por el hecho de que "vbap A" resultó principalmente en una panoramización por pares y, por lo tanto, provocó una extensión de la fuente percibida más pequeña en comparación con la otra variante de triangulación o EFAP.
Los resultados de la calidad general se muestran en la figura 32 y la figura 33. Si bien algunos sujetos favorecieron claramente a uno de los candidatos de la prueba, los resultados están totalmente equilibrados en promedio.
En las realizaciones, se obtienen ganancias de panoramización simétrica para configuraciones simétricas mediante panoramización en N definida mediante polígonos.
La prueba de escucha, que comparó los conceptos proporcionados con VBAP, demuestra que los conceptos propuestos dan como resultado una mejor precisión de la ubicación. El mayor número de altavoces activos estabiliza la posición y la trayectoria de la fuente fantasma, pero también produce un refuerzo de graves ligeramente más fuerte y una extensión de la fuente ligeramente mayor.
Si bien algunos sujetos prefirieron la precisión espacial mejorada, otros enfatizaron más el timbre, lo que dio como resultado una preferencia general equilibrada. Los conceptos propuestos son beneficiosos en aplicaciones donde la precisión de la ubicación y la suavidad del movimiento son importantes. Esta propiedad se mejora aún más mediante la exponenciación dependiente de la frecuencia de las ganancias de atenuación cruzada calculadas, mientras que el timbre podría compensarse por medio de ecualización.
Aunque algunos aspectos se han descrito en el contexto de un aparato, es evidente que estos aspectos también representan una descripción del método correspondiente, donde un bloque o dispositivo corresponde a una etapa del método o una característica de una etapa del método. De forma análoga, los aspectos descritos en el contexto de una etapa del método también representan una descripción de un bloque correspondiente o un elemento o una característica de un aparato correspondiente.
La señal descompuesta de la invención puede almacenarse en un medio de almacenamiento digital o puede transmitirse en un medio de transmisión tal como un medio de transmisión inalámbrica o un medio de transmisión por cable tal como Internet.
Dependiendo de determinados requisitos de implementación, las realizaciones de la invención pueden implementarse en hardware o en software. La implementación puede realizarse usando un medio de almacenamiento digital, por ejemplo, un disco flexible, un DVD, un CD, una memoria ROM, una PROM, una EPROM, una EEPROM o una FLASH, que tiene señales de control electrónicamente legibles almacenadas en el mismo, que actúan conjuntamente (o son capaces de actuar conjuntamente) con un sistema informático programable de manera que se realiza el respectivo método.
Algunas realizaciones según la invención comprenden un soporte de datos no transitorio que tiene señales de control electrónicamente legibles, que son capaces de actuar conjuntamente con un sistema informático programable, de manera que se realiza uno de los métodos descritos en el presente documento.
Por lo general, las realizaciones de la presente invención pueden implementarse como un producto de programa informático con un código de programa, siendo el código de programa operativo para realizar uno de los métodos, cuando el producto de programa informático se ejecuta en un ordenador. El código de programa puede almacenarse, por ejemplo, en un soporte legible por máquina.
Otras realizaciones comprenden el programa informático para realizar uno de los métodos descritos en el presente documento, almacenado en un soporte legible por máquina.
En otras palabras, una realización del método de la invención es, por lo tanto, un programa informático que tiene un código de programa para realizar uno de los métodos descritos en el presente documento, cuando el programa informático se ejecuta en un ordenador.
Una realización adicional de los métodos de la invención es, por lo tanto, un soporte de datos (o un medio de almacenamiento digital, o un medio legible por ordenador) que comprende, grabado en el mismo, el programa informático para realizar uno de los métodos descritos en el presente documento.
Una realización adicional del método de la invención es, por lo tanto, un flujo de datos o una secuencia de señales que representa el programa informático para realizar uno de los métodos descritos en el presente documento. El flujo de datos o la secuencia de señales pueden configurarse, por ejemplo, para transferirse mediante una conexión de comunicación de datos, por ejemplo, mediante Internet.
Una realización adicional comprende un medio de procesamiento, por ejemplo, un ordenador, o un dispositivo lógico programable, configurado o adaptado para realizar uno de los métodos descritos en el presente documento.
Una realización adicional comprende un ordenador que tiene instalado en el mismo el programa informático para realizar uno de los métodos descritos en el presente documento.
En algunas realizaciones, puede usarse un dispositivo de lógica programable (por ejemplo, una matriz de puertas de campo programable) para realizar algunas o todas las funcionalidades de los métodos descritos en el presente documento. En algunas realizaciones, una matriz de puertas de campo programable puede actuar conjuntamente con un microprocesador con el fin de realizar uno de los métodos descritos en el presente documento. Por lo general, los métodos se realizan preferiblemente por cualquier aparato de hardware.
Las realizaciones descritas anteriormente son meramente ilustrativas de los principios de la presente invención. Se entiende que las modificaciones y variaciones de las disposiciones y los detalles descritos en el presente documento serán evidentes para otros expertos en la técnica. Por lo tanto, la intención es limitarse únicamente por el alcance de las reivindicaciones de patente inminentes y no por los detalles específicos presentados a modo de descripción y explicación de las realizaciones en el presente documento.
Bibliografía:
[1] "SpaceMap" Software de Meyer Sound. URL: http://www.meyersound.com/products /d-mitri/spacemap.htm.
[2] Ando, A. y Hamasaki, K. Sound Intensity Based Three-Dimensional Panning. En la 126a Convención de AES, Múnich, Alemania, mayo de 2009.
[3] Barber, C. B., Dobkin, D. P., y Huhdanpaa, H. The QuickHull Algorithm for Convex Hulls. ACM Trans. Math. Softw., 22(4):469-483, 1996.
[4] Bekesy, G. v. Experiments in Hearing. McGraw-Hill, Nueva York, NY, EE. UU., 1960.
[5] Bennett, J. C., Barker, K., y Edeko, F. O. A New Approach to the Assessment of Stereophonic Sound System Performance. J. Audio Eng. Soc., 33(5): 314-321, 1985.
[6] Blauert, J. Spatial Hearing, The Psychophysics of Human Sound Localization. MIT Press, Cambridge, MA, segunda edición, 1997.
[7] Craven, P. G. Continuous Surround Panning for 5-Speaker Reproduction. En AES 24th Int. Conference, Banff, Alberta, Canadá, junio de 2003.
[8] Frank, M. Localization Using Different Amplitude-Panning Methods in the Fronta1Horizontal Plane. En EAA Joint Symposium on Auralization and Ambisonics, Berlín, Alemania, abril de 2014.
[9] Gerzon, M. A. General Metatheory of Auditory Localisation. En la 92a Convención de AES, Viena, Austria, marzo de 1992.
[10] Gretzki, R. y Silzle, A. A New Method for Elevation Panning Reducing the Size of the Resulting Auditory Events. En el Simposio de EAA "TecniAcustica 2003", Bilbao, España, 2003.
[11] ITU-R. Rec. ITU-R BS.1116-1, Methods for the Subjective Assessment of Small Impairments in Audio Systems Including Multichannel Sound Systems, 2003.
[12] ITU-R. Rec. ITU-R BS.1534-1, Method for the Subjective Assessment of Intermediate Quality Level of Coding Systems, 2003.
[13] ITU-R. Rec. ITU-R BS.775-1, Multichannel Stereophonic Sound System with and without Accompanying Picture, 2006.
[14] ITU-R. Rep. ITU-R BS.2266-1, Framework of Future Audio Representation Systems, 2013.
[15] Lee, H. The Relationship Between Interchannel Time and Level Differences in Vertical Sound Localization and Masking. En la 131a Convención de AES, Nueva York, NY, EE. UU., octubre de 2011.
[16] Pernaux, J.-M., Boussard, P., y Jot, J.-M. Virtual sound source positioning and mixing in 5.1 implementation on the real-time system genesis. En First COST-G6 Workshopon Digital Audio Effects (DAFx-98), Barcelona, España, 1998.
[17] Pulkki, V. Virtual Sound Source Positioning Using Vector Base Amplitude Panning. J. Audio Eng. Soc., 45(6): 456­ 466, 1997.
[18] Pulkki, V. Uniform Spreading of Amplitude Panned Virtual Sources. En IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, New Paltz, NY, EE.UU., octubre de 1999.
[19] Pulkki, V., Karjalainen, M., y Valimaki, V. Localization, Coloration, and Enhancement of Amplitude-Panned Virtual Sources. En AES 16th Int. Conference, Rovaniemi, Finlandia, 1999.
[20] Silzle, A.3D Audio Quality Evaluation: Theory and Practice. En International Conference on Spatial Audio (ICSA), Erlangen, Alemania, febrero de 2014.
[21] Theile, G. y Plenge, G. Localization of Lateral Phantom-Sources. En la 53a Convención AES, Berlín, Alemania, 1976.

Claims (1)

  1. REIVINDICACIONES
    Aparato para generar cuatro o más señales de salida de audio, que comprende:
    un determinador de ganancia de panoramización (110), y
    un procesador de señal (120),
    en el que el determinador de ganancia de panoramización (110) está configurado para determinar un subconjunto adecuado a partir de un conjunto de cinco o más posiciones de altavoz, de modo que el subconjunto adecuado comprende cuatro o más de las cinco o más posiciones de altavoz,
    en el que el determinador de ganancia de panoramización (110) está configurado para determinar el subconjunto adecuado dependiendo de una posición de panoramización y dependiendo de las cinco o más posiciones de altavoz,
    en el que el determinador de ganancia de panoramización (110) está configurado para determinar una ganancia de panoramización para cada una de las cuatro o más señales de salida de audio determinando dicha ganancia de panoramización dependiendo de la posición de panoramización y dependiendo de las cuatro o más posiciones de altavoz del subconjunto adecuado, y
    en el que el procesador de señal (120) está configurado para generar cada señal de salida de audio de las cuatro o más señales de salida de audio dependiendo de la ganancia de panoramización para dicha señal de salida de audio y dependiendo de una señal de entrada de audio,
    en el que cada posición de altavoz de las cuatro o más posiciones de altavoz del subconjunto adecuado está asociada con exactamente una de las cuatro o más señales de salida de audio, y en el que cada una de las cuatro o más señales de salida de audio está asociada con exactamente una de las cuatro o más posiciones de altavoz del subconjunto adecuado,
    en el que el determinador de ganancia de panoramización (110) está configurado para determinar, para cada señal de salida de audio de las cuatro o más señales de salida de audio, un grupo de posiciones de altavoz asociadas, que está asociado con dicha señal de salida de audio, dependiendo de la posición de altavoz de cada una de las cuatro o más señales de salida de audio y dependiendo de la posición de panoramización, de modo que dicho grupo de posiciones de altavoz asociadas comprende la posición de altavoz que está asociada con dicha señal de salida de audio y al menos dos posiciones de altavoz adicionales de las cuatro o más posiciones de altavoz del subconjunto adecuado, en el que al menos una de las cuatro o más posiciones de altavoz del subconjunto adecuado no está comprendida por dicho grupo de posiciones de altavoz asociadas,
    en el que el determinador de ganancia de panoramización (110) está configurado para calcular, para cada señal de salida de audio de las cuatro o más señales de salida de audio, la ganancia de panoramización para dicha señal de salida de audio dependiendo de la posición de panoramización y dependiendo de las posiciones de altavoz del grupo de las posiciones de altavoz asociadas que está asociado con dicha señal de salida de audio, y
    en el que el grupo de posiciones de altavoz asociadas que está asociado con una primera de las cuatro o más señales de salida de audio no es igual al grupo de posiciones de altavoz asociadas que está asociado con una segunda diferente de las cuatro o más señales de salida de audio.
    Aparato según una de las reivindicaciones anteriores, en el que la posición de panoramización y cada posición de altavoz del conjunto de cinco o más posiciones de altavoz indican, cada una, una posición dentro de un sistema de coordenadas bidimensional.
    Aparato según la reivindicación 2, en el que el determinador de ganancia de panoramización (110) está configurado para determinar el subconjunto adecuado de manera que exista un polígono específico de subconjunto, en el que los vértices del polígono específico de subconjunto adecuado son las posiciones de altavoz del subconjunto adecuado, y en el que la posición de panoramización está encerrada por el polígono específico de subconjunto.
    Aparato según la reivindicación 2 o 3, en el que, para cada una de las cuatro o más señales de salida de audio, el determinador de ganancia de panoramización (110) está configurado para determinar el grupo de posiciones de altavoz asociadas, que está asociado con dicha señal de salida de audio, de modo que el grupo de posiciones de altavoz asociadas comprende exactamente la posición de altavoz que está asociada con dicha señal de salida de audio y dos posiciones de altavoz adicionales del subconjunto adecuado, y de modo que la posición de panoramización se encuentra dentro de un triángulo o en un borde de dicho triángulo en el sistema de coordenadas bidimensional, en el que cada posición de altavoz del grupo de posiciones de altavoz asociadas indica un vértice de dicho triángulo en el sistema de coordenadas bidimensional.
    Aparato según una de las reivindicaciones anteriores,
    en el que la señal de entrada de audio comprende una pluralidad de muestras de entrada de audio, y en el que el procesador de señal (120) está configurado para generar cada señal de salida de audio de las cuatro o más señales de salida de audio multiplicando cada una de una o más de las muestras de entrada de audio de la señal de entrada de audio con la ganancia de panoramización para dicha señal de salida de audio para obtener una o más muestras de salida de audio de la señal de salida de audio.
    Aparato según una de las reivindicaciones 1 a 4,
    en el que la señal de entrada de audio comprende una pluralidad de muestras de entrada de audio, y en el que el procesador de señal (120) está configurado para generar cada señal de salida de audio de las cuatro o más señales de salida de audio multiplicando cada una de una o más de las muestras de entrada de audio de la señal de entrada de audio con una raíz cuadrada de la ganancia de panoramización para dicha señal de salida de audio para obtener una o más muestras de salida de audio de la señal de salida de audio. Aparato según una de las reivindicaciones anteriores,
    en el que el determinador de ganancia de panoramización (110) está configurado para determinar la ganancia de panoramización para cada señal de salida de audio de las cuatro o más señales de salida de audio para un primer punto en el tiempo como una primera ganancia de panoramización dependiente del tiempo para dicha señal de salida de audio, y
    en el que el determinador de ganancia de panoramización (110) está configurado para determinar una ganancia de panoramización adicional para cada señal de salida de audio de las cuatro o más señales de salida de audio para un segundo punto diferente en el tiempo como una segunda ganancia de panoramización dependiente del tiempo para dicha señal de salida de audio, siendo dicha segunda ganancia de panoramización dependiente del tiempo diferente de la primera ganancia de panoramización dependiente del tiempo para dicha señal de salida de audio.
    Sistema que comprende:
    cinco o más altavoces, y
    un aparato según una de las reivindicaciones anteriores,
    en el que cada uno de los cinco o más altavoces está asociado con exactamente una posición de altavoz del conjunto de cinco o más posiciones de altavoz,
    en el que cada una de las cuatro o más señales de salida de audio está asociada con exactamente una posición de altavoz de las cuatro o más posiciones de altavoz del subconjunto adecuado, y en el que cada una de las cuatro o más señales de salida de audio está asociada con exactamente una de las cuatro o más posiciones de altavoz del subconjunto adecuado,
    en el que el sistema está configurado para emitir cada señal de salida de audio de las cuatro o más señales de salida de audio mediante el altavoz que está asociado con la misma posición de altavoz que dicha señal de salida de audio.
    Método para generar cuatro o más señales de salida de audio, que comprende:
    determinar un subconjunto adecuado a partir de un conjunto de cinco o más posiciones de altavoz, de modo que el subconjunto adecuado comprenda cuatro o más de las cinco o más posiciones de altavoz, en el que la determinación del subconjunto adecuado se realiza dependiendo de una posición de panoramización y dependiendo de las cinco o más posiciones de altavoz,
    determinar una ganancia de panoramización para cada una de las cuatro o más señales de salida de audio determinando dicha ganancia de panoramización dependiendo de la posición de panoramización y dependiendo de las cuatro o más posiciones de altavoz del subconjunto adecuado, y
    generar cada señal de salida de audio de las cuatro o más señales de salida de audio dependiendo de la ganancia de panoramización para dicha señal de salida de audio y dependiendo de una señal de entrada de audio,
    en el que cada posición de altavoz de las cuatro o más posiciones de altavoz del subconjunto adecuado está asociada con exactamente una de las cuatro o más señales de salida de audio, y en el que cada una de las cuatro o más señales de salida de audio está asociada con exactamente una de las cuatro o más posiciones de altavoz del subconjunto adecuado,
    en el que el método comprende determinar, para cada señal de salida de audio de las cuatro o más señales de salida de audio, un grupo de posiciones de altavoz asociadas, que está asociado con dicha señal de salida de audio, dependiendo de la posición de altavoz de cada una de las cuatro o más señales de salida de audio y dependiendo de la posición de panoramización, de modo que dicho grupo de posiciones de altavoz asociadas comprenda la posición de altavoz que está asociada con dicha señal de salida de audio y al menos dos posiciones de altavoz adicionales de las cuatro o más posiciones de altavoz del subconjunto adecuado, en el que al menos una de las cuatro o más posiciones de altavoz del subconjunto adecuado no está comprendida por dicho grupo de posiciones de altavoz asociadas,
    en el que el método comprende calcular, para cada señal de salida de audio de las cuatro o más señales de salida de audio, la ganancia de panoramización para dicha señal de salida de audio dependiendo de la posición de panoramización y dependiendo de las posiciones de altavoz del grupo de posiciones de altavoz asociadas que está asociado con dicha señal de salida de audio, y
    en el que el grupo de posiciones de altavoz asociadas que está asociado con una primera de las cuatro o más señales de salida de audio no es igual al grupo de posiciones de altavoz asociadas que está asociado con una segunda diferente de las cuatro o más señales de salida de audio.
    Programa informático para implementar el método según la reivindicación 9 cuando se ejecuta en un ordenador o procesador de señal.
    Aparato para generar cuatro o más señales de salida de audio, en el que cada posición de altavoz de cuatro o más posiciones de altavoz está asociada con exactamente una de las cuatro o más señales de salida de audio, y en el que cada una de las cuatro o más señales de salida de audio está asociada con exactamente una de las cuatro o más posiciones de altavoz, en la que el aparato comprende:
    un determinador de ganancia de panoramización (110), y
    un procesador de señal (120),
    en el que el determinador de ganancia de panoramización (110) está configurado para determinar, para cada señal de salida de audio de las cuatro o más señales de salida de audio, un grupo de posiciones de altavoz asociadas, que está asociado con dicha señal de salida de audio, dependiendo de la posición de altavoz de cada una de las cuatro o más señales de salida de audio y dependiendo de una posición de panoramización, de modo que dicho grupo de posiciones de altavoz asociadas comprende la posición de altavoz que está asociada con dicha señal de salida de audio y al menos dos posiciones de altavoz adicionales de las cuatro o más posiciones de altavoz, en el que en al menos una de las cuatro o más posiciones de altavoz no está comprendida por dicho grupo de posiciones de altavoz asociadas,
    en el que el determinador de ganancia de panoramización (110) está configurado para calcular, para cada señal de salida de audio de las cuatro o más señales de salida de audio, la ganancia de panoramización para dicha señal de salida de audio dependiendo de la posición de panoramización y dependiendo de las posiciones de altavoz del grupo de las posiciones de altavoz asociadas que está asociado con dicha señal de salida de audio, y
    en el que el procesador de señal (120) está configurado para generar cada señal de salida de audio de las cuatro o más señales de salida de audio dependiendo de la ganancia de panoramización para dicha señal de salida de audio y dependiendo de una señal de entrada de audio,
    en el que el grupo de posiciones de altavoz asociadas que está asociado con una primera de las cuatro o más señales de salida de audio no es igual al grupo de posiciones de altavoz asociadas que está asociado con una segunda diferente de las cuatro o más señales de salida de audio.
    Método para generar cuatro o más señales de salida de audio, en el que cada posición de altavoz de cuatro o más posiciones de altavoz está asociada con exactamente una de las cuatro o más señales de salida de audio, y en el que cada una de las cuatro o más señales de salida de audio está asociada con exactamente una de las cuatro o más posiciones de altavoz, en la que el método comprende:
    determinar, para cada señal de salida de audio de las cuatro o más señales de salida de audio, un grupo de posiciones de altavoz asociadas, que está asociado con dicha señal de salida de audio, dependiendo de la posición de altavoz de cada una de las cuatro o más señales de salida de audio y dependiendo de una posición de panoramización, de modo que dicho grupo de posiciones de altavoz asociadas comprende la posición de altavoz que está asociada con dicha señal de salida de audio y al menos dos posiciones de altavoz adicionales de las cuatro o más posiciones de altavoz, en la que al menos una de las cuatro o más posiciones de altavoz no está comprendida por dicho grupo de posiciones de altavoz asociadas,
    calcular, para cada señal de salida de audio de las cuatro o más señales de salida de audio, la ganancia de panoramización para dicha señal de salida de audio dependiendo de la posición de panoramización y dependiendo de las posiciones de altavoz del grupo de posiciones de altavoz asociadas que está asociado con dicha señal de salida de audio, y
    generar cada señal de salida de audio de las cuatro o más señales de salida de audio dependiendo de la ganancia de panoramización para dicha señal de salida de audio y dependiendo de una señal de entrada de audio,
    en el que el grupo de posiciones de altavoz asociadas que está asociado con una primera de las cuatro o más señales de salida de audio no es igual al grupo de posiciones de altavoz asociadas que está asociado con una segunda diferente de las cuatro o más señales de salida de audio.
    Programa informático para implementar el método según la reivindicación 12 cuando se ejecuta en un ordenador o procesador de señal.
ES14781537T 2014-05-13 2014-10-07 Aparato y método para panoramización de amplitud de atenuación de bordes Active ES2833424T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP14168175 2014-05-13
PCT/EP2014/071449 WO2015172854A1 (en) 2014-05-13 2014-10-07 Apparatus and method for edge fading amplitude panning

Publications (1)

Publication Number Publication Date
ES2833424T3 true ES2833424T3 (es) 2021-06-15

Family

ID=50771413

Family Applications (1)

Application Number Title Priority Date Filing Date
ES14781537T Active ES2833424T3 (es) 2014-05-13 2014-10-07 Aparato y método para panoramización de amplitud de atenuación de bordes

Country Status (8)

Country Link
US (1) US10021499B2 (es)
EP (1) EP3143779B1 (es)
JP (1) JP6513703B2 (es)
CN (1) CN106465027B (es)
BR (1) BR112016026283B1 (es)
ES (1) ES2833424T3 (es)
RU (1) RU2666248C2 (es)
WO (1) WO2015172854A1 (es)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11492029B2 (en) 2013-09-18 2022-11-08 Allpillars, Inc. Collapsible reusable dry or liquid storage containers
WO2017132082A1 (en) * 2016-01-27 2017-08-03 Dolby Laboratories Licensing Corporation Acoustic environment simulation
US10861467B2 (en) * 2017-03-01 2020-12-08 Dolby Laboratories Licensing Corporation Audio processing in adaptive intermediate spatial format
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
ES2913426T3 (es) * 2018-03-13 2022-06-02 Nokia Technologies Oy Reproducción de sonido espacial usando sistemas de altavoz de múltiples canales
US11770172B2 (en) * 2018-05-10 2023-09-26 Qualcomm Incorporated Dynamic antenna selection in millimeter wave systems
CN109379694B (zh) * 2018-11-01 2020-08-18 华南理工大学 一种多通路三维空间环绕声的虚拟重放方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
DE102005033238A1 (de) * 2005-07-15 2007-01-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ansteuern einer Mehrzahl von Lautsprechern mittels eines DSP
JP5010148B2 (ja) * 2006-01-19 2012-08-29 日本放送協会 3次元パンニング装置
AU2007207861B2 (en) * 2006-01-19 2011-06-09 Blackmagic Design Pty Ltd Three-dimensional acoustic panning device
JP4928177B2 (ja) * 2006-07-05 2012-05-09 日本放送協会 音像形成装置
JP5401864B2 (ja) * 2008-08-01 2014-01-29 ヤマハ株式会社 音響装置及びプログラム
EP2154677B1 (en) * 2008-08-13 2013-07-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a converted spatial audio signal
UA101542C2 (ru) * 2008-12-15 2013-04-10 Долби Лабораторис Лайсензин Корпорейшн Виртуализатор окружающего звука с динамическим сжатием диапазона и способ
JP2010252220A (ja) * 2009-04-20 2010-11-04 Nippon Hoso Kyokai <Nhk> 3次元音響パンニング装置およびそのプログラム
EP2346028A1 (en) * 2009-12-17 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
WO2011104146A1 (en) * 2010-02-24 2011-09-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for generating an enhanced downmix signal, method for generating an enhanced downmix signal and computer program
WO2011117399A1 (en) * 2010-03-26 2011-09-29 Thomson Licensing Method and device for decoding an audio soundfield representation for audio playback
CN103460285B (zh) * 2010-12-03 2018-01-12 弗劳恩霍夫应用研究促进协会 用于以几何为基础的空间音频编码的装置及方法
EP2600343A1 (en) * 2011-12-02 2013-06-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for merging geometry - based spatial audio coding streams
EP2645748A1 (en) * 2012-03-28 2013-10-02 Thomson Licensing Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal
WO2013181272A2 (en) * 2012-05-31 2013-12-05 Dts Llc Object-based audio system using vector base amplitude panning
WO2014044332A1 (en) * 2012-09-24 2014-03-27 Iosono Gmbh Method for controlling a three-dimensional multi-layer speaker arrangement and apparatus for playing back three-dimensional sound in an audience area
CN104019885A (zh) * 2013-02-28 2014-09-03 杜比实验室特许公司 声场分析系统
EP2979467B1 (en) * 2013-03-28 2019-12-18 Dolby Laboratories Licensing Corporation Rendering audio using speakers organized as a mesh of arbitrary n-gons
US9860669B2 (en) * 2013-05-16 2018-01-02 Koninklijke Philips N.V. Audio apparatus and method therefor

Also Published As

Publication number Publication date
BR112016026283A2 (es) 2017-08-15
CN106465027B (zh) 2019-06-04
EP3143779A1 (en) 2017-03-22
JP6513703B2 (ja) 2019-05-15
EP3143779B1 (en) 2020-10-07
RU2666248C2 (ru) 2018-09-06
US10021499B2 (en) 2018-07-10
US20170064484A1 (en) 2017-03-02
CN106465027A (zh) 2017-02-22
WO2015172854A1 (en) 2015-11-19
BR112016026283B1 (pt) 2022-03-22
RU2016148647A (ru) 2018-06-13
JP2017520145A (ja) 2017-07-20
RU2016148647A3 (es) 2018-06-13

Similar Documents

Publication Publication Date Title
ES2833424T3 (es) Aparato y método para panoramización de amplitud de atenuación de bordes
Zotter et al. Ambisonics: A practical 3D audio theory for recording, studio production, sound reinforcement, and virtual reality
ES2922639T3 (es) Método y dispositivo para la reproducción mejorada de campo sonoro de señales de entrada de audio codificadas espacialmente
Gorzel et al. Efficient encoding and decoding of binaural sound with resonance audio
US10674301B2 (en) Fast and memory efficient encoding of sound objects using spherical harmonic symmetries
US20160119737A1 (en) Arrangement and method for reproducing audio data of an acoustic scene
CN106961645B (zh) 音频再生装置以及方法
Bates The composition and performance of spatial music
US11930351B2 (en) Spatially-bounded audio elements with interior and exterior representations
Pihlajamaki et al. Synthesis of complex sound scenes with transformation of recorded spatial sound in virtual reality
Batke et al. Using VBAP-derived panning functions for 3D ambisonics decoding
KR20160061315A (ko) 사운드 신호 처리 방법
JP6663490B2 (ja) スピーカシステム、音声信号レンダリング装置およびプログラム
Borß A polygon-based panning method for 3D loudspeaker setups
Pulkki et al. Multichannel audio rendering using amplitude panning [dsp applications]
Wendt et al. Panning with Height on 2, 3, and 4 Loudspeakers
Stitt et al. Perceptual investigation of image placement with ambisonics for non-centred listeners
WO2020209103A1 (ja) 情報処理装置および方法、再生装置および方法、並びにプログラム
Tucker et al. Perception of reconstructed sound-fields: The dirty little secret
JP7140766B2 (ja) オーディオオブジェクトをパンする処理方法及び処理システム
Tarzan et al. Assessment of sound spatialisation algorithms for sonic rendering with headphones
De Sena Analysis, design and implementation of multichannel audio systems
Dağlık Spatial Audio Reproduction Techniques and Their Application to Musical Composition: The Analysis of “Wunderkammer”,“Point-Instant” and “Hollow”
Trevino et al. Extrapolation of horizontal Ambisonics data from mainstream stereo sources
McKinnie et al. Coincident Microphone Techniques for Three-Channel Stereophonic Reproduction