ES2472456T3 - Método y dispositivo para decodificar una representación de un campo ac�stico de audio para reproducción de audio - Google Patents

Método y dispositivo para decodificar una representación de un campo ac�stico de audio para reproducción de audio Download PDF

Info

Publication number
ES2472456T3
ES2472456T3 ES11709968.9T ES11709968T ES2472456T3 ES 2472456 T3 ES2472456 T3 ES 2472456T3 ES 11709968 T ES11709968 T ES 11709968T ES 2472456 T3 ES2472456 T3 ES 2472456T3
Authority
ES
Spain
Prior art keywords
decoding
matrix
framing
representation
speakers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11709968.9T
Other languages
English (en)
Inventor
Johann-Markus Batke
Florian Keiler
Johannes Boehm
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Application granted granted Critical
Publication of ES2472456T3 publication Critical patent/ES2472456T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/308Electronic adaptation dependent on speaker or headphone connection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

Un método de acuerdo con una representación de un campo acústico de audio para reproducción de audio, que comprende los pasos de: - calcular (110) para cada uno de una pluralidad de altavoces una función de encuadre (W) que usa un método geométrico basado en las posiciones de los altavoces y en una pluralidad de direcciones de la fuente; - calcular (120) una matriz de modos (XN) a partir de las direcciones de la fuente; - calcular (130) una matriz de modos seudoinversa (X+) de la matriz de modos (X); y - decodificar (140) la representación de un campo acústico de audio, en donde la decodificación está basada en una matriz de decodificación (D) que se obtiene a partir de la función de encuadre (W) y la matriz de modos seudoinversa (X+).

Description

M�todo y dispositivo para decodificar una representación de un campo ac�stico de audio para reproducción de audio
Campo de la invención
Esta invención se refiere a un método y un dispositivo para decodificar una representación de un campo ac�stico de audio, y en particular una representación de audio formateada Ambisonics, para una reproducción de sonido.
Antecedentes
Esta sección tiene como objeto introducir al lector en los diversos aspectos de la técnica, que pueden estar relacionados con diversos aspectos de la presente invención que se describen y/o reivindican más adelante. Se cree que la discusión es útil para proveer al lector de una información sobre los antecedentes para facilitar una mejor comprensión de los diversos aspectos de la presente invención. Por consiguiente, se debería comprender que estas exposiciones han de ser leídas en este sentido, y no como supuestos de la técnica anterior, a menos que una fuente sea mencionada expresamente.
La localización exacta es un objetivo clave para cualquier sistema de reproducción de sonido. Tales sistemas de reproducción son altamente aplicables a sistemas de conferencias, juegos, u otros entornos virtuales que se benefician del sonido en 3D. Las escenas de sonido en 3D pueden ser sintetizadas o captadas como un campo ac�stico natural. Las señales del campo ac�stico tales como por ejemplo Ambisonics llevan una representación de un campo ac�stico deseado. El formato Ambisonics se basa en la descomposición armónica esférica del campo ac�stico. En tanto que el formato Ambisonics básico o formato-B utiliza armónicos esféricos de orden cero y uno, el denominado Ambisonics de Orden Superior (HOA) también utiliza armónicos esféricos adicionales de al menos 2� orden. Se requiere un proceso de decodificación para obtener las señales de altavoz individuales. Para sintetizar escenas de audio, se requieren funciones de encuadre que se refieren a la configuración espacial de los altavoces para obtener una localización espacial de la fuente de sonido dada. Si se tuviera que grabar un campo ac�stico natural se requiere un conjunto de micrófonos para captar la información espacial. El conocido enfoque Ambisonics es una herramienta muy apropiada para llevarlo a cabo. Las señales formateadas Ambisonics llevan una representación del campo ac�stico deseado. Se requiere un proceso de decodificación para obtener las señales de altavoz individuales a partir de las señales formateadas Ambisonics. Como también en este caso las funciones de encuadre pueden ser obtenidas a partir de las funciones de decodificación, las funciones de encuadre son el tema clave para describir la tarea de la localización espacial. La configuración espacial de los altavoces se denomina aquí disposición de altavoces.
Las disposiciones de altavoces comúnmente utilizadas son la disposición estereofónica, la cual emplea dos altavoces, la disposición envolvente normal que usa cinco altavoces, y las ampliaciones de la disposición envolvente que usa más de cinco altavoces. Estas disposiciones son bien conocidas. No obstante, est�n limitadas a dos dimensiones (2D), por ejemplo no se reproduce información sobre la altura.
Las disposiciones de altavoces para reproducción tridimensional (3D) est�n descritas por ejemplo en “área de escucha amplia con una calidad de sonido espacial excepcional de un sistema multicanal de sonido 22,2”, K. Hamasaki, T. Nishiguchi, R. Okumaura, e Y. Nakayama en Audio Engineering Society Preprints, Viena, Austria, Mayo 2007, que es una propuesta de la TV de ultra alta definición NHK con formato 22.2, o la disposición 2+2+2 de Dabringhaus (mdg – musikproduktion dabringhaus und Grimm, www.mdg.de) y una disposición 10.2 en “Sound for Film and Television”, T. Holman en 2� edición, Boston: Focal Press, 2002. Uno de los pocos sistemas conocidos que se refiere a la reproducción espacial y a las estrategias de encuadre es el enfoque de encuadre de amplitud de base vectorial (VBAP) en “Ubicación virtual de la fuente acústica que usa el encuadre de amplitud de base vectorial”, Journal of Audio Engineering Society, volumen 45, n� 6, pp. 456-466, Junio 1997, aquí Pulkki. El VBAP (Encuadre de Amplitud de Base Vectorial (VBAP) ha sido usado por Pulkki para reproducir fuentes acústicas virtuales con una disposición de altavoces arbitraria. Para colocar una fuente virtual en un plano en 2D se requiere un par de altavoces, en tanto que en el caso de 3D se requieren tríos de altavoces. Para cada fuente virtual se suministra una señal monof�nica con ganancias diferentes (dependientes de la posición de la fuente virtual) a los altavoces seleccionados desde la disposición total. A continuación se suman las señales de altavoz de todas las fuentes virtuales. El VBAP aplica un método geométrico para calcular las ganancias de las señales de los altavoces para el encuadre entre los altavoces.
Una disposición de altavoces en 3D a modo de ejemplo considerada y aquí recientemente propuesta tiene 16 altavoces, los cuales est�n colocados como se muestra en la Figura 2. La colocación se eligió debido a consideraciones prácticas, que tienen cuatro columnas con tres altavoces cada una y unos altavoces adicionales entre estas columnas. Con más detalle, ocho de los altavoces, que abarcan unos ángulos de 45 grados, est�n igualmente distribuidos en un círculo alrededor de la cabeza de la persona que escucha. Cuatro altavoces adicionales, que abarcan unos ángulos de 90 grados, est�n situados en la parte de arriba y en el fondo. Con respecto a Ambisonics, esta disposición es irregular y da lugar a problemas en el diseño del decodificador, como se ha mencionado en “Un formato ambisonics para distribuciones flexibles de la reproducción”, por H. Pomberger y F. Zotter en Proceedings of the 1st Ambisonics Symposium, Graz, Austria, Julio 2009.
La decodificación Ambisonics convencional, como est� descrita en el documento EP 2.094.032 y en “Sistemas ac�sticos envolventes tridimensionales basados en armónicos esféricos” por M. Poletti en J. Audio Eng. Soc., volumen 53, n� 11, pp 1.004-1.025, Noviembre 2005, emplea el comúnmente conocido proceso de adaptación de modos. Los modos son descritos por vectores de modos que contienen valores de los armónicos esféricos para una dirección de incidencia distinta. La combinación de todas las direcciones dadas por los altavoces individuales lleva a la matriz de modos de la disposición de altavoces, de modo que la matriz de modos representa las posiciones de los altavoces. Para reproducir el modo de una señal de fuente distinta se ponderan los modos de los altavoces de tal forma que los modos superpuestos de los altavoces individuales alcancen el modo deseado. Para obtener las ponderaciones necesarias es preciso calcular una representación de la matriz inversa de la matriz de modos de los altavoces. Desde el punto de vista de la decodificación de la señal las ponderaciones forman la señal piloto de los altavoces, y la matriz de modos inversa de los altavoces, a la que se hace referencia como “matriz de decodificación”, la cual se aplica para decodificar una representación de la señal formateada Ambisonics. En particular, para muchas disposiciones de altavoces, por ejemplo la disposición mostrada en la Figura 2, es difícil de obtener la inversa de la matriz de modos.
Como se ha mencionado antes, las disposiciones comúnmente usadas est�n limitadas a 2D, es decir no se reproduce información sobre la altura. La decodificación de una representación de campo ac�stico en una disposición de altavoces con una distribución espacial matemáticamente no regular lleva a problemas de localización y coloración con las técnicas comúnmente conocidas. Para decodificar una señal Ambisonics se usa una matriz de decodificación (es decir, una matriz de coeficientes de decodificación). En la decodificación convencional de las señales Ambisonics, y particularmente de las señales HOA, se presentan por lo menos dos problemas. Primero, para la correcta decodificación es necesario conocer las direcciones de la fuente de la señal para obtener la matriz de decodificación. Segundo, el establecimiento de una correspondencia con una disposición de altavoces existente es sistemáticamente erróneo debido al siguiente problema matemático: una decodificación matemáticamente correcta dar� lugar a no sólo una positiva, sino a también algunas amplitudes negativas de los altavoces. No obstante, éstas son reproducidas erróneamente como señales positivas, lo que da lugar a los problemas antes mencionados.
Compendio de la invención
La presente invención describe un método para decodificar una representación de un campo ac�stico para distribuciones espaciales no regulares con unas propiedades de localización y coloración altamente mejoradas. Representa otra forma de obtener la matriz de decodificación para datos del campo ac�stico, por ejemplo en formato Ambisonics, y utiliza un proceso en una forma de estimación del sistema. Considerando un conjunto de posibles direcciones de incidencia se calculan las funciones de encuadre relacionadas con los altavoces deseados. Las funciones de encuadre se toman como el resultado de un proceso de decodificación Ambisonics. La señal de entrada requerida es la matriz de modos de todas las direcciones consideradas. Por lo tanto, como se muestra más adelante, la matriz de decodificación se obtiene por multiplicación directa de la matriz de ponderaci�n por una versión inversa de la matriz de modos de las señales de entrada.
Con relación al segundo problema antes mencionado, se ha visto que también es posible obtener la matriz de decodificación a partir de la inversa de la denominada matriz de modos, la cual representa las posiciones de los altavoces, y las funciones W de ponderaci�n dependientes de la posición (“funciones de encuadre”). Un aspecto de la invención es que estas funciones de encuadre W pueden obtenerse mediante un método diferente del comúnmente usado. Ventajosamente, se usa un método geométrico sencillo. Tal método no requiere conocimiento alguno de ninguna dirección de la fuente de la señal, lo que resuelve el problema antes mencionado. Tal método es conocido como “Encuadre de Amplitud de Base Vectorial” (VBAP). De acuerdo con la invención, el VBAP se usa para calcular las funciones de encuadre requeridas, las cuales son a continuación usadas para calcular la matriz de decodificación Ambisonics. Otro problema se presenta debido a que se requiere la inversa de la matriz de modos (que representa la disposición de altavoces). Sin embargo, es difícil de obtener la inversa exacta, lo que también lleva a una reproducción de audio errónea. De este modo, un aspecto adicional consiste en que para obtener la matriz de decodificación se calcula una matriz de modos seudoinversa, la cual es mucho más fácil de obtener.
La invención usa un enfoque de dos pasos. El primer paso es una obtención de las funciones de encuadre que dependen de la disposición de altavoces usada para la reproducción. En el segundo paso se calcula una matriz de decodificación Ambisonics a partir de estas funciones de encuadre para todos los altavoces.
Una ventaja de la invención es que no se requiere una descripción paramétrica de la fuente acústica; en vez de ello, se puede usar una descripción del campo ac�stico tal como Ambisonics.
De acuerdo con la invención, un método para decodificar la representación de un campo ac�stico de audio para una reproducción de audio comprende los pasos de calcular, para cada uno de una pluralidad de altavoces, una función de encuadre mediante un método geométrico basado en las posiciones de los altavoces y una pluralidad de direcciones de la fuente mediante el cálculo de una matriz de modos a partir de las direcciones de la fuente, mediante el cálculo de una matriz de modos seudoinversa de la matriz de modos, y mediante la decodificación de una representación del campo ac�stico de audio, en donde la decodificación est� basada en una matriz de decodificación que se obtiene a partir de al menos la función de encuadre y de la matriz de modos seudoinversa.
De acuerdo con otro aspecto, un dispositivo para decodificar una representación de audio de un campo ac�stico para reproducción de audio comprende unos primeros medios de cálculo para calcular, para cada uno de una pluralidad de altavoces, una función de encuadre mediante un método geométrico basado en las posiciones de los altavoces y en una pluralidad de direcciones de la fuente, unos segundos medios de cálculo para calcular una matriz de modos a partir de las direcciones de la fuente, unos terceros medios de cálculo para calcular una matriz de modos seudoinversa de la matriz de modos, y unos medios de decodificador para decodificar la representación del campo ac�stico, en donde la decodificación est� basada en una matriz de decodificación y los medios de decodificador utilizan al menos la función de encuadre y la segunda matriz de modos seudoinversa para obtener la matriz de decodificación. Los primero, segundo y tercer medios de cálculo pueden ser un único procesador o dos o más procesadores independientes.
De acuerdo con otro aspecto más, un medio de ordenador, que puede ser leído tiene almacenadas en él unas instrucciones ejecutables para hacer que un ordenador ejecute un método para decodificar una representación de campo ac�stico de audio para reproducción de audio comprende los pasos de calcular, para cada uno de una pluralidad de altavoces, una función de encuadre mediante un método geométrico basado en las posiciones de los altavoces y en una pluralidad de direcciones de la fuente, calcular una matriz de modos a partir de las direcciones de la fuente, calcular la seudoinversa de la matriz de modos, y decodificar la representación del campo ac�stico de audio, en donde la decodificación est� basada en una matriz de decodificación que se obtiene a partir de al menos la función de encuadre y la matriz de modos seudoinversa.
Las realizaciones ventajosas de la invención se describen en las reivindicaciones dependientes, en la siguiente descripción y en las figuras.
Breve descripción de los dibujos
Las realizaciones a modo de ejemplo de la invención se describen con referencia a los dibujos que se acompañan, las cuales se muestran en
la Figura 1 es un diagrama de flujos del método;
la Figura 2 es una disposición a modo de ejemplo en 3D con 16 altavoces;
la Figura 3 es un patrón de haz que resulta de la decodificación mediante una adaptación de modos no regularizados;
la Figura 4 es un patrón de haz que resulta de la decodificación mediante una matriz de modos regularizados;
la Figura 5 es un patrón de haz que resulta de la decodificación mediante una matriz obtenida a partir de VBAP;
la Figura 6 resulta de una prueba de escucha; y
la Figura 7 es un diagrama de bloques de un dispositivo.
Descripci�n detallada de la invención
Como se muestra en la Figura 1, un método para decodificar una representación SFc del campo ac�stico de audio para reproducción de audio comprende los pasos de calcular 110, para cada uno de una pluralidad de altavoces, una función de encuadre W mediante un método geométrico basado en las posiciones 102 de los altavoces (L es el número de altavoces) y una pluralidad de direcciones 103 de la fuente (S es el número de direcciones de la fuente), calcular 120 una matriz de modos Ξ a partir de las direcciones de la fuente y de un orden dado N de la representación de un campo ac�stico, calcular 130 una matriz de modos seudoinversa Ξ+ de la matriz de modos Ξ, y decodificar 135, 140 la representación SFc del campo ac�stico de audio, en donde se obtienen los datos de sonido decodificados AUdec. La decodificación est� basada en una matriz D de decodificación que se obtiene 135 a partir de al menos la función W de encuadre y la matriz de modos seudoinversa Ξ+. En una realización la matriz de modos seudoinversa se obtiene de acuerdo con Ξ+ = ΞH [ΞΞH]-1. El orden N de la representación de un campo ac�stico puede ser predefinido, o puede ser extraído 105 a partir de la señal de entrada SFc.
Como se ha mostrado en la Figura 7, un dispositivo para decodificar una representación de audio de un campo ac�stico para una reproducción de audio comprende unos primeros medios de cálculo 210 para calcular, para cada uno de una pluralidad de altavoces, una función W de encuadre mediante un método geométrico basado en las posiciones 102 de los altavoces y en una pluralidad de direcciones 103 de la fuente, unos segundos medios de cálculo 220 para calcular una matriz Ξ de modos a partir de las direcciones de la fuente, unos terceros medios de cálculo 230 para calcular una matriz Ξ+ de modos seudoinversa de la matriz de modos Ξ, y unos medios de decodificador 240 para decodificar la representación de un campo ac�stico. La decodificación est� basada en una matriz D de modos seudoinversa, que se obtiene a partir de al menos la función de encuadre W y de la matriz Ξ+ de modos seudoinversa por unos medios de cálculo 235 de matriz de decodificación (por ejemplo un multiplicador). Los medios de decodificador 240 usan la matriz D de decodificación para obtener una señal de audio decodificada AUdec. Los medios de cálculo primero, segundo y tercero 220, 230, 240 pueden ser un único procesador, o dos o más
procesadores independientes. El orden N de la representación de un campo ac�stico puede ser predefinido, o puede ser obtenido por un medio 205 para extraer el orden a partir de la señal de entrada SFc.
Una disposición de altavoces en 3D particularmente útil tiene 16 altavoces. Como se ha mostrado en la Figura 2, hay cuatro columnas con tres altavoces cada una, y unos altavoces adicionales entre estas columnas. Ocho altavoces est�n igualmente distribuidos en un círculo alrededor de la cabeza del oyente, que abarcan unos ángulos de 45 grados. Cuatro altavoces adicionales est�n situados en la parte de arriba y en el fondo, que abarcan unos ángulos de azimut de 90 grados. Con respecto a Ambisonics, esta disposición es irregular y usualmente da lugar a problemas en el diseño del decodificador.
En lo que sigue se describe con detalle el método de encuadre de amplitud de base vectorial (VBAP). En una realización, el VBAP se usa aquí para colocar unas fuentes acústicas virtuales con una disposición de altavoces arbitraria en la que se supone la misma distancia de los altavoces desde la posición de escucha. El VBAP usa tres altavoces para colocar una fuente virtual en el espacio de 3D. Para cada fuente virtual se alimenta a los altavoces que van a ser usados una señal monof�nica con ganancias diferentes. Las ganancias de los diferentes altavoces dependen de la posición de la fuente virtual. El VBAP es un enfoque geométrico para calcular las ganancias de las señales de los altavoces para el encuadre entre los altavoces. En el caso de 3D tres altavoces configurados en un triángulo crean una base vectorial. Cada base vectorial est� identificada por los números del altavoz k, m, n, y los vectores lk, lm, ln, de las posiciones de los altavoces est�n dados en coordenadas cartesianas normalizadas con la longitud unidad. La base vectorial de los altavoces k, m, n est� definida por
Lkmn = {lk,lm,ln} (1)
La dirección deseada O = (S,φ) de la fuente virtual tiene que ser dada como un ángulo de azimut θ y un ángulo de inclinación S. El vector de posición de longitud unidad p(O) de la fuente virtual en coordenadas cartesianas est� por lo tanto definido por
p(O) = {cosφ senS, senφ senS, cosS}T (2)
Una posición virtual de la fuente puede ser representada con la base vectorial y los factores de ganancia
~ ~gn)T ~ ~
g(O) = (~gk, gm, por p(O) = Lkmn g(O) = ~gklk, gmlm,gnln (3)
Invirtiendo la matriz de la base vectorial los factores de ganancia requeridos pueden ser calculados por
g(O) = L-1mn p(O) (4)
La base vectorial que se ha de usar se determina de acuerdo con el documento de Pulkki: Primero se calculan las ganancias de acuerdo con Pulkki para todas las bases vectoriales. A continuación para cada base vectorial se evalúa el mínimo sobre los factores de ganancia por ~gmin = min{~gk, ~gm, ~gn}. Finalmente se usa la base vectorial en la que ~gmin tiene el valor más alto. Los factores de ganancia resultantes no deben ser negativos. Dependiendo de las condiciones acústicas del salón de escucha los factores de ganancia pueden ser normalizados para la conservación de la energía.
En lo que sigue se describe el formato Ambisonics, que es un formato de un campo ac�stico a título de ejemplo. La representación Ambisonics es un método de descripción de un campo ac�stico que emplea una aproximación matemática del campo ac�stico en un lugar determinado. Mediante el uso de un sistema de coordenadas esféricas, la presión en el punto r = (r,S,φ) es descrita por medio de la transformación de Fourier esférica:
∞ n mm
p(r,k) =L L A (k)j (kr)Y (ϑ,ϕ) (5)
nn n n=0 m=−n
en donde k es el número de ondas. Normalmente n va hasta un orden finito M. Los coeficientes Amn(k) de la serie describen el campo ac�stico (que supone las fuentes fuera de la región de validez), jn(kr) es la función de Bessel esférica de primera clase e Ymn(S,φ) representa los armónicos esféricos. Los coeficientes Amn(k) son considerados como coeficientes Ambisonics en este contexto. Los armónicos esféricos Ymn(S,φ) sólo dependen de los ángulos de inclinación y de azimut y describen una función sobre la esfera unidad.
Por motivos de simplicidad a menudo se suponen ondas planas para la reproducción de un campo ac�stico. Los coeficientes Ambisonics que describen una onda plana como una fuente acústica de dirección Os son
m nm
A , plane (Ω )= 4πiY (Ω )* (6)
ns ns
Su dependencia del número k de ondas disminuye hasta una mera dependencia direccional en este caso especial. Para un orden limitado M los coeficientes forman un vector A que puede ser dispuesto como
0 −101 MT
A(Ω) = [AA AA ]... A ] (7)
s 01 11 M
que mantiene O=(M+1)2 elementos. La misma disposición se usa para los coeficientes armónicos esféricos que producen un vector
*0 −1 01 M
Y(Ω ) =[YY YY ...A ]H
s 01 11 M
en donde el superíndice H representa la traspuesta conjugada compleja.
Para calcular las señales de los altavoces a partir de una representación Ambisonics de un campo ac�stico la adaptación de modos es un enfoque usado comúnmente. La idea básica es expresar una descripción del campo ac�stico A(Os) mediante una suma ponderada de las descripciones A(Ol)de los campos ac�sticos de los altavoces.
L
A(Ω ) =LWA(Ω ) (8)
s ll l=1
en donde Ol representa las direcciones de los altavoces, W son ponderaciones, y L es el número de altavoces. Para obtener las funciones de encuadre a partir de la ecuación (8), suponemos una dirección conocida de incidencia Os. Si los campos ac�sticos de la fuente y del que habla son ambos ondas planas, el factor 4πin (véase la ecuación (6)) puede omitirse, y la ecuación (8) sólo depende de los conjugados complejos de los vectores armónicos esféricos, a los que también se hace referencia como “modos”. Mediante la notación matricial, esto se escribe como
Y(Os)* = Ψ W(Os) (9)
Ψ = [Y(n1)*. Y(n2)*… Y(nL)*] (10)
con OxL elementos. Para obtener el vector de ponderaci�n w deseado se conocen diversas estrategias para llevarlo a cabo. Si se elige M=3, Ψ es cuadrada y puede ser invertible. A pesar de todo, debido a la disposición irregular de los altavoces la matriz est� mal graduada. En tal caso, a menudo se elige la matriz seudoinversa, y
D = [ΨH Ψ]-1 ΨH (11)
produce una matriz de decodificación D LxO. Finalmente podemos escribir
w(Os) = DY(Os)* (12)
en donde las ponderaciones (Os) son la solución de energía mínima para la ecuación (9). A continuación se describen las consecuencias de usar la seudoinversa.
Lo que sigue describe el enlace entre las funciones de encuadre y la matriz de decodificación Ambisonics. En el comienzo con Ambisonics las funciones de encuadre de los altavoces individuales se pueden calcular mediante la ecuación (12). Supongamos que
Ξ = [Y(O1)*, Y(O2)*, …, Y(Os)*] (13)
es la matriz de modos de las direcciones (Os) de la señal de entrada S, por ejemplo una rejilla esférica con un ángulo de inclinación que va por pasos de un grado de 1 a 180� y un ángulo de azimut de 1 a 360� respectivamente. Esta matriz de modos tiene OxS elementos. Mediante la ecuación (12), la matriz W que resulta tiene LxS elementos, la fila l mantiene las ponderaciones de encuadre S para el altavoz respectivo:
W =DΞ (14)
Como ejemplo representativo, en la Figura 3 se muestra como patrón de haz la función de encuadre de un único altavoz 2. En este ejemplo la matriz de decodificación D es de orden M=3. Como se puede ver, los valores de la función de encuadre no se refieren en modo alguno a la ubicación física del altavoz. Esto se debe a la colocación matemática irregular de los altavoces, que no es suficiente como un esquema de muestreo espacial para el orden escogido. Por lo tanto, se hace referencia a la matriz de decodificación como a una matriz de modos no regularizada. Este problema puede ser superado mediante la regularizaci�n de la matriz de modos Ψ de los altavoces en la ecuación (11). Esta solución funciona a costa de la resolución espacial de la matriz de decodificación, que a su vez puede ser expresada como un orden Ambisonics inferior. La Figura 4 muestra a modo de ejemplo el patrón de haz que resulta de la decodificación mediante una matriz de modos regularizada, y particularmente mediante la media de los valores propios de la matriz de modos para la regularizaci�n. En comparación con la Figura 3, se puede reconocer ahora claramente la dirección del altavoz considerado.
Como se ha esbozado en la introducción, es posible otro modo para obtener una matriz de decodificación D para la reproducción de las señales Ambisonics cuando ya son conocidas las funciones de encuadre. Las funciones de encuadre W son consideradas como la señal deseada definida en un conjunto de direcciones O de la fuente virtual, y la matriz de modos Ξ de estas direcciones sirve como señal de entrada. Entonces, la matriz de decodificación puede ser calculada mediante
D = W Ξ [ΞΞH]-1 = W Ξ+ (15)
en donde ΞH [ΞΞH]-1, o simplemente Ξ+, es la seudoinversa de la matriz de modos Ξ. En el nuevo método tomamos las funciones de encuadre en W a partir del VBAP y calculamos una matriz de decodificación Ambisonics a partir de éste.
Las funciones de encuadre de W se toman como valores de ganancia g(O) calculados mediante la ecuación (4), en la que O se elige de acuerdo con la ecuación (13). La matriz de decodificación resultante mediante la ecuación (15) es una matriz de decodificación Ambisonics que facilita las funciones de encuadre del VBAP. En la Figura 5 est� representado un ejemplo que muestra un patrón de haz que resulta de la decodificación mediante una matriz de decodificación obtenida a partir del VBAP. Ventajosamente, los lóbulos laterales SL son significativamente menores que los lóbulos laterales SLreg del resultado de la adaptación de modos regularizados de la Figura 4. Por otra parte, el patrón de haz obtenido del VBAP para cada uno de los altavoces individuales sigue la geometría de la disposición de altavoces cuando las funciones de encuadre del VBAP dependen de la base vectorial de la dirección considerada. Como consecuencia, el nuevo método de acuerdo con la invención produce mejores resultados en todas las direcciones de la disposición de altavoces.
Las direcciones 103 de la fuente pueden ser definidas más libremente. Una condición del número de direcciones de la fuente S es que debe ser al menos (N+1)2. De este modo, con un orden N dado de la señal SFc del campo ac�stico es posible definir S de acuerdo con S ≥ (N+1)2, y distribuir las direcciones de la fuente S uniformemente en una esfera unidad. Como se ha mencionado antes, el resultado puede ser una rejilla esférica con un ángulo de inclinación θ que va por pasos constantes de x (por ejemplo, x = 1 a 5 � x = 10, 20, etc) grados de 1 a 180�, y un ángulo de azimut φ de 1 a 360� respectivamente, en donde cada dirección O = (θ,φ) de la fuente puede ser dada por el ángulo de azimut φ y el ángulo de inclinación θ.
El efecto ventajoso ha sido confirmado en una prueba de escucha. Para la evaluación de la localización de una única fuente, se compara una fuente virtual con una fuente real de referencia. Para la fuente real se usa un altavoz en la posición deseada. Los métodos de reproducción usados son el VBAP, la decodificación de adaptación de modos Ambisonics, y la decodificación Ambisonics propuesta, y la decodificación Ambisonics recientemente propuesta que usa las funciones de encuadre del VBAP de acuerdo con la presente invención. En los dos últimos métodos, para cada posición ensayada y cada señal de entrada ensayada se genera una señal Ambisonics de tercer orden. Esta señal Ambisonics sintética es después decodificada mediante las correspondientes matrices de decodificación. Las señales de prueba usadas son un ruido rosado de banda ancha y una señal de conversación masculina. Las posiciones ensayadas se colocan en la región frontal con las direcciones
O1 = (76,1�, -23,2�), O2 = (63,3�, -4,3�) (16)
La prueba de escucha fue realizada en una habitación acústica con un tiempo de reverberación medio de aproximadamente 0,2 s. Nueve personas participaron en la prueba de escucha. Se pregunt� a los miembros de la prueba que evaluaran la realización de la reproducción espacial de todos los métodos de reproducción comparados con la referencia. Se tenía que encontrar un único valor de evaluación para representar la localización de la fuente virtual y las alteraciones de timbre. La Figura 5 muestra una lista de los resultados de la prueba.
Como muestran los resultados, la decodificación de adaptación de modos Ambisonics no regularizados est� evaluada perceptualmente peor que los otros métodos ensayados. Este resultado corresponde al de la Figura 3. El método de adaptación de modos Ambisonics sirve como referencia en esta prueba de escucha. Otra ventaja es que los intervalos de confianza para la señal de ruido son mayores para el VBAP que para los otros métodos. Los valores medios muestran los valores más altos para la decodificación Ambisonics mediante las funciones de encuadre del VBAP. De este modo, aunque la resolución espacial es reducida – debido al orden de Ambisonics usado - este método muestra ventajas sobre el enfoque del VBAP paramétrico. En comparación con el VBAP, las decodificaciones Ambisonics que decodifican con funciones de encuadre robustas y el VBAP tienen la ventaja de que no se usan sólo tres altavoces para representar la fuente virtual. En el VBAP los altavoces únicos pueden ser dominantes si la posición de la fuente virtual est� cerca de una de las posiciones físicas de los altavoces. La mayor parte de los participantes inform� de menos alteraciones del timbre en el VBAP impulsado por Ambisonics que en el VBAP aplicado directamente. El problema de las alteraciones de timbre en el VBAP es ya conocido a partir de Pulkki. Al contrario que el VBAP, el método recientemente propuesto usa más de tres altavoces para la reproducción de una fuente virtual, pero sorprendentemente produce una menor coloración.
Como conclusión, se describe un nuevo modo de obtener una matriz de decodificación Ambisonics a partir de las funciones de encuadre del VBAP. Para disposiciones diferentes de altavoces este método es ventajoso en comparación con las matrices del enfoque de adaptación de modos. Las propiedades y consecuencias de estas matrices de decodificación se han discutido anteriormente. En resumen, la decodificación Ambisonics recientemente propuesta con las funciones de encuadre del VBAP evita los t�picos problemas del bien conocido enfoque de adaptación de modos bien conocido. Una prueba de escucha ha mostrado que la decodificación Ambisonics obtenida a partir del VBAP puede producir una calidad de reproducción espacial mejor que la que puede producir el
5 uso directo del VBAP. El método propuesto requiere sólo una descripción del campo ac�stico en tanto que el VBAP requiere una descripción paramétrica de las fuentes virtuales que han de ser presentadas.
En tanto que se han mostrado, descrito, y señalado las características novedosas fundamentales de la presente invención como aplicadas a las realizaciones preferidas de ella, se comprender� que los expertos en la técnica pueden realizar diversas omisiones y sustituciones y cambios en el aparato y método descritos, en la forma y 10 detalles de los dispositivos descritos, y en su funcionamiento, sin apartarse del espíritu de la presente invención. Se pretende expresamente que todas las combinaciones de los elementos que llevan a cabo sustancialmente la misma función en sustancialmente la misma forma para conseguir los mismos resultados est�n dentro del alcance de la invención. Las sustituciones de los elementos de una realización descrita a otra son también totalmente intencionadas y contempladas. Se comprender� que se pueden realizar modificaciones de detalles sin apartarse del
15 alcance de la invención. Cada característica descrita en la descripción y (en donde proceda) las reivindicaciones y dibujos pueden ser proporcionados independientemente o en cualquier combinación apropiada. Donde proceda, las características pueden ser puestas en práctica en el soporte físico, en el soporte lógico, o en una combinación de los dos. Los números de referencia que aparecen en las reivindicaciones son solamente a modo ilustrativo y no tendrán efecto limitativo alguno sobre el alcance de las reivindicaciones.

Claims (15)

  1. REIVINDICACIONES
    1. Un método de acuerdo con una representación de un campo ac�stico de audio para reproducción de audio, que comprende los pasos de:
    -
    calcular (110) para cada uno de una pluralidad de altavoces una función de encuadre (W) que usa un método geométrico basado en las posiciones de los altavoces y en una pluralidad de direcciones de la fuente;
    -
    calcular (120) una matriz de modos (ΞN) a partir de las direcciones de la fuente;
    -
    calcular (130) una matriz de modos seudoinversa (Ξ+) de la matriz de modos (Ξ); y
    -
    decodificar (140) la representación de un campo ac�stico de audio, en donde la decodificación est� basada en una matriz de decodificación (D) que se obtiene a partir de la función de encuadre (W) y la matriz de modos seudoinversa (Ξ+).
  2. 2.
    M�todo de acuerdo con la reivindicación 1, en donde el método geométrico usado en el paso de cálculo de una función de encuadre es el Encuadre de Amplitud de la Base Vectorial (VBAP).
  3. 3.
    M�todo de acuerdo con la reivindicación 1 � 2, en donde la representación de un campo ac�stico de audio es un formato Ambisonics de al menos 2� orden.
  4. 4.
    M�todo de acuerdo con cualquiera de las reivindicaciones 1-3, en donde la matriz de modos seudoinversa (Ξ+) se obtiene de acuerdo con ΞH [ΞΞH]-1, en donde Ξ es la matriz de modos de la pluralidad de direcciones de la fuente.
  5. 5.
    M�todo de acuerdo con la reivindicación 4, en donde la matriz de decodificación (DN) se obtiene (135) de acuerdo con D = W ΞH [ΞΞH]-1 = WΞ+, en donde W es el conjunto de funciones de encuadre para cada altavoz.
  6. 6.
    Un dispositivo para decodificar una representación de reproducción de audio, que comprende:
    -
    unos primeros medios de cálculo (210) para calcular para cada uno de una pluralidad de altavoces una función de encuadre (W) que usa un método geométrico basado en las posiciones de los altavoces y en una pluralidad de direcciones de la fuente;
    -
    unos segundos medios de cálculo (220) para calcular una matriz de modos (Ξ) a partir de las direcciones de la fuente;
    -
    unos terceros medios de cálculo (230) para calcular una matriz de modos seudoinversa (Ξ+) de la matriz de modos (Ξ); y
    -
    unos medios (240) de decodificador para decodificar la representación de un campo ac�stico, en donde la decodificación est� basada en una matriz de decodificación (D) y los medios de decodificador usan al menos la función de encuadre (W) y la matriz de modos seudoinversa (Ξ+) para obtener la matriz de decodificación (D).
  7. 7.
    Dispositivo de acuerdo con la reivindicación 6, en donde el dispositivo para decodificación comprende además unos medios (235) para calcular la matriz de decodificación (D) a partir de la función de encuadre (W) y de la matriz de modos seudoinversa (Ξ+).
  8. 8.
    Dispositivo de acuerdo con la reivindicación 6 � 7, en donde el método geométrico usado en el paso de cálculo de una función de encuadre es el Encuadre de Amplitud de la Base Vectorial (VBAP).
  9. 9.
    Dispositivo de acuerdo con cualquiera de las reivindicaciones 6-8, en donde la representación de un campo ac�stico es un formato Ambisonics de al menos 2� orden.
  10. 10.
    Dispositivo de acuerdo con cualquiera de las reivindicaciones 6-9, en donde la matriz de modos seudoinversa Ξ+ se obtiene de acuerdo con Ξ+ = ΞH [ΞΞH]-1, en donde Ξ es la matriz de modos de la pluralidad de direcciones de la fuente.
  11. 11.
    M�todo de acuerdo con la reivindicación 10, en donde la matriz de decodificación (DN) se obtiene en un medio (245) para calcular una matriz de decodificación, de acuerdo con D = W ΞH [ΞΞH]-1 = WΞ+, en donde W esel conjunto de funciones de encuadre para cada altavoz.
  12. 12.
    Medio que puede ser leído por un ordenador que tiene almacenado en él unas instrucciones ejecutables para hacer que un ordenador ejecute un método para decodificar una representación de un sonido ac�stico para reproducción de audio, en donde el método comprende los pasos de
    -
    calcular (110) para cada uno de una pluralidad de altavoces una función de encuadre (W) que usa un método geométrico basado en las posiciones de los altavoces y en una pluralidad de direcciones de la fuente;
    -
    calcular (120) una matriz de modos (Ξ) a partir de las direcciones de la fuente;
    -
    calcular (130) una matriz de modos seudoinversa (Ξ+) de la matriz de modos (Ξ); y
    -
    decodificar (140) la representación de un campo ac�stico de audio, en donde la decodificación est� basada en
    una matriz de decodificación (D) que se obtiene a partir de la función de encuadre (W) y la matriz de modos 5 seudoinversa (Ξ+).
  13. 13. Un medio que puede ser leído por un ordenador, de acuerdo con la reivindicación 12, en donde el método geométrico usado en el paso de calcular una función de encuadre es un Encuadre de Amplitud de Base Vectorial (VBAP).
  14. 14. Un medio que puede ser leído por un ordenador, de acuerdo con la reivindicación 12 � 13, en donde la 10 representación de un campo ac�stico es un formato Ambisonics de al menos 2� orden.
  15. 15. Un medio que puede ser leído por un ordenador, de acuerdo con cualquiera de las reivindicaciones 12-14, en donde la matriz de modos seudoinversa Ξ+ se obtiene de acuerdo con Ξ+ = ΞH [ΞΞH]-1, en donde Ξ es la matriz de modos de la pluralidad de direcciones de la fuente.
ES11709968.9T 2010-03-26 2011-03-25 Método y dispositivo para decodificar una representación de un campo ac�stico de audio para reproducción de audio Active ES2472456T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP10305316 2010-03-26
EP10305316 2010-03-26
PCT/EP2011/054644 WO2011117399A1 (en) 2010-03-26 2011-03-25 Method and device for decoding an audio soundfield representation for audio playback

Publications (1)

Publication Number Publication Date
ES2472456T3 true ES2472456T3 (es) 2014-07-01

Family

ID=43989831

Family Applications (1)

Application Number Title Priority Date Filing Date
ES11709968.9T Active ES2472456T3 (es) 2010-03-26 2011-03-25 Método y dispositivo para decodificar una representación de un campo ac�stico de audio para reproducción de audio

Country Status (12)

Country Link
US (9) US9100768B2 (es)
EP (1) EP2553947B1 (es)
JP (8) JP5559415B2 (es)
KR (9) KR101890229B1 (es)
CN (1) CN102823277B (es)
AU (1) AU2011231565B2 (es)
BR (2) BR122020001822B1 (es)
ES (1) ES2472456T3 (es)
HK (1) HK1174763A1 (es)
PL (1) PL2553947T3 (es)
PT (1) PT2553947E (es)
WO (1) WO2011117399A1 (es)

Families Citing this family (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2472456T3 (es) 2010-03-26 2014-07-01 Thomson Licensing Método y dispositivo para decodificar una representación de un campo ac�stico de audio para reproducción de audio
EP2541547A1 (en) * 2011-06-30 2013-01-02 Thomson Licensing Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation
CA3151342A1 (en) 2011-07-01 2013-01-10 Dolby Laboratories Licensing Corporation System and tools for enhanced 3d audio authoring and rendering
US9084058B2 (en) 2011-12-29 2015-07-14 Sonos, Inc. Sound field calibration using listener localization
EP2637427A1 (en) 2012-03-06 2013-09-11 Thomson Licensing Method and apparatus for playback of a higher-order ambisonics audio signal
EP2645748A1 (en) * 2012-03-28 2013-10-02 Thomson Licensing Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal
EP2665208A1 (en) 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
US9219460B2 (en) 2014-03-17 2015-12-22 Sonos, Inc. Audio settings based on environment
US9106192B2 (en) 2012-06-28 2015-08-11 Sonos, Inc. System and method for device playback calibration
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
KR102079680B1 (ko) 2012-07-16 2020-02-20 돌비 인터네셔널 에이비 오디오 재생을 위한 오디오 음장 표현을 렌더링하는 방법 및 장치
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
EP2688066A1 (en) * 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
US9516446B2 (en) 2012-07-20 2016-12-06 Qualcomm Incorporated Scalable downmix design for object-based surround codec with cluster analysis by synthesis
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
EP2738962A1 (en) * 2012-11-29 2014-06-04 Thomson Licensing Method and apparatus for determining dominant sound source directions in a higher order ambisonics representation of a sound field
CN108174341B (zh) * 2013-01-16 2021-01-08 杜比国际公司 测量高阶高保真度立体声响复制响度级的方法及设备
US9913064B2 (en) 2013-02-07 2018-03-06 Qualcomm Incorporated Mapping virtual speakers to physical speakers
EP2765791A1 (en) * 2013-02-08 2014-08-13 Thomson Licensing Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field
WO2014160576A2 (en) 2013-03-28 2014-10-02 Dolby Laboratories Licensing Corporation Rendering audio using speakers organized as a mesh of arbitrary n-gons
RU2667377C2 (ru) * 2013-04-26 2018-09-19 Сони Корпорейшн Способ и устройство обработки звука и программа
EP3840421A1 (en) 2013-04-26 2021-06-23 Sony Corporation Audio processing device and audio processing system
EP2800401A1 (en) 2013-04-29 2014-11-05 Thomson Licensing Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
BR112015030103B1 (pt) * 2013-05-29 2021-12-28 Qualcomm Incorporated Compressão de representações decomposta de campo sonoro
US9883312B2 (en) 2013-05-29 2018-01-30 Qualcomm Incorporated Transformed higher order ambisonics audio data
US9691406B2 (en) * 2013-06-05 2017-06-27 Dolby Laboratories Licensing Corporation Method for encoding audio signals, apparatus for encoding audio signals, method for decoding audio signals and apparatus for decoding audio signals
EP2824661A1 (en) * 2013-07-11 2015-01-14 Thomson Licensing Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals
EP2866475A1 (en) 2013-10-23 2015-04-29 Thomson Licensing Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups
EP2879408A1 (en) * 2013-11-28 2015-06-03 Thomson Licensing Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
EP4089675A1 (en) * 2014-01-08 2022-11-16 Dolby International AB Method and apparatus for improving the coding of side information required for coding a higher order ambisonics representation of a sound field
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9502045B2 (en) 2014-01-30 2016-11-22 Qualcomm Incorporated Coding independent frames of ambient higher-order ambisonic coefficients
US9264839B2 (en) 2014-03-17 2016-02-16 Sonos, Inc. Playback device configuration based on proximity detection
EP2922057A1 (en) * 2014-03-21 2015-09-23 Thomson Licensing Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal
US10127914B2 (en) 2014-03-21 2018-11-13 Dolby Laboratories Licensing Corporation Method for compressing a higher order ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal
US10412522B2 (en) * 2014-03-21 2019-09-10 Qualcomm Incorporated Inserting audio channels into descriptions of soundfields
JP6374980B2 (ja) 2014-03-26 2018-08-15 パナソニック株式会社 サラウンドオーディオ信号処理のための装置及び方法
WO2015172854A1 (en) 2014-05-13 2015-11-19 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for edge fading amplitude panning
US9847087B2 (en) * 2014-05-16 2017-12-19 Qualcomm Incorporated Higher order ambisonics signal compression
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9852737B2 (en) * 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
EP2960903A1 (en) 2014-06-27 2015-12-30 Thomson Licensing Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
CN110415712B (zh) * 2014-06-27 2023-12-12 杜比国际公司 用于解码声音或声场的高阶高保真度立体声响复制(hoa)表示的方法
US9910634B2 (en) * 2014-09-09 2018-03-06 Sonos, Inc. Microphone calibration
US9952825B2 (en) 2014-09-09 2018-04-24 Sonos, Inc. Audio processing algorithms
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
US10140996B2 (en) * 2014-10-10 2018-11-27 Qualcomm Incorporated Signaling layers for scalable coding of higher order ambisonic audio data
EP3073488A1 (en) 2015-03-24 2016-09-28 Thomson Licensing Method and apparatus for embedding and regaining watermarks in an ambisonics representation of a sound field
CN108028985B (zh) 2015-09-17 2020-03-13 搜诺思公司 用于计算设备的方法
US9693165B2 (en) 2015-09-17 2017-06-27 Sonos, Inc. Validation of audio calibration using multi-dimensional motion check
US10070094B2 (en) * 2015-10-14 2018-09-04 Qualcomm Incorporated Screen related adaptation of higher order ambisonic (HOA) content
CN105392102B (zh) * 2015-11-30 2017-07-25 武汉大学 用于非球面扬声器阵列的三维音频信号生成方法及系统
WO2017119318A1 (ja) * 2016-01-08 2017-07-13 ソニー株式会社 音声処理装置および方法、並びにプログラム
WO2017119320A1 (ja) * 2016-01-08 2017-07-13 ソニー株式会社 音声処理装置および方法、並びにプログラム
EP3402223B1 (en) 2016-01-08 2020-10-07 Sony Corporation Audio processing device and method, and program
US9743207B1 (en) 2016-01-18 2017-08-22 Sonos, Inc. Calibration using multiple recording devices
US10003899B2 (en) 2016-01-25 2018-06-19 Sonos, Inc. Calibration with particular locations
US11106423B2 (en) 2016-01-25 2021-08-31 Sonos, Inc. Evaluating calibration of a playback device
US9860662B2 (en) 2016-04-01 2018-01-02 Sonos, Inc. Updating playback device configuration information based on calibration data
US9864574B2 (en) 2016-04-01 2018-01-09 Sonos, Inc. Playback device calibration based on representation spectral characteristics
US9763018B1 (en) 2016-04-12 2017-09-12 Sonos, Inc. Calibration of audio playback devices
US9794710B1 (en) 2016-07-15 2017-10-17 Sonos, Inc. Spatial audio correction
US10372406B2 (en) 2016-07-22 2019-08-06 Sonos, Inc. Calibration interface
US10459684B2 (en) 2016-08-05 2019-10-29 Sonos, Inc. Calibration of a playback device based on an estimated frequency response
CN110383856B (zh) 2017-01-27 2021-12-10 奥罗技术公司 用于平移音频对象的处理方法和系统
US10861467B2 (en) 2017-03-01 2020-12-08 Dolby Laboratories Licensing Corporation Audio processing in adaptive intermediate spatial format
US10972859B2 (en) 2017-04-13 2021-04-06 Sony Corporation Signal processing apparatus and method as well as program
CN107147975B (zh) * 2017-04-26 2019-05-14 北京大学 一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法
US11277705B2 (en) 2017-05-15 2022-03-15 Dolby Laboratories Licensing Corporation Methods, systems and apparatus for conversion of spatial audio format(s) to speaker signals
US10405126B2 (en) * 2017-06-30 2019-09-03 Qualcomm Incorporated Mixed-order ambisonics (MOA) audio data for computer-mediated reality systems
US10674301B2 (en) 2017-08-25 2020-06-02 Google Llc Fast and memory efficient encoding of sound objects using spherical harmonic symmetries
US10264386B1 (en) * 2018-02-09 2019-04-16 Google Llc Directional emphasis in ambisonics
US11206484B2 (en) 2018-08-28 2021-12-21 Sonos, Inc. Passive speaker authentication
US10299061B1 (en) 2018-08-28 2019-05-21 Sonos, Inc. Playback device calibration
US20200402523A1 (en) * 2019-06-24 2020-12-24 Qualcomm Incorporated Psychoacoustic audio coding of ambisonic audio data
US10734965B1 (en) 2019-08-12 2020-08-04 Sonos, Inc. Audio calibration of a portable playback device
CN112530445A (zh) * 2020-11-23 2021-03-19 雷欧尼斯(北京)信息技术有限公司 高阶Ambisonic音频的编解码方法及芯片
US11743670B2 (en) 2020-12-18 2023-08-29 Qualcomm Incorporated Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4095049A (en) * 1976-03-15 1978-06-13 National Research Development Corporation Non-rotationally-symmetric surround-sound encoding system
CN1452851A (zh) 2000-04-19 2003-10-29 音响方案公司 保持三维中的空间谐波的多通道环绕声母版制作和再现技术
JP2002218655A (ja) * 2001-01-16 2002-08-02 Nippon Telegr & Teleph Corp <Ntt> 空港における給電システム
FR2847376B1 (fr) 2002-11-19 2005-02-04 France Telecom Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
US7558393B2 (en) * 2003-03-18 2009-07-07 Miller Iii Robert E System and method for compatible 2D/3D (full sphere with height) surround sound reproduction
ATE378793T1 (de) * 2005-06-23 2007-11-15 Akg Acoustics Gmbh Methode zur modellierung eines mikrofons
JP4928177B2 (ja) * 2006-07-05 2012-05-09 日本放送協会 音像形成装置
DE102006053919A1 (de) 2006-10-11 2008-04-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer Anzahl von Lautsprechersignalen für ein Lautsprecher-Array, das einen Wiedergaberaum definiert
US20080232601A1 (en) 2007-03-21 2008-09-25 Ville Pulkki Method and apparatus for enhancement of audio reconstruction
US8290167B2 (en) 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
EP2094032A1 (en) 2008-02-19 2009-08-26 Deutsche Thomson OHG Audio signal, method and apparatus for encoding or transmitting the same and method and apparatus for processing the same
JP4922211B2 (ja) * 2008-03-07 2012-04-25 日本放送協会 音響信号変換装置、その方法及びそのプログラム
PL2154677T3 (pl) 2008-08-13 2013-12-31 Fraunhofer Ges Forschung Urządzenie do wyznaczania konwertowanego przestrzennego sygnału audio
WO2011012455A1 (en) 2009-07-30 2011-02-03 Oce-Technologies B.V. Automatic table location in documents
ES2472456T3 (es) * 2010-03-26 2014-07-01 Thomson Licensing Método y dispositivo para decodificar una representación de un campo ac�stico de audio para reproducción de audio
EP2879408A1 (en) * 2013-11-28 2015-06-03 Thomson Licensing Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
JP6589838B2 (ja) 2016-11-30 2019-10-16 カシオ計算機株式会社 動画像編集装置及び動画像編集方法

Also Published As

Publication number Publication date
JP2017085620A (ja) 2017-05-18
US20190139555A1 (en) 2019-05-09
KR20190104450A (ko) 2019-09-09
BR112012024528B1 (pt) 2021-05-11
US20130010971A1 (en) 2013-01-10
US20200273470A1 (en) 2020-08-27
CN102823277B (zh) 2015-07-15
BR122020001822B1 (pt) 2021-05-04
US20170372709A1 (en) 2017-12-28
JP2021184611A (ja) 2021-12-02
CN102823277A (zh) 2012-12-12
JP2014161122A (ja) 2014-09-04
US9100768B2 (en) 2015-08-04
KR20170084335A (ko) 2017-07-19
AU2011231565A1 (en) 2012-08-23
JP6336558B2 (ja) 2018-06-06
PL2553947T3 (pl) 2014-08-29
KR101890229B1 (ko) 2018-08-21
US10522159B2 (en) 2019-12-31
KR101795015B1 (ko) 2017-11-07
KR102622947B1 (ko) 2024-01-10
JP5739041B2 (ja) 2015-06-24
US10037762B2 (en) 2018-07-31
JP6615936B2 (ja) 2019-12-04
US10134405B2 (en) 2018-11-20
US9767813B2 (en) 2017-09-19
KR102093390B1 (ko) 2020-03-25
US11217258B2 (en) 2022-01-04
JP6918896B2 (ja) 2021-08-11
KR20210107165A (ko) 2021-08-31
KR102018824B1 (ko) 2019-09-05
AU2011231565B2 (en) 2014-08-28
KR20180094144A (ko) 2018-08-22
EP2553947B1 (en) 2014-05-07
JP2018137818A (ja) 2018-08-30
KR101953279B1 (ko) 2019-02-28
KR20200033997A (ko) 2020-03-30
JP6067773B2 (ja) 2017-01-25
HK1174763A1 (en) 2013-06-14
US20190341062A1 (en) 2019-11-07
KR20240009530A (ko) 2024-01-22
KR20190022914A (ko) 2019-03-06
EP2553947A1 (en) 2013-02-06
PT2553947E (pt) 2014-06-24
US9460726B2 (en) 2016-10-04
JP2023052781A (ja) 2023-04-12
BR112012024528A2 (pt) 2016-09-06
KR101755531B1 (ko) 2017-07-07
US20180308498A1 (en) 2018-10-25
KR20130031823A (ko) 2013-03-29
JP7220749B2 (ja) 2023-02-10
WO2011117399A1 (en) 2011-09-29
US20170025127A1 (en) 2017-01-26
JP2020039148A (ja) 2020-03-12
US20220189492A1 (en) 2022-06-16
US10629211B2 (en) 2020-04-21
JP5559415B2 (ja) 2014-07-23
JP2013524564A (ja) 2013-06-17
US20150294672A1 (en) 2015-10-15
BR112012024528A8 (pt) 2017-12-05
JP2015159598A (ja) 2015-09-03
KR102294460B1 (ko) 2021-08-27
KR20170125138A (ko) 2017-11-13
US11948583B2 (en) 2024-04-02

Similar Documents

Publication Publication Date Title
ES2472456T3 (es) Método y dispositivo para decodificar una representación de un campo ac�stico de audio para reproducción de audio
ES2922639T3 (es) Método y dispositivo para la reproducción mejorada de campo sonoro de señales de entrada de audio codificadas espacialmente
ES2758522T3 (es) Aparato, procedimiento o programa informático para generar una descripción de campo de sonido
ES2773623T3 (es) Aparato y procedimiento para la generación de una pluralidad de canales de audio
AU2024200911A1 (en) Method and device for decoding an audio soundfield representation
WO2019168083A1 (ja) 音響信号処理装置、音響信号処理方法および音響信号処理プログラム
AU2020201419B2 (en) Method and device for decoding an audio soundfield representation