ES2637922T3 - Método y dispositivo para decodificar una representación de campo sonoro de audio ambisónico para reproducir audio utilizando configuraciones 2D - Google Patents
Método y dispositivo para decodificar una representación de campo sonoro de audio ambisónico para reproducir audio utilizando configuraciones 2D Download PDFInfo
- Publication number
- ES2637922T3 ES2637922T3 ES14786876.4T ES14786876T ES2637922T3 ES 2637922 T3 ES2637922 T3 ES 2637922T3 ES 14786876 T ES14786876 T ES 14786876T ES 2637922 T3 ES2637922 T3 ES 2637922T3
- Authority
- ES
- Spain
- Prior art keywords
- positions
- decoding
- speakers
- speaker
- virtual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/308—Electronic adaptation dependent on speaker or headphone connection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/07—Synergistic effects of band splitting and sub-band processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Stereophonic System (AREA)
Abstract
Un método para decodificar una señal de audio codificada en formato ambisónico para L altavoces en posiciones determinadas conocidas, que comprende los pasos de - añadir (10) al menos una posición de al menos un altavoz virtual a las posiciones (Ω1, ...., Ω1) de los L altavoces; - generar (11) una matriz de decodificación 3D (D'), en donde se utilizan las posiciones de los L altavoces y la al menos una posición virtual (Ω'L+1)y la matriz de decodificación 3D (D') tiene los coeficientes para dichas posiciones determinadas y de altavoces virtuales; - mezclar (12) la matriz de decodificación 3D (D'), en donde se ponderan los coeficientes para las posiciones de altavoces virtuales y se distribuyen a los coeficientes relativos a las posiciones de altavoces determinadas, y en donde se obtiene una matriz de decodificación 3D adaptada (D) que tienen los coeficientes para las posiciones de altavoces determinadas; y - decodificar (14) la señal de audio codificada (i14) usando la matriz de decodificación 3D adaptada (D), en donde se obtiene una pluralidad de señales de altavoz decodificadas (q14).
Description
5
10
15
20
25
30
35
40
45
DESCRIPCION
Metodo y dispositivo para decodificar una representacion de campo sonoro de audio ambisonico para reproducir audio utilizando configuraciones 2D
Campo de la invencion
Esta invencion se refiere a un metodo y a un aparato para decodificar una representacion de campo sonoro de audio y, en particular, una representacion de audio formateado ambisonico, para la reproduccion de audio utilizando una configuracion 2D o cercana a 2D.
Antecedentes
La localizacion precisa es un objetivo clave para cualquier sistema de reproduccion de audio espacial. Tales sistemas de reproduccion son muy aplicables para sistemas de conferencias, juegos u otros entornos virtuales que se benefician del sonido 3D. Se pueden sintetizar o capturar escenas de sonido en 3D como un campo sonoro natural. Senales de campo sonoro, tal como p. ej. el ambisonico, llevan una representacion de un campo sonoro deseado. Se requiere un proceso de decodificacion para obtener las senales de los altavoces individuales de una representacion del campo sonoro. Decodificar una senal formateada ambisonica tambien se conoce como "representacion". Con el fin de sintetizar escenas de audio, se requieren funciones de paneo que se refieren a la disposicion de altavoces espacial para la obtencion de una localizacion espacial de la fuente de sonido dada. Para la grabacion de un campo sonoro natural, se requieren conjuntos de microfonos para capturar la informacion espacial. El enfoque ambisonico es una herramienta muy adecuada para lograr esto. Las senales formateadas ambisonicas llevan una representacion del campo sonoro deseado, basada en la descomposicion armonica esferica del campo sonoro. Mientras que el formato ambisonico basico o formato-B utiliza armonicos esfericos de orden cero y uno, el llamado ambisonico de orden superior (HOA) utiliza tambien armonicos esfericos adicionales de al menos 2° orden. La disposicion espacial de los altavoces se conoce como configuracion de altavoces. Para el proceso de decodificacion, se requiere una matriz de decodificacion (tambien llamada matriz de representacion), la cual es espedfica para una configuracion de altavoces dada y la cual se genera utilizando las posiciones de altavoces conocidas.
Las configuraciones de altavoces utilizadas habitualmente son la configuracion estereo que utiliza dos altavoces, la configuracion envolvente estandar que utiliza cinco altavoces y las extensiones de la configuracion envolvente que utilizan mas de cinco altavoces. Sin embargo, estas configuraciones bien conocidas se limitan a dos dimensiones (2D), p. ej., no se reproduce informacion de la altura. Representar para configuraciones de altavoces conocidas que pueden reproducir informacion de la altura tiene desventajas en la localizacion del sonido y la coloracion: bien se perciben platillos verticales espaciales con sonoridad muy desigual, o senales del altavoz tienen fuertes lobulos laterales, los cuales son desventajosos especialmente para posiciones de escucha descentradas. Por lo tanto, se prefiere un denominado diseno de representacion de conservacion de energfa cuando se representa una descripcion del campo sonoro HOA a los altavoces. Esto significa que la representacion de una sola fuente de sonido resulta en senales de altavoz de energfa constante, independientemente de la direccion de la fuente. En otras palabras, la energfa de entrada llevada por la representacion ambisonica es conservada por el representador del altavoz. La publicacion de patente internacional WO2014/012945A1 [1] de los presentes inventores describe un diseno de representacion de HOA con buenas propiedades de conservacion de energfa y de localizacion para configuraciones de altavoces 3D. Sin embargo, aunque este enfoque funciona bastante bien para configuraciones de altavoces 3D que cubren todas las direcciones, algunas direcciones de las fuentes son atenuadas para configuraciones de altavoces 2D (como p. ej. sonido envolvente 5.1). Esto aplica especialmente para las direcciones donde no hay altavoces colocados, p. ej., desde la parte superior.
En F. Zotter y M. Frank, "All-Round Ambisonic Panning and Decoding" [2], se anade un altavoz "imaginario" si hay un agujero en la envoltura convexa creada por los altavoces. Sin embargo, se omite la senal resultante para ese altavoz imaginario para su reproduccion en el altavoz real. Por lo tanto, todavfa se atenua una senal de fuente de esa direccion (es decir, una direccion en donde no esta colocado un altavoz real). Ademas, ese documento muestra el uso del altavoz imaginario para su uso solo con VBAP (paneo vectorial basado en amplitud).
Sumario de la invencion
5
10
15
20
25
30
35
40
45
50
Por lo tanto, es un problema pendiente disenar presentadores ambisonicos de conservacion de energfa para configuraciones de altavoces 2D (2-dimensional), en donde las fuentes de sonido de direcciones donde no estan colocados altavoces son menos atenuadas, o no atenuadas en absoluto. Las configuraciones de altavoces 2D se pueden clasificar como aquellas en las que los angulos de elevacion de los altavoces estan dentro de un pequeno rango definido (p. ej., < 10°), por lo que estan cerca del plano horizontal.
La presente memoria describe una solucion para representar/decodificar una representacion de campo sonoro de audio formateado ambisonico para distribuciones de altavoces espaciales regulares o no regulares, en donde la representacion/decodificacion proporciona propiedades de localizacion y de coloracion altamente mejoradas y conserva la energfa, y en donde incluso se representa el sonido de direcciones en las que no esta disponible un altavoz. Ventajosamente, el sonido de direcciones en las que no esta disponible un altavoz se representa sustancialmente con la misma energfa y sonoridad percibida que tendna si estuviese disponible un altavoz en la direccion respectiva. Por supuesto, no es posible una localizacion exacta de estas fuentes de sonido ya que no esta disponible un altavoz en su direccion.
En particular, al menos algunas realizaciones descritas proporcionan una nueva manera de obtener la matriz de decodificacion para la decodificacion de los datos de campo sonoro en formato HOA. Puesto que al menos el formato HOA describe un campo sonoro que no esta directamente relacionado con las posiciones de los altavoces y ya que las senales de los altavoces que se obtienen son necesariamente en un formato de audio basado en canales, la decodificacion de senales HOA esta siempre estrechamente relacionada con la representacion de la senal de audio. En principio, lo mismo aplica tambien para otros formatos de campo sonoro de audio. Por lo tanto, la presente divulgacion se refiere a la decodificacion y representacion de formatos de audio relacionados con el campo sonoro. Los terminos matriz de decodificacion y matriz de representacion se utilizan como sinonimos.
Para obtener una matriz de decodificacion para una configuracion dada con buenas propiedades de conservacion de energfa, se anaden uno o mas altavoces virtuales en posiciones donde no esta disponible un altavoz. Por ejemplo, para la obtencion de una matriz de decodificacion mejorada para una configuracion 2D, se anaden dos altavoces virtuales en la parte superior e inferior (correspondientes a angulos de elevacion + 90° y - 90°, con los altavoces 2D colocados aproximadamente a una elevacion de 0°). Para esta configuracion de altavoz 3D virtual, esta disenada una matriz de decodificacion que satisface la propiedad de conservacion de energfa. Finalmente, los factores de ponderacion de la matriz de decodificacion de los altavoces virtuales se mezclan con ganancias constantes a los altavoces reales de la configuracion 2D.
De acuerdo con una realizacion, una matriz de decodificacion (o matriz de representacion) para representar o decodificar una senal de audio en formato ambisonico a un conjunto de altavoces dado, se genera mediante la generacion de una primera matriz de decodificacion preliminar utilizando un metodo convencional y utilizando posiciones de altavoces modificadas, en donde las posiciones de altavoces modificadas incluyen las posiciones de altavoces de un conjunto de altavoces dado y al menos una posicion de altavoz virtual adicional, y la mezcla de la primera matriz de decodificacion preliminar, en donde los coeficientes relativos al por lo menos un altavoz virtual adicional se retiran y se distribuyen a los coeficientes relativos a los altavoces del conjunto de altavoces dado. En una realizacion, sigue un paso subsiguiente de normalizacion de la matriz de decodificacion. La matriz de decodificacion resultante es adecuada para la representacion o la decodificacion de la senal ambisonica al conjunto de altavoces dado, en donde incluso el sonido de posiciones en las que no esta presente un altavoz se reproduce con energfa de senal correcta. Esto es debido a la construccion de la matriz de decodificacion mejorada. Preferiblemente, la primera matriz de decodificacion preliminar es de conservacion de energfa.
En una realizacion, la matriz de decodificacion tiene filas L y O3D columnas. El numero de filas corresponde al numero de altavoces en la configuracion de altavoces 2D y el numero de columnas corresponde al numero de coeficientes ambisonicos O3D, el cual depende del HOA de orden N de acuerdo con O3D = (N + 1)2. Cada uno de los coeficientes de la matriz de decodificacion para una configuracion de altavoces 2D, es una suma de al menos un primer coeficiente intermedio y un segundo coeficiente intermedio. El primer coeficiente intermedio se obtiene por un metodo de diseno de la matriz 3D de conservacion de energfa para la posicion de altavoz actual de la configuracion de altavoces 2D, en donde el metodo de diseno de la matriz 3d de conservacion de energfa utiliza al menos una posicion de altavoz virtual. El segundo coeficiente intermedio se obtiene por un coeficiente que se obtiene a partir de dicho metodo de diseno de la matriz 3D de conservacion de energfa para la al menos una posicion de altavoz virtual, multiplicada con un factor de ponderacion g. En una realizacion, el factor de ponderacion g se calcula de acuerdo 1
9 ~ ~F >
con '/L en donde L es el numero de altavoces en la configuracion de altavoces 2D.
5
10
15
20
25
30
35
40
En una realizacion, la invencion se refiere a un medio de almacenamiento legible por ordenador que tiene almacenado en el mismo instrucciones ejecutables para hacer que un ordenador realice un metodo que comprende los pasos del metodo divulgado anteriormente o en las reivindicaciones.
En la reivindicacion 9 se describe un aparato que utiliza el metodo.
Las realizaciones ventajosas se describen en las reivindicaciones dependientes, la siguiente descripcion y las figuras.
Breve descripcion de los dibujos
Se describen ejemplos de realizacion de la invencion con referencia a los dibujos que se acompanan, los cuales muestran en
la Fig. 1 un diagrama de flujo de un metodo de acuerdo con una realizacion;
la Fig.2 una construccion ejemplar de una matriz de decodificacion HOA mezclada;
la Fig.3 un diagrama de flujo para obtener y modificar las posiciones de los altavoces;
la Fig.4 un diagrama de bloques de un aparato de acuerdo con una realizacion;
la Fig.5 la distribucion de energfa resultante de una matriz de decodificacion convencional;
la Fig.6 la distribucion de energfa resultante de una matriz de decodificacion de acuerdo con las realizaciones; y
la Fig.7 el uso de matrices de decodificacion optimizadas por separado para diferentes bandas de frecuencia.
Descripcion detallada de realizaciones
La Fig. 1 muestra un diagrama de flujo de un metodo para decodificar una senal de audio, en particular, una senal de campo sonoro, de acuerdo con una realizacion. La decodificacion de las senales de campo sonoro requiere generalmente las posiciones de los altavoces a los cuales sera representada la senal de audio. Tales posiciones de
altavoces Sl Slpara L altavoces son la entrada i10 para el proceso. Tenga en cuenta que cuando se mencionan las posiciones, en realidad en este documento se entienden direcciones espaciales, es decir, las posiciones de los altavoces se definen por sus angulos 9i de inclinacion y los angulos azimutales q>i, los cuales se combinan en un vector fi; = [9i,cpi\T. Despues, se anade 10 al menos una posicion de un altavoz virtual. En una realizacion, todas las posiciones de los altavoces que se introducen en el proceso i10 estan sustancialmente en el mismo plano, de forma que constituyen una configuracion 2D, y el al menos un altavoz virtual que se anade esta fuera de este plano. En una realizacion particularmente ventajosa, todas las posiciones de los altavoces que se introducen en el proceso i10 estan sustancialmente en el mismo plano y se anaden las posiciones de dos altavoces virtuales en el paso 10. Las posiciones ventajosas de los dos altavoces virtuales se describen a continuacion. En una realizacion, la adicion se realiza de acuerdo con la Ec. (6) de mas abajo. El paso de adicion 10 da como resultado un conjunto modificado de angulos de altavoz en q 10. Uw es el numero de altavoces virtuales. El conjunto modificado de los angulos
de altavoces se utiliza en un paso 11 de diseno de la matriz de decodificacion 3D. Tambien el HOA de orden N (generalmente del orden de los coeficientes de la senal de campo sonoro) necesita ser proporcionado i11 al paso 11.
El paso 11 de diseno de la matriz de decodificacion 3D realiza cualquier metodo conocido para generar una matriz de decodificacion 3D. Preferiblemente, la matriz de decodificacion 3D es adecuada para un tipo de decodificacion/representacion de conservacion de energfa. Por ejemplo, se puede utilizar el metodo descrito en el documento PCT/EP2013/065034. El paso 11 de diseno de matriz de decodificacion 3D da como resultado una matriz de decodificacion, o matriz de representacion D' que es adecuada para la representacion de las senales de
5
10
15
20
25
30
35
40
45
altavoces L' = L + Lvirt, con Lvirt siendo el numero de posiciones de altavoces virtuales que se anadieron en el paso 10 "adicion de posiciones de altavoz virtual".
Dado que solo estan ffsicamente disponibles L altavoces, la matriz de decodificacion D' que resulta del paso 11 de de diseno de la matriz de decodificacion 3D, necesita ser adaptada a los L altavoces en un paso 12 de mezcla. Este paso realiza la mezcla de la matriz de decodificacion D', en donde son ponderados los coeficientes relativos a los altavoces virtuales y distribuidos a los coeficientes relativos a los altavoces existentes. Preferiblemente, los coeficientes de cualquier de orden HOA particular (es decir, columna de la matriz de decodificacion D') se ponderan y se anaden a los coeficientes del mismo orden HOA (es decir, la misma columna de la matriz de decodificacion D) Un ejemplo es una mezcla de acuerdo con la Ec. (8) de mas abajo. El paso 12 de mezcla da como resultado la matriz de decodificacion 3D mezclada D que tiene L filas, es decir, menos filas que la matriz de decodificacion D', pero tiene el mismo numero de columnas que la matriz de decodificacion D'. En otras palabras, la dimension de la matriz de decodificacion D' es (L + Lvirt) x O3D, y la dimension de la matriz de decodificacion 3D mezclada D es L x O3D.
La Fig.2 muestra una construccion a modo de ejemplo de una matriz de decodificacion HOA mezclada D a partir de una matriz de decodificacion HOA D'. La matriz de decodificacion HOA D' tiene L + 2 filas, lo cual significa que se han anadido dos posiciones de altavoces virtuales a las L posiciones de altavoces disponibles, y O3D columnas, con O3D = (N + 1)2 y siendo N el orden HOA. En el paso 12 de mezcla, se ponderan los coeficientes de filas L + 1 y L + 2 de la matriz de decodificacion HOA D' y se distribuyen a los coeficientes de su respectiva columna, y se eliminan las filas L + 1 y L + 2. Por ejemplo, se ponderan los primeros coeficientes d'L+1,1 y d'L+2,1 de cada una de las filas L + 1 y L + 2 y se suman a los primeros coeficientes de cada una de las filas restantes, tales como d'1,1. El coeficiente resultante d-i -i de la matriz de decodificacion HOA mezcla D es una funcion de d'1,1, d'L+1,1, d'L+2,1 y del factor de ponderacion g. De la misma manera, p. ej., el coeficiente d2,1 resultante de la matriz de decodificacion HOA mezclada D es una funcion de d'2,1, d'L+1,1, d'L+2,1 y del factor de ponderacion g, y el coeficiente resultante d1,2 de la matriz de decodificacion HOA mezclada D es una funcion de d'1,2, d'L+1,2, d'L+2,2 y del factor de ponderacion g.
Por lo general, la matriz de decodificacion HOA mezclada D se normalizara en un paso de normalizacion 13. Sin embargo, este paso 13 es opcional ya que tambien podria ser utilizada una matriz de decodificacion no normalizada para la decodificacion de una senal de campo sonoro. En una realizacion, la matriz de decodificacion HOA mezclada D se normaliza de acuerdo con la Ec. (9) de mas abajo. El paso 13 de normalizacion da como resultado una la matriz de decodificacion HOA mezclada normalizada D, la cual tiene la misma dimension L x O3D que la matriz de decodificacion HOA mezclada D.
La matriz de decodificacion HOA mezclada normalizada D, se puede entonces utilizar en un paso 14 de decodificacion de campo sonoro, donde se decodifica una senal i14 de campo sonoro de entrada a senales q14 de L altavoces. Por lo general, la matriz de decodificacion HOA mezclada normalizada D, no necesita ser modificada hasta que se modifica la configuracion de los altavoces. Por lo tanto, en una realizacion la matriz de decodificacion HOA mezclada normalizada D se almacena en un almacenamiento de matriz de decodificacion HOA.
La Fig.3 muestra detalles de como en una realizacion, se obtienen y modifican las posiciones de los altavoces. Esta
realizacion comprende los pasos para determinar 101 las posiciones ^1-^L de los L altavoces y un orden N de coeficientes de la senal de campo sonoro, determinar 102 a partir de las posiciones que los L altavoces estan
nl,
sustancialmente en un piano 2D, y generar 103 al menos una posicion virtual L+1de un altavoz virtual.
In/ 0/ t 0/ r
, , i+1 es una de L+1 = [0,0] y i+1 = [tt,0] .
I O' o'
, w , L+1 y 1+2 correspondientes a dos altavoces virtuales,
con n'L+1 = [0,0]Ty fi^+z= [tt, 0]t.
De acuerdo con una realizacion, un metodo para decodificar una senal de audio codificada para L altavoces en
posiciones conocidas comprende los pasos para determinar 101 las posiciones ^1-^L de los L altavoces y un orden N de coeficientes de la senal de campo sonoro, determinar 102 a partir de las posiciones que los L altavoces que
nl,
estan sustancialmente en un piano 2D, generar 103 al menos una posicion virtual L+1 de un altavoz virtual, generar
11 una matriz de decodificacion 3D D', en donde se utilizan las posiciones determinadas ^1-^L de los L altavoces y
n;.
la al menos una posicion virtual i+1, y la matriz de decodificacion 3D D'tiene coeficientes para dichas posiciones determinadas y de altavoces virtuales, mezclar 12 la matriz de decodificacion 3D D', en donde se ponderan los
5
10
15
20
25
30
35
40
45
50
coeficientes para las posiciones de los altavoces virtuales y se distribuyen a los coeficientes relativos a las posiciones de altavoces determinados, y en donde se obtiene un matriz de decodificacion 3D adaptada D que tienen los coeficientes para las posiciones de los altavoces determinadas, y decodificar 14 la senal de audio codificada i14 usando la matriz de decodificacion 3D adaptada D, en donde se obtiene una pluralidad de senales de altavoz q14 decodificadas.
En una realizacion, la senal de audio codificada es una senal de campo sonoro, p. ej.
In/ n/ j
, , L+1 de un altavoz virtual es una de i+1 = [0,0] y
en formato HOA. En una
iT
‘L + 2= [TTi 0] .
En una realizacion, los coeficientes para las posiciones de los altavoces virtuales se ponderan con un factor de
g — — .
ponderacion vz.
En una realizacion, el metodo tiene un paso adicional de normalizacion de la matriz de decodificacion 3D adaptada D, en donde se obtiene la matriz de decodificacion 3D adaptada normalizada D, y el paso de decodificacion 14 de la senal de audio codificada i14 usa la matriz de decodificacion 3D adaptada normalizada D. En una realizacion, el metodo tiene un paso adicional de almacenamiento de la matriz de decodificacion 3D adaptada D o de la matriz de decodificacion HOA mezclada normalizada D, en un almacenamiento de la matriz de decodificacion.
De acuerdo con una realizacion, una matriz de decodificacion para la representacion o la decodificacion de una senal de campo sonoro para un conjunto de altavoces dado, se genera mediante la generacion de una primera matriz de decodificacion preliminar utilizando un metodo convencional y utilizando las posiciones de los altavoces modificadas, en donde las posiciones de los altavoces modificadas incluyen posiciones de altavoces del conjunto de altavoces dado y al menos una posicion de altavoz virtual adicional, y se mezcla la primera matriz de decodificacion preliminar, en donde los coeficientes relativos al por lo menos un altavoz virtual adicional se retiran y se distribuyen a los coeficientes relativos a los altavoces del conjunto de altavoces dado. En una realizacion, sigue un paso subsiguiente de normalizacion de la matriz de decodificacion. La matriz de decodificacion resultante es adecuada para la representacion o la decodificacion de la senal de campo sonoro para el conjunto de altavoces dado, en donde incluso el sonido de las posiciones en las que no esta presente un altavoz se reproduce con energfa de senal correcta. Esto es debido a la construccion de la matriz de decodificacion mejorada. Preferiblemente, la primera matriz de decodificacion preliminar es de conservacion de energfa.
La Fig.4 a) muestra un diagrama de bloques de un aparato de acuerdo con una realizacion. El aparato 400 para decodificar una senal de audio codificada en formato de campo sonoro para L altavoces en posiciones conocidas, comprende una unidad sumadora 410 para la adicion de al menos una posicion de al menos un altavoz virtual a las posiciones de los L altavoces, una unidad generadora de matrices de decodificacion 411 para la generacion de una
matriz de decodificacion 3D D', en donde se utilizan las posiciones nLde los L altavoces y la al menos una
no
posicion virtual L+1 y la matriz de decodificacion 3D D'tiene los coeficientes para dichas posiciones determinadas y de altavoces virtuales, una unidad de mezcla de matrices 412 para mezclar la matriz de decodificacion 3D D', en donde se ponderan los coeficientes para las posiciones de los altavoces virtuales y se distribuyen a los coeficientes relativos a las posiciones de los altavoces determinados, y en donde se obtiene una matriz de decodificacion 3D mezclada D que tiene los coeficientes para las posiciones de los altavoces determinadas y la unidad de decodificacion 414 para decodificar la senal de audio codificada usando la matriz de decodificacion 3D mezclada D, en donde se obtiene una pluralidad de senales de altavoces decodificadas.
En una realizacion, el aparato comprende ademas una unidad de normalizacion 413 para normalizar la matriz de decodificacion 3D mezclada D, en donde se obtiene una matriz de decodificacion 3D mezclada normalizada D y la unidad de decodificacion 414 utiliza la matriz de decodificacion 3D mezclada normalizada D.
En una realizacion mostrada en la Fig.4 b), el aparato comprende ademas una primera unidad de determinacion
4101, para determinar las posiciones (®l) de los L altavoces y un orden N de coeficientes de la serial de campo sonoro, una segunda unidad de determinacion 4102, para determinar a partir de las posiciones que los L altavoces estan sustancialmente en una piano 2D, y una unidad generadora de posiciones de altavoces virtuales 4103, para
generar al menos una posicion virtual de un altavoz virtual.
En una realizacion, el aparato comprende ademas una pluralidad de filtros de paso de banda 715b para separar la senal de audio codificada en una pluralidad de bandas de frecuencia, en donde se genera una pluralidad de matrices de decodificacion 3D separadas Db 711b, una para cada una de las bandas de frecuencia, y se mezcla cada una de las matrices de decodificacion 3D Db 712b y, opcionalmente, se normaliza por separado, y en donde la unidad de decodificacion 714b decodifica cada una de las bandas de frecuencia por separado. En esta realizacion, el aparato comprende ademas una pluralidad de unidades sumadoras 716b, una para cada uno de los altavoces. Cada una de las unidades sumadoras anade las bandas de frecuencia relativas al altavoz respectivo.
6
5
10
15
20
25
30
35
40
45
50
Cada una de las unidades sumadoras 410, las unidades generadoras de matrices de decodificacion 411, las unidades de mezcla de matrices 412, las unidades de normalization 413, las unidades de decodificacion 414, las primeras unidades de determination 4101, las segundas unidades de determination 4102 y las unidades de generation de posiciones de altavoces virtuales 4103, pueden ser implementadas por uno o mas procesadores y cada una de estas unidades puede compartir el mismo procesador con cualquier otra de estas u otras unidades.
La Fig.7 muestra una realization que utiliza matrices de decodificacion optimizadas separadas para las diferentes bandas de frecuencia de la senal de entrada. En esta realizacion, el metodo de decodificacion comprende un paso de separation de la senal de audio codificada en una pluralidad de bandas de frecuencias utilizando filtros de paso de banda. Se genera una pluralidad de matrices de decodificacion 3D Db'separadas 711b, una para cada una de las bandas de frecuencia, y se mezcla 712b cada una de las matrices de decodificacion 3D Db' y, opcionalmente, se normaliza por separado. La decodificacion 714b de la senal de audio codificada se realiza para cada una de las bandas de frecuencias por separado. Esto tiene la ventaja de que pueden ser tomadas en consideration las diferencias dependientes de la frecuencia en la perception humana y puede dar lugar a diferentes matrices de decodificacion para diferentes bandas de frecuencia. En una realizacion, se genera solo una o mas (pero no todas) de las matrices de decodificacion mediante la adicion de posiciones de altavoces virtuales y luego la ponderacion y la distribution de sus coeficientes a los coeficientes de las posiciones de altavoces existentes como descrito anteriormente. En otra realizacion, cada una de las matrices de decodificacion se genera mediante la adicion de posiciones de altavoces virtuales y luego la ponderacion y la distribucion de sus coeficientes a los coeficientes de las posiciones de altavoces existentes como descrito anteriormente. Por ultimo, se suman todas las bandas de frecuencia relativas al mismo altavoz en una unidad sumadora de banda de frecuencia 716b por cada uno de los altavoces, en una operation inversa a la division de banda de frecuencia.
Cada una de las unidades sumadoras 410, las unidades generadoras de matrices de decodificacion 711b, las unidades de mezcla de matrices 712b, las unidades de normalizacion 713b, las unidades de decodificacion 714b, las unidades sumadoras de banda de frecuencia 716b y las unidades de filtro de paso de banda 715b, pueden ser implementadas por uno o mas procesadores y cada una de estas unidades puede compartir el mismo procesador con cualquier otra de estas u otras unidades.
Un aspecto de la presente divulgation es obtener una matriz de representation para una configuration 2D con buenas propiedades de conservation de energia. En una realizacion, se anaden dos altavoces virtuales en la parte superior e inferior (angulos de elevation + 90° y - 90° con los altavoces 2D colocados aproximadamente a una elevation de 0°). Para esta configuracion de altavoz virtual 3D, se disena una matriz de representacion que satisface la propiedad de conservacion de energia. Finalmente, se mezclan los factores de ponderacion de la matriz de representacion de los altavoces virtuales con ganancias constantes a los altavoces reales de la configuracion 2D.
A continuation, se describe la representacion ambisonica (en particular HOA)
La representacion ambisonica es el proceso de calculo de las senales de altavoces de una description de campo sonoro ambisonico. A veces, tambien se le llama decodificacion ambisonica. Se considera una representacion de campo sonoro ambisonico 3D de orden N, donde el numero de coeficientes es
03D = (N + l)2 (1)
b(t) e (C°3dX1
Los coeficientes para la muestra de tiempo t estan representados por el vector
con O3D elementos.
Con la matriz de representacion D E por
£LX03D
las senales de los altavoces para la muestra de tiempo t se calculan
w{t)=Db{t) (2)
con
y
y siendo L el numero de altavoces.
Las posiciones de los altavoces se definen por sus angulos de inclination 0/ y los angulos azimutales <p/, los cuales
se combinan en un vector = [0i.<A]rpara /= 1, L. Las diferentes distancias de los altavoces de la posicion de escucha se compensan mediante el uso de retardos individuales para los canales de los altavoces.
La energia de senal en el dominio HOA esta dada por
E -bH b (3)
donde H indica la transpuesta (compleja conjugada). La energia correspondiente de las senales del altavoz se calcula por
E = wH w = bHDHD b. (4)
La relation E/E para una matriz de decodificacion/procesamiento de conservacion de energia, debe ser constante a fin de lograr la decodificacion/representacion de conservacion de energia.
5
10
15
20
25
30
35
40
En principio, se propone la siguiente extension para la representacion 2D mejorada: Para el diseno de la representacion de matrices para configuraciones de altavoces 2D, se anaden uno o mas altavoces virtuales. Las configuraciones 2D se entienden como aquellas en las que los angulos de elevacion de los altavoces estan dentro de un pequeno intervalo definido, de modo que estan cerca del piano horizontal. Esto puede ser expresado por
I 7T|
0thres2d> 1 = 1,—,L (5)
En una realizacion, el valor umbral 0thres2d se elige normalmente para corresponder a un valor en el intervalo de 5° a 10°.
n;
Para el diseno de representacion, se define un conjunto modificado de angulos ' de altavoces. Las ultimas (en este ejemplo dos) posiciones de altavoces son las de dos altavoces virtuales en los polos norte y sur (en direccion vertical, es decir, superior e inferior) del sistema de coordenadas polares:
Asf, el nuevo numero de altavoces usado para el diseno de representacion es L - L + 2. A partir de estas posiciones
de altavoces modificadas, se disena una matriz de representacion D' e C^L+2^X°3D con un enfoque de conservacion de energia. Por ejemplo, se puede utilizar el metodo de diseno descrito en [1]. Ahora, se deriva de D' la matriz de representacion final para la configuracion de altavoces original. Una idea es mezclar los factores de ponderacion para el altavoz virtual como se define en la matriz D' con los altavoces reales. Se utiliza un factor de ganancia fijo que se elige como
1
(7)
9 -
VT
Los coeficientes de la matriz intermedia D £ CLx°3D (tambien llamada matriz de decodificacion 3D adaptada en este documento) se definen por
dl,q
di,q + g-d'L+1,q + 9 ■ d'L+2,q para l = 1,..., L y q = l,...,0
3D
(8)
donde d/q, es el elemento de la matriz D en la fila /-esima y la columna q-esima. En un paso final opcional, la matriz intermedia (matriz de decodificacion 3D adaptada) se normaliza usando la norma de Frobenius:
Las Figs. 5 y 6 muestran las distribuciones de energia para una configuracion de altavoces de sonido envolvente 5.0. En ambas figuras, los valores de energia se muestran como escalas de grises y los drculos indican las posiciones de los altavoces. Con el metodo descrito, especialmente, se reduce claramente la atenuacion en la parte superior (y tambien en la parte inferior, no mostrada aqd).
La Fig.5 muestra la distribucion de energia resultante de una matriz de decodificacion convencional. Los pequenos drculos alrededor del plano z = 0 representan las posiciones de los altavoces. Como puede verse, esta cubierto un intervalo de energia de [-3,9, ..., 2,1] dB, lo que resulta en diferencias de energia de 6 dB. Ademas, las senales de la parte superior (y de la parte inferior, no visible) de la n-esfera se reproducen con energia muy baja, es decir, no audible, ya que aqu no estan disponibles altavoces.
La Fig.6 muestra la distribucion de energia resultante de una matriz de decodificacion de acuerdo con una o mas realizaciones, con la misma cantidad de altavoces que estan en las mismas posiciones que en la Fig.5. Al menos se proporcionan las siguientes ventajas: primero, se cubre un intervalo de energia menor de [-1,6, ..., 0,8] dB, lo que resulta en diferencias de energia mas pequenas de unicamente 2,4 dB. Segundo, se reproducen las senales de todas las direcciones de la n-esfera con su energia correcta, incluso si aqui no estan disponibles altavoces. Puesto que estas senales se reproducen a traves de los altavoces disponibles, su localizacion no es correcta, pero las senales son audibles con sonoridad correcta. En este ejemplo, las senales de la parte superior y en la parte inferior (no visible) se hacen audibles debido a la decodificacion con la matriz de decodificacion mejorada.
En una realizacion, un metodo para decodificar una senal de audio codificada en formato ambisonico para L altavoces en posiciones conocidas, comprende pasos de adicion de al menos una posicion de al menos un altavoz virtual a las posiciones de los L altavoces, generando una matriz de decodificacion 3D D', en donde se utilizan las
8
5
10
15
20
25
30
35
40
45
50
posiciones ^..^de los L altavoces y la al menos una posicion virtual fil+i, y la matriz de decodificacion 3D D'
tiene coeficientes para dichas posiciones determinadas y de altavoces virtuales, mezclar la matriz decodificacion 3D D', en donde se ponderan los coeficientes para las posiciones de altavoces virtuales y se distribuyen a los coeficientes relativos a las posiciones de altavoces determinadas, y en donde se obtiene una matriz de decodificacion 3D adaptada D que tiene los coeficientes para las posiciones de los altavoces determinadas, y la decodificacion de la senal de audio codificada usando la matriz de decodificacion 3D adaptada D, en donde se obtiene una pluralidad de senales de altavoz decodificadas.
En otra realizacion, un aparato para decodificar una senal de audio codificada en formato ambisonico para L altavoces en posiciones conocidas, comprende una unidad sumadora 410 para la adicion de al menos una posicion de al menos un altavoz virtual a las posiciones de los L altavoces, una unidad generadora de matrices de
decodificacion 411 para generar una matriz de decodificacion 3D D', en donde se utilizan las posiciones ..^de
los L altavoces y la al menos una posicion virtual ^i+i, s para
dichas posiciones determinadas y de altavoces virtuales, una unidad de mezcla de matrices 412 para mezclar la matriz de decodificacion 3D D', en donde se ponderan los coeficientes para las posiciones de los altavoces virtuales y se distribuyen a los coeficientes relativos a las posiciones de altavoces determinadas, y en donde se obtiene una matriz de decodificacion 3D adaptada D que tiene los coeficientes para las posiciones de los altavoces determinadas, y una unidad de decodificacion 414 para decodificar la senal de audio codificada usando la matriz de decodificacion 3D adaptada D, en donde se obtiene una pluralidad de senales de altavoz decodificadas.
En otra realizacion, un aparato para decodificar una senal de audio codificada en formato ambisonico para L altavoces en posiciones conocidas, comprende al menos un procesador y al menos una memoria, la memoria tiene almacenadas instrucciones que cuando se ejecutan en el procesador, implementan una unidad sumadora 410 para la adicion de al menos una posicion de al menos un altavoz virtual a las posiciones de los L altavoces, una unidad generadora de matrices de decodificacion 411 para generar una matriz de decodificacion 3D D', en donde se utilizan
las posiciones ..de los L altavoces y la al menos una posicion virtual ^i+i, y la matriz de decodificacion 3D D'
tiene coeficientes para dichas posiciones determinadas y de altavoces virtuales, una unidad de mezcla de matrices 412 para mezclar la matriz de decodificacion 3D D', en donde se ponderan los coeficientes para las posiciones de los altavoces virtuales y se distribuyen a los coeficientes relativos a las posiciones de altavoces determinadas, y en donde se obtiene una matriz de decodificacion 3D adaptada D que tiene los coeficientes para las posiciones de altavoces determinadas, y una unidad de decodificacion 414 para decodificar la senal de audio codificada usando la matriz de decodificacion 3d adaptada D, en donde se obtiene una pluralidad de senales de altavoz decodificadas.
En otra realizacion, un medio de almacenamiento legible por ordenador que tiene almacenado en el mismo instrucciones ejecutables para hacer que un ordenador realice un metodo para decodificar una senal de audio codificada en formato ambisonico para L altavoces en posiciones conocidas, en donde el metodo comprende pasos de adicion de al menos una posicion de de al menos un altavoz virtual a las posiciones de los L altavoces,
generando una matriz de decodificacion 3D D', en donde se utilizan las posiciones ..de los L altavoces y la al
menos una posicion virtual ^i+i, y la matriz de decodificacion 3D D' tiene los coeficientes para dichas posiciones determinadas y de altavoces virtuales, mezclar la matriz de decodificacion 3D D', en donde se ponderan los coeficientes para las posiciones de altavoces virtuales y se distribuyen a los coeficientes relativos a las posiciones de altavoces determinadas, y en donde se obtiene una matriz de decodificacion 3D adaptada D que tiene los coeficientes para las posiciones de altavoces determinadas, y decodificar la senal de audio codificada usando la matriz de decodificacion 3D adaptada D, en donde se obtiene una pluralidad de senales de altavoz decodificadas. Otras realizaciones de medios de almacenamiento legibles por ordenador pueden incluir cualquier caractertstica descrita anteriormente en las caractertsticas particulares divulgadas en las reivindicaciones dependientes que se refieran a la reivindicacion 1.
Se entendera que la presente invencion se ha descrito puramente a modo de ejemplo y se pueden hacer modificaciones de detalle sin apartarse del alcance de la invencion. Por ejemplo, aunque se ha descrito solo con respecto a HOA, la invencion tambien se puede aplicar para otros formatos de audio de campo sonoro.
Cada una de las caractertsticas descritas en la descripcion y (donde sea apropiado) las reivindicaciones y los dibujos, puede ser proporcionada independientemente o en cualquier combinacion apropiada. Las caractertsticas pueden, en su caso, ser implementadas en hardware, software o una combinacion de los dos. Los numeros de referencia que aparecen en las reivindicaciones son solo a modo de ilustracion y no tendran efecto limitativo en el alcance de las reivindicaciones.
Las siguientes referencias se han citado anteriormente.
[1] Publicacion de Patente Internacional n.° WO2014/012945A1 (PD120032)
[2] F. Zotter y M. Frank, " All-Round Ambisonic Panning and Decoding", J. Audio Eng. Soc., 2012, vol. 60, pp. 807820
5
Claims (15)
- 510152025303540REIVINDICACIONES1. Un metodo para decodificar una senal de audio codificada en formato ambisonico para L altavoces en posiciones determinadas conocidas, que comprende los pasos de- anadir (10) al menos una position de al menos un altavoz virtual a las posiciones de los L altavoces;- generar (11) una matriz de decodificacion 3D (D), en donde se utilizan las posiciones (^1..SL) de los Laltavoces y la al menos una posicion virtual y la matriz de decodificacion 3D (D) tiene los coeficientes para dichas posiciones determinadas y de altavoces virtuales;- mezclar (12) la matriz de decodificacion 3D (D) en donde se ponderan los coeficientes para las posiciones de altavoces virtuales y se distribuyen a los coeficientes relativos a las posiciones de altavoces determinadas, y en donde se obtiene una matriz de decodificacion 3D adaptada (D) que tienen los coeficientes para las posiciones de altavoces determinadas; y- decodificar (14) la senal de audio codificada (i14) usando la matriz de decodificacion 3D adaptada (D), en donde se obtiene una pluralidad de senales de altavoz decodificadas (q14).
- 2. El metodo de acuerdo con la reivindicacion 1, en donde se ponderan los coeficientes para las posiciones de loslg - — ,altavoces virtuales con un factor de ponderacion Vi en donde L es el numero de altavoces.
- 3. El metodo de acuerdo con la reivindicacion 1 o 2, en donde la al menos una posicion virtual (nl+i) de un altavoz virtual es una de &l+1= [0,0]r y &l+i = [TT,0]r.
- 4. El metodo de acuerdo con cualquiera de las reivindicaciones 1-3, que comprende ademas un paso de normalization (13) de la matriz de decodificacion 3D adaptada (D) utilizando una norma de Frobenius, en donde se obtiene una matriz de decodificacion 3D adaptada normalizada (D), y el paso de decodificacion (14) de la senal de audio codificada utiliza la matriz de decodificacion 3D adaptada normalizada (D).
- 5. El metodo de acuerdo con la reivindicacion 4, en donde la normalization se realiza de acuerdo con
imagen1 - 6. El metodo de acuerdo con cualquiera de las reivindicaciones 1-5, que comprende ademas los pasos de- determinar (101) posiciones (®i..^-) de los L altavoces y un orden N de coeficientes de la senal de camposonoro;- determinar (102) a partir de las posiciones que los L altavoces estan sustancialmente en un piano 2D; y- generar (103) al menos una posicion virtual de un altavoz virtual.
- 7. El metodo de acuerdo con cualquiera de las reivindicaciones 1-6, que comprende ademas un paso de separation de la senal de audio codificada en una pluralidad de bandas de frecuencia utilizando filtros de paso de banda, en donde se genera una pluralidad de matrices de decodificacion 3D separadas (Db) (711 b ), una para cada una de las bandas de frecuencia, y cada una de las matrices de decodificacion 3D (Db) se mezcla (712b) y opcionalmente se normaliza por separado (713b), y donde el paso de decodificacion (714b) de la senal de audio codificada (i14) se realiza para cada una de las bandas de frecuencias por separado.
- 8. El metodo de acuerdo con cualquiera de las reivindicaciones 1-7, en donde las posiciones de los L altavoces conocidas estan sustancialmente dentro de un plano 2D, con elevaciones de no mas de 10°.
- 9. Un aparato para decodificar una senal de audio codificada en formato ambisonico para L altavoces en posiciones determinadas conocidas, que comprende- la unidad sumadora (410) para anadir al menos una posicion de al menos un altavoz virtual a las posiciones de los L altavoces;- la unidad generadora de matrices de decodificacion (411) para generar una matriz de decodificacion 3D(D), en donde se utilizan las posiciones @1..^0 de los L altavoces y la al menos una posicion virtual (^+1) y la510152025303540matriz de decodificacion 3D (D') que tiene los coeficientes para dichas posiciones determinadas y de altavoces virtuales;- la unidad de mezcla de matrices (412) para mezclar la matriz de decodificacion 3D (D) en donde se ponderan los coeficientes para las posiciones de los altavoces virtuales y se distribuyen a los coeficientes relativos a las posiciones de altavoces determinadas, y en donde se obtiene una matriz de decodificacion 3D adaptada (D) que tiene los coeficientes para las posiciones de altavoces determinadas; y- la unidad de decodificacion (414) para decodificar la senal de audio codificada (i14) usando la matriz de decodificacion 3D adaptada (D), en donde se obtiene una pluralidad de senales de altavoz decodificadas (q 14).
- 10. El aparato de acuerdo con la reivindicacion 9, que comprende ademas una unidad de normalizacion (413) para normalizar la matriz de decodificacion 3D adaptada (D) utilizando una norma de Frobenius, en donde se obtiene una matriz de decodificacion 3D adaptada normalizada (D), y la unidad de decodificacion (414) utiliza la matriz de decodificacion 3D adaptada normalizada (D).
- 11. El aparato de acuerdo con la reivindicacion 9 o 10, que comprende ademas- la primera unidad de determinacion (101) para determinar las posiciones ..^0 de los L altavoces y unorden N de los coeficientes de la senal de campo sonoro;- la segunda unidad de determinacion (102) para determinar a partir de las posiciones que los L altavoces estan sustancialmente en un plano 2D; y- la unidad generadora de posiciones de altavoces virtuales (103) para generar al menos una posicion virtual (^t+i) de un altavoz virtual.
- 12. El aparato de acuerdo con una de las reivindicaciones 9-11, que comprende ademas una pluralidad de filtros de paso de banda (715b) para separar la senal de audio codificada en una pluralidad de bandas de frecuencia, en donde se genera una pluralidad de matrices de decodificacion 3D separadas (Db') (711 b), una para cada una de las bandas de frecuencia, y se mezcla cada una de las matrices de decodificacion 3D (Db') (712b) y opcionalmente se normaliza por separado, y en donde la unidad de decodificacion (714b) decodifica cada una de las bandas de frecuencias por separado.
- 13. Un medio de almacenamiento legible por ordenador que tiene almacenado en el mismo instrucciones ejecutables para hacer que un ordenador realice un metodo para decodificar una senal de audio codificada en formato ambisonico para L altavoces en posiciones determinadas conocidas, el metodo comprende los pasos de- anadir (10) al menos una posicion de al menos un altavoz virtual a las posiciones de los L altavoces;- generar (11) una matriz de decodificacion 3D (O'), en donde se utilizan las posiciones ..^0 de los L altavoces yla al menos una posicion virtual (^t+i) y la matriz de decodificacion 3D (O') tiene los coeficientes para dichas posiciones determinadas y de altavoces virtuales;- mezclar (12) la matriz de decodificacion 3D (D) en donde se ponderan los coeficientes para las posiciones de los altavoces virtuales y se distribuyen a los coeficientes relativos a las posiciones de altavoces determinadas, y en donde se obtiene una matriz de decodificacion 3D adaptada (D) que tienen los coeficientes para las posiciones de altavoces determinadas; y- decodificar (14) la senal de audio codificada (i14) usando la matriz de decodificacion 3D adaptada (D), en donde se obtiene una pluralidad de senales de altavoz decodificadas (q 14).
- 14. El medio de almacenamiento legible por ordenador de acuerdo con la reivindicacion 13, en donde se ponderanlg = — ,los coeficientes para las posiciones de altavoces virtuales con un factor de ponderacion v£ en donde L es el numero de altavoces.
- 15. El medio de almacenamiento legible por ordenador de acuerdo con la reivindicacion 13 o 14, en donde la al menos una posicion virtual (^l+i)de un altavoz virtual es una de ^L+1 = [0,0]Ty ^L+1 = [tt,0]t.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13290255 | 2013-10-23 | ||
EP20130290255 EP2866475A1 (en) | 2013-10-23 | 2013-10-23 | Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups |
PCT/EP2014/072411 WO2015059081A1 (en) | 2013-10-23 | 2014-10-20 | Method for and apparatus for decoding an ambisonics audio soundfield representation for audio playback using 2d setups |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2637922T3 true ES2637922T3 (es) | 2017-10-17 |
Family
ID=49626882
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES14786876.4T Active ES2637922T3 (es) | 2013-10-23 | 2014-10-20 | Método y dispositivo para decodificar una representación de campo sonoro de audio ambisónico para reproducir audio utilizando configuraciones 2D |
Country Status (16)
Country | Link |
---|---|
US (8) | US9813834B2 (es) |
EP (5) | EP2866475A1 (es) |
JP (6) | JP6463749B2 (es) |
KR (4) | KR102629324B1 (es) |
CN (6) | CN108632737B (es) |
AU (6) | AU2014339080B2 (es) |
BR (2) | BR112016009209B1 (es) |
CA (5) | CA3147196C (es) |
ES (1) | ES2637922T3 (es) |
HK (4) | HK1221105A1 (es) |
MX (5) | MX359846B (es) |
MY (2) | MY191340A (es) |
RU (2) | RU2679230C2 (es) |
TW (5) | TWI651973B (es) |
WO (1) | WO2015059081A1 (es) |
ZA (5) | ZA201801738B (es) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9288603B2 (en) | 2012-07-15 | 2016-03-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding |
US9473870B2 (en) | 2012-07-16 | 2016-10-18 | Qualcomm Incorporated | Loudspeaker position compensation with 3D-audio hierarchical coding |
US9516446B2 (en) | 2012-07-20 | 2016-12-06 | Qualcomm Incorporated | Scalable downmix design for object-based surround codec with cluster analysis by synthesis |
US9761229B2 (en) | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
US9736609B2 (en) | 2013-02-07 | 2017-08-15 | Qualcomm Incorporated | Determining renderers for spherical harmonic coefficients |
EP2866475A1 (en) * | 2013-10-23 | 2015-04-29 | Thomson Licensing | Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups |
US9838819B2 (en) * | 2014-07-02 | 2017-12-05 | Qualcomm Incorporated | Reducing correlation between higher order ambisonic (HOA) background channels |
EP3375208B1 (en) * | 2015-11-13 | 2019-11-06 | Dolby International AB | Method and apparatus for generating from a multi-channel 2d audio input signal a 3d sound representation signal |
US20170372697A1 (en) * | 2016-06-22 | 2017-12-28 | Elwha Llc | Systems and methods for rule-based user control of audio rendering |
FR3060830A1 (fr) * | 2016-12-21 | 2018-06-22 | Orange | Traitement en sous-bandes d'un contenu ambisonique reel pour un decodage perfectionne |
US10405126B2 (en) | 2017-06-30 | 2019-09-03 | Qualcomm Incorporated | Mixed-order ambisonics (MOA) audio data for computer-mediated reality systems |
SG11202000285QA (en) | 2017-07-14 | 2020-02-27 | Fraunhofer Ges Forschung | Concept for generating an enhanced sound-field description or a modified sound field description using a multi-layer description |
AU2018298874C1 (en) | 2017-07-14 | 2023-10-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for generating an enhanced sound field description or a modified sound field description using a multi-point sound field description |
US10015618B1 (en) * | 2017-08-01 | 2018-07-03 | Google Llc | Incoherent idempotent ambisonics rendering |
CN114582357A (zh) * | 2020-11-30 | 2022-06-03 | 华为技术有限公司 | 一种音频编解码方法和装置 |
US11743670B2 (en) | 2020-12-18 | 2023-08-29 | Qualcomm Incorporated | Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications |
CN118800248A (zh) * | 2023-04-13 | 2024-10-18 | 华为技术有限公司 | 场景音频解码方法及电子设备 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5594800A (en) * | 1991-02-15 | 1997-01-14 | Trifield Productions Limited | Sound reproduction system having a matrix converter |
GB9204485D0 (en) * | 1992-03-02 | 1992-04-15 | Trifield Productions Ltd | Surround sound apparatus |
US6798889B1 (en) * | 1999-11-12 | 2004-09-28 | Creative Technology Ltd. | Method and apparatus for multi-channel sound system calibration |
FR2847376B1 (fr) | 2002-11-19 | 2005-02-04 | France Telecom | Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede |
ATE433182T1 (de) * | 2005-07-14 | 2009-06-15 | Koninkl Philips Electronics Nv | Audiokodierung und audiodekodierung |
KR100619082B1 (ko) * | 2005-07-20 | 2006-09-05 | 삼성전자주식회사 | 와이드 모노 사운드 재생 방법 및 시스템 |
US8111830B2 (en) * | 2005-12-19 | 2012-02-07 | Samsung Electronics Co., Ltd. | Method and apparatus to provide active audio matrix decoding based on the positions of speakers and a listener |
KR20070099456A (ko) * | 2006-04-03 | 2007-10-09 | 엘지전자 주식회사 | 미디어 신호 처리 방법 및 장치 |
US8379868B2 (en) * | 2006-05-17 | 2013-02-19 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
JP5270557B2 (ja) | 2006-10-16 | 2013-08-21 | ドルビー・インターナショナル・アクチボラゲット | 多チャネルダウンミックスされたオブジェクト符号化における強化された符号化及びパラメータ表現 |
FR2916078A1 (fr) * | 2007-05-10 | 2008-11-14 | France Telecom | Procede de codage et decodage audio, codeur audio, decodeur audio et programmes d'ordinateur associes |
WO2009046223A2 (en) * | 2007-10-03 | 2009-04-09 | Creative Technology Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
WO2009128078A1 (en) * | 2008-04-17 | 2009-10-22 | Waves Audio Ltd. | Nonlinear filter for separation of center sounds in stereophonic audio |
EP2124351B1 (en) * | 2008-05-20 | 2010-12-15 | NTT DoCoMo, Inc. | A spatial sub-channel selection and pre-coding apparatus |
EP2175670A1 (en) * | 2008-10-07 | 2010-04-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Binaural rendering of a multi-channel audio signal |
EP2211563B1 (en) * | 2009-01-21 | 2011-08-24 | Siemens Medical Instruments Pte. Ltd. | Method and apparatus for blind source separation improving interference estimation in binaural Wiener filtering |
KR20110041062A (ko) * | 2009-10-15 | 2011-04-21 | 삼성전자주식회사 | 가상 스피커 장치 및 가상 스피커 처리 방법 |
KR101795015B1 (ko) * | 2010-03-26 | 2017-11-07 | 돌비 인터네셔널 에이비 | 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치 |
JP2011211312A (ja) * | 2010-03-29 | 2011-10-20 | Panasonic Corp | 音像定位処理装置及び音像定位処理方法 |
JP5652658B2 (ja) * | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US9271081B2 (en) * | 2010-08-27 | 2016-02-23 | Sonicemotion Ag | Method and device for enhanced sound field reproduction of spatially encoded audio input signals |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
EP2541547A1 (en) * | 2011-06-30 | 2013-01-02 | Thomson Licensing | Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation |
EP2592845A1 (en) * | 2011-11-11 | 2013-05-15 | Thomson Licensing | Method and Apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an Ambisonics representation of the sound field |
EP2645748A1 (en) * | 2012-03-28 | 2013-10-02 | Thomson Licensing | Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal |
US20150131824A1 (en) * | 2012-04-02 | 2015-05-14 | Sonicemotion Ag | Method for high quality efficient 3d sound reproduction |
KR102681514B1 (ko) | 2012-07-16 | 2024-07-05 | 돌비 인터네셔널 에이비 | 오디오 재생을 위한 오디오 음장 표현을 렌더링하는 방법 및 장치 |
CN102932730B (zh) * | 2012-11-08 | 2014-09-17 | 武汉大学 | 一种正四面体结构的扬声器组声场效果增强方法及系统 |
EP2866475A1 (en) * | 2013-10-23 | 2015-04-29 | Thomson Licensing | Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups |
-
2013
- 2013-10-23 EP EP20130290255 patent/EP2866475A1/en not_active Withdrawn
-
2014
- 2014-10-17 TW TW103135906A patent/TWI651973B/zh active
- 2014-10-17 TW TW109102609A patent/TWI797417B/zh active
- 2014-10-17 TW TW107141933A patent/TWI686794B/zh active
- 2014-10-17 TW TW112133717A patent/TWI841483B/zh active
- 2014-10-17 TW TW112107889A patent/TWI817909B/zh active
- 2014-10-20 CA CA3147196A patent/CA3147196C/en active Active
- 2014-10-20 RU RU2016119533A patent/RU2679230C2/ru active
- 2014-10-20 EP EP17180213.5A patent/EP3300391B1/en active Active
- 2014-10-20 EP EP20186663.9A patent/EP3742763B1/en active Active
- 2014-10-20 CA CA3168427A patent/CA3168427A1/en active Pending
- 2014-10-20 RU RU2019100542A patent/RU2766560C2/ru active
- 2014-10-20 CN CN201810453100.8A patent/CN108632737B/zh active Active
- 2014-10-20 BR BR112016009209-0A patent/BR112016009209B1/pt active IP Right Grant
- 2014-10-20 CA CA3147189A patent/CA3147189C/en active Active
- 2014-10-20 BR BR122017020302-9A patent/BR122017020302B1/pt active IP Right Grant
- 2014-10-20 US US15/030,066 patent/US9813834B2/en active Active
- 2014-10-20 CN CN201810453094.6A patent/CN108777836B/zh active Active
- 2014-10-20 CN CN201810453121.XA patent/CN108337624B/zh active Active
- 2014-10-20 MX MX2016005191A patent/MX359846B/es active IP Right Grant
- 2014-10-20 JP JP2016525578A patent/JP6463749B2/ja active Active
- 2014-10-20 ES ES14786876.4T patent/ES2637922T3/es active Active
- 2014-10-20 MY MYPI2019006201A patent/MY191340A/en unknown
- 2014-10-20 CN CN201810453106.5A patent/CN108777837B/zh active Active
- 2014-10-20 KR KR1020237001978A patent/KR102629324B1/ko active IP Right Grant
- 2014-10-20 CA CA2924700A patent/CA2924700C/en active Active
- 2014-10-20 KR KR1020167010383A patent/KR102235398B1/ko active IP Right Grant
- 2014-10-20 EP EP23160070.1A patent/EP4213508A1/en active Pending
- 2014-10-20 KR KR1020247002360A patent/KR20240017091A/ko active Application Filing
- 2014-10-20 CA CA3221605A patent/CA3221605A1/en active Pending
- 2014-10-20 KR KR1020217009256A patent/KR102491042B1/ko active IP Right Grant
- 2014-10-20 CN CN201810453098.4A patent/CN108632736B/zh active Active
- 2014-10-20 WO PCT/EP2014/072411 patent/WO2015059081A1/en active Application Filing
- 2014-10-20 EP EP14786876.4A patent/EP3061270B1/en active Active
- 2014-10-20 MY MYPI2016700638A patent/MY179460A/en unknown
- 2014-10-20 CN CN201480056122.0A patent/CN105637902B/zh active Active
- 2014-10-20 AU AU2014339080A patent/AU2014339080B2/en active Active
-
2016
- 2016-04-21 MX MX2018012489A patent/MX2018012489A/es unknown
- 2016-04-21 MX MX2022011448A patent/MX2022011448A/es unknown
- 2016-04-21 MX MX2022011449A patent/MX2022011449A/es unknown
- 2016-04-21 MX MX2022011447A patent/MX2022011447A/es unknown
- 2016-07-29 HK HK16109099.3A patent/HK1221105A1/zh unknown
- 2016-07-29 HK HK18116206.6A patent/HK1257203A1/zh unknown
- 2016-07-29 HK HK18114756.5A patent/HK1255621A1/zh unknown
-
2017
- 2017-09-28 US US15/718,471 patent/US10158959B2/en active Active
-
2018
- 2018-03-14 ZA ZA2018/01738A patent/ZA201801738B/en unknown
- 2018-09-26 HK HK18112339.5A patent/HK1252979A1/zh unknown
- 2018-11-13 US US16/189,732 patent/US10694308B2/en active Active
- 2018-11-23 AU AU2018267665A patent/AU2018267665B2/en active Active
-
2019
- 2019-01-04 JP JP2019000177A patent/JP6660493B2/ja active Active
- 2019-02-27 ZA ZA2019/01243A patent/ZA201901243B/en unknown
-
2020
- 2020-02-07 JP JP2020019638A patent/JP6950014B2/ja active Active
- 2020-06-16 US US16/903,238 patent/US10986455B2/en active Active
- 2020-08-14 ZA ZA2020/05036A patent/ZA202005036B/en unknown
-
2021
- 2021-02-12 AU AU2021200911A patent/AU2021200911B2/en active Active
- 2021-04-15 US US17/231,291 patent/US11451918B2/en active Active
- 2021-09-22 JP JP2021153984A patent/JP7254137B2/ja active Active
- 2021-09-28 ZA ZA2021/07269A patent/ZA202107269B/en unknown
-
2022
- 2022-08-23 US US17/893,753 patent/US11750996B2/en active Active
- 2022-08-23 US US17/893,729 patent/US11770667B2/en active Active
- 2022-09-27 ZA ZA2022/10670A patent/ZA202210670B/en unknown
- 2022-12-20 AU AU2022291444A patent/AU2022291444B2/en active Active
- 2022-12-20 AU AU2022291445A patent/AU2022291445A1/en active Pending
- 2022-12-20 AU AU2022291443A patent/AU2022291443A1/en active Pending
-
2023
- 2023-03-28 JP JP2023051470A patent/JP7529371B2/ja active Active
- 2023-08-28 US US18/457,030 patent/US20240056755A1/en active Pending
-
2024
- 2024-07-23 JP JP2024117375A patent/JP2024138553A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2637922T3 (es) | Método y dispositivo para decodificar una representación de campo sonoro de audio ambisónico para reproducir audio utilizando configuraciones 2D | |
ES2710774T3 (es) | Mezcla de matriz basada en multipletes para audio de múltiples canales de alta cantidad de canales | |
ES2649725T3 (es) | Aparato, procedimiento y programa informático para mapear primer y segundo canales de entrada con al menos un canal de salida | |
BR122020012403B1 (pt) | Método e aparelho para determinar uma matriz de decodificação para decodificar um sinal de áudio codificado, e meio de armazenamento legível por computador |