ES2754245T3 - Espacialización sonora con efecto de sala - Google Patents
Espacialización sonora con efecto de sala Download PDFInfo
- Publication number
- ES2754245T3 ES2754245T3 ES14748239T ES14748239T ES2754245T3 ES 2754245 T3 ES2754245 T3 ES 2754245T3 ES 14748239 T ES14748239 T ES 14748239T ES 14748239 T ES14748239 T ES 14748239T ES 2754245 T3 ES2754245 T3 ES 2754245T3
- Authority
- ES
- Spain
- Prior art keywords
- signals
- input
- transfer function
- signal
- output signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000000694 effects Effects 0.000 title description 10
- 230000006870 function Effects 0.000 claims abstract description 52
- 238000012546 transfer Methods 0.000 claims abstract description 51
- 230000004044 response Effects 0.000 claims abstract description 34
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000001914 filtration Methods 0.000 claims abstract description 14
- 238000000638 solvent extraction Methods 0.000 claims abstract description 8
- 230000005355 Hall effect Effects 0.000 claims abstract 9
- 230000005236 sound signal Effects 0.000 claims description 10
- 230000002123 temporal effect Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 2
- 238000005192 partition Methods 0.000 abstract 1
- 210000005069 ears Anatomy 0.000 description 10
- 238000011282 treatment Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000009877 rendering Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000004091 panning Methods 0.000 description 2
- 230000035807 sensation Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 101100071959 Bartonella bacilliformis (strain ATCC 35685 / NCTC 12138 / KC583) ialB gene Proteins 0.000 description 1
- 206010011878 Deafness Diseases 0.000 description 1
- 102000001690 Factor VIII Human genes 0.000 description 1
- 108010054218 Factor VIII Proteins 0.000 description 1
- 102000000429 Factor XII Human genes 0.000 description 1
- 108010080865 Factor XII Proteins 0.000 description 1
- 101100397045 Xenopus laevis invs-b gene Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 101150114988 invA gene Proteins 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 101150021607 rppH gene Proteins 0.000 description 1
- 101150082821 sacA gene Proteins 0.000 description 1
- 101150080136 sacC gene Proteins 0.000 description 1
- 101150094617 spaK gene Proteins 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000004584 weight gain Effects 0.000 description 1
- 235000019786 weight gain Nutrition 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
- 101150070603 yadA gene Proteins 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/305—Electronic adaptation of stereophonic audio signals to reverberation of the listening space
- H04S7/306—For headphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
- H04S1/005—For headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/13—Aspects of volume control, not necessarily automatic, in stereophonic sound systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Stereophonic System (AREA)
Abstract
Procedimiento de espacialización sonora en el que se aplica al menos un filtrado en al menos dos señales de entrada (I(1), I(2), ..., I(L)) para suministrar al menos dos señales de salida (O(1), O(2), ..., O(K)), incluyendo el filtrado: - ponderar (M4B1, M4B2, ..., M4BL) dichas al menos dos señales de entrada con pesos de ponderación (Wk(1), ..., Wk(L)) respectivos, siendo cada peso de ponderación específico para cada una de las señales de entrada; - para cada respuesta de impulso que incorpora un efecto de sala entre una pluralidad de respuestas de impulso que incorporan un efecto de sala, estando dicha respuesta de impulso que incorpora un efecto de sala respectivamente asociada a una señal de entrada entre dichas al menos dos señales de entrada (I(1), I(2), ..., I(L)) y a una señal de salida entre dichas al menos dos señales de salida (O(1), O(2), ..., O(K)): o particionar (S22), en un dominio temporal, dicha respuesta de impulso en una primera parte (A) y en una segunda parte (B), efectuándose dicho particionamiento de modo que: dicha primera parte representa unas propagaciones sonoras directas y unas primeras reflexiones sonoras de dichas propagaciones y se extiende por un primer número de muestras, y dicha segunda parte representa un campo sonoro difuso presente después de dichas primeras reflexiones y se extiende por un segundo número de muestras, siendo dicho segundo número de muestras un múltiplo de dicho primer número de muestras; o determinar una primera función de transferencia (Ak(1), Ak(2), ..., Ak(L)) a partir de dicha primera parte; o determinar una segunda función de transferencia a partir de dicha segunda parte; - para cada señal de salida (O(1), O(2), ... O(K)) entre dichas al menos dos señales de salida (O(1), O(2), ..., O(K)): o determinar (S23B1) una tercera función de transferencia (Bmediok) a partir de una media de dichas segundas funciones de transferencia correspondiente a la señal de salida (O(1), O(2), ..., O(K)); o aplicar (S4A1, S4A2, ..., S4AL) a cada señal de entrada (I(1), I(2), ..., I(L)) la primera función de transferencia (Ak(1), Ak(2), ..., Ak(L)) correspondiente a la señal de entrada (I(1), I(2), ..., I(L)) y a la señal de salida (O(1), O(2), ..., O(K)); o aplicar (S4B1) a cada señal de entrada la tercera función de transferencia (Bmediok) correspondiente a la señal de salida (O(1), O(2), ... O(K)); en donde la aplicación de las primeras y terceras funciones de transferencia se efectúa por bloques de FFT; - sumar las señales resultantes de dichas aplicaciones de las primeras y terceras funciones de transferencia para obtener dichas al menos dos señales de salida (O(1), O(2), ..., O(K))
Description
DESCRIPCIÓN
Espacialización sonora con efecto de sala
La invención se refiere al tratamiento de datos sonoros y, de manera más particular, a la espacialización (denominada “renderizado 3D”) de señales audio.
Una operación de este tipo se ejecuta, por ejemplo, durante la descodificación de una señal audio 3D codificada, representada en un número de canales determinado, hacia un número de canales diferentes, dos, por ejemplo, para permitir la restitución de los efectos 3D audio en un casco de auriculares.
La invención se refiere igualmente a la transmisión y a la restitución de señales audio multicanales y a su conversión hacia un dispositivo de restitución, transductor, impuesto por el equipo de un usuario. Este es, por ejemplo, el caso para la restitución de una escena sonora 5.1 mediante un casco de auriculares audio o mediante un par de altavoces.
La invención se refiere igualmente a la restitución, en el marco de un juego o grabación en video, por ejemplo, de una o varias muestras sonoras almacenadas en ficheros, con vistas a su espacialización.
En el caso de una fuente monofónica estática, la binauralización se basa en el filtrado de la señal monofónica por la función de transferencia entre la posición deseada de la fuente y cada uno de los dos oídos. La señal binaural (dos canales) obtenida puede alimentar entonces un casco audio y proporcionar al oyente la sensación de una fuente en la posición simulada. De este modo, el término “binaural” tiene por objeto la restitución de una señal sonora con efectos de espacialización.
Cada una de las funciones de transferencia que simulan diferentes posiciones pueden medirse en cámara sorda, lo que resulta de este modo en un conjunto de HRTF (por sus siglas de “Head Related Transfer Functions” o “Funciones de transferencias relativas a la cabeza”) en las que ningún efecto de sala está presente.
Estas funciones de transferencia pueden medirse igualmente en una sala “clásica”, lo que resulta de este modo en un conjunto de BRIR ( por sus siglas de “Binaural Room Impulse Response” o “Respuesta de impulso binaural de sala”) en las que el efecto de sala, o reverberación, está presente. El conjunto de las BRIR corresponde por tanto a un conjunto de funciones de transferencia entre una posición dada y los oídos de un oyente (real o cabeza artificial) situado en una sala.
La técnica habitual de medición de BRIR consiste en enviar sucesivamente a cada uno de los altavoces reales, posicionados alrededor de una cabeza (real o artificial) equipada con micrófonos en los oídos, una señal de prueba (por ejemplo, una señal de barrido "sweep", una secuencia binaria pseudo-aleatoria o un ruido blanco). Esta señal de prueba permite, durante un tratamiento fuera de tiempo real, la reconstitución (generalmente por deconvolución) de la respuesta de impulso entre la posición del altavoz y cada uno de los dos oídos.
La diferencia entre un conjunto de HRTF y de BRIR se sitúa principalmente en la longitud de la respuesta de impulso, del orden del milisegundo para las HRTF, al orden del segundo para las BRIR.
Al basarse el filtrado en la convolución entre la señal monofónica y la respuesta de impulso, la complejidad para efectuar una binauralización con las BRIR (que contiene un efecto de sala) es significativamente más elevada que con las HRTF.
Mediante esta técnica, es posible simular en el casco o en un número limitado de altavoces una escucha de un contenido multicanal (L canales) generado por L altavoces en una sala. En efecto, basta con considerar cada uno de los altavoces L como una fuente virtual posicionada idóneamente con respecto al oyente, medir en la sala a simular las funciones de transferencia (para los oídos izquierdo y derecho) de cada uno de estos L altavoces, después aplicar a cada una de las L señales audio (que supuestamente alimentan los L altavoces reales) los filtros BRIR correspondientes a los altavoces. Las señales que alimentan cada uno de los oídos se suman para proporcionar una señal binaural que alimenta un casco audio.
Se denomina l(1) (siendo 1=[l, L] a la señal de entrada que supuestamente alimenta los L altavoces. Se denomina BRIRi/d(1), a las BRIR de cada uno de los altavoces para cada uno de los dos oídos y se denomina Oi/d a la señal binaural de salida. La binauralización de la señal multicanal se escribe por tanto:
Oi= Z [=1/( í) * BRIR(l)
Od= Z f=1/( í) * BRIRd(l)
Dónde * representa al operador de convolución.
A continuación, el índice 1 como l e [1, L] hace referencia a uno de los L altavoces. Se tiene una BRIR para una señal
De este modo, con referencia a la figura 1, dos convoluciones (una para cada oído) están presentes para cada altavoz (etapas S11 a S1L).
Para L altavoces, la binauralización necesita por tanto 2.L convoluciones. Se puede calcular la complejidad Cconv en el caso de una implementación rápida por bloque. Una implementación rápida por bloque se da, por ejemplo, mediante una transformada de Fourier rápida (FFT de “Fast Fourier Transform”). El documento “Submission and Evaluation Procedures for 3D Audio” (MPEG 3D Audio) precisa una formula posible para el cálculo de Cconv:
Cconv = (L 2). (nBloques). (6.log2 (2Fs/nBloques))
En esta ecuación, L representa el número de FFT para transformar en frecuencia las señales de entrada (1FFT por señal de entrada), el 2 representa el número de FFT inversa para obtener la señal binaural temporal (2 FFT inversa para los dos canales del binaural), el 6 indica un coeficiente de complejidad por FFT, el segundo 2 indica un relleno de ceros necesario para evitar los problemas debidos a la convolución circular, Fs indica el tamaño de cada una de las BRIR, y nBloques representa el hecho de usar un tratamiento por bloque, más realista en una perspectiva en la que la latencia no debe ser excesivamente elevada, y . representa la multiplicación.
De este modo, para un uso típico con nBloques=10, Fs=48000, L=22, la complejidad por muestra de señal multicanal para una convolución directa basada en una FFT es de Cconv = 19049 multiplicaciones-adiciones.
Esta complejidad es demasiada elevada para una implementación realista hoy en día en procesadores corrientes (móviles por ejemplo), por lo tanto es necesario disminuir esta complejidad sin degradar demasiado el renderizado de la binauralización.
Para que la espacialización sea de buena calidad, se debe aplicar la totalidad de la señal temporal de las BRIR.
El documento US 2006/045294 A1 divulga un sistema de espacialización sonora de señales multicanales para suministrar al menos dos canales de salida, y que incluye el particionamiento de las respuestas de impulso en dos partes, conteniendo la primera la llegada directa y las primeras reflexiones, y conteniendo la segunda la reverberación, sumándose y ponderándose las segundas partes de al menos dos respuestas de impulso para obtener una función de transferencia única que representa la reverberación que hay que aplicar a las señales de entrada, con el fin de reducir la complejidad de las operaciones de convolución. El documento US 2006/045294 A1 también divulga un filtrado por bloques de FFT.
El documento STEWARD REBECCA ET AL: “Generating a Spatial Average Reverberation Tail Across Multiple Impulse Responses”, CONFERENCE: 35TH INTERNATIONAL CONFERENCE: AUDIO FOR GAMES; FEBRUARY 2009, AES, NEW YORK, EE. UU., del 1 de febrero de 2009 (2009-02-01) divulga un particionamiento similar de respuestas de impulso, así como la promediación de las partes de respuestas de impulso que representan la reverberación, para reducir la redundancia en las bases de datos de respuestas de impulso.
El documento GARDNER W G: “EFFICIENT CONVOLUTION WITHOUT INPUT-OUTPUT DELAY”, JOURNAL OF THE AUDIO ENGINEERING SOCIETY, AUDIO ENGINEERING SOCIETY, NEW YORK, NY, EE. UU., VOL. 43, N.° 3, del 1 de marzo de 1995 (1995-03-01), páginas 127-135 describe una implementación eficaz para la convolución de respuestas de impulso, en concreto en el contexto de las simulaciones de reverberación, en forma de bloques FFT. Este artículo sugiere reutilizar las transformadas de las señales de entrada lo antes posible, para reducir los costes de cálculo, y muestra que un particionamiento de una respuesta de impulso en sub-bloques, cuya longitud es múltiplo los unos de los otros, permite reducir la complejidad de cálculo.
La presente invención viene a mejorar la situación.
Tiene por objeto disminuir en gran medida la complejidad de la binauralización de una señal multicanal con efecto de sala mientras se conserva lo mejor posible la calidad audio.
La presente invención propone para tal efecto un procedimiento de espacialización sonora como el que se define en las reivindicaciones 1 a 10.
La invención tiene también por objeto un programa informático que incluye unas instrucciones para la implementación del procedimiento.
La invención puede implementarse mediante un dispositivo de espacialización sonora como el que se define en la reivindicación 12.
La invención puede implementarse igualmente en un módulo de descodificación de señales sonoras, como señales de entrada, que incluye el dispositivo de espacialización anterior.
Otras ventajas y características de la invención se pondrán de manifiesto tras la lectura de la descripción detallada a continuación, de unos ejemplos de realización de la invención y del examen de los dibujos en los que:
- la figura 1 ilustra un procedimiento de espacialización de la técnica anterior,
- la figura 2 ilustra esquemáticamente las etapas de un procedimiento en el sentido de la invención, en un ejemplo de realización,
- la figura 3 representa una respuesta de impulso binaural de sala BRIR,
- la figura 4 ilustra esquemáticamente las etapas de un procedimiento en el sentido de la invención, en un ejemplo de realización,
- la figura 5 ilustra esquemáticamente las etapas de un procedimiento en el sentido de la invención, en un ejemplo de realización,
- la figura 6 representa esquemáticamente un dispositivo que incluye unos medios de implementación del procedimiento en el sentido de la invención.
Se hace referencia a la figura 6 para ilustrar en primer lugar un posible contexto de implementación de la presente invención en un dispositivo de tipo terminal conectado TER (por ejemplo, un teléfono, smartphone u otro, o incluso una tableta conectada, un ordenador conectado u otros). Un dispositivo de este tipo TER incluye unos medios de recepción (normalmente, una antena) de señales audio Xc codificadas en compresión, un dispositivo de descodificación DESCOD que suministra señales descodificadas X listas para ser tratadas por un dispositivo de espacialización antes de la restitución de las señales audio (por ejemplo, en binaural en un casco con auriculares CAS). Por supuesto, en ciertos casos, puede ser ventajoso guardar las señales parcialmente descodificadas (por ejemplo, en el ámbito de las sub-bandas) si el tratamiento de espacialización se efectúa en el mismo ámbito (tratamiento frecuencial en el ámbito de las sub-bandas, por ejemplo).
También con referencia a la figura 6, el dispositivo de espacialización se presenta con una combinación de elementos: - hardware que normalmente incluye uno o varios circuitos CIR que cooperan con una memoria de trabajo MEM y un procesador PROC,
- y software, respecto al cual, las figuras 2 y 4 son unos ejemplos de organigramas que ilustran el algoritmo general.
En este caso, la cooperación entre los elementos de hardware y software produce un efecto técnico que conlleva, en concreto, un ahorro de complejidad de espacialización para sustancialmente un mismo renderizado audio (misma sensación para un oyente), como se verá más adelante.
Se hace referencia ahora a la figura 2 para describir un tratamiento en el sentido de la invención, implementado de este modo mediante unos medios informáticos.
En una primera etapa S21, se efectúa una preparación de los datos. Esta preparación es opcional, las señales pueden tratarse según las etapas S22 y siguientes sin este pretratamiento.
En particular, esta preparación consiste en efectuar un truncamiento de cada BRIR para ignorar las muestras inaudibles al inicio y al final de la respuesta de impulso.
Esta preparación, para el truncamiento al inicio de la respuesta de impulso TRUNCADO S, en la etapa S211, consiste en determinar un instante de inicio de ondas sonoras directas y puede implementarse mediante las siguientes etapas: - Se calcula una suma acumulada de las energías de cada uno de los filtros BRIR(1). Normalmente, esta energía se calcula mediante una suma al cuadrado de las amplitudes de las muestras 1 a j, estando j comprendida en [1 ; J] siendo J el número de muestras de un filtro BRIR.
- Se calcula el valor de energía del filtro de energía máximo valMáx (entre los filtros relativos al oído izquierdo y al oído derecho).
- Para cada uno de los altavoces 1, se calcula el índice para el que la energía de cada uno de los filtros BRIR (1) supera un determinado umbral en dB calculado con respecto a valMáx (por ejemplo, valMáx-50dB).
- El índice de truncamiento iT seleccionado para todas las BRIR es el índice mínimo de entre todos los índices de las BRIR y se considera como el instante de inicio de las ondas sonoras directas.
El índice iT obtenido corresponde por tanto al número de muestras que hay que ignorar para cada una de las BRIR. Un truncamiento brutal al inicio de la respuesta de impulso con una ventana rectangular puede llevar a artefactos
audibles si se aplica en una parte demasiada energética. Por lo tanto, puede ser preferible aplicar una ventana de fundido de entrada adaptada, sin embargo, si se han tomado unas precauciones en el umbral seleccionado, esta ventana es inútil por ser inaudible (solo se corta señal inaudible).
El sincronismo entre BRIR permite la aplicación de un plazo constante para todas las BRIR en aras de una mayor simplicidad de implementación, incluso si una optimización de la complejidad es posible.
El truncamiento de cada BRIR para ignorar las muestras inaudibles al final de la respuesta de impulso TRUNCADO E, en la etapa S212, puede realizarse a partir de etapas similares a las que se han descrito anteriormente, adaptadas para convenir al final de la respuesta de impulso. Un truncamiento brutal al final de la respuesta de impulso con una ventana rectangular puede llevar a artefactos audibles en señales de impulso en las que la cola de reverberación puede revelarse audible. De este modo, en un modo de realización, se aplica una ventana de fundido de salida adaptada.
En la etapa 22, se efectúa un aislamiento sincronizado AISL A/B. Este aislamiento sincronizado consiste en separar, para cada BRIR, la parte de “sonido directo” y “primeras reflexiones” (o Directo, denotado A) y de la parte de “sonido difuso”, denotado B). En efecto, el tratamiento que hay que efectuar en la parte de “sonido difuso” puede ser ventajosamente diferente del que hay que efectuar en la parte de “sonido directo”, en la medida en que es preferible tener una mejor calidad de tratamiento en la parte de “sonido directo” que en la parte de “sonido difuso”. Esto hace posible una optimización de la relación calidad/complejidad.
En particular, para realizar el aislamiento sincronizado, se determina un índice “ iDD” de muestra única y común para todas las BRIR (de ahí el término “sincronizado”) a partir del cual se considera que el resto de la respuesta de impulso corresponde a un campo difuso. Se particionan por tanto las respuestas de impulso BRIR(1) en dos: A(1) y B1l), en las que la concatenación de las dos corresponde a BRIR(1).
La figura 3 muestra el índice de particionamiento iDD en la muestra 2000. La parte a la izquierda de este índice iDD corresponde a la parte A. La parte a la derecha de este índice iDD corresponde a la parte B.
En un modo de realización, estas dos partes están aisladas, sin ventana, con el fin de someterse a tratamientos diferentes. En una variante, se aplica una ventana entre las partes A(1) y B(1).
El índice iDD puede ser específico de la sala para la que se han determinado las BRIR. El cálculo de este índice puede depender por tanto de la envolvente espectral, de la correlación de las BRIR o incluso del ecograma de estas BRIR. Por ejemplo, se puede determinar el iDD con una fórmula de tipo iDD = Vísala siendo Vsala el volumen de la sala de medición.
En un modo de realización, iDD es un valor fijo, normalmente 2000. En una variante, iDD varía, ventajosamente de manera dinámica, en función del entorno a partir del cual se capturan las señales de entrada.
La señal de salida para los oídos izquierdo (i) y derecho (d), representada por Oi/d, se escribe, por tanto:
donde z-iDD corresponde al plazo de iDD muestras.
La aplicación de este plazo a las señales se efectúa almacenando los valores calculados para en una memoria temporal (por ejemplo, en un búfer) y restituyéndolos en el momento deseado.
En un modo de realización, los índices de muestras seleccionados para A y B pueden tomar en cuenta igualmente las longitudes de tramas en el caso de integración en un codificador audio. En efecto, los tamaños típicos de tramas de 1024 muestras pueden llevar a una selección tal que A haga 1024 y B haga 2048, asegurándose de que B sea en efecto una zona de campo difuso para todas las BRIR.
En particular, puede ser interesante que el tamaño de B sea un múltiplo del tamaño de A porque si el filtrado se implementa por bloques de FFT, entonces el cálculo de una FFT puede reutilizarse para B.
Un campo difuso se caracteriza por el hecho de que es estadísticamente idéntico en todos los puntos de la sala. De este modo, su respuesta en frecuencia varía poco en función del altavoz que hay que simular. La presente invención aprovecha esta característica con el fin de sustituir todos los filtros Difusos D(l) de todas las BRIR por un solo y único filtro “medio” Bmedio con el fin de disminuir en gran medida la complejidad debida a las múltiples convoluciones. Para ello, se puede modificar la parte de campo difuso B en la etapa s 23B, siempre con referencia a la figura 2.
En la etapa S23B1, se calcula el valor del filtro medio Bmedio. Primero, es extremadamente poco frecuente que el sistema completo esté calibrado idóneamente, se puede aplicar por tanto una ganancia de ponderación que se aplicará en la señal de entrada con el fin de efectuar una única convolución por oído para la parte de campo difuso. Se descomponen por tanto las BRIR en filtros normalizados en energía, y se aplica la ganancia de normalización ^Egt/d([) en la señal de entrada:
siendo Bnormi/d(l) = -= j - donde Egi/d(l) representa la energía de Bl/d(l).
A continuación, se aproxima Bnorm¡/d(¡) mediante un solo y único filtro medio Bmedlot/d que ya no es función del altavoz 1, pero que es posible normalizar igualmente en energía:
0)/d » Ój/d = Z í= i[( J E ^ , . / ( í)) * ( , ^ ¡°í/d )]
J Bmedioi/d
siendo Bmedio‘/* = zZÍ=l[Bnorml/*(l)]
En un modo de realización, este filtro medio puede obtenerse promediando las muestras temporales. En una variante, se puede obtener mediante cualquier tipo de promediación como, por ejemplo, una promediación de las densidades espectrales de potencia.
En un modo de realización, la energía del filtro medio Egmedio1/ puede medirse directamente a partir del filtro construido “
Bmedi0i/d . En una variante, se puede estimar igualmente tomando en cuenta la hipótesis de que los filtros Bnormi/d (l) están descorrelacionados. En efecto, en ese caso, como se suman señales de energía unitaria, se tiene:
La energía puede calcularse sobre el conjunto de las muestras correspondientes a la parte de campo difuso.
En la etapa S23B2, se calcula el valor del factor de ponderación W/d(l). Se calcula un único factor de ponderación que hay que aplicar a la señal de entrada, tomando en cuenta las normalizaciones de los filtros Difusos y del filtro medio:
JEBi
/
dm
Al ser el filtro medio constante, puede salir de la suma:
De este modo, las L convoluciones con la parte de campo difuso se sustituyen por una sola convolución con un filtro medio, por medio de una suma ponderada de la señal de entrada.
En la etapa S23B3, se puede calcular opcionalmente una ganancia G que corrige la ganancia del filtro medio Bmedioi/d. En efecto, en el caso de convolución entre las señales de entrada y los filtros no aproximados, sean cuales sean los valores de correlación entre las señales de entrada, el filtrado por filtros descorrelacionados que son los Bi/d(í) lleva a señales que hay que sumar que entonces están a su vez también descorrelacionadas. A la inversa, en el caso de convolución entre las señales de entrada y el filtro medio aproximado, la energía de la señal procedente de la suma de las señales filtradas va a depender del valor de correlación que existe entre las señales de entrada.
Por ejemplo,
* Si todas las señales de entrada I(1) son idénticas y de energía unitaria, y los filtros B(l) están todos descorrelacionados (ya que se trata de campo difuso) y de energía unitaria, se tiene:
E0w = energía (£f=1[l(Q * Bnormí/d (í)]) = L
* si todas las señales de entrada I(1) están descorrelacionadas y son de energía unitaria, y los filtros B(l) son todos de energía unitaria pero sustituidos por filtros idénticos Bmedioí/^ se tiene:
Ieb.
medio^/d
Edm = energía (£ f=1[/(Q * ( )])
■J Bmedioi/d
= energía ( , 1 . Z [=1[/(í) *^mediol/d ]) ( ' ) . (L^ L
J medio^
/
d J medio^
/
d
Porque se añaden las energías de las señales descorrelacionadas.
Este caso es equivalente al anterior en el sentido en que las señales procedentes del filtrado están todas descorrelacionadas, gracias a las señales de entrada en el primer caso, y gracias a los filtros en el segundo caso. * si todas las señales de entrada I(1) son idénticas y de energía unitaria, y los filtros B(l) son todos de energía unitaria, pero sustituidos por filtros idénticos Bmeit°l/d , se tiene:
J Bmedio^
/
d
Ed
/
Ó í B d = energía
= energía ( , 1 . Z f=1[/(í)
Porque las energías de las señales idénticas se añaden en cuadratura (porque sus amplitudes se añaden).
De este modo,
- si dos altavoces son activos simultáneamente, alimentados por señales descorrelacionadas, entonces no se aporta ninguna ganancia aplicando las etapas S23B1 y S23B2 con respecto al método clásico.
- si tres altavoces son activos simultáneamente, alimentados por señales idénticas, entonces se aporta una ganancia de 10./og10(L2/L)=10./og10(22/2) = 3,01 dB aplicando las etapas S23B1 y S23B2 con respecto al método clásico. - si tres altavoces son activos simultáneamente, alimentados por señales idénticas, entonces se aporta una ganancia de 10./og10(L2/L)=10./og10(32/3) = 4,77 dB aplicando las etapas S23B1 y S23B2 con respecto al método clásico. Los casos evocados anteriormente corresponden a casos extremos de señales idénticas o descorrelacionadas. Estos casos son sin embargo realistas: una fuente posicionada en el medio de dos altavoces, virtuales o reales, proporcionará una señal idéntica a estos dos altavoces (por ejemplo, con una técnica de tipo VBAP, por sus siglas de “Vector base amplitude panning”, en español, amplitud de panoramización de base de vector). En el caso de un posicionamiento en un sistema 3D, los 3 altavoces pueden recibir la misma señal al mismo nivel.
De este modo, se puede aplicar una compensación con el fin de respetar la energía de las señales binauralizadas. Idóneamente, esta ganancia de compensación G se determinará en función de la señal de entrada (es decir G(I(1))) y se aplicará a la suma de las señales de entrada ponderadas:
Ó f = G. E f=1[ ( - ^ • 1(1)] * E m e d l o i/d
La ganancia G (/(í)) puede estimarse mediante un cálculo de correlación entre cada una de las señales. Puede estimarse igualmente comparando las energías de las señales antes y después de las sumas. En ese caso, la ganancia G puede variar dinámicamente a lo largo del tiempo, por ejemplo, en función de las correlaciones entre las señales de entrada, que varían ellas mismas a lo largo del tiempo.
En un modo de realización simplificado, es posible establecer una ganancia constante, por ejemplo G = -3db = 10'3/2°, lo que evitará tener que efectuar una estimación de correlación que puede ser costosa. La ganancia constante G puede aplicarse entonces fuera de línea a los factores de ponderación (obteniéndose así ^ ¡/lt ), o al filtro Bmedoi/d, lo que evitará la aplicación de una ganancia suplementaria al vuelo.
Una vez calculadas las funciones de transferencia A y B aisladas y los filtros BmedO/d (opcionalmente los pesos W/d(l) y G), se aplican estas funciones de transferencia y estos filtros a las señales de entrada.
En un primer modo de realización, descrito con referencia a la figura 4, el tratamiento de la señal multicanal mediante la aplicación de los filtros Directo (A) y Difuso (B) para cada uno de los oídos se efectúa de la siguiente manera: - Se aplica (etapas S4A1 a S4AL) a la señal multicanal de entrada un filtrado eficaz (por ejemplo, convolución directa basada-FFT) mediante los filtros Directo (A), como se describe en el estado de la técnica. Se obtiene una señal o f
- En función de las relaciones entre las señales de entrada, concretamente, en función de su correlación, se puede corregir opcionalmente en la etapa S4B11 la ganancia del filtro medio Bmedioi/d mediante la aplicación de la ganancia G a las señales de salida después de la suma de las señales de entrada previamente ponderadas (etapas M4B1 a M4BL).
- Se aplica a la señal multicanal B en la etapa S4B1 un filtrado eficaz mediante el filtro Difuso medio Bmedio. Esta etapa tiene lugar, en efecto, después de la suma de las señales de entrada previamente ponderadas (etapas M4B1 a M4BL). Se obtiene la señal Ógd.
- Se aplica a la señal Óg dun plazo iDD con el fin de compensar el retraso introducido durante la etapa de aislamiento de la señal B en la etapa S4B2.
- Se suman las señales Ó^ /d y Ógd.
- Si se ha realizado un truncamiento que elimina las muestras inaudibles en el inicio de las respuestas de impulso, entonces, en la etapa S41 se aplica a la señal de entrada un plazo iT correspondiente a las muestras inaudibles suprimidas.
En una variante, con referencia a la figura 5, las señales no solo se calculan para los oídos izquierdo y derecho (índices i y d, en lo sucesivo) sino para k dispositivos de restitución (normalmente altavoces).
En un segundo modo de realización, se aplica la ganancia G antes de la suma de las señales de entrada, es decir durante las etapas de ponderación (etapas M4B1 a M4BL).
En un tercer modo de realización, se aplica una descorrelación a las señales de entrada. De este modo, las señales están descorrelacionadas después de la convolución mediante el filtro Bmedio sean cuales sean las correlaciones de origen entre señales de entrada. Se puede usar una implementación eficaz de descorrelación (por ejemplo, usando una red de retrasos en bucle) con el fin de evitar el uso de filtros de descorrelación costosos.
De este modo, al suponer de manera realista que unas BRIR con una longitud de 48000 muestras pueden estar: - truncadas entre la muestra 150 y la muestra 3222 mediante la técnica descrita en la etapa S21,
- descompuestas en dos partes: campo directo A de 1024 muestras, y campo difuso B de 2048 muestras, mediante la técnica descrita en la etapa S22,
entonces, la complejidad de binauralización puede venir dada aproximadamente por:
Cinv = CinvA + CinvB = (L+2).(6.log2(2.NA)) (L+2).(6.log2(2.NB))
Siendo NA y NB los tamaños en muestras de A y B
De este modo, para nBloques=10, Fs=48000, L=22, NA=1024 y NB=2048, la complejidad por muestra de señal multicanal para una convolución basada-FFT es de Cconv = 3312 multiplicaciones-adiciones. Este resultado, sin embargo, ha de compararse lógicamente con una solución simple que implementa solo el truncamiento, es decir para nBloques=10, Fs=3072, L=22:
Ctruncado = (L+2).(nBloques).(6.log2(2.Fs/nBloques)) = 13339
Existe por tanto un factor 19049/3312 = 5,75 de complejidad entre el estado de la técnica y la presente invención, e incluso un factor 13339/3312=4 de complejidad entre el estado de la técnica que se beneficia del truncamiento y la presente invención.
Si el tamaño de B es un múltiplo del tamaño de A, entonces si el filtrado se implementa por bloques de FFT, el cálculo de una FFT para A puede reutilizarse para B. Se necesita por tanto L FFT sobre NA puntos, que servirán a la vez para
el filtrado por A y por B, dos FFT inversas sobre NA puntos para obtener la señal binaural temporal, y la multiplicación de los espectros de frecuencia.
En este caso, se puede aproximar la complejidad (se ignoran las adiciones, (L+1) corresponde a la multiplicación de los espectros, L para A y 1 para B) por :
Cinv2 = (L+2).(6.log2(2.NA)) (L+1) = 1607
Con este enfoque, se gana también un factor 2, y por tanto un factor 12 y 8 con respecto al estado de la técnica no truncada y truncada.
La invención puede encontrar una aplicación directa en la norma MPEG-H 3D Audio.
Por supuesto, la presente invención no se limita a la forma de realización descrita anteriormente; se extiende a otras variantes quedando al mismo tiempo dentro del alcance de la protección definida en las reivindicaciones adjuntas. De este modo, anteriormente se ha descrito, por ejemplo, un modo de realización en el que la señal Directa A no está aproximada por un filtro medio. Por supuesto, se puede usar un filtro medio de A para hacer las convoluciones (etapas S4A1 a S4AL) con las señales procedentes de los altavoces.
Se ha descrito anteriormente un modo de realización basado en el tratamiento de un contenido multicanal generado para L altavoces. Por supuesto, el contenido multicanal puede ser generado por cualquier tipo de fuente audio como, por ejemplo, la voz, un instrumento de música, cualquier ruido, etc.
Se ha descrito anteriormente un modo de realización basado en valores de BRIR determinadas en una sala. Por supuesto, se puede implementar la presente invención para cualquier tipo de entorno exterior (por ejemplo, una sala de concierto, al air libre, etc.).
Se ha descrito anteriormente un modo de realización basado en la aplicación de dos funciones de transferencia. Por supuesto, se puede implementar la presente invención con más de dos funciones de transferencia. Por ejemplo, se puede aislar de manera sincronizada una parte relativa a los sonidos emitidos directamente, una parte relativa a las primeras reflexiones y una parte relativa a los sonidos difusos.
Claims (13)
1. Procedimiento de espacialización sonora en el que se aplica al menos un filtrado en al menos dos señales de entrada (I(1), I(2), ..., I(L)) para suministrar al menos dos señales de salida (O(1), O(2), ..., O(K)), incluyendo el filtrado:
- ponderar (M4B1, M4B2, ..., M4BL) dichas al menos dos señales de entrada con pesos de ponderación (Wk(1), ..., W k(L)) respectivos, siendo cada peso de ponderación específico para cada una de las señales de entrada; - para cada respuesta de impulso que incorpora un efecto de sala entre una pluralidad de respuestas de impulso que incorporan un efecto de sala, estando dicha respuesta de impulso que incorpora un efecto de sala respectivamente asociada a una señal de entrada entre dichas al menos dos señales de entrada (I(1), I(2), ..., I(L)) y a una señal de salida entre dichas al menos dos señales de salida (O(1), O(2), ..., O(K)):
o particionar (S22), en un dominio temporal, dicha respuesta de impulso en una primera parte (A) y en una segunda parte (B), efectuándose dicho particionamiento de modo que:
dicha primera parte representa unas propagaciones sonoras directas y unas primeras reflexiones sonoras de dichas propagaciones y se extiende por un primer número de muestras, y
dicha segunda parte representa un campo sonoro difuso presente después de dichas primeras reflexiones y se extiende por un segundo número de muestras, siendo dicho segundo número de muestras un múltiplo de dicho primer número de muestras;
o determinar una primera función de transferencia (Ak(1), Ak(2), . , A k(L)) a partir de dicha primera parte; o determinar una segunda función de transferencia a partir de dicha segunda parte;
- para cada señal de salida (O(1), O(2), ... O(K)) entre dichas al menos dos señales de salida (O(1), O(2), ..., O(K)):
o determinar (S23B1) una tercera función de transferencia (Bmediok) a partir de una media de dichas segundas funciones de transferencia correspondiente a la señal de salida (O(l), O(2), ..., O(K));
o aplicar (S4A1, S4A2, . , S4AL) a cada señal de entrada (I(1), I(2), . , I(L)) la primera función de transferencia (Ak(1), Ak(2), ..., A k(L)) correspondiente a la señal de entrada (I(1), I(2), ..., I(L)) y a la señal de salida (O(1), O(2), . , O(K));
o aplicar (S4B1) a cada señal de entrada la tercera función de transferencia (Bmediok) correspondiente a la señal de salida (O(1), O(2), ... O(K));
en donde la aplicación de las primeras y terceras funciones de transferencia se efectúa por bloques de FFT;
- sumar las señales resultantes de dichas aplicaciones de las primeras y terceras funciones de transferencia para obtener dichas al menos dos señales de salida (O(1), O(2), . , O(K)).
2. Procedimiento según la reivindicación 1, caracterizado por que una ganancia de compensación de energía (G) se aplica (S4B11) a los pesos de ponderación (Wk(1), ..., Wk(L)).
3. Procedimiento según una de las reivindicaciones anteriores, caracterizado por que dicho particionamiento de dicha respuesta de impulso incluye las operaciones:
- de determinación (S211) de un instante de inicio de presencia de ondas sonoras directas,
- de determinación de un instante de inicio de presencia de dicho campo sonoro difuso después de las primeras reflexiones, y
- de selección (S22), en dicha respuesta de impulso, de una parte de la respuesta que se extiende temporalmente entre dicho instante de inicio de presencia de ondas sonoras directas hasta dicho instante de inicio de presencia de campo difuso, correspondiendo dicha parte de respuesta seleccionada a dicha primera función de transferencia.
4. Procedimiento según la reivindicación 3, caracterizado por que dicho filtrado incluye la aplicación de al menos un plazo de compensación (S3B2) correspondiente a una diferencia temporal entre dicho instante de inicio de ondas sonoras directas y dicho instante de inicio de presencia de campo difuso.
5. Procedimiento según la reivindicación 4, caracterizado por que dichas primera y tercera funciones de transferencia se aplican en paralelo a dichas señales de entrada y por que dicho al menos un plazo de compensación se aplica a las señales de entrada filtradas por dichas terceras funciones de transferencia.
6. Procedimiento según una de las reivindicaciones anteriores, en el que dicha tercera función de transferencia viene dada por:
siendo:
k un índice relativo a una señal de salida,
l e [1;L] un índice relativo a una señal de entrada entre dichas señales de entrada,
L un número de señales de entrada,
Bnormk (l) es una función de transferencia normalizada obtenida a partir de una segunda función de transferencia entre dichas segundas funciones de transferencia.
7. Procedimiento según la reivindicación 6, caracterizado por que al menos una señal de salida Ok de dicho procedimiento viene dada por:
Ok = £ f=1( /(0 * A* (l)) + z - iDD . z í=1( ^ . i(l)) * B^edl0
siendo:
1(1) una señal de entrada entre dichas señales de entrada,
Ak (l) una primera función de transferencia entre dichas primeras funciones de transferencia,
Wk(í) un peso de ponderación entre dichos pesos de ponderación,
z-iDD corresponde a la aplicación de dicho plazo de compensación,
donde . es la multiplicación, y
donde * es el operador de convolución.
8. Procedimiento según la reivindicación 6, caracterizado por que comprende una etapa de descorrelación de las señales de entrada, previamente a la aplicación de las terceras funciones de transferencia y por que al menos una señal de salida Ok de dicho procedimiento viene dada por:
Ok = £ f=1( /(0 * A* (l)) + z - iDD . Z í=1( - ^ . ld(l) * Bínedl0
siendo:
1(1) una señal de entrada entre dichas señales de entrada,
Id(l) una señal de entrada entre dichas señales de entrada que se han sometido a dicha etapa de descorrelación, Ak (l) una primera función de transferencia entre dichas primeras funciones de transferencia,
Wk(í) un peso de ponderación entre dichos pesos de ponderación,
z-iDD corresponde a la aplicación de dicho plazo de compensación,
donde . es la multiplicación, y
donde * es el operador de convolución.
9. Procedimiento según la reivindicación 6, caracterizado por que comprende una etapa de determinación de una ganancia de compensación de energía en función de las señales de entrada y por que al menos una señal de salida viene dada por:
siendo:
1(1) una señal de entrada entre dichas señales de entrada,
G(l(1)) dicha ganancia de compensación de energía determinada,
Ak (l) una primera función de transferencia entre dichas primeras funciones de transferencia,
Wk(í) un peso de ponderación entre dichos pesos de ponderación,
z-iDD corresponde a la aplicación de dicho plazo de compensación,
donde . es la multiplicación, y
donde * es el operador de convolución.
10. Procedimiento según una de las reivindicaciones 6 a 9, caracterizado por que dicho peso viene dado por:
siendo k el índice relativo a una señal de salida,
l e [1; L] el índice relativo a una señal de entrada entre dichas señales de entrada,
L el número de señales de entrada,
siendo EB medi o .K una energía relativa a B k dl0,
EBk(r¡ una energía relativa a una segunda función de transferencia entre las segundas funciones de transferencia.
11. Programa informático que incluye unas instrucciones para la implementación del procedimiento según una de las reivindicaciones 1 a 10, cuando estas instrucciones son ejecutadas por un procesador.
12. Dispositivo de espacialización sonora, que incluye al menos un filtro aplicado en al menos dos señales de entrada (I(1), I(2), ..., I(L)), siendo el dispositivo apto para suministrar al menos dos señales de salida (O(1), O(2), ..., O(K)), comprendiendo el dispositivo unos módulos de ponderación (M4B1, M4B2, ..., M4BL) para ponderar dichas al menos dos señales de entrada con unos pesos de ponderación (Wk(1), ..., (Wk(L)) respectivos, siendo cada peso de ponderación específico para cada una de las señales de entrada;
estando además el dispositivo configurado para:
- para cada respuesta de impulso que incorpora un efecto de sala entre una pluralidad de respuestas de impulso que incorporan un efecto de sala, estando dicha respuesta de impulso que incorpora un efecto de sala respectivamente asociada a una señal de entrada entre dichas al menos dos señales de entrada (I(1), I(2), ..., I(L)) y a una señal de salida entre dichas al menos dos señales de salida (O(1), O(2), ..., O(K)):
o particionar (S22), en un dominio temporal, dicha respuesta de impulso en una primera parte (A) y en una segunda parte (B), efectuándose dicho particionamiento de modo que:
dicha primera parte representa unas propagaciones sonoras directas y unas primeras reflexiones sonoras de dichas propagaciones y se extiende por un primer número de muestras, y
dicha segunda parte representa un campo sonoro difuso presente después de dichas primeras reflexiones y se extiende por un segundo número de muestras, siendo dicho segundo número de muestras un múltiplo de dicho primer número de muestras;
o determinar una primera función de transferencia (Ak(1), Ak(2), . , A k(L)) a partir de dicha primera parte; o determinar una segunda función de transferencia a partir de dicha segunda parte, comprendiendo el filtro:
- para cada señal de salida (O(1), O(2), ... O(K)) entre las dichas al menos dos señales de salida (O(1), O(2), ..., O(K)):
o determinar (S23B1) una tercera función de transferencia (Bmediok) a partir de una media de dichas segundas funciones de transferencia correspondiente a la señal de salida (O(1), O(2), ..., O(K));
o aplicar (S4A1, S4A2, ..., S4AL) a cada señal de entrada de las primeras funciones de transferencia correspondientes a la señal de salida (O(1), O(2), ..., O(K));
o aplicar (S4B1) a cada señal de entrada la tercera función de transferencia (Bmediok) correspondiente a la señal de salida (O(1), O(2), ... O(K));
en el que las señales resultantes de dichas aplicaciones de las primeras y terceras funciones de transferencia se suman para obtener dichas al menos dos señales de salida (O(1), O(2), ..., O(K)).
13. Módulo de descodificación de señales sonoras, que incluye un dispositivo de espacialización según la reivindicación 12, de dichas señales sonoras como señales de entrada.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1357299A FR3009158A1 (fr) | 2013-07-24 | 2013-07-24 | Spatialisation sonore avec effet de salle |
PCT/FR2014/051728 WO2015011359A1 (fr) | 2013-07-24 | 2014-07-04 | Spatialisation sonore avec effet de salle |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2754245T3 true ES2754245T3 (es) | 2020-04-16 |
Family
ID=49876752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES14748239T Active ES2754245T3 (es) | 2013-07-24 | 2014-07-04 | Espacialización sonora con efecto de sala |
Country Status (8)
Country | Link |
---|---|
US (1) | US9848274B2 (es) |
EP (1) | EP3025514B1 (es) |
JP (1) | JP6486351B2 (es) |
KR (2) | KR102310859B1 (es) |
CN (1) | CN105684465B (es) |
ES (1) | ES2754245T3 (es) |
FR (1) | FR3009158A1 (es) |
WO (1) | WO2015011359A1 (es) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3001701B1 (en) * | 2014-09-24 | 2018-11-14 | Harman Becker Automotive Systems GmbH | Audio reproduction systems and methods |
US10187740B2 (en) * | 2016-09-23 | 2019-01-22 | Apple Inc. | Producing headphone driver signals in a digital audio signal processing binaural rendering environment |
JP1640846S (es) * | 2018-10-16 | 2019-09-09 | ||
CN109584892A (zh) * | 2018-11-29 | 2019-04-05 | 网易(杭州)网络有限公司 | 音效模拟方法、装置、介质及电子设备 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2851879A1 (fr) * | 2003-02-27 | 2004-09-03 | France Telecom | Procede de traitement de donnees sonores compressees, pour spatialisation. |
GB0419346D0 (en) * | 2004-09-01 | 2004-09-29 | Smyth Stephen M F | Method and apparatus for improved headphone virtualisation |
JP2006279588A (ja) * | 2005-03-29 | 2006-10-12 | Yamaha Corp | 多地点通信会議用端末 |
CN102395098B (zh) * | 2005-09-13 | 2015-01-28 | 皇家飞利浦电子股份有限公司 | 生成3d声音的方法和设备 |
KR101562379B1 (ko) * | 2005-09-13 | 2015-10-22 | 코닌클리케 필립스 엔.브이. | 공간 디코더 유닛 및 한 쌍의 바이노럴 출력 채널들을 생성하기 위한 방법 |
JP2010118978A (ja) * | 2008-11-14 | 2010-05-27 | Victor Co Of Japan Ltd | 音像定位制御装置および音像定位制御方法 |
US9431987B2 (en) * | 2013-06-04 | 2016-08-30 | Sony Interactive Entertainment America Llc | Sound synthesis with fixed partition size convolution of audio signals |
-
2013
- 2013-07-24 FR FR1357299A patent/FR3009158A1/fr not_active Withdrawn
-
2014
- 2014-07-04 ES ES14748239T patent/ES2754245T3/es active Active
- 2014-07-04 US US14/906,311 patent/US9848274B2/en active Active
- 2014-07-04 KR KR1020217001620A patent/KR102310859B1/ko active IP Right Grant
- 2014-07-04 WO PCT/FR2014/051728 patent/WO2015011359A1/fr active Application Filing
- 2014-07-04 CN CN201480052602.XA patent/CN105684465B/zh active Active
- 2014-07-04 EP EP14748239.2A patent/EP3025514B1/fr active Active
- 2014-07-04 KR KR1020167003222A patent/KR102206572B1/ko active IP Right Grant
- 2014-07-04 JP JP2016528570A patent/JP6486351B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
FR3009158A1 (fr) | 2015-01-30 |
KR20210008952A (ko) | 2021-01-25 |
US20160174013A1 (en) | 2016-06-16 |
KR102206572B1 (ko) | 2021-01-22 |
KR102310859B1 (ko) | 2021-10-12 |
WO2015011359A1 (fr) | 2015-01-29 |
EP3025514A1 (fr) | 2016-06-01 |
CN105684465B (zh) | 2018-06-12 |
JP6486351B2 (ja) | 2019-03-20 |
JP2016527815A (ja) | 2016-09-08 |
EP3025514B1 (fr) | 2019-09-11 |
CN105684465A (zh) | 2016-06-15 |
KR20160034942A (ko) | 2016-03-30 |
US9848274B2 (en) | 2017-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10262650B2 (en) | Earphone active noise control | |
ES2961396T3 (es) | Generación de audio binaural en respuesta a audio multicanal que usa al menos una red de retardo de retroalimentación | |
JP7254137B2 (ja) | 2dセットアップを使用したオーディオ再生のためのアンビソニックス・オーディオ音場表現を復号する方法および装置 | |
ES2837864T3 (es) | Generación de audio binaural en respuesta a un audio multicanal que usa al menos una red de retardo de retroalimentación | |
US9560467B2 (en) | 3D immersive spatial audio systems and methods | |
ES2932422T3 (es) | Método y aparato para procesar señales multimedia | |
JP5298199B2 (ja) | モノフォニック対応およびラウドスピーカ対応のバイノーラルフィルタ | |
ES2760873T3 (es) | Procedimiento de tratamiento de una señal de audio, unidad de tratamiento de señales, renderizador binaural, codificador de audio y decodificador de audio | |
ES2340796T3 (es) | Dispositivo y metodo para generar una señal estereofonica codificada de una pieza de audio o flujo de datos de audio. | |
ES2895436T3 (es) | Aparato y método para generar una señal de salida de audio que tiene por lo menos dos canales de salida | |
CN104581610B (zh) | 一种虚拟立体声合成方法及装置 | |
ES2754245T3 (es) | Espacialización sonora con efecto de sala | |
KR20090066188A (ko) | 개인화된 머리전달함수를 이용한 3차원 오디오 신호 처리장치 및 그 방법과, 그를 이용한 고현장감 멀티미디어 재생시스템 | |
US20210211810A1 (en) | Partial hrtf compensation or prediction for in-ear microphone arrays | |
CN116261086A (zh) | 声音信号处理方法、装置、设备及存储介质 | |
WO2014084706A1 (es) | Método de ubicación tridimensional de audio en tiempo real usando un mezclador paramétrico y predescomposición en bandas de frecuencia | |
CN116456264A (zh) | 一种耳机虚拟声像头外化方法 | |
KR20090090975A (ko) | 음상 외재화를 위한 머리전달함수 생성 방법과, 그를이용한 3차원 오디오 신호 처리 장치 및 그 방법 |