ES2807192T3 - Aparato y procedimiento para generar señales de salida basadas en una señal de fuente de audio, un sistema de reproducción de sonido y una señal de altavoz - Google Patents

Aparato y procedimiento para generar señales de salida basadas en una señal de fuente de audio, un sistema de reproducción de sonido y una señal de altavoz Download PDF

Info

Publication number
ES2807192T3
ES2807192T3 ES15786985T ES15786985T ES2807192T3 ES 2807192 T3 ES2807192 T3 ES 2807192T3 ES 15786985 T ES15786985 T ES 15786985T ES 15786985 T ES15786985 T ES 15786985T ES 2807192 T3 ES2807192 T3 ES 2807192T3
Authority
ES
Spain
Prior art keywords
signal
audio source
virtual
delay
multitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15786985T
Other languages
English (en)
Inventor
Sebastian Schlecht
Andreas Silzle
Emanuel Habets
Christian Borss
Bernhard Neugebauer
Hanne Stenzel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2807192T3 publication Critical patent/ES2807192T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/08Arrangements for producing a reverberation or echo sound
    • G10K15/10Arrangements for producing a reverberation or echo sound using time-delay networks comprising electromechanical or electro-acoustic devices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/08Arrangements for producing a reverberation or echo sound
    • G10K15/12Arrangements for producing a reverberation or echo sound using electronic time-delay networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

Aparato (100; 200) para generar una primera multitud de señales de salida (102a-d) en función de al menos una señal de fuente de audio (104a, 104b), comprendiendo el aparato: una red de retardo (202) que comprende una segunda multitud de vías de retardo (106a-d) teniendo cada vía de retardo (106a-d) una línea de retardo (108a-d) y un filtro de atenuación (112a-d), estando la línea de retardo de cada vía de retardo (108a-d) configurada para retrasar las señales de entrada de línea de retardo (104a-b, 104a", 104b", 114a-d) y para combinar la al menos una señal de fuente de audio (104a-b, 104a", 104b") y una señal de audio reverberada (114a-d) para obtener una señal combinada (116), donde el filtro de atenuación (112a-d) de cada vía de retardo (106a-d) está configurado para filtrar la señal combinada (116) de la línea de retardo (108a-d) de la vía de retardo (106a-d) para obtener una señal de salida (102a-d), donde la primera multitud de señales de salida comprende la señal de salida (102a-d) de cada vía de retardo; y un procesador de retroalimentación (120) configurado para reverberar la primera multitud de señales de salida (102a-d) para obtener una tercera multitud de señales de audio reverberadas (114a-d) que comprende la señal de audio reverberada de cada vía de retardo; donde la señal combinada de cada vía de retardo (116) comprende una porción de señal de fuente de audio (104ab) y una porción de señal reverberada (114) y donde la línea de retardo de cada vía de retardo (108a-d) comprende una sexta multitud de tomas de entrada (302a-d) que están configuradas para recibir la señal de fuente de audio (104a-b) o una versión ponderada (104a", 104b") de la señal de fuente de audio, donde el aparato (100) comprende un controlador de entrada (140) configurado para conectar la señal de fuente de audio (104a-b) o la versión ponderada (104a", 104b") de la señal de fuente de audio y una de la sexta multitud de tomas de entrada (302a-d) en función de una primera posición de una fuente de audio virtual en una sala de reproducción virtual (130), mientras que no conecta la señal de fuente de audio (104a-b) o la versión ponderada (104", 104b") de la señal de fuente de audio a una toma de entrada diferente de la sexta multitud de tomas de entrada (103a-d), y donde el controlador de entrada (140) está configurado para desconectar la señal de fuente de audio (104a- b) o la versión ponderada (104a", 104b") de la señal de fuente de audio de la una de la sexta multitud de tomas de entrada (302ad) en función de una segunda posición de la fuente de audio virtual, siendo la segunda posición diferente de la primera posición; o donde la señal combinada de cada vía de retardo (116) comprende una porción de señal de fuente de audio (104a30 b) y una porción de señal reverberada (114) y donde la línea de retardo (108a-d) comprende una séptima multitud de tomas de salida (308a-c) que están configuradas para proporcionar la señal combinada (116) o una señal de línea de retardo intermedia (308a-c), donde el aparato (100) comprende un controlador de salida (170) configurado para conectar un filtro de ecualización (142a-d) a la señal de salida (102a-d) o a una de la séptima multitud de tomas de salida (308a-c) en función de una primera característica de reflexión de una sala de reproducción virtual (130), mientras que no conecta una toma de salida diferente de la séptima multitud de tomas de salida (308a-c) al filtro de ecualización (142a-d), y donde el controlador de salida (170) está configurado para desconectar el filtro de ecualización (142a-d) de la señal de salida (102a-d) o de la señal de línea de retardo intermedia (308a-c) en función de una segunda característica de reflexión de la sala de producción virtual (130) que es diferente de la primera característica.

Description

DESCRIPCIÓN
Aparato y procedimiento para generar señales de salida basadas en una señal de fuente de audio, un sistema de reproducción de sonido y una señal de altavoz
[0001] La presente invención se refiere a un aparato para generar señales de salida basadas en al menos una señal de fuente de audio, a un aparato para generar una multitud de señales de altavoz basadas en al menos una señal de fuente de audio, a un sistema de reproducción de sonido, a un procedimiento para generar las señales de salida y a un programa informático. La presente invención se refiere además a una señal de altavoz y a técnicas de reverberación paramétrica multicanal espacial.
[0002] Si el sonido se emite en una sala, las ondas sonoras viajan a través del espacio hasta que se reflejan en los límites de la sala. Las reflexiones vuelven a rebotar y con el tiempo evoluciona un patrón cada vez más complejo de ondas sonoras, la llamada reverberación. La figura 8 muestra una representación esquemática de un solo canal de reverberación que es una respuesta de impulso de una sala típica con sonido directo 1002, reflexiones tempranas 1004 y reverberación tardía 1006. En una posición de receptor y tal como se ilustra en la abscisa de la figura 8, primero se recibe el sonido directo 1002 del receptor. El sonido directo 1002 viaja sin reflejos al receptor. Después, se reciben las reflexiones tempranas 1004. Las reflexiones tempranas 1004 consisten en una serie de reflexiones distintas, que con el tiempo se condensan a la reverberación tardía 1006. El sonido directo 1002 y las reflexiones tempranas 1004 dependen particularmente de la fuente y las posiciones del receptor con respecto a la geometría de la sala. Las reflexiones en la reverberación tardía 1006 se caracterizan por estar distribuidas equitativamente en dirección y relativamente independientes de las posiciones de fuente y receptor.
[0003] Sin embargo, en la reproducción espacial cada sonido tiene una dirección de llegada (DOA), es decir, el sonido llega desde una cierta dirección angular dada por el azimut y la elevación. Para una mejor ilustración, la figura 9 muestra una representación espacial esquemática de la reverberación en solo dos dimensiones. La DOA es claramente perceptible para el sonido directo 1002 y determina principalmente la localización de la fuente. La DOA es importante también para las reflexiones tempranas 1004, ya que ayuda a crear una sensación de geometría de la sala, profundidad espacial de la fuente y localización de la fuente angular. La reverberación tardía 1006 es difusa y no se puede percibir DOA explícita.
[0004] Con un aumento del tiempo t, representado en la abscisa, el receptor percibe primero el sonido directo 1002 y, posteriormente, las reflexiones tempranas 1004 seguidas de reverberación tardía 1006. Una dirección angular es el ángulo azimut de la dirección de llegada de la onda sonora, el ángulo azimut representado como dimensión radial. La distancia al receptor es el tiempo de llegada. La oscuridad de los puntos representa el nivel de nivel percibido de reflexión. Por lo tanto, la figura 9 representa una representación espacial de reverberación en dos dimensiones.
[0005] En el transcurso de la postproducción de audio, la reverberación artificial se añade al sonido para mejorar la calidad espacial. Los objetivos deseados van desde la mejora de la musicalidad, la mejora del diseño sonoro hasta la recreación de un espacio acústico físico. Se puede crear un espacio acústico realista mediante el uso de múltiples altavoces, reflexiones tempranas dependientes de la fuente y reverberación tardía no correlacionada. En este sentido, se hace referencia a multicanal como que tiene un alto número de fuentes de audio y un alto número de canales de salida.
[0006] Los algoritmos prácticos de reverberación se clasifican generalmente en una de dos categorías, aunque existen híbridos:
1) redes de retardo, en las que la señal de entrada se retrasa, filtra y retroalimenta;
2) convolucional, donde la señal de entrada simplemente convoluciona con una respuesta de impulso registrada o estimada de un espacio acústico.
[0007] Los reverberadores convolucionales reproducen una acústica dada con alta precisión, pero también con altos costes computacionales, es decir, esfuerzos. Se han diseñado reverberadores convolucionales multicanal, pero los costes computacionales escalan linealmente con el número de pares de fuentes y canales.
[0008] Para aplicaciones de canal bajo, es decir, mono y estéreo, se desarrolló una amplia variedad de reverberadores paramétricos. Ninguno de estos desarrollos, sin embargo, se ha extendido de manera eficiente a un reverberador multicanal alto. En particular, carecen de flexibilidad para hacer frente a entradas de fuentes arbitrarias y configuraciones de altavoces.
[0009] En los últimos años se han desarrollado muchos reverberadores artificiales, donde a continuación se ofrece una breve descripción de su aplicación en la reverberación multicanal. La gran mayoría de los reverberadores disponibles comercialmente tienen un bajo número de canales de entrada y salida. Mientras que han desarrollado un alto estándar en usabilidad, eficiencia computacional y calidad de sonido, escalan ineficientemente para un gran número de canales de salida.
[0010] Una forma de lograr un gran número de canales utilizando reverberadores de canal bajo es instanciar múltiples reverberadores similares. Esto aumenta considerablemente los requisitos de memoria y los costes computacionales. Para canales de salida no correlacionados, los reverberadores se parametrizan de manera diferente, por lo que podrían ser distintivos. Es posible superar reverberadores claramente pendientes mediante señales de alimentación cruzada entre los reverberadores.
[0011] Sin embargo, la DOA de las reflexiones tempranas no se puede implementar de esta manera, ya que la DOA deseada podría estar entre el canal de salida de dos reverberadores. En consecuencia, no hay una forma explícita de posicionar múltiples fuentes mediante la combinación de múltiples reverberadores. Además, la usabilidad para múltiples instancias puede volverse incómoda y complicada.
[0012] Mientras que los reverberadores basados en convoluciones pueden producir un espacio acústico físico dado con alta precisión, como se describe, por ejemplo, en [1], escalan muy ineficientemente con un gran número de fuentes de sonido y canales de salida. Cada par de fuente de sonido y canal de salida es procesado por una convolución separada. En consecuencia, el número de convoluciones que se va a realizar es el producto del número de fuentes de sonido y canales de salida. Las respuestas de impulso son difíciles de adquirir y carecen de flexibilidad en el posicionamiento de la fuente y el receptor de otros parámetros de la sala.
[0013] Por el contrario, los reverberadores basados en redes de retardo permiten un amplio control sobre cualquier detalle del sonido reverberado. Además, los reverberadores de redes de retardo recientes desarrollaron un alto estándar de calidad de sonido en aplicaciones de canal bajo. Los algoritmos existentes actualmente no ofrecen, u ofrecen de manera ineficiente, una estrategia consistente para recrear audio multicanal con alta eficiencia.
[0014] Típicamente, la reverberación se crea en dos etapas: las reflexiones tempranas y la reverberación tardía como se representa en la figura 10 y se describe en [2,3]. Las reflexiones tempranas 1004 y 1004 son copias retardadas (1008a y 1008b) y atenuadas (1012a y 1012b) de la fuente monoaural 1014a y 1014b. Las líneas de retardo 1008a y 1008b, etiquetadas como Tsi, las ganancias de toma de salida 1012a y 1012, etiquetadas como bsi y la panoramización 1016 dependen de la posición de la fuente y son exclusivas de cada fuente. Por lo tanto, para cada fuente 1014a y 1014b, la sección de reflexión temprana 1018 debe duplicarse. Para mejorar la calidad de las reflexiones tempranas 1004a y 1004b, se procesan mediante una unidad de difusor 1022. El difusor 1022 se implementa típicamente como un filtro de paso completo o un filtro de respuesta de impulso finito corto (FIR) para emular el efecto de las reflexiones de pared no especulares. El orden particular y el reemplazo de las unidades de difusor 1022 y de panoramización 101 6 pueden variar, por ejemplo, para la panoramización precisa de cada unidad de panoramización dedicada 1016 de reflexión temprana única 1004a y 1004ba para cada fuente 1014a y 1014b puede emplearse o el difusor 1022 puede colocarse directamente en la entrada de la fuente de la línea de retardo 1008a y 1008b. Por lo tanto, el diseño particular es una compensación entre el control detallado y la eficiencia computacional.
[0015] La reverberación tardía es creada por la red de retardo de retroalimentación (FDN) 1024. La FDN 1024 se basa en un conjunto de líneas de retardo N 1025, etiquetadas como t1, t2, ..., tN y una matriz de mezcla de retroalimentación A para desarrollar un patrón de eco complejo con el tiempo. El tiempo de reverberación y la difusión se controlan mediante los filtros de atenuación 1026, etiquetados como a1, a2, ..., aN. La implementación de los filtros de atenuación va desde un simple filtro de paso bajo, tal como se describe en [4], hasta filtros absorbentes de paso completo, tal como se describe en [5].
[0016] Las reflexiones tempranas se introducen en el bucle FDN para aumentar la densidad inicial de la reverberación retardada. La reverberación retardada se mezcla y se añade a las reflexiones tempranas panorámicas. Los canales resultantes se introducen en los altavoces 1028 de la sala de reproducción 1032. Opcionalmente, se puede aplicar un filtro de ecualización dependiente del canal (EQ) 1034 a los canales del altavoz para correcciones espectrales y respuesta de frecuencia dependiente del altavoz.
[0017] En la posición de escucha, todos los canales de salida en la sala de reproducción 160 se retrasan y se resumen y forman la señal del receptor. Por lo tanto, la premezcla de las señales de línea de retardo como se realiza típicamente en el diseño anterior aumenta la densidad de eco en cada canal de salida, pero no aumenta la densidad de eco percibida en la sala. Más bien tiende a introducir una coherencia desagradable y artefactos de filtro tipo peine. Un ejemplo extremo, que puede ocurrir con una matriz de mezcla Hadamard, es distribuir la salida de una línea de retardo a todos los canales de salida, lo que crea una señal mono multicanal con un cambio de fase.
[0018] Los diseños de conceptos conocidos no tienen una manera eficiente y conveniente de manejar la reverberación multicanal, incluidas las señales espaciales y la dependencia de la dirección. Además, las reflexiones tempranas, que son más importantes para la percepción espacial del reverberador, se representan por separado por conceptos conocidos, lo que es costoso desde el punto de vista computacional.
[0019] En el documento US 5.491754 se describen un procedimiento y un sistema para la espacialización artificial de señales audio-digitales que tienen como objetivo efectuar en las señales elementales, réplicas de la señal audio-digital, diferentes retardos que crean señales elementales retrasadas sumadas después de la ponderación con la señal con el fin de crear la señal audio-digital espacializada.
[0020] Actualmente, existen muchas configuraciones de múltiples altavoces diferentes, lo que significa que las reverberaciones multicanal con configuraciones de altavoces flexibles son muy necesarias. Por lo tanto, por ejemplo, hay una necesidad de conceptos de reproducción de audio, lo que permite reverberadores multicanal con una configuración de altavoz más flexible y/o una manera eficiente de obtener las reverberaciones.
[0021] Un objetivo de la presente invención es proporcionar un concepto para un aparato más eficiente para obtener señales reverberadas y un sistema de reproducción de sonido más flexible.
[0022] La cuestión para la que se solicita protección se define en las reivindicaciones independientes 1, 16, 18 y 19. Modificaciones ventajosas adicionales de la presente invención son el tema de las reivindicaciones dependientes.
[0023] Realizaciones de la presente invención relacionadas con un aparato para generar una primera multitud de señales de salida basadas en al menos una señal de fuente de audio. El aparato comprende una red de retardo y un procesador de retroalimentación. La red de retardo comprende una segunda multitud de vías de retardo, donde cada vía de retardo comprende una línea de retardo y un filtro de atenuación. Cada línea de retardo está configurada para retrasar las señales de entrada de la línea de retardo y para combinar la al menos una señal de fuente de audio y una señal de audio reverberada para obtener una señal combinada. El filtro de atenuación de la vía de retardo está configurado para filtrar la señal combinada de la línea de retardo de la vía de retardo para obtener una señal de salida. La primera multitud de señales de salida comprende la señal de salida. El procesador de retroalimentación está configurado para reverberar la primera multitud de señales de salida para obtener una tercera multitud de las señales de audio reverberadas que comprenden la señal de audio reverberada. La señal combinada comprende una porción de señal de fuente de audio y una porción de señal reverberada y la línea de retardo comprende una sexta multitud de tomas de entrada que se configuran para recibir la señal de fuente de audio o una versión ponderada de la señal de fuente de audio. El aparato comprende un controlador de entrada configurado para conectar la señal de fuente de audio o la versión ponderada de la señal de fuente de audio y una de la sexta multitud de tomas de entrada y basado en una primera posición de una fuente de audio virtual en una sala de reproducción virtual y mientras no se conecta la señal de fuente de audio o la versión ponderada de la señal de fuente de audio a una toma de entrada diferente de la sexta multitud de tomas de entrada. El controlador de entrada está configurado para desconectar la señal de fuente de audio o la versión ponderada de la señal de fuente de audio de la una de la sexta multitud de tomas de entrada en función de una segunda posición de la fuente de audio virtual, siendo la segunda posición diferente de la primera posición. La señal combinada comprende de manera alternativa o adicional una porción de señal de fuente de audio y una porción de señal reverberada y la línea de retardo comprende una séptima multitud de tomas de salida que se configuran para proporcionar la señal combinada o una señal de línea de retardo intermedia. El aparato comprende un controlador de salida configurado para conectar un filtro de ecualización a la señal de salida o la parte superior de la séptima multitud de tomas de salida en función de una primera característica de reflexión de una sala de reproducción virtual, mientras que no conecta una toma de salida diferente de la séptima multitud de tomas de salida al filtro de ecualización. El controlador de salida está configurado para desconectar el filtro de ecualización de la señal de salida o de la señal de línea de retardo intermedia en función de que una segunda característica de reflexión de la sala de producción virtual que es diferente de la primera característica.
[0024] Esto permite obtener señales retardadas (reflexiones tempranas) y reverberadas de una FDN, donde una complejidad de la FDN puede ser casi independiente de una cantidad de señales fuente de modo que las señales retardadas y reverberadas se obtienen de manera eficiente.
[0025] Los inventores han descubierto que mediante la combinación de la señal de la fuente de audio y las señales de audio reverberadas en una línea de retardo tanto, las reflexiones tempranas como la reverberación tardía pueden obtenerse mediante una red de retardo de retroalimentación. Una complejidad computacional del concepto propuesto escala con una cantidad de señales de salida o señales de altavoz que se van a obtener, pero puede ser independiente o casi independiente de una cantidad de señales de fuente de audio que se van a representar en las señales de salida, las señales de altavoz, respectivamente. Además, se puede mantener una información espacial de señales de audio reflejadas y/o reverberadas.
[0026] Otras realizaciones de la presente invención se refieren a un sistema de reproducción de sonido que comprende un aparato para generar una primera multitud de señales de salida o un aparato para generar una cuarta multitud de señales de altavoz, una multitud de altavoces y un panoramizador configurado para recibir señales de altavoz derivadas de la señal de salida y para panoramizar las señales de altavoz a una multitud de señales de altavoz que corresponden a una cantidad de altavoces que pueden ser diferentes de una cantidad de señales de altavoz recibidas. El panoramizador está configurado para mantener una característica de propagación de sonido de una sala de reproducción virtual asociada con la multitud de señales de altavoz recibidas cuando se panoramizan las señales recibidas a las señales de altavoz panorámicas.
[0027] Esto permite una configuración de altavoz flexible, independiente de las señales de salida generadas o señales de altavoz del aparato, ya que esas señales pueden comprender información direccional relacionada con las líneas de retardo del aparato para generar las señales de salida o las señales de altavoz, de modo que se pueda mantener esa información espacial.
[0028] Otras realizaciones de la presente invención se refieren a un procedimiento para generar una primera multitud de señales de salida, un procedimiento para generar una multitud de señales de altavoz, a un programa informático y a una señal de altavoz.
[0029] Las realizaciones de la presente invención se describirán más en detalle con referencia a las figuras adjuntas en las que:
La figura 1 muestra un diagrama de bloques esquemático de un sistema de reproducción de sonido que comprende un aparato para generar una multitud de señales de salida basadas en dos señales de fuente de audio según una realización;
señales de línea de retardo para obtener la cuarta multitud de señales de altavoz. Las señales de línea de retardo intermedia se reciben de una toma de salida de la línea de retardo.
[0030] Los inventores han descubierto que mediante la combinación de la señal de fuente de audio y las señales de audio reverberadas en una línea de retardo tanto, las reflexiones tempranas como la reverberación tardía pueden obtenerse mediante una red de retardo de retroalimentación. Una complejidad computacional del concepto propuesto escala con una cantidad de señales de salida o señales de altavoz que se van a obtener, pero puede ser independiente o casi independiente de una cantidad de señales de fuente de audio que se van a representar en las señales de salida, las señales de altavoz, respectivamente. Además, se puede mantener una información espacial de señales de audio reflejadas y/o reverberadas.
[0031] Otras realizaciones de la presente invención se refieren a un sistema de reproducción de sonido que comprende un aparato para generar una primera multitud de señales de salida o un aparato para generar una cuarta multitud de señales de altavoz, una multitud de altavoces y un panoramizador configurado para recibir señales de altavoz derivadas de la señal de salida y para panoramizar las señales de altavoz a una multitud de señales de altavoz que corresponden a una cantidad de altavoces que pueden ser diferentes de una cantidad de señales de altavoz recibidas. El panoramizador está configurado para mantener una característica de propagación de sonido de una sala de reproducción virtual asociada con la multitud de señales de altavoz recibidas cuando se panoramizan las señales recibidas a las señales de altavoz panorámicas.
[0032] Esto permite una configuración de altavoz flexible, independiente de las señales de salida generadas o señales de altavoz del aparato, ya que esas señales pueden comprender información direccional relacionada con las líneas de retardo del aparato para generar las señales de salida o las señales de altavoz, de modo que se pueda mantener esa información espacial.
[0033] Otras realizaciones de la presente invención se refieren a un procedimiento para generar una primera multitud de señales de salida, un procedimiento para generar una multitud de señales de altavoz, a un programa informático y a una señal de altavoz.
[0034] Las realizaciones de la presente invención se describirán más en detalle con referencia a las figuras adjuntas en las que:
La figura 1 muestra un diagrama de bloques esquemático de un sistema de reproducción de sonido que comprende un aparato para generar una multitud de señales de salida basadas en dos señales de fuente de audio según una realización;
La figura 2 muestra un diagrama de bloques esquemático de un aparato para generar las señales de altavoz según una realización;
La figura 3 muestra un diagrama de bloques esquemático de la vía de retardo según una realización;
La figura 4a muestra un diagrama de bloques esquemático de un escenario en el que la señal del altavoz comprende una porción reflejada y una porción reverberada de la señal de fuente de audio según una realización; La figura 4b muestra un diagrama de bloques esquemático de un escenario diferente en el que el filtro de ecualización está conectado a una toma de salida de la línea de retardo según una realización;
La figura 5a muestra un diagrama de bloques esquemático del procesador de retroalimentación configurado para reverberar las señales de salida según una realización;
La figura 5b muestra un diagrama esquemático de la sala de reproducción virtual que comprende, por ejemplo, dos subsalas según una realización;
La figura 6a muestra una vista superior esquemática de una distribución de 16 líneas de retardo en un hemisferio superior de una sala de reproducción virtual según una realización;
La figura 6b muestra una implementación esquemática de un acoplamiento acústico entre los altavoces virtuales realizado por los parámetros de la matriz A según una realización;
La figura 7 muestra un diagrama de bloques esquemático de una posible realización del filtro de atenuación según una realización;
La figura 8 muestra una representación esquemática de un solo canal de reverberación que es una respuesta de impulso de una sala típica con sonido directo, reflexiones tempranas y reverberación tardía;
La figura 9 muestra una representación espacial esquemática de la reverberación en solo dos dimensiones; y La figura 10 un concepto para obtener señales reverberadas según la técnica anterior.
[0035] Los elementos iguales o equivalentes o elementos con funcionalidad igual o equivalente se indican en la siguiente descripción por números de referencia iguales o equivalentes incluso si ocurre en figuras diferentes.
[0036] En la siguiente descripción, una pluralidad de detalles se establece para proporcionar una explicación más exhaustiva de las realizaciones de la presente invención. Sin embargo, resultará evidente para un experto en la materia que las realizaciones de la presente invención pueden llevarse a cabo sin estos detalles específicos. En otros ejemplos, los dispositivos y estructuras bien conocidos se muestran en forma de diagrama de bloques en vez de en detalle con el fin de evitar ocultar las realizaciones de la presente invención. Además, las características de las diferentes realizaciones descritas en lo sucesivo se pueden combinar entre sí, a menos que se indique específicamente de otro modo.
[0037] La figura 1 muestra un diagrama de bloques esquemático de un sistema de reproducción de sonido 1000 que comprende un aparato 100 para generar una multitud de señales de salida 102a-d en función de dos señales de fuente de audio 104a y 104b. Las señales de fuente de audio pueden ser, por ejemplo, una señal mono y pueden estar asociadas con un objeto de audio virtual, es decir, una fuente de audio virtual adaptada para emitir una señal mono.
[0038] El aparato 100 está configurado para generar las señales de salida 102a-d en función de las señales de fuente de audio 104a y 104b de modo que las señales de salida 102a-d sean versiones reflejadas y/o reverberadas de las señales de fuente de audio 104a y 104b, es decir, las señales de salida 102a-d se derivan de las señales de fuente de audio 104a y 104b. Una información transportada por la señal de salida 102a-d puede variar con el tiempo. Por ejemplo, la señal de salida puede ser una reflexión temprana de la señal de fuente de audio en una sala de reproducción virtual 130 en una primera instancia de tiempo y una versión reverberada de la señal de fuente de audio en una segunda instancia de tiempo después de la primera instancia de tiempo.
[0039] El aparato 100 comprende cuatro líneas de retardo 106a-d. Cada vía de retardo 106a-d comprende una línea de retardo 108a-d y un filtro de atenuación 112a-d. Las líneas de retardo 108a-d están configuradas para recibir las señales de fuente de audio 104a y 104b y una señal de audio reverberada 114a-d, es decir, cada línea de retardo 108a-d está configurada para recibir tres señales, dos señales de fuente de audio y una señal de audio reverberada.
[0040] Como se describirá más adelante y con más detalle, cada línea de retardo 108a-d está configurada para retrasar una señal de (entrada) recibida y para combinar la señal recibida y retrasada de modo que se obtenga una señal combinada 116. La señal combinada 116 comprende, por ejemplo, por un retardo de tiempo diferente, porciones retardadas de las señales de fuente de audio 104a y 104b y de la señal reverberada 114a, 114b, 114c o 114c. Las líneas de retardo 108a-d se representan como bloques esquemáticos etiquetados como t1 - t4. Esquemáticamente, las líneas de retardo 104a-d pueden entenderse como filtros de retardo, tales como un filtro de respuesta de impulso finito (FIR) que transfiere una señal recibida de una dirección, por ejemplo, izquierda, a otra dirección, por ejemplo, derecha de la estructura de filtro esquemática. Simplificado, cuanto más a la "izquierda" se introduce una señal en la línea de retardo, más se retrasa. Cuando se hace referencia a la línea de retardo 108a, la señal de fuente de audio 104a se retrasa durante un mayor retardo de tiempo que la señal de fuente de audio 104b y la señal de audio reverberada 114a se retrasa durante una mayor duración de tiempo que la señal de fuente de audio 104a.
[0041] Cada una de las vías de retardo 106a-d comprende el filtro de atenuación 112a-d etiquetado como a1, a2, a3, a4, respectivamente. Los filtros de atenuación 116 están configurados para proporcionar, es decir, para emitir, las señales de salida 102a-d mediante la atenuación de la señal combinada 116 de la línea de retardo 108a-d y pueden implementarse, por ejemplo, como filtros de respuesta de impulso infinito (IIR). Al combinar la señal de fuente de audio 104a y 104b en una línea de retardo 108a-d y al atenuar la señal combinada 116, se pueden obtener reflexiones tempranas de las señales de fuente de audio 104a y 104b.
[0042] El aparato 100 comprende además un procesador de retroalimentación 120 configurado para reverberar las señales de salida 102a-d de modo que se obtienen las señales de audio reverberadas 114a-d. El procesador de retroalimentación 120 puede entenderse, por ejemplo, como alimentación cruzada de las señales de salida 102a-d. La alimentación cruzada se puede representar, por ejemplo, como una operación de matriz. Las vías de retardo pueden formar una red de retardo. El procesador de retroalimentación 120 y la red de retardo pueden formar una red de retardo de retroalimentación (FDN), donde el procesador de retroalimentación 120 está configurado para realizar una retroalimentación y/o una alimentación cruzada de las señales de salida 102 a la red de retardo.
[0043] El aparato 100 comprende dos distribuidores 118a y 118b, donde el distribuidor 118a está configurado para recibir la señal de fuente de audio 104a y donde el distribuidor 118b está configurado para recibir la señal de fuente de audio 104b. Los distribuidores 118a y 118b están configurados para distribuir la señal de fuente de audio recibida 104a o 104b en una cantidad de versiones (copias) de estos. Simplificado, el distribuidor 118a y 118b están configurados para dividir o copiar la señal de fuente de audio recibida 104a o 104b. Las versiones obtenidas 104a', 104b' pueden comprender un retardo bajo o nulo con respecto a cada una de las otras versiones de la señal de fuente de audio respectiva 104a o 104b. Un retardo bajo puede ser, por ejemplo, inferior o igual al 20 %, al 10 % o al 4 % de un retardo de tiempo máximo de las líneas de retardo 108a-d. Los distribuidores 118a y 118b comprenden además una pluralidad o una multitud de amplificadores 122 configurados para amplificar o atenuar individualmente las versiones 104a', 104b' respectivamente. La ganancia o atenuación aplicada puede correlacionarse, por ejemplo, con una fuerza o un valor de la reflexión de la fuente de sonido en la sala de reproducción virtual.
[0044] El distribuidor 118a está configurado para proporcionar una cantidad de versiones amplificadas 104a" individualmente, es decir, independientes entre sí, de la señal de fuente de audio 104a, donde una cantidad de las versiones 104a" puede ser igual a una cantidad de vías de retardo 106a-d de modo que cada línea de retardo 108a-d pueda recibir una de las versiones 104a". El distribuidor 118b puede comprender una multitud de amplificadores 122 configurados para amplificar independientemente las versiones 104b' para obtener una cantidad de versiones amplificadas independientemente 104b" de la señal de fuente de audio 104b, donde una cantidad de las versiones obtenidas 104b" o 104b' puede ser igual a la cantidad de líneas de retardo 108a-d de modo que cada línea de retardo 108a-d pueda recibir una de las versiones amplificadas 104b". Dado que cada línea de retardo 106a-d puede estar asociada con un altavoz virtual, una ganancia de cada uno de los amplificadores 122 puede influir en una característica de la reflexión reproducida del objeto de sonido reproducido en la sala de reproducción virtual y reflejado en una estructura de reflejo de sonido tal como una pared.
[0045] Las versiones (copias) y las versiones amplificadas de la señal de fuente de audio 104a y 104b llevan una información sin cambios con respecto a la señal mono, es decir, a la señal de fuente de audio 104a y 104b. En términos del procesamiento adicional para retrasar, atenuar y similares, esas señales pueden considerarse sin cambios.
[0046] La estructura del aparato 100 permite, con el tiempo, que cada señal de salida 102a-d comprenda una porción reflejada y reverberada de las señales de fuente de audio 104a y 104b como se describirá en el siguiente ejemplo:
La línea de retardo 108a está configurada para recibir la señal de fuente de audio 104a, una versión amplificada 104a" de esta respectivamente, y una versión amplificada 104b" de la señal de fuente de audio 104b. La señal de fuente de audio 104b se retrasa por un retardo de tiempo más corto que la señal de fuente de audio 104a, ya que se indica mediante la entrada de la señal de fuente de audio 104b que está dispuesta más cerca de la salida de la línea de retardo 108a en comparación con la entrada de la señal de fuente de audio 104a. Por ejemplo, cuando la línea de retardo 108a comprende una pluralidad de bloques de retardo, la señal de fuente de audio 104a puede retrasarse por una mayor cantidad de bloques de retardo en comparación con la señal de fuente de audio 104b. La señal combinada 116 comprende, por lo tanto, una porción derivada de la señal de fuente de audio retardada 104b y una porción de la señal de fuente de audio 104b que se retrasa durante un tiempo más largo. La señal combinada 116 se proporciona al filtro de atenuación 112a. La señal de salida 102a puede describirse como una versión retardada y atenuada y, por lo tanto, reflejada de las señales de fuente de audio 104a y 104b.
[0047] Tal como lo indican las entradas en diferentes posiciones reales y, por lo tanto, retardos de tiempo de las líneas de retardo 108a- d, las entradas que reciben las señales de fuente de audio 104a y 104b, las versiones amplificadas 104a" y 104b" respectivamente, cada versión 104a "pueden retrasarse durante un retardo de tiempo diferente en comparación con otras líneas de retardo 108a-d. Por consiguiente, cada versión 104b" de la señal de fuente de audio 104b puede retrasarse durante un retardo de tiempo diferente en comparación con las otras líneas de retardo 108a-d. Por lo tanto, se puede obtener una multitud de señales reflejadas.
[0048] Las señales de salida 102a-d son reverberadas por el procesador de retroalimentación 120 y, a continuación, se proporcionan a las vías de retardo 106a-d. Las señales reverberadas 114a-d se retrasan por las líneas de retardo 108a-d y se combinan con las señales de fuente de audio 104a y 104b. Esto permite obtener porciones reverberadas en las señales de salida 102a- d.
[0049] Se pueden alimentar señales de fuente de audio adicionales a la red de retardo, es decir, a la pluralidad de vías de retardo 106a-d. Se puede obtener un procesamiento de las señales de fuente de audio adicionales sin una disposición adicional de vías de retardo y, por lo tanto, sin proporcionar etapas de filtro o memoria adicionales. Alternativamente, solo se puede procesar una señal de fuente de audio, es decir, retrasada y reverberada.
[0050] Un retardo de tiempo de la señal de fuente de audio 104a y 104b, es decir, una posición de la entrada de señal con respecto a la línea de retardo 108a-d puede ajustarse o configurarse según una posición de un altavoz virtual 132a-d en una sala de reproducción virtual 130. La sala de reproducción virtual 130 puede parametrizarse como una escena de referencia en la que se reproducirán o generarán objetos de audio. Los altavoces virtuales 130a-d están dispuestos en posiciones virtuales en la sala de reproducción virtual y comprenden características de radiación virtuales, tales como una dirección y/o un patrón de radiación. La posición y/o dirección de propagación del sonido de los altavoces virtuales 132a-d (la dirección de llegada del sonido) en la sala de reproducción virtual 130 están relacionados (parametrizados) por la FDN, por las líneas de retardo 108a-d respectivamente. Simplificado, la sala de reproducción virtual 130 se puede usar para adquirir los parámetros para las líneas de retardo 108a-d, los filtros de atenuación 112a-d y el procesador de retroalimentación 120.
[0051] Un tiempo de retardo de una línea de retardo 108a-d puede corresponder a una distancia de un altavoz virtual 132a-d a una estructura que refleja el sonido de la sala de reproducción virtual. Un tiempo de reverberación de la sala de reproducción virtual puede corresponder a factores de atenuación de los filtros de atenuación 112a-d. Los factores de atenuación de los filtros de atenuación 112a-d y/o el tiempo de reverberación pueden depender de la frecuencia, es decir, una primera frecuencia puede reverberarse con un primer tiempo de reverberación, diferente de un segundo tiempo de reverberación mediante el cual se reverbera una segunda frecuencia, diferente de la primera frecuencia. Por ejemplo, cuanto mayor es la atenuación, más corto puede ser el tiempo de reverberación. Por lo tanto, los coeficientes de filtro de los filtros de atenuación 112a-d pueden estar relacionados con un tiempo de reverberación de la señal de fuente de audio con respecto a la sala de reproducción virtual 130. Los coeficientes de filtro pueden ser variantes de tiempo, por ejemplo, en función de una sala de reproducción virtual de variantes de tiempo 130.
[0052] Por lo tanto, los altavoces virtuales 132a-d están asociados con una información que comprende una dirección virtual de propagación de sonido en la sala de reproducción virtual 130. Cada altavoz virtual 132a-d puede ajustarse independientemente con respecto a otros altavoces virtuales 132a-d. Al variar un retardo de tiempo de la línea de retardo 108a-d, se puede influir en una posición de un altavoz virtual 132a-d correspondiente en la sala de reproducción virtual 130 o viceversa. Por lo tanto, la configuración de altavoz virtual se puede realizar en cualquier forma deseada, por ejemplo, los altavoces virtuales 132a-d se pueden distribuir por igual en la sala de reproducción virtual 130. Alternativamente, los altavoces virtuales 132a-d pueden distribuirse de manera desigual, por ejemplo y con respecto a una posición de un oyente, un área izquierda, derecha, frontal o trasera del oyente puede comprender una densidad mayor de altavoces en comparación con otras secciones de la sala de reproducción virtual 130.
[0053] Un suelo, un techo, paredes y/u otros objetos que reflejan el sonido pueden parametrizarse también por o en la sala de reproducción virtual. Por lo tanto, un objeto de sonido virtual que emite un sonido en la sala de reproducción virtual con una característica de propagación de sonido, tal como una dirección, puede ser reproducido por los altavoces virtuales 130a-d. Las características de propagación de sonido de la sala de reproducción virtual, tales como reflexiones sonoras y/o atenuación sonora en paredes o similares, pueden transferirse al menos parcialmente a los parámetros de la red de retardo. Por ejemplo, una distancia entre un altavoz virtual y una pared de la sala de reproducción virtual puede transferirse en un tiempo de desplazamiento (retardo de tiempo) antes de que se refleje la onda sonora. Los retardos de tiempo de las líneas de retardo 108a-d pueden referirse a un retardo de un sonido propagado en la sala de reproducción virtual antes de llegar a una posición de escucha virtual. Cada vía de retardo 106a-d puede estar relacionada con un altavoz virtual 130a-d en la sala de reproducción virtual 130. Esto permite un escalado del aparato 100 basado en una cantidad de altavoces virtuales 130a-d en lugar de basarse en una cantidad de fuentes de sonido reproducidas.
[0054] En función de una posición variable de una fuente de audio virtual en la sala de reproducción virtual 130, también los retardos de tiempo pueden variar, por ejemplo, cuando la fuente de audio virtual se mueve más cerca de una pared, entonces el sonido emitido se refleja antes. El aparato 100 comprende un controlador de entrada 140 configurado para conectar las señales de fuente de audio 104a y 104b, versiones amplificadas 104a" y 104b" respectivamente, con diferentes entradas de las líneas de retardo 108a-d, donde las diferentes entradas están relacionadas con un retardo de tiempo diferente entre la entrada y la salida respectiva. Simplificado, el controlador de entrada 140 está configurado para recibir parámetros relacionados con un retardo de tiempo requerido o destinado y para adaptar el retardo de tiempo por el cual la señal de fuente de audio se retrasa por la línea de retardo 108a-d.
[0055] Las señales de salida 102a-d se pueden almacenar, por ejemplo, en una memoria de datos, por ejemplo, un disco duro, un disco de vídeo digital (DVD), Internet u otros medios. Alternativamente, las señales de entrada 102ad pueden proporcionarse a una red de ecualización 141 que comprende filtros de ecualización 142a-d configurados para conformar espectralmente las señales de salida 102a-d. Se puede implementar una conformación espectral de los filtros de ecualización 142a-d según las características de propagación de sonido y/o una dirección de una propagación de sonido del sonido emitido en la sala de reproducción virtual. Por ejemplo, cuando las paredes de la sala de reproducción virtual 130 se adaptan para atenuar altas frecuencias, los filtros de ecualización 142a-d pueden implementarse según tal característica y pueden permitir el ajuste del sonido según una dirección del sonido.
[0056] Por lo tanto, las señales de salida 144a-d de los filtros de ecualización 142a-d pueden configurarse para reproducir la escena de reproducción virtual que comprende los objetos de audio virtuales, la sala de reproducción virtual 130 y los altavoces virtuales132a-d como cuando la sala de reproducción virtual 130 y los altavoces virtuales 132a-d eran reales. Las señales obtenidas 144a-d pueden almacenarse en un medio de almacenamiento y/o proporcionarse a un panoramizador 150 del sistema de audio 1000, donde el panoramizador 150 está configurado para proporcionar señales de altavoz (reales) 152a-f en una cantidad según una cantidad de altavoces reales 162 en una sala de reproducción real 160. Simplificado, el panoramizador 150 está configurado para panoramizar una cantidad de señales de altavoz 144a-d que tienen una cantidad según una cantidad de los altavoces virtuales 132a-d a una cantidad de señales de altavoz 152a-f que tienen una cantidad según una cantidad de altavoces reales 162a-f. En general, una cantidad de altavoces reales 152a-f puede ser mayor o menor que una cantidad de altavoces virtuales 132a-d. Una cantidad de altavoces reales puede depender de una configuración de usuario e incluso puede ser desconocida, cuando se generan las señales de salida 102a-d y/o las señales de altavoz 144a-d. Por lo tanto, la generación de las señales de salida 102a-d y/o de las señales de altavoz 144a-d puede considerarse independiente de la sala de reproducción. Por lo tanto, una cantidad de señales de salida 102a-d, vías de retardo 106a-d y filtros de ecualización 142a-d para filtrar las señales de salida pueden ser iguales. Simplificado, las líneas de retardo 106a-d están asociadas a una dirección de propagación de sonido de las reflexiones tempranas en la sala de reproducción virtual 130. Los parámetros de filtro de los filtros de ecualización 142a-d pueden adaptarse en función de la dirección de propagación del sonido.
[0057] La reproducción de una escena de audio puede comprender la reproducción de sonido directo, es decir, una señal no reflejada del objeto de audio reproducido al oyente. El sistema de reproducción de audio 1000 puede comprender filtros de ecualización 143a y 143b configurados para ecualizar, es decir, conformar espectralmente, la señal de fuente de audio 104a y/o 104b, para obtener señales de fuente de audio con forma espectral 145a y 145b. El panoramizador 150 puede configurarse para recibir las señales de fuente de audio 104a y 104b y/o las señales de forma espectral 145a y 145b. El panoramizador 150 puede configurarse además para proporcionar las señales de altavoz 152a-f basado en las señales de altavoz 144a-d y en las señales de fuente de audio 104a y 104b las versiones con forma espectral de estas, respectivamente. Simplificado, el panoramizador 150 puede proporcionar las señales de altavoz 152a-d que comprenden una información relacionada con el sonido directo, las reflexiones tempranas y las reverberaciones tardías.
[0058] Aunque los filtros de ecualización 152a-d se describieron como configurados para recibir la señal de salida 102a-d, los filtros de ecualización 142a-d se pueden configurar también para recibir una señal de línea de retardo intermedia, que, por ejemplo, no está atenuada por los filtros de atenuación 112a-d. Tal escenario se describe más adelante y permite obtener señales de altavoz 144a-d y, por lo tanto, señales de altavoz 152a-d que comprenden señales reverberadas en ausencia de porciones reflejadas.
[0059] El aparato 100 puede comprender un controlador de salida 170 configurado para conectar un filtro de ecualización 142a-d a una toma de salida de una línea de retardo 108a-d. En la toma de salida se puede obtener la señal de línea de retardo intermedia. En función de las características de reflexión de sonido cambiadas de la sala de reproducción virtual, el controlador de salida 170 está configurado además para desconectar el filtro de ecualización 142a-d de la toma de salida de la línea de retardo 108a-d y/o para conectar el filtro de ecualización 142a-d a otra toma de salida. Según una realización, como máximo una toma de salida está conectada al filtro de ecualización 142a-d. Tanto el controlador de entrada 140 como el controlador de salida 170 pueden configurarse para conectar solo una toma de entrada de una línea de retardo, solo una toma de salida respectivamente.
[0060] La figura 2 muestra un diagrama de bloques esquemático de un aparato 200 para generar las señales de altavoz 144a-d según una realización. Cuando se compara con el aparato 100, el aparato 200 comprende los filtros de ecualización 142a-d de modo que las señales de salida 102a-d pueden tener forma espectral internamente, es decir, el aparato 200 está configurado para emitir las señales de altavoz 144a-d como señales de salida.
[0061] El aparato 200 comprende una red de retardo 202 que comprende las vías de retardo 106a-d. La red de retardo 202 y el procesador de retroalimentación 120 forman una FDN, donde el procesador de retroalimentación 120 está configurado para realizar una retroalimentación y/o una alimentación cruzada de las señales de salida 102 a la red de retardo 202.
[0062] En otras palabras, en las figuras 1 y 2 se propone un reverberador multicanal de redes de retardo innovador, que permite el posicionamiento de una gran cantidad de fuentes de sonido con una gran cantidad de altavoces, manteniendo al mismo tiempo la eficiencia computacional. La FDN se extiende para crear una gran cantidad de canales decorrelacionados asignables espacialmente, así como reflexiones tempranas individuales para todas las fuentes y ganar control sobre el tiempo de reverberación espacial y la energía espectral.
[0063] La cantidad de líneas de retardo y la cantidad de fuentes son escalables de uno a enteros superiores. En diseños anteriores tales como el representado en la figura 10, las reflexiones tempranas y la reverberación tardía se obtienen en diferentes redes que pueden tener que escalarse según una cantidad de canales de entrada (fuentes). Además, la FDN no lleva información de dirección explícita, a veces incluso la minimiza mediante técnicas de alta densidad como la mezcla ortogonal. En la red de retardo de retroalimentación representada en las figuras 1 y 2, las salidas de línea de retardo, es decir, las señales de salida 102a-d, reciben información direccional mediante alimentación directa en un altavoz virtual o mediante la adaptación de las vías de retardo 106a-d según los altavoces virtuales 132a-d. Estos altavoces virtuales se representan a continuación en una sala de reproducción, tal como la sala de reproducción 130, mediante un algoritmo de panoramización del panoramizador 150. Según la situación de representación real, la salida de reverberación se puede garantizar para reproducir las características espaciales correctas con la máxima flexibilidad.
[0064] Una asignación directa de las líneas de retardo a las direcciones virtuales de los altavoces virtuales 132a-d puede proporcionar una solución preferida en comparación con los conceptos conocidos. A la inversa, se asigna una dirección angular a cada salida de línea de retardo filtrada, las señales de salida 102a-d y, por lo tanto, a la propia línea de retardo 108a-d. Esta correspondencia uno-a-uno entre una línea de retardo 108a-d y un altavoz virtual 130a-d, por ejemplo, la línea de retardo 108a al altavoz virtual 130a, se puede considerar importante o incluso más importante cuando se compara con diseños anteriores, se puede introducir un diseño espacial en el marco de FDN. De manera similar, los filtros de atenuación 112a-d y los filtros de ecualización de salida 142a-d pueden corresponder a direcciones espaciales.
[0065] Las direcciones del canal como se indican por los altavoces virtuales 132a-d en la sala de reproducción virtual 130 se panoramizan a continuación a la configuración de altavoz de salida deseada en la sala de reproducción real 160. Cada altavoz virtual 132 puede entenderse como una fuente puntual en una esfera alrededor del oyente, que puede ser reproducida por los altavoces físicos con ganancias ponderadas dependiendo de su posición relativa. Por ejemplo, se puede emplear un panoramizador de amplitud basado en vectores (VBAP) como se describe en [6] como una opción simple y eficaz. Alternativamente, especialmente en un escenario que utiliza una cantidad elevada de altavoces tales como al menos 20, al menos 30 o al menos 50, se puede realizar una panoramización como una llamada panoramización dura, es decir, la señal de altavoz 144a-d se proporciona al altavoz real 162a-f más cercano, es decir, que tiene la distancia más cercana a un altavoz virtual 132a-d que emitiría la señal de sonido.
[0066] La etapa intermedia de una sala de reproducción virtual permite una flexibilidad alta o incluso máxima en la elección de configuraciones de altavoces y mantiene las características espaciales y acústicas de la reverberación con un buen nivel o tal vez lo mejor posible. La matriz de mezcla resultante, es decir, el procesador de retroalimentación 120, es muy escasa en términos de complejidad computacional para configuraciones de altavoces multicanal.
[0067] Las líneas de retardo 108a-d están posicionadas para discretizar la esfera de panoramización alrededor de la posición de escucha. El posicionamiento particular puede ser panoramizado en el diseño de sonido, por ejemplo, se pueden colocar igualmente separadas en la esfera o determinadas secciones de la esfera se pueden mejorar por la cantidad de líneas de retardo.
[0068] Dependiendo de la configuración del altavoz objetivo, ciertas secciones de la esfera pueden omitirse y otras pueden condensarse, por ejemplo, para: configuraciones del altavoz como 5,1 4 o 22,2 partes grandes del hemisferio inferior pueden omitirse, o dependiendo de la aplicación puede ser favorable colocar más líneas de retardo en la parte frontal, la dirección de la etapa natural. Tal área se indica como "frontal" en la figura 9. Cabe señalar que la resolución angular de los altavoces virtuales puede ser mayor que la disposición de los altavoces físicos.
[0069] La figura 3 muestra un diagrama de bloques esquemático de la vía de retardo 106a, donde la siguiente descripción es aplicable también para las otras vías de retardo 106b-d. La vía de retardo 106a comprende la línea de retardo 108a que, por ejemplo, se implementa como un filtro de respuesta de impulso finito. La línea de retardo 108a comprende una multitud de tomas de entrada 302a-d. Por ejemplo, la línea de retardo 108a puede comprender al menos 4, al menos 16, al menos 500 o incluso al menos 1000 tomas de entrada 302a-d. Las tomas de entrada 302ad están configuradas para recibir señales de fuente de audio, tales como las señales de fuente de audio 104a y 104b, una versión y/o una versión amplificada de estas. Por ejemplo, el controlador de entrada 140 representado en la figura 1 puede conectar o desconectar una primera señal de fuente de audio hacia o desde una de las tomas de entrada 302a- d mientras no conecta esta señal de entrada a otras tomas de entrada, de modo que la señal de fuente de audio esté conectada a la línea de retardo 108a en una toma de entrada. Esto permite un tiempo de retardo de variante de tiempo de la línea de retardo. El controlador de entrada 140 puede configurarse para conectar la misma o una toma de entrada diferente 302a-d a una señal de fuente de audio adicional y/o la señal de entrada o una versión (amplificada) de esta a una línea de retardo diferente.
[0070] Las tomas de entrada 302a-d se disponen secuencialmente y con un bloque de retardo 304a-d entre dos tomas de entrada 302a-d. Por lo tanto, una señal recibida en la toma de entrada 302a se reenvía al bloque de retardo 304a, se retrasa y, a continuación, se reenvía a la segunda toma de entrada 302b. Cuando la primera toma de entrada 302a recibe la señal de audio reverberada 114a y cuando la segunda toma de entrada 302b recibe la señal de fuente de audio 104a, la señal de audio reverberada 114a se combina con la señal de fuente de audio 104a en la segunda toma de entrada. Una última toma de salida, por ejemplo, la toma de salida 306c puede ser la salida del filtro que proporciona la señal combinada 116, de modo que una "última" señal de línea de retardo intermedia, por ejemplo, 308c, puede ser la señal combinada.
[0071] De manera alternativa o adicional, por ejemplo, cuando la tercera toma de entrada 302c recibe la señal de fuente de audio 104b, en la tercera toma de entrada 302c se combinan la señal de audio reverberada 114a, la señal de fuente de audio 104a y la señal de fuente de audio 104b. Cada una de las señales 114a, 104a y 104b se retrasa durante un retardo de tiempo diferente, es decir, por una cantidad diferente de bloques de retardo 304a-c. Una señal combinada en una toma de entrada 302a-d puede amplificarse o atenuarse mediante un factor de ganancia o un factor de atenuación k-i-k 3. Las señales amplificadas o atenuadas posteriores se combinan en las tomas de salida 306a-c, donde en las tomas de salida 306a-c se pueden obtener señales de línea de retardo intermedia 308a-c. Por ejemplo, el controlador de salida 170 puede conectar o desconectar una de las tomas de salida 306a-c o una salida del filtro de atenuación 112a con o desde el filtro de ecualización 142a de modo que el filtro de ecualización 142a pueda recibir una de las señales de línea de retardo intermedia 308a-c o la señal de salida 102a.
[0072] Las figuras 4a y 4b representan un diagrama de bloques esquemático de diferentes escenarios para obtener las señales de altavoz 144.
[0073] La figura 4a muestra un diagrama de bloques esquemático de un escenario en el que la señal de altavoz 144 comprende una porción reflejada y una porción reverberada de la señal de fuente de audio 104a. Una línea de retardo 108i que puede ser, por ejemplo, una de las líneas de retardo 108a-d está configurada para recibir una señal de audio reverberada 114i, por ejemplo, una de las señales de audio reverberadas 114a-d, en una primera entrada. En una toma de entrada 302i, que puede ser cualquier toma de entrada tal como una de las tomas de entrada 302ad, la línea de retardo 108i está configurada para recibir una versión amplificada 104a" de la señal de fuente de audio 104a. Por lo tanto, la señal de audio reverberada 114i y la señal de fuente de audio 302i se combinan en la toma de entrada 302i.
[0074] Un tiempo de retardo desde la toma de entrada 302i hasta la salida del filtro, es decir, hasta que el filtro de atenuación 112i recibe la señal combinada 116 puede considerarse como un retardo de reflexión. Una señal de salida 102i del filtro de atenuación 112i, por ejemplo, una de las señales de salida 102a-d, se reenvía al filtro de ecualización 142i de modo que la señal de altavoz 144i comprende una porción reverberada y una porción reflejada. Cuando los filtros de la línea de retardo 108i y/o del filtro de atenuación 112i están, por ejemplo, en un estado inicial o básico, entonces la señal reverberada 114i también puede ser estática y/o inicial, por ejemplo, en un estado cero. Cuando la señal de fuente de audio 104 se aplica al sistema y la línea de retardo 108i recibe la versión amplificada de este, entonces la señal de altavoz 144i puede comprender primero solo la porción reflejada ya que la señal reverberada 114i es diferente del estado cero en la siguiente iteración. Simplificado, la señal de fuente de audio viaja primero una vez a través de partes de la línea de retardo 108i de modo que la señal de altavoz 144i se basa en la señal de fuente de audio retardada (reflejada). A continuación, la señal de salida 102i se reverbera y se combina con la señal de fuente de audio de modo que en un intervalo de tiempo siguiente la señal del altavoz 144i se basa en porciones reflejadas y reverberadas.
[0075] La figura 4b muestra un diagrama de bloques esquemático de un escenario diferente en el que el filtro de ecualización 142i está conectado a una toma de salida 306i, por ejemplo, una de las tomas de salida 306a-c. La toma de salida 306i, cuando se considera esquemáticamente en el dominio de tiempo, está dispuesta "antes" de la toma de entrada 302i conectada a la señal de fuente de audio. Por lo tanto, cuando se considera desde el estado cero, la señal de la fuente de audio primero se retrasa, a continuación, se atenúa mediante el filtro de atenuación 112i, se reverbera mediante el procesador de retroalimentación 120 y se introduce en la línea de retardo 108i. Una señal de línea de retardo intermedia 308i está conectada al filtro de ecualización 142i. En función de este escenario, la señal de altavoz 144i puede comprender siempre porciones reverberadas cuando es diferente del estado cero. De esta manera, se pueden obtener señales con reflexiones bajas o incluso sin reflexiones tempranas. Tal escenario puede ser deseado, por ejemplo, cuando se reproduce una escena acústica donde no se producirán reflexiones tempranas distintas, por ejemplo, en escenarios difusos.
[0076] En otras palabras, para cada fuente, las entradas, es decir, las tomas de entrada, hasta una cantidad de líneas de retardo se pueden elegir de manera que las primeras reflexiones se determinen en ganancia, retardo y dirección aproximada y todas las reflexiones se filtren por el filtro de atenuación. El aparato y procedimiento propuesto viene con un coste computacional reducido en comparación con los procedimientos anteriores conocidos. En el caso de que no se deseen reflexiones espaciales tempranas, se puede realizar una estrategia alternativa como se representa en la figura 4b al diseño de la línea de retardo. La diferencia entre la figura 4a y la figura 4b es únicamente que la posición de la toma de salida, es decir, la toma de salida 308i, está conectada al filtro de ecualización. En lugar de la entrada de matriz de retroalimentación, es decir, la señal de salida 102i, la salida, es decir, la señal de línea de retardo intermedia 308i, se toma desde el principio (una sección delante de la entrada conectada) de la línea de retardo 108i, de manera que la entrada de la fuente se coloca después de la salida. En consecuencia, la señal de salida fue procesada por el procesador de retroalimentación (matriz de retroalimentación) al menos una vez y posiblemente distribuida a todas las direcciones de la línea de retardo. Esto resulta en una reflexión temprana menos prominente y un aumento más rápido de la densidad de reflexión.
[0077] La figura 5a muestra un diagrama de bloques esquemático del procesador de retroalimentación 120 configurado para reverberar las señales de salida 102a-d. Tal como se puede representar mediante operaciones de matriz, el procesador de retroalimentación está configurado para combinar las señales de salida 102a-d con diferentes parámetros de reverberación aii-a44. Los parámetros a-n, a22, a33 y a44 en la diagonal de la matriz A se refieren a una variación (amplificación o atenuación) de la señal de salida 102a- d. Otros valores se refieren a influencias (reverberación) de otras señales de salida 102a-d a una señal de salida respectiva. Por lo tanto, las señales de audio reverberadas 114a-d pueden basarse y/o verse influenciadas por una o más señales de salida 102a. Los valores de los parámetros an-a44 pueden referirse a una configuración de la sala de reproducción virtual, por ejemplo, una configuración de altavoz y/o características de reflexión de la sala de reproducción virtual que influyen en la reverberación. Simplificado, la operación de matriz puede señalarse, por ejemplo, como:
Figure imgf000012_0001
o, alternativamente
Figure imgf000012_0002
donde r indica un vector que comprende las señales reverberadas 114a-d, A indica la matriz de reverberación, o indica las señales de salida 102a-d y xT indica una versión transpuesta de x.
[0078] La figura 5b muestra un diagrama esquemático de la sala de reproducción virtual 130 que comprende, por ejemplo, dos subsalas 136a y 136b. La subsala 136a puede ser, por ejemplo, una parte frontal o un primer lado de una sala. La sala de reproducción virtual 130 comprende características de propagación, por ejemplo, definidas por objetos virtuales en la sala y/o un material de los objetos o las paredes, así como por las propias estructuras.
[0079] La subsala 136b puede ser, por ejemplo, un lado posterior o un segundo lado diferente de la sala de reproducción virtual 130 en comparación con la subsala 136a. La subsala 136a puede parametrizarse mediante un bloque de parámetros U1 (que comprende un subconjunto de los parámetros an - a44). La subsala 136b puede parametrizarse mediante un bloque de parámetros U2 (que comprende un subconjunto al menos parcialmente diferente de los parámetros an - a44). Los bloques de parámetros V1 y V2 indican un acoplamiento acústico desde la primera subsala 136a a la segunda subsala 136b, desde la segunda subsala 136b a la primera subsala 136a, respectivamente. La matriz A puede estructurarse según los bloques de parámetros U1, U2 , V1 y V2. Las subsalas 136a y 136b también pueden ser dos salas diferentes que comprenden un acoplamiento acústico entre sí, por ejemplo, dos salas conectadas por una puerta. Esto permite una fácil parametrización de la sala de reproducción virtual 130. La parametrización puede obtenerse en función de la información direccional mantenida de las reflexiones y/o de las reverberaciones.
[0080] En otras palabras, la matriz de retroalimentación A menudo se elige para controlar la densidad de reflexión. Cada entrada en la matriz indica la ganancia de una línea de retardo a otra. Cuanto más densa sea la matriz, más densa será la cola de reverberación. El aparato y procedimiento propuestos permiten subdividir la matriz A en secciones direccionales para controlar la propagación direccional de las reflexiones a lo largo del tiempo. Se conoce la dirección virtual de las líneas de retardo, de modo que una entrada de matriz indique la propagación de una dirección a otra, por ejemplo, una entrada diagonal mantenga la dirección. Para salas homogéneas, donde cada dirección se mezcla entre sí, pueden ser apropiadas ganancias de matriz uniformes. Dos salas acopladas acústicamente, por ejemplo, una sala y un pasillo vecino se pueden implementar mediante una matriz de bloques 2x2.
[0081] Los bloques diagonales U1 y U2 controlan la mezcla de, por ejemplo, la sala delantera y la trasera, respectivamente. Los bloques no diagonales V1 y V2 pueden controlar la fuga entre las salas acopladas.
[0082] La figura 6a muestra una vista superior esquemática de una distribución de 16 líneas de retardo en un hemisferio superior de una sala de reproducción virtual 130. Cada punto 603 corresponde a una posición de un altavoz virtual en la sala de reproducción virtual 130 y puede adaptarse mediante los parámetros de una vía de retardo asociada. Por lo tanto, el altavoz virtual se define al menos parcialmente por una posición angular de línea de retardo virtual, es decir, por una posición basada en parámetros de la línea de retardo de la vía de retardo. Los altavoces virtuales se distribuyen de manera desigual, es decir, asimétrica. Diez de dieciséis altavoces virtuales están dispuestos en una sección frontal con respecto a la posición de un oyente 604 y con respecto a una dirección frontal indicada como cero grados. Seis de los dieciséis altavoces virtuales están dispuestos en una región posterior de la sala de reproducción virtual. Según la cantidad de dieciséis altavoces virtuales, el aparato 100 o 200 comprende 16 vías de retardo. En otras palabras, la figura 6a muestra una distribución de 16 líneas de retardo en el hemisferio superior.
[0083] La figura 6b muestra una implementación esquemática de un acoplamiento acústico entre los altavoces virtuales realizado por los parámetros de la matriz A. Cada una de las flechas 606 representa un acoplamiento entre dos altavoces, es decir, un parámetro ay que es desigual a cero. En contraste, las flechas de puntos 608 indican que a lo largo de la vía respectiva no hay acoplamiento acústico que pueda implementarse mediante un parámetro ay igual a cero. Una superficie sombreada gris dispuesta en la región frontal corresponde, por ejemplo, a la primera subsala 136a de la sala de reproducción virtual 130. Una superficie sombreada gris dispuesta en la parte posterior de la subsala virtual 130 puede corresponder, por ejemplo, a la subsala 136b. Como la línea de retardo se relaciona con una dirección y con una posición de un altavoz virtual en la sala de reproducción virtual, también se puede relacionar con una distancia entre el altavoz virtual y una estructura que refleja el sonido de la sala de reproducción virtual 130. ay también se puede indicar como parámetros de reverberación ya que se relacionan con la reverberación de las señales sonoras basadas en el acoplamiento acústico de la sala de reproducción virtual. Los parámetros ay se pueden ajustar según una característica de reverberación de la sala de reproducción virtual 130. De este modo, el tiempo de reverberación y, por lo tanto, los coeficientes de filtro correspondientes pueden adaptarse según y/o dependiendo de una dirección de llegada (sonora).
[0084] Por consiguiente, los filtros de atenuación y/o los filtros de ecualización relacionados con altavoces virtuales dispuestos en diferentes subsalas pueden ajustarse de manera diferente, es decir, puede ser que implementen diferentes características de reverberación.
[0085] En otras palabras, la figura 6b muestra un esquema esquemático para la mezcla dependiente de la dirección para un acoplamiento frontal y trasero e incluye una selección de una vía de ganancia representada como flechas entre las direcciones de la línea de retardo en la distribución de la línea de retardo de la figura 6a. Los tiempos de reverberación en geometrías de sala simples se pueden describir mediante una sola curva. Los casos más extremos de salas acopladas, o salas poco homogéneas como catedrales con techos altos en forma de cúpula pueden tener un tiempo de reverberación dependiente direccional. El procedimiento y aparato propuestos permiten un ajuste dependiente de la dirección del tiempo de reverberación. Esto se basa en las matrices de mezcla dependientes de la dirección A. Si los bloques están casi aislados y la mezcla se propaga lentamente, el filtrado espectral de los filtros de atenuación 112a-d permanece intacto para cada dirección. Siguiendo el ejemplo anterior de una sala acoplada, que se representa en las figuras 5b y 6b, al elegir una resistencia de atenuación diferente para el filtro de atenuación en la sala y el pasillo, es decir, las subsalas 136a y 136b, se pueden lograr diferentes tiempos de reverberación en la parte frontal y trasera. Otro ejemplo es un largo tiempo de reverberación en el techo de la cúpula de una catedral. Dentro de una sala de conciertos, un tiempo de reverberación corto en la dirección de la orquesta y un tiempo de reverberación más largo envolvente desde los lados de la parte trasera pueden crear un entorno musicalmente equilibrado.
[0086] La figura 7 muestra un diagrama de bloques esquemático de una posible realización del filtro de atenuación 112a, donde la siguiente descripción se aplica también a los filtros de atenuación 112b-d. El filtro de atenuación 112a está configurado para controlar el tiempo de reverberación y la difusividad de la red de retardo de retroalimentación. La coloración y difusión de las reflexiones tempranas puede llevar importantes señales perceptivas de la geometría de la sala y los materiales de contorno. El filtro de atenuación 112a que se dispone en la salida del retardo puede asegurar que no hay copia no procesada de la señal directa en la salida de red de retardo de retroalimentación, que puede obtenerse, por ejemplo, cuando la señal de fuente de audio está conectada a la última toma de entrada de la línea de retardo de una vía de retardo. Cuando el filtro de atenuación 112a está dispuesto para ajustar el tiempo de reverberación, el filtrado de las reflexiones tempranas puede lograrse sin costes adicionales en términos de filtros adicionales. Aunque el filtro de atenuación 112a se representa como realizado como una estructura de respuesta de impulso infinito (IIR) de forma directa 2, el filtro de atenuación 112a se puede realizar también como otro tipo de filtro, por ejemplo, como una estructura IIR de forma directa 1, como un filtro IIR en cascada, un filtro enrejado o similares. Alternativamente, también se puede disponer un filtro con una estructura de respuesta de impulso finito.
[0087] En otras palabras, para colocar una cierta reflexión en dirección y tiempo, se puede elegir la línea de retardo más cercana a la dirección de llegada deseada y la entrada se coloca en la línea de retardo con la distancia adecuada. La dirección de la reflexión temprana es aproximada por la distribución de la línea de retardo angular y puede reflejar la percepción de DOA disminuida para las reflexiones tempranas. En comparación con los procedimientos conocidos, no importa cuántas fuentes de entrada se representen, no se necesita memoria adicional para las líneas de retardo externas. Además, se puede omitir la unidad de panoramización dedicada a las reflexiones tempranas. En los procedimientos conocidos, se debe realizar típicamente un procesamiento adicional de la salida de reflexión temprana para evitar reflexiones tempranas sin atenuar. Los costes computacionales de las entradas adicionales son prácticamente iguales al coste de las salidas de reflexión temprana.
[0088] Típicamente, la energía espectral general de una reverberación hecha para ajustarse, por ejemplo, mediante una conformación espectral como se describe para los filtros de ecualización 142a-d en las figuras 1 y 2. Esto se puede realizar en la salida FDN en el aparato o como un aparato externo. Por lo tanto, el ajuste de energía espectral se puede realizar basado en canal. Sin embargo, a menudo las salas tienen diferentes materiales de contorno y, por lo tanto, curvas de energía espectral variables, por ejemplo, las reflexiones traseras tienen menos recorrido debido a una pared trasera suave que las reflexiones frontales que rebotan de un material rígido. Las realizaciones descritas anteriormente permiten un ajuste dependiente de la dirección de la energía espectral. A medida que se conocen las direcciones de panoramización de las líneas de retardo 108a-d en la sala de reproducción virtual 130, los filtros de ecualización 142a-d pueden diseñarse según la dirección. Mediante el uso de este concepto, la energía espectral espacial puede ser independiente de la configuración final del altavoz y es consistente en todas las opciones. El concepto propuesto integra las reflexiones tempranas en el marco de las FDN existentes. Para cada fuente de entrada, es decir, señal de fuente de audio, hay una entrada en cada línea de retardo como se describe en la figura 3 con respecto a la figura 1. La "distancia" entre la entrada y la salida puede dar el retardo de reflexión. La ganancia de la reflexión se determina mediante la ganancia de entrada aplicada por los amplificadores 122.
[0089] El concepto propuesto presenta técnicas de reverberación paramétrica multicanal espacial. Se basa en la Red de retardo de retroalimentación (Feedback Delay Network) como el representante más general de los reverberadores de la red de retardo.
[0090] El concepto propuesto introduce una interpretación espacial de las líneas de retardo. El nivel intermedio de una sala de escucha virtual proporciona flexibilidad ponderada con configuraciones de altavoces objetivo a través de un algoritmo de panoramización. Por lo tanto, es aplicable una técnica integrada para las reflexiones tempranas. Al mismo tiempo, se pueden mantener los costes computacionales y controlar la dirección de llegada. Además, el procedimiento propuesto permite un ajuste eficiente de la energía espectral dependiente de la dirección, el tiempo de mezcla y reverberación. El concepto propuesto permite la creación de reverberación espacial para la reproducción en configuraciones de altavoces multicanal 3D. Por consiguiente, el concepto propuesto proporciona técnicas para la reverberación paramétrica multicanal espacial. Se propone un reverberador multicanal de redes de retardo innovador, que permite el posicionamiento de una gran cantidad de fuentes sonoras con una gran cantidad de altavoces, manteniendo al mismo tiempo la eficiencia computacional. El concepto propuesto introduce una interpretación espacial de las líneas de retardo y una técnica integrada para procesar las reflexiones tempranas. Además, el concepto propuesto permite un ajuste eficiente de la energía espectral dependiente de la dirección, el tiempo de mezcla y reverberación.
[0091] Los filtros de atenuación de la FDN y/o los filtros de ecualización se pueden implementar como filtros IIR que tienen una cantidad baja de coeficientes de filtro tales como a lo sumo 200, a lo sumo 100 o a lo sumo 50 y/o un orden bajo del filtro, tal como, por ejemplo, a lo sumo del orden 8, del orden 5 o del orden 3 o inferior. Los factores de atenuación de los filtros de atenuación se pueden ajustar en función de un tiempo de reverberación selectivo de frecuencia de la señal combinada. Los coeficientes de filtro de los filtros de ecualización pueden basarse en una energía espectral selectiva de frecuencia de la señal de salida, la señal de línea de retardo intermedia, respectivamente. Además, los coeficientes de filtro de los filtros de atenuación y/o del filtro de ecualización pueden establecerse según una dirección de llegada del sonido que se va a implementar.
[0092] Aunque las realizaciones descritas anteriormente se refieren a una cantidad de cuatro y dieciséis líneas de retardo, otras realizaciones se refieren a una cantidad diferente de líneas de retardo y, por lo tanto, altavoces virtuales, por ejemplo, al menos tres, al menos ocho, doce o dieciséis.
[0093] Aunque las realizaciones anteriores se refieren a una realización del procesador de retroalimentación de modo que el procesador de retroalimentación esté configurado para realizar operaciones basadas en matriz, el procesador de retroalimentación puede estar configurado de manera alternativa o adicional para realizar otros tipos de operaciones tales como una operación de convolución relacionada con una matriz (por ejemplo, relacionada con filtros IIR o FIR), una transformación, una diferencia, una división y/u operaciones no lineales.
[0094] Aunque las realizaciones anteriores se refieren a una sala de reproducción que comprende seis altavoces, una sala de reproducción puede comprender también una cantidad diferente de altavoces, por ejemplo, al menos dos, al menos cuatro, diez o más.
[0095] Aunque las realizaciones anteriores se refieren a líneas de retardo que se implementan como filtros FIR, las líneas de retardo se pueden realizar también como diferentes tipos de filtros y/o sin parámetros de atenuación o ganancia. Por ejemplo, una multitud de bloques de retardo se pueden implementar digitalmente de modo que la línea de retardo se pueda caracterizar por una cantidad simple de bloques de retardo para señales de retardo.
[0096] Aunque las realizaciones anteriores se refieren a una sala de reproducción virtual que comprende dos subsalas o una sala, la sala de reproducción virtual puede comprender también tres o más subsalas. Por consiguiente, la matriz A puede comprender también una cantidad diferente de bloques de parámetros que pueden separarse o combinarse (superponerse parcialmente) entre sí y donde una cantidad de bloques de parámetros y/o vías de retardo pueden basarse en una cantidad de vías de acoplamiento entre las subsalas. Sin embargo, aunque la matriz A se representa como cuadrática, en función de los parámetros de acoplamiento, la matriz A también puede ser no cuadrática y/o comprender una o más matrices relacionadas con la subsala que tienen una forma no cuadrática.
[0097] Aunque se han descrito algunos aspectos en el contexto de un aparato, es evidente que estos aspectos representan también una descripción del procedimiento correspondiente, donde un bloque o dispositivo corresponde a una etapa de procedimiento o un rasgo de una etapa de procedimiento. De forma análoga, los aspectos descritos en el contexto de una etapa de procedimiento representan también una descripción de un bloque o elemento o rasgo correspondiente de un aparato correspondiente.
[0098] La señal de audio codificada de la invención puede almacenarse en un medio de almacenamiento digital o puede transmitirse en un medio de transmisión tal como un medio de transmisión inalámbrico o un medio de transmisión por cable, tal como Internet.
[0099] Dependiendo de ciertos requisitos de implementación, las realizaciones de la invención pueden implementarse en hardware o software. La implementación puede ser efectuada utilizando un medio de almacenamiento digital, por ejemplo, un disco flexible, un DVD, un CD, un ROM, un PROM, un EPROM, un EEPROM o una memoria flash que tiene señales de control legibles electrónicamente almacenadas en el mismo que cooperan (o son capaces de cooperar) con un sistema informático programable de tal manera que se efectúa el procedimiento respectivo.
[0100] Algunas realizaciones según la invención comprenden un soporte de datos que tiene señales de control legibles electrónicamente, que son capaces de cooperar con un sistema informático programable, de modo que se realiza uno de los procedimientos descritos en esta invención.
[0101] En general, las realizaciones de la presente invención pueden implementarse como un producto de programa informático con un código de programa, siendo el código de programa operativo para realizar uno de los procedimientos cuando el producto de programa informático se ejecuta en un ordenador. El código de programa puede almacenarse, por ejemplo, en un soporte legible por máquina.
[0102] Otras realizaciones comprenden el programa informático para realizar uno de los procedimientos descritos en esta invención, almacenados en un soporte legible por máquina.
[0103] En otras palabras, una realización del procedimiento inventivo es, por lo tanto, un programa informático que tiene un código de programa para realizar uno de los procedimientos descritos en esta invención, cuando el programa informático se ejecuta en un ordenador.
[0104] Una realización adicional del procedimiento inventivo es, por lo tanto, un soporte de datos (o un medio de almacenamiento digital, o un medio legible por ordenador) que comprende, grabado en el mismo, el programa informático para realizar uno de los procedimientos descritos en esta invención.
[0105] Una realización adicional del procedimiento inventivo es, por lo tanto, un flujo de datos o una secuencia de señales que representan el programa informático para realizar uno de los procedimientos descritos en esta invención. El flujo de datos o la secuencia de señales pueden estar configurados, por ejemplo, para que se transfieran a través de una conexión de comunicación de datos, por ejemplo, a través de Internet.
[0106] Una realización adicional comprende un medio de procesamiento, por ejemplo, un ordenador, o un dispositivo lógico programable, configurado para o adaptado para realizar uno de los procedimientos descritos en esta invención.
[0107] Una realización adicional comprende un ordenador que tiene instalado en el mismo el programa informático para realizar uno de los procedimientos descritos en esta invención.
[0108] En algunas realizaciones, puede usarse un dispositivo lógico programable (por ejemplo, una matriz de puertas programable por campo) para realizar algunas o todas las funcionalidades de los procedimientos descritos en esta invención. En algunas realizaciones, una matriz de puertas programable por campo puede cooperar con un microprocesador con el fin de realizar uno de los procedimientos descritos en esta invención. En general, los procedimientos se realizan preferentemente mediante cualquier aparato de hardware.
[0109] Las realizaciones descritas anteriormente son simplemente ilustrativas de los principios de la presente invención. Se entiende que, para otros expertos en la materia, resultarán evidentes modificaciones y variaciones de las disposiciones y los detalles descritos en esta invención. Por lo tanto, la intención es que esté limitada solo por el alcance de las reivindicaciones de patente inminentes y no por los detalles específicos presentados a modo de descripción y explicación de las realizaciones de esta invención.
Bibliografía
[1] S. Diedrichsen, "Methods, modules, and computer-readable recording media for providing a multichannel convolution reverb," Patente US8363843 BB, 2013.
[2] P. S. Anand, "Method and device for artificial reverberation," Patente US2002067836 AA, 2001.
[3] J. M. Jot, "Method and system for artificial spa- tialisation of digital audio signals," Patente US5491754 A, 1996.
[4] J.-M. Jot, "An analysis/synthesis approach to realtime artificial reverberation," in International Conference on Acoustics, Speech, and Signal Processing, ICASSP-92., vol. 2. IEEE, 1992, págs. 221-224.
[5] L. Dahl and J.-M. Jot, "A reverberator based on absorbent all-pass filters," en Proc. COST G-6 Conference on Digital Audio Effects (DAFX-00), 2000.
[6] V. Pulkki, "Virtual sound source positioning using vector base amplitude panning," Journal of the Audio Engineering Society, vol. 45, n. ° 6, págs. 456-466, 1997.

Claims (19)

REIVINDICACIONES
1. Aparato (100; 200) para generar una primera multitud de señales de salida (102a-d) en función de al menos una señal de fuente de audio (104a, 104b), comprendiendo el aparato:
una red de retardo (202) que comprende una segunda multitud de vías de retardo (106a-d) teniendo cada vía de retardo (106a-d) una línea de retardo (108a-d) y un filtro de atenuación (112a-d), estando la línea de retardo de cada vía de retardo (108a-d) configurada para retrasar las señales de entrada de línea de retardo (104a-b, 104a", 104b", 114a-d) y para combinar la al menos una señal de fuente de audio (104a-b, 104a", 104b") y una señal de audio reverberada (114a-d) para obtener una señal combinada (116), donde el filtro de atenuación (112a-d) de cada vía de retardo (106a-d) está configurado para filtrar la señal combinada (116) de la línea de retardo (108a-d) de la vía de retardo (106a-d) para obtener una señal de salida (102a-d), donde la primera multitud de señales de salida comprende la señal de salida (102a-d) de cada vía de retardo; y un procesador de retroalimentación (120) configurado para reverberar la primera multitud de señales de salida (102a-d) para obtener una tercera multitud de señales de audio reverberadas (114a-d) que comprende la señal de audio reverberada de cada vía de retardo; donde la señal combinada de cada vía de retardo (116) comprende una porción de señal de fuente de audio (104ab) y una porción de señal reverberada (114) y donde la línea de retardo de cada vía de retardo (108a-d) comprende una sexta multitud de tomas de entrada (302a-d) que están configuradas para recibir la señal de fuente de audio (104a-b) o una versión ponderada (104a", 104b") de la señal de fuente de audio, donde el aparato (100) comprende un controlador de entrada (140) configurado para conectar la señal de fuente de audio (104a-b) o la versión ponderada (104a", 104b") de la señal de fuente de audio y una de la sexta multitud de tomas de entrada (302a-d) en función de una primera posición de una fuente de audio virtual en una sala de reproducción virtual (130), mientras que no conecta la señal de fuente de audio (104a-b) o la versión ponderada (104", 104b") de la señal de fuente de audio a una toma de entrada diferente de la sexta multitud de tomas de entrada (103a-d), y donde el controlador de entrada (140) está configurado para desconectar la señal de fuente de audio (104a- b) o la versión ponderada (104a", 104b") de la señal de fuente de audio de la una de la sexta multitud de tomas de entrada (302ad) en función de una segunda posición de la fuente de audio virtual, siendo la segunda posición diferente de la primera posición; o
donde la señal combinada de cada vía de retardo (116) comprende una porción de señal de fuente de audio (104ab) y una porción de señal reverberada (114) y donde la línea de retardo (108a-d) comprende una séptima multitud de tomas de salida (308a-c) que están configuradas para proporcionar la señal combinada (116) o una señal de línea de retardo intermedia (308a-c), donde el aparato (100) comprende un controlador de salida (170) configurado para conectar un filtro de ecualización (142a-d) a la señal de salida (102a-d) o a una de la séptima multitud de tomas de salida (308a-c) en función de una primera característica de reflexión de una sala de reproducción virtual (130), mientras que no conecta una toma de salida diferente de la séptima multitud de tomas de salida (308a-c) al filtro de ecualización (142a-d), y donde el controlador de salida (170) está configurado para desconectar el filtro de ecualización (142a-d) de la señal de salida (102a-d) o de la señal de línea de retardo intermedia (308a-c) en función de una segunda característica de reflexión de la sala de producción virtual (130) que es diferente de la primera característica.
2. Aparato (200) según la reivindicación 1 que está configurado para generar una cuarta multitud de señales de altavoz (144a-d) en función de la al menos una señal de fuente de audio (104a-d),
donde la red de retardo (202) comprende una quinta multitud de filtros de ecualización (142a-d) que están configurados para conformar espectralmente la primera multitud de señales de salida (102a-d) o señales de línea de retardo intermedias (308a-c) para obtener la cuarta multitud de señales de altavoz (144a-d), siendo las señales de línea de retardo intermedias (308a-c) recibidas de una toma de salida (306a-c) de la línea de retardo (108a-d).
3. Aparato según la reivindicación 1 o 2, donde una cantidad de la primera multitud, la segunda multitud, la tercera multitud y una quinta multitud de filtros de ecualización (142a-d) es igual.
4. Aparato según la reivindicación 2 o 3, donde las líneas de retardo (108a-d) están asociadas a una dirección de llegada con respecto a una posición de escucha de un sonido reflejado en una sala de reproducción virtual (130), donde los parámetros de filtro del filtro de ecualización (142a-d) se adaptan en función de la dirección de llegada.
5. Aparato según cualquiera de las reivindicaciones anteriores, que comprende además un distribuidor (118a, 118b) configurado para distribuir la señal de fuente de audio (104a, 104b) en una cantidad de versiones de este (104a', 104b'), siendo la cantidad de versiones (104a', 104b') al menos una cantidad de la segunda multitud de vías de retardo (106a-d), teniendo las versiones (104a', 104b') de la señal de fuente de audio (104a, 104b), entre sí, un retardo de como máximo el 20 % de un retardo de tiempo máximo de la segunda multitud de líneas de retardo (106ad).
6. Aparato según cualquiera de las reivindicaciones anteriores, donde el distribuidor (118a, 118b) comprende además una octava multitud de amplificadores (122) que están configurados para ponderar las versiones (104a', 104b') de la señal de fuente de audio (104a, 104b) para obtener versiones ponderadas (104a", 104b") de la señal de fuente de audio (104a, 104b), donde las versiones ponderadas (104a", 104b") de la señal de fuente de audio (104a, 104b) están asociadas a una señal de audio de una fuente de sonido virtual en una sala de reproducción virtual (130) que comprende altavoces virtuales (132a-d) y donde un factor de ganancia de un amplificador (122) de la octava multitud de amplificadores (122) está asociado a una característica de la reflexión de la fuente de audio en la sala de reproducción virtual (130).
7. Aparato según cualquiera de las reivindicaciones anteriores,
donde el filtro de atenuación (112a-d) comprende una novena multitud de coeficientes de filtro (a0-an, p-i-pn); donde la vía de retardo (106a-d) está asociada con una posición virtual de un altavoz virtual (132a-d) en una sala de reproducción virtual (130) que tiene características de propagación de sonido virtual y estructuras de reflexión de sonido;
donde los coeficientes de filtro (a0-an, p1-pn) están relacionados con un tiempo de reverberación de la sala de reproducción virtual (130) en la que se reverbera la señal de la fuente de audio.
8. Aparato según cualquiera de las reivindicaciones 1-6,
donde el filtro de atenuación (112a-d) comprende una novena multitud de coeficientes de filtro (a0-an, p1-pn); donde la vía de retardo (106a-d) está asociada con una posición virtual de un altavoz virtual (132a-d) en una sala de reproducción virtual (130) que tiene características de propagación de sonido virtual y estructuras de reflexión de sonido;
donde la señal combinada (116) comprende una información direccional de una señal de audio reflejada o una señal de audio reverberada que se refleja o reverbera en la sala de reproducción virtual (130);
donde un retardo de tiempo por el cual la señal de fuente de audio (104a, 104b) se retrasa por la línea de retardo (108a-d) se relaciona con una distancia entre un altavoz virtual (132a-d) y una estructura que refleja el sonido de la sala de reproducción virtual (130);
donde los coeficientes de filtro (a0-an, p1-pn) están relacionados con un tiempo de reverberación y una característica de difusión de la sala de reproducción virtual (130) o con una dirección de llegada del sonido.
9. Aparato según cualquiera de las reivindicaciones anteriores, donde el procesador de retroalimentación (120) está configurado para combinar la primera multitud de señales de salida (102a-d) para obtener la tercera multitud de señales de audio reverberadas (114a-d), donde el procesador de retroalimentación (120) está configurado para combinar la primera multitud de señales de salida (102a-d) en función de parámetros de reverberación (a-n-a44), estando los parámetros de reverberación relacionados con una característica de reflexión de una sala de reproducción virtual (130) que comprende una fuente de audio virtual, estando la fuente de audio virtual asociada a la señal de fuente de audio (104a, 104b), donde la característica de reverberación es independiente de una posición de la fuente de audio virtual en la sala de reproducción virtual (130).
10. Aparato según la reivindicación 9, donde los parámetros (a-n-a44) se refieren a una pluralidad de subsalas (136a, 136b) de la sala de reproducción virtual (130) y donde los parámetros de reverberación (a-n-a44) se pueden representar en una notación de matriz basada en:
Figure imgf000018_0001
donde U1 indica parámetros de reverberación de una primera subsala (136a), donde U2 indica características de reverberación de una segunda subsala (136b), donde V1 indica parámetros de acoplamiento de la primera subsala (136a) a la segunda subsala (136b) y donde V2 indica parámetros de acoplamiento de la segunda subsala (136b) a la primera subsala (136a).
11. Aparato según la reivindicación 9 o 10, donde los filtros de atenuación (112a-d) comprenden una estructura de respuesta de impulso infinito y donde los parámetros de filtro (a0-an, p1-pn) de la estructura de respuesta de impulso infinito se adaptan de modo que las primeras características de reverberación de una primera subsala (136a) de la sala de reproducción virtual (130) sean diferentes de las segundas características de reverberación de una segunda subsala (136b) de la sala de reproducción virtual (130).
12. Aparato según cualquiera de las reivindicaciones anteriores, donde la red de retardo (202) comprende una quinta multitud de filtros de ecualización (142a-d) que están configurados para conformar espectralmente las señales de salida (102a-d), señales de línea de retardo intermedias (308a-c) o las señales combinadas (116) para obtener una cuarta multitud de señales de altavoz (144) que se relacionan con altavoces virtuales (132a-d) de una sala de reproducción virtual (130) y donde la cuarta multitud de señales de altavoz (144a-d) está configurada para almacenarse en un medio de almacenamiento de modo que una décima multitud de señales de altavoz reales (152af) que se relacionan con altavoces reales (162a-f) de una sala de reproducción real (160) se pueda obtener mediante un aparato (150) que está configurado para panoramizar la cuarta multitud de señales de altavoz (144a-d) a la décima multitud de señales de altavoz reales (144a-f).
13. Aparato según cualquiera de las reivindicaciones anteriores, donde la línea de retardo (106a-d) está configurada además para combinar al menos dos señales de fuente de audio (104a, 104b) y la señal de audio reverberada (114), donde la línea de retardo (106a-d) está configurada para aplicar un primer retardo de tiempo a una primera señal de fuente de audio (104a) y un segundo retardo de tiempo a una segunda señal de fuente de audio (104b).
14. Aparato según cualquiera de las reivindicaciones anteriores, donde una línea de retardo (106a-d) de la segunda multitud de líneas de retardo está asociada a una dirección de un altavoz virtual (132a-d) con respecto a una posición virtual (604) de un oyente en una sala de reproducción virtual (130) que comprende el altavoz virtual (132ad), donde una distribución de altavoces virtuales (132a-d) en la sala de reproducción virtual (130) es desigual.
15. Sistema de reproducción de sonido (1000) que comprende:
un aparato (100, 200) según cualquiera de las reivindicaciones 1-14;
una undécima multitud de altavoces (162a-f); y
un panoramizador (150) configurado para recibir una cuarta multitud de señales de altavoz (144a-d) derivadas de la primera multitud de señales de salida (102a-d) y para panoramizar la cuarta multitud de señales de altavoz (144a-d) a una duodécima multitud de señales de altavoz panoramizadas (152a-f), teniendo la duodécima multitud de señales de altavoz panoramizadas una cantidad de señales de altavoz que es igual a una cantidad de altavoces (162a-f) de la undécima multitud de altavoces;
donde el panoramizador (150) está configurado para mantener una característica de propagación de sonido de una sala de reproducción virtual (130) asociada a la cuarta multitud de señales de altavoz (144a-d) al panoramizar la cuarta multitud de señales de altavoz.
16. Procedimiento para generar una primera multitud de señales de salida en función de al menos una señal de fuente de audio, comprendiendo el procedimiento:
retrasar y combinar la al menos una señal de fuente de audio (104a, 104b) y una señal de audio reverberada (114) con una línea de retardo (108a-d) para obtener una señal combinada (116);
filtrar la señal combinada (116) de la línea de retardo (108a-d) para obtener una señal de salida (102a-d), donde la señal de salida está compuesta por la primera multitud de señales de salida y donde la primera multitud de señales de salida (102a-d) se obtiene de una segunda multitud de vías de retardo (106a-d), teniendo cada vía de retardo una línea de retardo; y
reverberar la primera multitud de señales de salida (102a-d) para obtener una tercera multitud de señales de audio reverberadas (114) que comprenden la señal de audio reverberada;
donde
la señal combinada (116) comprende una porción de señal de fuente de audio (104a-b) y una porción de señal reverberada (114) y donde la línea de retardo (108a-d) comprende una sexta multitud de tomas de entrada (302ad) que están configuradas para recibir la señal de fuente de audio (104a-b) o una versión ponderada (104a", 104b") de la señal de fuente de audio, comprendiendo el procedimiento:
conectar la señal de fuente de audio (104a- b) o la versión ponderada (104a", 104b") de la señal de fuente de audio y una de la sexta multitud de tomas de entrada (302a-d) en función de una primera posición de una fuente de audio virtual en una sala de reproducción virtual (130), mientras no se conecta la señal de fuente de audio (104a- b) o la versión ponderada (104", 104b") de la señal de fuente de audio a una toma de entrada diferente de la sexta multitud de tomas de entrada (103a- d), y
desconectar la señal de fuente de audio (104a-b) o la versión ponderada (104a", 104b") de la señal de fuente de audio de la una de la sexta multitud de tomas de entrada (302a-d) en función de una segunda posición de la fuente de audio virtual, siendo la segunda posición diferente de la primera posición;
o donde
la señal combinada (116) comprende una porción de señal de fuente de audio (104a-b) y una porción de señal reverberada (114) y donde la línea de retardo (108a-d) comprende una séptima multitud de tomas de salida (308ac) que están configuradas para proporcionar la señal combinada (116) o una señal de línea de retardo intermedia (308a-c), comprendiendo el procedimiento
conectar un filtro de ecualización (142a-d) a la señal de salida (102a-d) o a una de la séptima multitud de tomas de salida (308a-c) en función de una primera característica de reflexión de una sala de reproducción virtual (130), mientras no se conecta una toma de salida diferente de la séptima multitud de tomas de salida (308a-c) al filtro de ecualización (142a-d), y desconectar el filtro de ecualización (142a-d) de la señal de salida (102a-d) o de la señal de línea de retardo intermedia (308a-c) en función de una segunda característica de reflexión de la sala de producción virtual (130) que es diferente de la primera característica.
17. Procedimiento según la reivindicación 16, que comprende además, para generar una cuarta multitud de señales de altavoz en función de la al menos una señal de fuente de audio: conformar espectralmente la primera multitud de señales de salida (102a-d) o señales de línea de retardo intermedias (308a-c) para obtener la cuarta multitud de señales de altavoz (144a-d), siendo las señales de línea de retardo intermedias (308a-c) recibidas de una toma de salida (306a-c) de la línea de retardo (106a-d).
18. Un programa informático que tiene un código de programa para ejecutar un procedimiento según la reivindicación 16 o 17, cuando el programa se ejecuta en un ordenador.
19. Señal de altavoz (144a-d) obtenida por un aparato según cualquiera de las reivindicaciones 1-14, estando la señal de altavoz basada en un tiempo de retardo de variante de tiempo de al menos una de las líneas de retardo.
ES15786985T 2014-11-07 2015-10-29 Aparato y procedimiento para generar señales de salida basadas en una señal de fuente de audio, un sistema de reproducción de sonido y una señal de altavoz Active ES2807192T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP14192213.8A EP3018918A1 (en) 2014-11-07 2014-11-07 Apparatus and method for generating output signals based on an audio source signal, sound reproduction system and loudspeaker signal
PCT/EP2015/075141 WO2016071206A1 (en) 2014-11-07 2015-10-29 Apparatus and method for generating output signals based on an audio source signal, sound reproduction system and loudspeaker signal

Publications (1)

Publication Number Publication Date
ES2807192T3 true ES2807192T3 (es) 2021-02-22

Family

ID=51897130

Family Applications (1)

Application Number Title Priority Date Filing Date
ES15786985T Active ES2807192T3 (es) 2014-11-07 2015-10-29 Aparato y procedimiento para generar señales de salida basadas en una señal de fuente de audio, un sistema de reproducción de sonido y una señal de altavoz

Country Status (10)

Country Link
US (1) US9961473B2 (es)
EP (3) EP3018918A1 (es)
JP (1) JP6490823B2 (es)
CN (1) CN107211228B (es)
BR (1) BR112017008519B1 (es)
ES (1) ES2807192T3 (es)
PL (1) PL3216236T3 (es)
PT (1) PT3216236T (es)
RU (1) RU2686026C2 (es)
WO (1) WO2016071206A1 (es)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3698201A4 (en) 2017-10-17 2020-12-09 Magic Leap, Inc. MIXED REALITY SPACE AUDIO
EP3499917A1 (en) 2017-12-18 2019-06-19 Nokia Technologies Oy Enabling rendering, for consumption by a user, of spatial audio content
US11477510B2 (en) 2018-02-15 2022-10-18 Magic Leap, Inc. Mixed reality virtual reverberation
EP3808108A4 (en) * 2018-06-18 2022-04-13 Magic Leap, Inc. SPATIAL AUDIO FOR INTERACTIVE AUDIO ENVIRONMENTS
DE102018210143A1 (de) * 2018-06-21 2019-12-24 Sivantos Pte. Ltd. Verfahren zur Unterdrückung eines akustischen Nachhalls in einem Audiosignal
US10524080B1 (en) * 2018-08-23 2019-12-31 Apple Inc. System to move a virtual sound away from a listener using a crosstalk canceler
JP2022504203A (ja) * 2018-10-05 2022-01-13 マジック リープ, インコーポレイテッド オーディオ空間化のための強調
JP7199930B2 (ja) * 2018-11-21 2023-01-06 任天堂株式会社 音声処理プログラム、情報処理装置、音声処理方法、および情報処理システム
WO2021081435A1 (en) 2019-10-25 2021-04-29 Magic Leap, Inc. Reverberation fingerprint estimation
JP2021131434A (ja) 2020-02-19 2021-09-09 ヤマハ株式会社 音信号処理方法および音信号処理装置
WO2021186107A1 (en) 2020-03-16 2021-09-23 Nokia Technologies Oy Encoding reverberator parameters from virtual or physical scene geometry and desired reverberation characteristics and rendering using these
NL2026361B1 (en) * 2020-08-28 2022-04-29 Liquid Oxigen Lox B V Method for generating a reverberation audio signal
CN112071291A (zh) * 2020-08-28 2020-12-11 北京戴乐科技有限公司 低延迟音频处理设备、系统和方法
US11750745B2 (en) 2020-11-18 2023-09-05 Kelly Properties, Llc Processing and distribution of audio signals in a multi-party conferencing environment
CN112820256B (zh) * 2021-01-14 2022-06-14 四川湖山电器股份有限公司 基于改进的反馈延时网络的混响方法及系统
JP2022144498A (ja) * 2021-03-19 2022-10-03 ヤマハ株式会社 音信号処理方法および音信号処理装置
JP2022144496A (ja) * 2021-03-19 2022-10-03 ヤマハ株式会社 音信号処理方法および音信号処理装置
JP2022144497A (ja) * 2021-03-19 2022-10-03 ヤマハ株式会社 音信号処理方法および音信号処理装置
WO2023083876A2 (en) * 2021-11-09 2023-05-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Renderers, decoders, encoders, methods and bitstreams using spatially extended sound sources
CN114363794B (zh) * 2021-12-27 2023-10-24 北京百度网讯科技有限公司 音频处理方法、装置、电子设备和计算机可读存储介质
GB2616424A (en) * 2022-03-07 2023-09-13 Nokia Technologies Oy Spatial audio rendering of reverberation
GB202206430D0 (en) * 2022-05-03 2022-06-15 Nokia Technologies Oy Apparatus, methods and computer programs for spatial rendering of reverberation

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2688371B1 (fr) 1992-03-03 1997-05-23 France Telecom Procede et systeme de spatialisation artificielle de signaux audio-numeriques.
US5521323A (en) 1993-05-21 1996-05-28 Coda Music Technologies, Inc. Real-time performance score matching
JP3321266B2 (ja) * 1993-09-29 2002-09-03 株式会社モリタ製作所 生体凹部測深装置並びに同装置用の測深用探針及び校正用アダプタ
US5729613A (en) * 1993-10-15 1998-03-17 Industrial Research Limited Reverberators for use in wide band assisted reverberation systems
US5774560A (en) * 1996-05-30 1998-06-30 Industrial Technology Research Institute Digital acoustic reverberation filter network
FI116990B (fi) * 1997-10-20 2006-04-28 Nokia Oyj Menetelmä ja järjestelmä akustisen virtuaaliympäristön käsittelemiseksi
JP4306029B2 (ja) * 1999-06-28 2009-07-29 ソニー株式会社 音場再生システム
US20020067836A1 (en) 2000-10-24 2002-06-06 Paranjpe Shreyas Anand Method and device for artificial reverberation
BRPI0516971A (pt) * 2004-10-26 2008-09-30 Richard S Burwen sistema para gerar eletronicamente uma forma de onda de reverberação artificial a partir de uma forma de onda de entrada e produto de programa de computador
SG135058A1 (en) * 2006-02-14 2007-09-28 St Microelectronics Asia Digital audio signal processing method and system for generating and controlling digital reverberations for audio signals
US8363843B2 (en) 2007-03-01 2013-01-29 Apple Inc. Methods, modules, and computer-readable recording media for providing a multi-channel convolution reverb
US8204240B2 (en) * 2007-06-30 2012-06-19 Neunaber Brian C Apparatus and method for artificial reverberation
PL2478519T3 (pl) * 2009-10-21 2013-07-31 Fraunhofer Ges Forschung Rewerberator i sposób rewerberacji sygnału audio
KR101217544B1 (ko) * 2010-12-07 2013-01-02 래드손(주) 음질 향상 효과를 가지는 오디오 신호를 생성하는 오디오 장치 및 방법

Also Published As

Publication number Publication date
WO2016071206A1 (en) 2016-05-12
JP6490823B2 (ja) 2019-03-27
PL3216236T3 (pl) 2020-10-19
US9961473B2 (en) 2018-05-01
PT3216236T (pt) 2020-07-06
EP3018918A1 (en) 2016-05-11
EP3216236A1 (en) 2017-09-13
CN107211228B (zh) 2019-09-03
US20170238119A1 (en) 2017-08-17
BR112017008519A2 (pt) 2018-01-09
JP2017537574A (ja) 2017-12-14
BR112017008519B1 (pt) 2022-08-16
EP3694231B1 (en) 2022-09-14
CN107211228A (zh) 2017-09-26
EP3216236B1 (en) 2020-04-22
EP3694231A1 (en) 2020-08-12
RU2686026C2 (ru) 2019-04-23
RU2017119648A (ru) 2018-12-07
RU2017119648A3 (es) 2018-12-07

Similar Documents

Publication Publication Date Title
ES2807192T3 (es) Aparato y procedimiento para generar señales de salida basadas en una señal de fuente de audio, un sistema de reproducción de sonido y una señal de altavoz
US8477951B2 (en) Front surround system and method of reproducing sound using psychoacoustic models
EP1871143B1 (en) Array speaker apparatus
US7577260B1 (en) Method and apparatus to direct sound
US8488796B2 (en) 3D audio renderer
EP1694097B1 (en) Array speaker device
US7336793B2 (en) Loudspeaker system for virtual sound synthesis
KR100416757B1 (ko) 위치 조절이 가능한 가상 음상을 이용한 스피커 재생용 다채널오디오 재생 장치 및 방법
US20050265558A1 (en) Method and circuit for enhancement of stereo audio reproduction
US7835535B1 (en) Virtualizer with cross-talk cancellation and reverb
US8363847B2 (en) Device and method for simulation of WFS systems and compensation of sound-influencing properties
US9355632B2 (en) Apparatus, method and electroacoustic system for reverberation time extension
Pulkki et al. Spatial effects
US7974418B1 (en) Virtualizer with cross-talk cancellation and reverb
JP4407467B2 (ja) 音響シミュレーション装置、音響シミュレーション方法、および音響シミュレーションプログラム
US9843856B2 (en) Acoustic set comprising a speaker with controlled and variable directivity
Jot et al. Binaural concert hall simulation in real time
Glasgal Improving 5.1 and Stereophonic Mastering/Monitoring by Using Ambiophonic Techniques
JP2008011099A (ja) ヘッドフォン音響再生システム、ヘッドフォン装置
KR20050060552A (ko) 입체 음향 시스템 및 입체 음향 구현 방법
Bruno et al. Designing high spatial resolution microphones