MX2012009785A - Aparato para generar señal de mezcla descendente mejorada, metodo para generar señal de mezcla descendente mejorada y programa de computadora. - Google Patents

Aparato para generar señal de mezcla descendente mejorada, metodo para generar señal de mezcla descendente mejorada y programa de computadora.

Info

Publication number
MX2012009785A
MX2012009785A MX2012009785A MX2012009785A MX2012009785A MX 2012009785 A MX2012009785 A MX 2012009785A MX 2012009785 A MX2012009785 A MX 2012009785A MX 2012009785 A MX2012009785 A MX 2012009785A MX 2012009785 A MX2012009785 A MX 2012009785A
Authority
MX
Mexico
Prior art keywords
channel
signal
improved
microphone signal
downmix
Prior art date
Application number
MX2012009785A
Other languages
English (en)
Inventor
Fabian Kuech
Juergen Herre
Christof Faller
Christophe Tournery
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of MX2012009785A publication Critical patent/MX2012009785A/es

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

Se describe un aparato para generar una señal de mezcla descendente mejorada en base a una señal de micrófono de multicanal que comprende un analizador espacial configurado para calcular un conjunto de parámetros de pista espacial que comprende información de dirección que describe la dirección de llegada de un sonido directo, información de potencia de sonido directo e información de potencia de sonido difuso en base a la señal de micrófono de multicanal. El aparato también comprende un calculador de filtro para calcular parámetros de filtro mejorados en dependencia de la información de dirección que describe la dirección de llegada del sonido directo, en dependencia de la información de potencia de sonido directo y en dependencia de la información de potencia de sonido difuso. El aparato también comprende un filtro para filtrar la señal de micrófono o una señal derivada de la misma usando los parámetros de filtro mejorados para obtener la señal de mezcla descendente mejorada.

Description

APARATO PARA GENERAR SEÑAL DE MEZCLA DESCENDENTE MEJORADA, METODO PARA GENERAR SEÑAL DE MEZCLA DESCENDENTE MEJORADA Y PROGRAMA DE COMPUTADORA DESCRIPCIÓN DE LA INVENCIÓN Las modalidades ' de acuerdo con la invención son concernientes con un aparato para generar una señal de mezcla descendente mejorada con un método para generar una señal de mezcla descendente mejorada y con un programa de computadora para generar una señal de mezcla descendente mejorada.
Una modalidad de acuerdo con la invención es concerniente con el cálculo de mezcla descendente mejorada para micrófonos de audio espaciales.
ANTECEDENTES DE LA INVENCIÓN La grabación del sonido surround con una configuración de micrófono pequeño sigue siendo un reto. Una de tal configuración más ampliamente conocida es un micrófono de campo de sonido y descodificadores surround correspondientes (véase, por ejemplo referencia[3]) , que filtran y combinan sus cuatro señales de cápsula de micrófono casi coincidentes para generar los canales de salida de sonido surround. En tanto que la alta fidelidad de señal de un solo canal es mantenida, la debilidad de este procedimiento es su separación de canal limitada concerniente con la directividad limitada de respuestas direccionales de micrófono de primer orden .
Alternativamente, se pueden aplicar técnicas basadas en una .representación paramétrica del campo de sonido observado. En la referencia [2], se ha propuesto un método utilizando pares de micrófono estéreo coincidentes convencionales para grabar sonido surround. Se demostró como estimar las proporciones de sonido directo a sonido difuso de los parámetros de pista espacial y direcciones de llegada del sonido a partir de estas señales de micrófono direccionales y como aplicar esta información para conducir una síntesis de codificación de audio espacial para generar sonidos surround. En la referencia [2] también se ha discutido como la información paramétrica, esto es dirección de llegada (DOA) del sonido y la proporción de sonido difuso (DSR) del campo de sonido puede ser usada para calcular directamente los parámetros espaciales específicos que son usados en el esquema de codificación surround de MPEG (MPS) (véase, por ejemplo referencia [6]) .
El surround de MPEG es una representación paramétrica de señales de audio de multicanal que representa un procedimiento eficiente a la codificación de audio espacial de alta calidad. MPS aprovecha el hecho de que, desde un punto de vista perceptual, las señales de audio de multicanal contienen redundancia significativa con respecto a los diferentes canales de altavoz. El codificador: de MPS toma múltiples señales de altavoz como entrada, con la configuración espacial correspondiente de los ' altavoces que tiene que ser conocida de antemano. En base a estas señales de entrada, el codificador de MPS calcula los parámetros espaciales en sub-bandas de frecuencia, tales como diferencias de nivel . de canal (CLD) entre dos canales y correlación de intercanal (ICC) entre dos canales. Luego, la información lateral de MPS real es derivada a partir de estos parámetros espaciales. Además, el codificador calcula una señal de mezcla descendente, que podría consistir de uno o más canales de audio.
Se ha encontrado que las señales de entrada de micrófono estero son apropiadas para estimar los parámetros de pista espacial. Sin embargo, también se ha encontrado que la señal de entrada de micrófono esterero sin procesar es en general no apropiada para ser usada directamente como la señal de mezcla descendente surround de MPEG correspondiente. Se ha encontrado que en muchos casos, la diafonia entre canales izquierdo y derecho es demasiado alta, dando eomo resultado una separación de canal escasa en las señales ' decodificadas surround de MPEG.
En vista de esta situación, hay la necesidad de un concepto para generar una señal de mezcla descendente mejorada en base a una señal de micrófono de multicanal, de tal manera que las señales de mezcla descendente mejoradas conducen a una calidad de audio espacial suficientemente buena y propiedad de localización después de la descodificación surround de MPEG.
BREVE DESCRIPCIÓN DE LA INVENCIÓN Este objetivo es obtenido por el aparato reivindicado para generar una señal de mezcla descendente mejorada, mediante el método reivindicado para generar , una señal de mezcla descendente mejora y por el programa de computadora reivindicado para mejorar una señal de mezcla descendente mejorada .
Una modalidad de acuerdo con la invención crea un aparato para generar una señal de mezcla descendente mejorada en base a una señal de micrófono de multicanal. El aparato comprende un analizador espacial configurado para calcular un conjunto de parámetros de pista espacial que comprenden información de dirección que describe la dirección de llegada de sonido directo, información de potencia de sonido directo e información de potencia de sonido difuso en base a la señal de micrófono de multicanal. El aparato también comprende un calculador de filtro para calcular parámetros de filtro mejorados en dependencia de la información de dirección que describe la dirección de llegada del sonido directo, en dependencia de la información de potencia del sonido directo y en dependencia de la información de potencia de sonido difuso. El aparato también comprende un filtro para filtrar la señal de micrófono o una señal derivada de la misma, utilizando los parámetros de filtro mejorados, para obtener la señal de mezcla descendente mejorada.
Esta modalidad de acuerdo con la invención esta basada en el hallazgo de que una mezcla de señal descendente mejorada, que es apropiada más que la señal de micrófono de multicanal de entrada, puede ser derivada de la señal de micrófono de multicanal de entrada por una operación de filtración y que los parámetros de filtro para tal operación de filtración mejorada de señal puede ser derivada eficientemente de los parámetros de pista espacial.
Asi, es posible reutilizar la misma información, es decir los parámetros de pista espacial.
Asi, es posible reutilizar la misma información, es decir los parámetros de pista espacial, que es también apropiada para la derivación de los parámetros surround de MPEG, para el cálculo de los parámetros de filtro mejorados. Asi, un sistema altamente eficiente puedei ser creado utilizando el concepto descrito anteriormente. 1 Además, es posible derivar una señal de mezcla descendente que permite una buena separación dé canal cuando es procesada en un descodificador surround de MPEG aun si las señales de canal de la señal de micrófono de multicanal solamente comprenden una baja separación espacial. Así, la señal de mezcla descendente mejorada puede conducir a una calidad de audio espacial significativamente mejorada y propiedad de localización después de la descodificación surround de MPEG en comparación con los sistemas convencionales.
Para resumir, la modalidad descrita anteriormente de acuerdo con la invención permite proveer una señal de mezcla descendente mejorada que tiene buenas propiedades de separación espacial en un esfuerzo computacional moderado.
En una modalidad preferida, el calculador de filtro esta calculado para calcular los parámetros de filtro mejorados, de tal manera que la señal de mezcla descendente mejorada se aproxima a una señal de mezcla descendente deseada. Utilizando este procedimiento, se puede asegurar que los parámetros de filtro mejorados estén bien adaptados a un resultado deseado de la filtración. Por ejemplo, parámetros de filtro mejorados pueden ser calculados de tal manera que una o más propiedades estadísticas de la señal de mezcla descendente mejorada se aproximan a las- propiedades estadísticas deseadas de la señal de mezcla descendente. Así, se puede alcanzar que la señal de mezcla descendente mejorada es bien adaptada a las expectativas, en donde las expectativas pueden ser definidas numéricamente en términos de valores de correlación deseados.
En una modalidad preferida, el calculador de filtro esta configurado para calcular valores de correlación deseados entre la señal de micrófono de multicanal (o más precisamente, señales de canal del mismo) y señales de canal deseadas, de- la señal de mezcla descendente en dependencia de los parámetros de pista espacial. En este caso, el calculador de filtro esta configurado preferiblemente para calcular los parámetros de filtro mejorados en dependencia de los valores de correlación cruzada deseados. Se ha encontrado que dichos valores de correlación cruzada son una buena medida de si las señales de canal de la señal de mezcla descendente exhiben características de separación de canal suficientemente buenas. También, se ha encontrado que los valores de correlación deseados pueden ser calculados con esfuerzo computacional moderado en base a los parámetros de pista espacial.
En una modalidad preferida, el calculador de filtro esta configurado para calcular los valores de correlación cruzada deseados en dependencia de los factores ' de ganancia dependientes de la dirección, que describen contribuciones deseadas de un componente de sonido directo de un componente de sonido directo de la señal de micrófono de multicanal a una pluralidad de señales de altavoz y en dependencia de uno o más valores de matriz de mezcla descendente que describen contribuciones deseadas de una pluralidad de canales de audio (por ejemplo, señales de altavoz) a uno o más canales de la señal de mezcla descendente mejoradas. Se ha encontrado que tanto los factores de ganancia dependientes de la dirección como los valores de matriz de mezcla descendente son apropiados para calcular los valores de correlación cruzada deseados y que dichos factores de ganancia dependientes de la dirección y dichos valores de matriz de mezcla descendente son fácilmente obtenibles. Además, se ha encontrado que los valores de correlación cruzada deseados son fácilmente obtenibles en base a dicha información.
En una modalidad preferida, el calculador de filtro esta configurado para mapear la información de dirección sobre un conjunto de factores de ganancia dependientes de la dirección. Se ha encontrado que se puede usar una ley de toma panorámica de amplitud de multicanal para determinar los factores de ganancia con el esfuerzo moderado en dependencia de la información de dirección. Se ha encontrado que la información de dirección de llegada es apropiada para determinar los factores de ganancia dependientes de la dirección, que pueden describir, por ejemplo cuales altavoces deben presentar el componente de sonido directo. Es fácilmente comprensible que el componente de sonido directo este distribuido a diferentes señales de altavoz en dependencia de la información de dirección de llegada (designada brevemente como información de dirección) y que es relativamente simple determinar los factores de ganancia que describen cual de los altavoces deben presentar el componente de sonido directo. Por ejemplo, la regla de mapeo que es usada para mapear la información de dirección sobre conjunto de factores de ganancia dependientes de la dirección, puede simplemente determinar que aquellos altavoces que están asociados con la dirección de llegada podrían presentar (o principalmente presentar) el componente de sonido directo, mientras que los otros altavoces que están asociados con otras direcciones deben solamente presentar una pequeña porción del componente de sonido directo o deben aun suprimir el componente de sonido directo.
En una modalidad preferida, el calculador de filtro esta configurado para considerar la información de potencia de sonido directo y la información de potencia de sonido difuso para calcular los valores de correlación cruzada deseados. Se ha encontrado que la consideración de las potencias de ambos de dichos componentes de sonido (componente de sonido directo y componente de sonido difuso) da como resultado una impresión de audición particularmente buena, debido a que tanto el componente de sonido directo como el 1 componente de sonido difuso pueden ser asignados apropiadamente a las señales de canal de la señal de mezcla descendente (comúnmente de multicanal) .
En una modalidad preferida, el calculador de filtro esta configurado para ponderar la información de potencia de sonido directo en dependencia de la información de dirección y para aplicar una ponderación¦ predeterminada que es independiente de la información de dirección a la información de potencia de sonido difuso con el fin de calcular los valores de correlación cruzada deseados. Asi, se puede distinguir entre los componentes de sonido directo y los componentes de sonido difuso lo que da como resultado una estimación particularmente real de los valores de correlación cruzada deseados.
En una modalidad preferida, el calculador de filtro esta configurado para evaluar una ecuación de Wiener-Hopf para derivar los parámetros de filtro mejorados. En este caso, la ecuación de iener-Hopf describe una relación 'entre valores de correlación que describen una correlación entre diferentes pares de canal de la señal de micrófono de multicanal, parámetros de filtro mejorados y valores de correlación cruzada deseados entre' señales de canal desde las señales de micrófono de multicanal y señales de canal deseados de la señal de mezcla descendente. Se ha encontrado que la evaluación de tal ecuación de Wiener-Hopf da cómo resultados parámetros de filtro mejorados que son bien adaptados a las características de correlación deseadas de las señales de canal de la señal de mezcla descendente.
En una modalidad preferida, el calculador de filtro esta configurado para calcular los parámetros de filtro mejorados en dependencia de un modelo de canales 'de mezcla descendente deseados. Al modelar los canales de mezcla descendente deseados, los parámetros de filtro mejorados pueden ser calculados de tal manera que producen una señal de mezcla descendente que permite una buena reconstrucción de las señales de altavoz de multicanal deseadas en un decodificador de multicanal.
En algunas modalidades, el modelo de los canales de mezcla descendente deseados puede comprender un modelo de una mezcla descendente ideal, que. seria efectuada si las señales de canal (por ejemplo, señales de altavoz) estuvieran disponibles individualmente. Además, el modelado puede incluir un modelo de como las señales de canal individual podrían ser obtenidas a partir de la señal de micrófono de multicanal, aun si la señal de micrófono de multicanal comprende señales de canal que tienen solamente una separación espacial limitada. Así, un modelo global de los canales de mezcla descendente deseados puede ser obtenido, por ejemplo al combinar un modelado de como obtener señales de canal individuales (por ejemplo, señales de altavoz) y como derivar canales de mezcla descendente deseados a partir de dichas señales de canal individuales. Así, es una referencia suficientemente buena para el cálculo de los parámetros de filtro mejorados obtenibles con un esfuerzo computacional relativamente pequeño.
En una modalidad preferida, el calculador de filtro esta configurado para efectuar selectivamente una filtración de un solo canal, en la cual un primer canal de la señal de mezcla descendente es derivado mediante una filtración de un primer canal de la señal de micrófono de multicanal y en la cual un segundo canal la señal de mezcla descendente es derivado mediante una filtración de un segundo canal de la señal de micrófono de multicanal mientras que evita la diafonia del primer canal de la señal de micrófono de multicanal al segundo canal de señal de mezcla descendente y del segundo canal de la señal de micrófono - de multicanal al primer canal de la señal de mezcla descendente o una filtración de dos canales, en la cual un primer canal de la señal de mezcla descendente es derivado mediante filtración de' un primero y un segundo canal de la señal de micrófono de multicanal y en la cual un segundo canal de la señal de mezcla descendente es derivada mediante filtración de un primero y un, segundo canal de la señal de micrófono de multicanal. La selección de la filtración de un solo canal y de la filtración de dos canales se hace en dependencia de un valor de correlación que describe una correlación entre el primer canal de la señal de • micrófono de multicanal y el segundo canal de la señal de micrófono de multicanal. Al seleccionar entre la filtración de un solo canal y la filtración de dos canales, se pueden evitar errores numéricos que pueden algunas veces aparecer si se usa filtración de dos canales en una situación en la cual el canal izquierdo y derecho están altamente correlacionados. Asi, una señal de mezcla descendente de buena calidad puede ser obtenida sin consideración de si las señales de canal de la señal micrófono de multicanal están altamente correlacionadas o no.
Otra modalidad de. acuerdo con la invención crea un método para generar una señal de mezcla descendente mejorada.
Otra modalidad de acuerdo con la invención crea un programa de computadora para efectuar dichos métodos para generar una señal de mezcla descendente mejorada.
El método y programas de computadora están basados en los mismos hallazgos como el aparato y pueden ser complementados por cualquiera de los elementos y funcionalidades discutidas con respecto al aparato.
BREVE DESCRIPCIÓN DE LAS FIGURAS Modalidades de acuerdo con la invención serán subsecuentemente descritas con referencia a, las figuras adjuntas en las cuales: La Figura 1 muestra un diagrama esquemático en bloques de un aparato para generar una señal de mezcla descendente mejorada de acuerdo con una modalidad de la invención; la Figura 2 muestra una ilustración gráfica del procesamiento de micrófono de audio espacial de acuerdo con una modalidad de la invención; la Figura 3 muestra una ilustración gráfica del cálculo de mezcla descendente mejorada de acuerdo con una modalidad de la invención; la Figura 4 muestra una ilustración gráfica del mapeo de canal para el cálculo de las señales de mezcla descendente deseada Yi e Y2, que pueden ser usadas en modalidades de acuerdo con la invención; la Figura 5 muestra una ilustración gráfica de un cálculo de mezcla descendente mejorada en base a señales de micrófono pre procesadas de acuerdo con una modalidad de la invención; la Figura 6 muestra una representación esquemática de cálculos para derivar los parámetros de filtro mejorados a partir de la señal de micrófono de multicanal de acuerdo con una modalidad de la invención y la Figura 7 muestra una representación esquemática de cálculos para derivar los parámetros de filtro mejorados a partir de la señal de micrófono de multicanal de acuerdo con otra modalidad de la invención.
DESCRIPCIÓN DETALLADA DE LAS MODALIDADES 1. Aparato para generar una señal de mezcla descendente mejorada de acuerdo con la Figura 1 La Figura 1 muestra un diagrama de bloque esquemático de un aparato para generar una señal de mezcla descendente mejorada en base a una señal de micrófono de multicanal . El aparato 100 esta configurada para recibir una señal de micrófono de multicanal 100 y para proveer, en base a la misma, una señal de mezcla descendente mejorada 112. El aparato 100 comprende un analizador espacial 120 configurado para calcular un conjunto de parámetros de pista espaciales 122 en base a la señal de micrófono de multicanal 110. Los parámetros de pista espacial comprenden comúnmente una información de dirección que describe una dirección de llegada del sonido directo (tal sonido directo! esta incluido en la señal de micrófono de multicanal), información de potencia del sonido directo e información de potencia de sonido difuso. El aparato 100 también comprende un calculador de filtro 130 para calcular parámetros de filtro mejorados 132 en dependencia de los parámetros de pista espacial 122, esto es, en dependencia de la información de dirección que describe la dirección de llegada del sonido directo, en dependencia de la información de potencia del sonido directo y en dependencia de la información de potencia del sonido difuso. El aparato 100 también comprende un filtro 140 para filtrar la señal de micrófono 110 o una señal 110' derivada de la misma, utilizando los parámetros de filtro mejorados 132, para obtener la señal de mezcla descendente 112. La señal 110' puede opcionalmente ser derivada de la señal de micrófono de multicanal 110 utilizando un pre-procesamiento opcional 150.
Con respecto a la funcionalidad del aparato 100, se puede notar que la señal de mezcla descendente mejorada 112 es provista comúnmente de tal manera que la señal de mezcla descendente mejorada 112 permite una calidad de audio espacial mejorada después de la descodificación surround de MPEG cuando se compara con la señal de micrófono multicanal 110, debido a que los parámetros de filtro mejorados 132, son provistos comúnmente por el calculador de filtro 130 con el fin de obtener este objetivo. La provisión de los parámetros de filtro mejorados 130 esta basada en los parámetros de pista espacial 122 provistos por el analizador espacial, de tal manera que los parámetros de filtro mejorados 130 son provistos de acuerdo con una característica espacial de la señal de micrófono del multicanal 110 y con el fin de enfatizar la característica espacial de la señal de micrófono del multicanal 110. Así, la filtración efectuada por el filtro 140 permite una mejora señal-adaptable de la característica espacial de la señal de mezcla descendente mejorada 112 cuando se compara con la señal de micrófono del multicanal de entrada 110.
Detalles con respecto al análisis espacial efectuado por el administrador espacial 120 con respecto al cálculo de parámetros de filtro efectuados por el calculador de filtro 130 y con respecto a la filtración efectuada por el filtro 140 serán subsecuentemente descritos en más detalle. 2. Aparato para generar una señal de mezcla descendente mejorada de acuerdo con la Figura 2 La Figura 2 muestra un diagrama de bloque esquemático de un aparato 200 para generar una señal de mezcla descendente mejorada (que puede tomar la forma de una señal de audio de dos canales) y un conjunto de pistas espaciales asociadas con una señal de mezcla ascendente que tiene más de dos canales. El aparato 200 comprende un arreglo de micrófono 205 configurado para proveer una señal de micrófono de dos canales que comprende una señal de primer canal 210a y una señal del segundo canal 210b.
El aparato 200 comprende además un procesador 210 para proveer un conjunto de pistas espaciales asociadas con una señal de mezcla ascendente que tiene más de dos canales en base a la señal de micrófono de dos canales, El procesador 216 también esta configurado para proveer parámetros de filtro mejorados 232. El procesador 216 esta configurado para recibir señales de entrada, la señal del primer canal 210a y la señal del segundo canal 210b provista por el arreglo de micrófono 205. El aparato 216 esta configurado para proveer los parámetros de filtro mejorados 232 y para también proveer una información de pista espacial 262. EL aparato 200 comprende además un proveedor de señal de audio de dos canales 240 que esta configurado para recibir la señal del primer canal 210a y la señal del segundo canal 210b provista por el arreglo de micrófono 205 y para proveer versiones procesadas de la señal de micrófono del primer canal 210a y la señal de micrófono¦ del segundo canal 210b como la señal de audio de dos canales 212 que comprende las señales de canal 212a, 212b.
El arreglo de micrófono 205 comprende un primer micrófono direccional 206 y un segundo micrófono direccional 208. El primer micrófono direccional 206 y el segundo micrófono direccional 208 están preferiblemente espaciados por no más de 30 cm. Asi, la señales recibidas por el primer micrófono direccional 206 y el segundo micrófono direccional 208 están correlacionadas fuertemente, lo que se ha encontrado que es benéfico para el calculo de la información del componente de energía (o información de energía componente) 122a e información de dirección¦ 122b por el analizador de señal 220. Sin embargo, el primer micrófono direccional 206 y el segundo micrófono direcciona 208 están orientados de tal manera que una característica direccional 209 del segundo micrófono direccional 208 es una versión girada de una característica direcciona 207 del primer micrófono direccional 206. Así, la señal de micrófono del primer canal 210a y la señal de micrófono del segundo canal 210b están fuertemente correlacionadas (debido a la proximidad espacial de los micrófonos 206, 208) y todavía diferentes (debido a las diferentes características direccional 207, 209 de los micrófonos direccionales 206, 208) . En particular, una señal direccional incidente sobre el arreglo de micrófono 205 desde una dirección aproximadamente constante provoca que componentes de señal fuertemente correlacionados de la señal de micrófono del primer canal 210a y la señal de micrófono del segundo canal 210b que tienen una proporción de amplitud dependiente de la dirección temporalmente constante (o proporción de intensidad) . Una señal de audio ambiental incidente sobre el arreglo de micrófono 205 desde direcciones que varían temporalmente provoca que los componentes de señal de la señal de micrófono del primer canal 210a y la señal de micrófono del segundo canal 210b que tienen una correlación significativa pero proporciones de amplitud que fluctúan temporalmente (o proporciones de intensidad) . Así, el arreglo de micrófono 205 provee .una señal de micrófono de dos canales, 210a, 210b que permite que el analizador de señal 220 del procesador 216 distinga que entre sonidos directos y sonidos difusos aunque los micrófonos 206, 208 estén espaciados estrechamente. Así, el aparato 200 constituye un proveedor de señal de audio que puede ser implementado de forma espacialmente compacta y que es no obstante apto de proveer pistas espaciales asociadas con una señal de mezcla ascendente que tiene más de dos canales.
Las pistas espaciales 262 pueden ser usadas en combinación con la señal de audio de dos canales provista 212a, 212b por un descodificador de audio espacial para proveer una señal de salida de sonido surround.
En lo siguiente, se darán algunas explicaciones adicionales con respecto al aparato 200. El aparato 200 comprende opcionalmente un arreglo de micrófono 205 que provee la señal del primer canal 210a y la señal del segundo canal 210b. La señal del primer canal 210a es también designada con xi(t) y la señal del segundo canal 210b es también designada con X2(t) . También se debe notar que la señal del primer canal 210a y la señal del segundo canal 210b pueden representar la señal de micrófono de multicanal 110, que es introducida al aparato 100 de acuerdo con la Figura 1.
El proveedor de señal de audio de dos canales 240 provee la seña del primer canal 210a y la señal del segundo canal 210b y comúnmente también recibe la información , del parámetro de filtro mejorado 232. El proveedor de señal dé audio de dos canales 240 puede por ejemplo efectuar la funcionalidad del pre-procesamiento opcional 150 y del filtro 240 para proveer la señal de audio de dos canales 212 que es representada por una señal de primer canal 212a y una señal del segundo canal 212b. La señal de audio de dos canales 212 puede ser equivalente a la señal de mezcla descendente mejorada 112 emitida por el aparato 100 de la Figura 1.
El analizador de señal 220 puede ser configurado para recibir la señal del primer canal 219a y la señal del segundo canal 210b. También, el administrador de señal 220 puede estar configurado para obtener información de energía componente 112a e información de dirección 122b en base a la señal de micrófono de dos canales 210 esto es, en base a la señal del primer canal 210a y la señal del segundo canal 210b. Preferiblemente, el analizador de señal 220 esta configurado para obtener información de energía componente 122a y la información de dirección 122b de tal manera que la información de energía componente 122a describe valores estimativos de energía (o equivalentemente de potencia) de un componente de sonido directo de la señal de micrófono de dos canales y de un componente de sonido difuso de la señal de micrófono de dos canales y¦ de tal manera que la información de dirección 122 describe un valor estimativo de la dirección desde la cual el componente de sonido directa de la señal de micrófono de dos canales 210a y 210b se origina. Así, el analizador de señal 220 puede tomar la funcionalidad del analizador espacial 120 y la información de energía componente 122a y la información de dirección 122b puede ser equivalente a los parámetros de pista espacial 122. La información de energía componente 122a puede ser equivalente a la información de potencia de sonido directa y la información de potencia del sonido difuso. El procesador 216 también comprende el generador de información lateral espacial 260 que recibe la información de energía componente 122a y la información de dirección 122b del analizador de señal 220. El generador de información lateral espacial 260 esta configurado para proveer en base al mismo, la información de pista espacial 262. Preferiblemente, el generador de información lateral espacial 260 esta configurado para mapear la información de energía componente 122a de la señal de micrófono de dos canales 210a, 210b y la información de dirección 122b de la señal de micrófono de dos canales 210a, 210b sobre la información de pista espacial 262. Así, la información lateral espacial 262 es obtenida de tal manera que la información de pista espacial 262 describe un conjunto de pistas espaciales asociadas con una señal de audio de mezcla ascendente que tiene más de dos canales.
El procesador 216 permite un cálculo computacionalmente muy eficiente de la información de pista espacial 262 que esta asociada con una señal de audio de mezcla ascendente que tiene más de dos canales en base a una señal de micrófono de dos canales 210a, 210b. El analizador de señal 220 es apto de extraer una gran cantidad de información a partir de la señal de micrófono de dos canales, es decir la información de energía componente 122a que describe tanto un valor estimativo de la energía de un componente de sonido directo como un valor estimativo de la energía de un componente de sonido difuso y la información de dirección 122b que describe un valor estimativo de la dirección desde la cual el componente de sonido directo de la señal de micrófono de dos canales se origina. Se ha encontrado que esta información que puede ser obtenida por el analizador de señal 220 en base a la señal de micrófono de dos canales 210a, 210b, es suficiente para derivar la información de pista espacial 262 a un para una señal de audio de mezcla ascendente que tiene más de dos canales. Importantemente se ha encontrado que la información de energía componente 122a y la información de dirección 122b son suficientes para determinar directamente la información de pista espacial 262 sin usar realmente los canales de audio de mezcla ascendente como una cantidad intermedia.
Además, el procesador 216 comprende un calculador de filtro 230 que esta configurado para recibir la información de energía componente 122a y la información de dirección 122b y para proveer, en base a las mismas, la información de parámetro de filtro mejorado 232. Así, el calculador de filtro 230 puede tomar la funcionalidad del calculador de filtro 130.
Para resumir lo anterior, el aparato 200 es apto de determinar eficientemente tanto la señal de mezcla descendente mejorada 212 como la información de pista espacial 262 de manera eficiente, utilizando la misma información intermedia 122a, 122b en ambos casos. También, se debe notar que el aparato 200 es apto de usar un arreglo de micrófono espacialmente pequeño 205 con el fin de obtener tanto la señal de mezcla descendente (mejorada) 212 como la información de pista espacial 262. La señal de mezcla descendente 212 comprende una característica de separación espacial particularmente buena a pesar del uso del arreglo de micrófono pequeño 205 (que puede ser parte del aparato 200 o que puede ser externo al aparato 200 pero conectado al aparato 200) debido al calculo de los parámetros de filtro mejorados 232 por el calculador de filtro 230. Asi, la señal de mezcla descendente (mejorada) 212 puede ser apropiada para una presentación espacial (por ejemplo, utilizando un descodificador surround de MPEG) cuando es tomado en combinación con la información de pista espacial 262.
Para resumir, la Figura 2 muestra un diagrama de bloque esquemático de un procedimiento de micrófono de audio espacial. Como se puede ver, las señales de entrada de micrófono estéreo 210a (también designada con xi(t) y 210b (también designada con x2(t)) son usadas en el bloque 216 para calcular el conjunto de información de pista espacial 262 asociada con la señal de mezcla ascendente de multicanal (por ejemplo, la señal de audio de dos canales 212) . Además, se provee una señal de mezcla descendente de dos canales 212.
En las siguientes secciones, se requerirán las etapas requeridas para determinar la información de pista espacial 262 en base al análisis de las señales de micrófono estéreo. Asi, se hará referencia a la presentación en referencia [2]. 3. Análisis de señal estéreo En lo siguiente, un análisis de señal estéreo será descrito que puede ser efectuado por el analizador espacial 120 o por el analizador de señal 220. Se debe notar que en algunas modalidades en las cuales hay más de dos micrófonos usados y en las cuales hay más de dos señales de canal de una señal de micrófono de multicanal, se puede usar un análisis de señal mejorado.
El análisis de señal estéreo descrito eh la presente puede ser usado para proveer los parámetros de pista espacial 122, que pueden tomar la forma de la información de energía del componente 122a e información de dirección 122b. Se deb.e notar que el análisis de señal estéreo puede ser efectuado en un dominio de tiempo-frecuencia. Así, las señales de canal 210a, 210b de la señal de micrófono de multicanal 110, 210 pueden ser transformadas a una representación de dominio de tiempo-frecuencia por el propósito del análisis adicional.
La representación de tiempo-frecuencia de las señales de micrófono son Xi(t) y x2(t) y Xi(k, i) y X2(k, i), en donde k e i son índices de tiempo y frecuencia. Se supone que Xi(k, i) y X2(k, i) pueden ser modelados como X] (k. i) = S(k, ¿) + Ni {k, i) X2(k, i) = a(fc,«)S(&, i) + N2 (k, i) , (1) en donde a(k,i) es un factor de ganancia, S(k,i) es el sonido directo en el canal izquierdo y Ni(k,i) y N2(k,i) representan sonido difuso.
La señal de mezcla descendente de codificación de audio espacial (SAC) 112, 212 e información lateral 262 son calculadas como función de E{SS*}, E{NiNi*} y E{N2N2*}, en donde E{.} es una operación de promedio de tiempo corto y en donde * denota conjugado complejo. Estos valores son derivados en lo siguiente.
De (1) se sigue que E{XiX¡) = E{SS*} + E{NiN{} E{A'2 ;} = rrE{ó'S*} + E{N2N2} E{XiX¡} = aE{SS*} + E{iViV}. (2) Se debe notar aquí que E{SS*} puede ser considerado como información de potencia de sonido directo o equivalentemente, información de energía de sonido directo y que ??????*} y E{N2N2*} pueden ser considerados como información de potencia de sonido difuso o información de energía de sonido difuso. E{SS*} y E{NiNi*} pueden ser considerados como información de energía del componente. a puede ser considerada como información de dirección.
Se supone que la cantidad de sonido difuso en ambas señales de micrófono es la misma, esto es ?{?? ?*} = E{N2N2*} = E{NN*} y que el coeficiente de relación cruzada normalizado entre Ni y N2 es <¡>dift esto es «tdiff puede por ejemplo tomar un valor predeterminado o puede ser calculado de acuerdo con algún algoritmo.
Dadas estas suposiciones, (2) puede ser escrito como La eliminación de {SS*} y a en (2) produce la ecuación cuadrática AE{NN*}2 + BE{NN*} + C = 0 (5) Con ? = 1- ?, B = 2 (??1·?{?1,?2*} - Ei iA'í } - { 2 1 } .
C = EiXxX^iX^X ) - E íi j}2. (6) Entonces { N } es una de las dos soluciones de (5) la físicamente posible, esto es La otra solución de (5) produce una potencia de salida difuso más grande que la potencia de señal del micrófono, lo que es físicamente imposible.
Dado (7), es fácil calcular a y E {SS*}: a2E{SS*} = E{X2X$} ~ E{NN*} . ' (8) Como se discute en la referencia [2] , , la dirección de llegada de a(k,i) de sonido directo puede ser determinada como función de la proporción de amplitud estimada a(k, i) a( ) = /(a( )). (9) El mapeo específico depende de las características direccionales de micrófonos estéreo usados para la grabación del sonido. 4. Generación de información lateral espacial En lo siguiente, se describirá la generación de la información de pista espacial 262, que puede ser provista por el generador de información lateral espacial 260. Sin embargo, se debe notar que la generación de información lateral espacial en forma de la información de pista espacial 262 no es un elemento necesario de modalidades de la presente invención. Asi, se debe notar que la generación de la información lateral espacial puede ser omitida en algunas modalidades. También, se debe notar que se pueden usar diferentes métodos para obtener la información de pista espacial 262 o cualquier otra información lateral espacial.
No obstante, también se debe notar que la generación de la información lateral espacial que es discutida en lo siguiente puede ser considerada como un concepto preferido para generar una información de pista espacial.
Dados los resultados de análisis de la señal estéreo 122a, 122b, esto es los parámetros a respectivamente a de acuerdo con la ecuación (9) E{SS*} y E{NN*}, parámetros espaciales compatibles con el descodificador' de SAC son generados, por ejemplo por el generador de información lateral espacial 260. Se ha encontrado que una manera eficiente de hacer esto es considerando un modelo de señal de multicanal. Como un ejemplo, se considera la configuración de altavoces como se muestra en la Figura 4 en lo siguiente, que implican : L{k, i) = 9i(k. i)S(k i) + /ii(fc, /)JVi ( :, ¾) B{k, i) = 2(k i)S(k *) + h2(k,i)Ñ2(k,i) C{k,i) = az{k. i)S(k ) + ½(/,·, ?·{(.·. i) Ls(k, i) = g*{k. i)S(k i) + h4{k, i)Ñ4(k,i) k .) = ífó(¿:- i)S{k i) + h5(k,i)Ñ5{k,i) (10) en donde S (k,i) es la señal de sonido directo y N, a N5 son señales difusas (independientes de inter-canal) . S corresponde a la cantidad total ganancia-compensada del sonido directo en la señal de micrófono estéreo, esto es S[k, i) = 10^ /l + c?S(ki i) 1 (11) y la señales de sonido difuso, N, a N5 , tienen todas la misma potencia igual a E{NN*}. Se debe notar que esta definición de potencia de sonido difuso es arbitraria, puesto que finalmente las ganancias hi a h5 determinan la cantidad de sonido difuso.
Se debe notar que L(k,i), R(k,i), C(k,i), Ls(k,i) y Rs(k,i) pueden ser por ejemplo señales de canal deseados o señales de altavoz deseadas.
En una primera etapa, como función de la dirección de llegada del sonido directo o¡(k, i), se aplica una ley de toma panorámica de amplitud de multicanal (véanse, por ejemplo referencias [7] y [4])) para determinar los factores de ganancia gi a g5. Luego, se usa un procedimiento euristico para determinar la ganancias de sonido difuso hi a hs. Los valores constantes hi= 1.0, h2= 1.0, h3= 0, h4= 1.0 y h5= 1.0 son una elección razonable, esto es, el ambientes es distribuido igualmente a la parte frontal y parte posterior, mientras que el canal central es generado por como una señal seca. Sin embargo, una elección diferente de hi a h5 es posible.
El sonido directo de la parte lateral y parte posterior es atenuado en relación con el sonido que llega desde direcciones delanteras. El sonido directo contenido en las señales de micrófono es preferiblemente compensado en ganancia por un factor g( ) que depende del patrón de directividad de los micrófonos.
Dado, el modelo de señal surround (10), el análisis de pista espacial del SAC especifico usado es aplicado al modelo de señal para obtener las pistas espaciales para surround de MPEG.
Los espectros de potencia de las señales^ definidas en (10) son ' en donde E{5 *} = 10 w (l + a2)E{SS*} . (13) Los espectros cruzados, usados en lo siguiente son 5 .91.9410^(1 + a?)E{SS*} PRRA^Í) .¾.9 ??^(1 + 2)?{55*}. (14) Surround de MPEG aplica una ganancia de -3dB (gs 1/ l) a los canales surround antes de procesarlos adicionalmente . Esto puede ser considerado para generar mezcla descendente e información lateral espacial .
El primer bloque de dos a uno (TTO) del surround MPEG utiliza diferencia de nivel de inter-canal (ICLD) y coherencia de inter-canal (ICC) entre L y Ls. En base a (10) y compensado por el pre-escalamiento de los canales surround estas pistas son: Pdk. i) ICLDn = 10 los ¾10 *2¾ ( ) ICC¿¿S (15) Similarmente, la ICLD e ICC del segundo bloque de TTO para R Rs son calculados: I El bloque de tres a dos (TTT) de surround de MPEG es usado en "modo de energía", véase, por ejemplo referencia [1]. Nótese que el bloque de TTT escala descendentemente el canal central por VT/2 antes de calcular las mezclas descendentes e información lateral espacial. Tomando en cuenta el pre-escalamiento de los canales surround, los dos parámetros de I CLD usados por el bloque de TTT son ,?? , N , PL + PL, +PR + g PRS Nótese que los índices i y k han sido dejados otra vez por brevedad de notación.
Así, una información de pista espacial que comprende las pistas ICLDLLS , I CCLLS , I CLDRRS , I CCRRS , ICLDI y I CLD2 es obtenida por el generador de información lateral espacial 260 en base a los parámetros de pista espacial 122, 122a, 122b esto es, en base a la información de energía de componente 122a y la información de dirección 122b. 5. Descodificación surround de MPEG En lo siguiente, se describirá una descodificación de surround de MPEG posible, que puede ser usada para derivar señales de canal múltiple, por ejemplo señales de altavoz múltiples a partir de una señal de mezcla descendente (por ejemplo, a partir de la señal de mezcla descendente mejorada 112 o la señal de mezclada descendente mejorada 212) Utilizando la información de pista espacial 262 (o cualquier otra información de pista espacial apropiada) .
En el descodificador surround de MPEG, la señal de mezcla descendente recibida 112, 212 es expandida a más de dos canales utilizando la información lateral espacial recibida 262. Esta mezcla ascendente es efectuaba mediante la representación en cascada apropiadamente de los llamados bloques de una a dos inverso (R-OTT) y tres a dos inverso (R-TTT) , respectivamente (véase, por ejemplo referencia [6]) . Mientras que el bloque de R-OTT emite dos canales de audio en base a una entrada de audio mono e información lateral, el bloque de R-TTT determina tres canales de audio en base a una entrada de audio de dos canales y la información lateral asociada. En otras palabras, los bloques inversos efectúan el procesamiento inverso como los bloques de TTT y OTT correspondientes descritos anteriormente.
Análogamente al modelo de señal de multicanal en el codificador, el descodificador supone una configuración de altavoces especifica para reproducir correctamente el sonido surround original. Adicionalmente, el descodificador supone que el codificador de MPS (codificador surround de MPEG) efectúa una mezcla especifica de los múltiples canales de entrada para calcular de señal de mezcla descendente correcta .
El cálculo, de la mezcla descendente estéreo surround de MPEG es presentado en la siguiente sección. 6. Generación de señal de mezcla descendente estéreo surround de MPEG En lo siguiente, se describirá como se genera la señal de mezcla descendente estéreo surround de MPEG.
En modalidades preferidas, la mezcla descendente es determinada de tal manera que no hay diafonia entre canales de altavoz correspondientes al hemisferio izquierdo y derecho. Esto tiene la ventaja de que no hay fugas indeseables de energía de sonido del hemisferiq izquierdo al derecho, lo que incrementa significativamente ¡la separación izquierdo/derecho después de la descodific ción de la corriente surround de MPEG. Además, el mismo razonamiento se aplica para las fugas de señal de los canales derecho a izquierdo.
Cuando se usa surround de MPEG para la codificación de señales de audio surround de 5.1 convencionales, la mezcla descendente estéreo que es usada es Y, Y2 ]T = M[L R C Ls Ra]T . (18) en donde la matriz de mezcla descendent en donde gs es la pre-ganancia mencionada previamente dada al canal surround.
El calculo de mezcla descendente de acuerdo a (18), (19) puede ser considerado como un mapeo de las áreas de reproducción, cubiertas por posiciones de altavoz correspondientes, a los dos canales de mezcla descendente. Este mapeo es ilustrado en la Figura 4 para casos específicos del cálculo de mezcla descendente convencional (18), (19) . 7. Calculo de mezcla descendente mejorada 7.1 Vista general con respecto al cálculo de mezcla descendente mejorada En lo siguiente, se describirán detalles cón respecto al cálculo de mezcla descendente mejorada. Con el fin de facilitar el entendimiento de las ventajas del concepto presente, se dará en la presente una comparación con algunos sistemas convencionales.
En el caso del micrófono de audio espacial como se describe en la sección 2,. la señal de mezcla descendente correspondería básicamente a las señales grabadas del micrófono estéreo (por ejemplo, del arreglo de micrófono 205) en ausencia del cálculo de mezcla descendente mejorada descrito en lo siguiente. Se ha encontrado que los micrófonos estéreo prácticos no proveen la separación deseada de los componentes de señal izquierdos y derechos debido a sus patrones de directividad específicos. También se ha encontrado que consecuentemente, la diafonía entre los canales izquierdo y derecho (por ejemplo, señales de canal 210a, 210b) es demasiado alta, dando como resultado una separación de canal escasa en la señal descodificada surround de MPEG.
Las modalidades de acuerdo con la invención crean un procedimiento para calcular una señal de mezcla descendente mejorada 112, 212 que se aproxima a las señales de mezcla descendente de SAC deseadas (por ejemplo, la señales Yi, Y2) , esto es,¦ exhibe un nivel deseado de diafonía entre los diferentes canales, que es diferente del nivel de diafonía incluido en la entrada estéreo original 110, 210. Estos da como resultado una calidad de sonido mejorada después de la descodificación de audio espacial utilizando la información lateral espacial asociada 262.
Los diagramas de bloques esquemáticos mostrados en las Figuras 1, 2, 3 y 5 ilustran el procedimiento propuesto. Como se puede ver, las señales de micrófono originales 110, 210, 310 son procesadas por una unidad de mejora de mezcla descendente 140, 240, 340 para obtener canales de mezcla descendente mejorada 112, 212, 312. La modificación de las señales de micrófono 110, 210, 310 es controlada por una unidad de control 120, 130, 216, 316. La unidad de control toma en cuenta el modelo de señal de multicanal para la reproducción de altavoz y los parámetros de pista espacial estimados 122, 122a, 122b, 322. A partir de esta información, la unidad de control determina un objetivo para la mejora, esto es, el modelo de la señal de mezcla descendente deseada (por ejemplo, señales de mezcla descendente Yi, Y2) . Los detalles de la invención serán discutidos en lo siguiente . 7.2 Modelo para la señal de mezcla descendente estéreo deseada En esta sección, se discute un modelo de la señal de mezcla descendente estéreo deseada, que también presenta el objetivo para el cálculo de mezcla descendente mejorada propuesta.
Si se aplican las ecuaciones (18) y (19) al modelo de señal surround supuesta de acuerdo con la ecuación (10) que tiene un modelo de seña de mezcla descendente deseada de acuerdo con , (20) en donde las dos señales de sonido difuso Ni y N2 son El sonido difuso en la señal de micrófono izquierda y derecha es i y N2. Asi, la mezcla descendente debe estar basada en el sonido difuso relacionado con i y N2. Puesto que como se define previamente, la potencia de Ni, · N2 y NI y N5 son las mismas, las señales difusas basadas en Ni y N2 con la misma potencia como NI A N2 (21) son Ni = \[h\ + +g2 Ni Asi, el modelo de señal de mezcla descendente estéreo deseada permite expresar la señales de canal Yi, Y2 de la señal de mezcla descendente estéreo deseada como función de valores de ganancia gx, g2, g3, g*, gs, gs, h_, h2, h3, h4, h5 y también en dependencia de la cantidad total compensada en ganancia S del sonido directo en la señal de micrófono estéreo y la señal difusa i, N2. 7.3 Filtración de un solo canal En lo siguiente, se describirá un procedimiento en el cual un primer canal de la señal de mezcla descendente mejorada es derivada a partir de una señal del primer canal de la señal de micrófono de multicanal y en el cual un segundo canal de la señal de mezcla descendente mejorada es derivado a partir de una señal del segundo canal de la señal del micrófono del multicanal. Se debe notar que la filtración descrita en lo siguiente puede ser efectuada por el filtro 40 o por el proveedor de señal de audio de dos canales 240 o por el mejorador de mezcla descendente 340. También se debe notar que los parámetros de filtro mejorados Hi, H2 pueden ser provistos por el calculador de filtro 130, por, el calculador de filtro 230 o por el control 316.
Un procedimiento posible para determinar la señales de mezcla descendente deseadas Yi(k, i) y Y2(k, i) de acuerdo con (20) es aplicar un filtro mejorado a la entrada de micrófono estéreo original Xi(k, i) y X2(k, i), esto es Estos filtros son escogidos de tal manera que Yi(k, i) y i) (esto es, la señales de mezcla descendente reales obtenidas mediante filtración de las señales de canal de la señal de micrófono de multicanal) se aproximan a las señales de mezcla descendente deseadas Yi(k, i) y Y2(k, i), respectivamente. Una aproximación apropiada es que Yi(k, i) y Y2(k, i) comparten la misma distribución de energía con respecto a las energías del modelo de señal de altavoz de multicanal como es dado en las señales de mezcla descendente objetivo Yi(k, i) y Y2(k, i), respectivamente. En otras palabras, los filtros son escogidos de tal manera que las señales de mezcla descendente reales obtenidas mediante filtración de las señales de canal de la señal de micrófono de multicanal se aproximan a las señales de mezcla descendente deseadas con respecto a algunas propiedades estadísticas como por ejemplo características de energía o características de correlación cruzada.
En el caso en que los filtros mejorados corresponden a filtros de Wiener (véase, por ejemplo referencia [5] ) , Hi(k, i) y H2(k, i) pueden ser determinados de acuerdo con Sustituyendo (20) con (22) en (24), producen wiE{55*} + w:iE{NN*} H, E{SS*}+E{NN*} ?/2E{SS*} + M¾E{NiV*} H-> a2E{S5'*} + E{NiV*} ; (25) Con Como se puede notar, los filtros mejorados dependen directamente, de los diferentes componentes del modelo de señal multicanal (10) . Puesto que estos componentes son estimados en base a los parámetros de pista · espacial, se puede concluir que los filtros Hi(k, i) y H2(k, i) para el calculo de mezcla descendente mejorada dependen de estos parámetros de pista espacial también. En otras, palabras, el calculo de los filtros mejorados puede ser controlado por lo s parámetros de pista espacial estimados, como también se ilustra en la Figura 3. 7. 4 Filtración de dos canales En esta sección, se presenta un método alternativo al procedimiento de un solo canal discutido en la sección titulada "filtración de un solo canal". En este caso, cada canal de mezcla descendente mejorado Ylr Y2 es determinado a partir de versiones filtradas de ambas señales¦ de entrada de micrófono Xi, X2. Ya que este procedimiento es apto de combinar ambos canales de micrófono de manera óptima, se puede esperar un. desempeño mejorado en comparación con el método de filtración de un solo canal.
La señal de mezcla descendente real puede ser obtenida de acuerdo con En lo siguiente, se muestra el ejemplo para estimar los .filtros mejorados en base a filtros de Wiener de dos canales. Por simplicidad de presentación, se dejan los índices (k, i) en lo siguiente. La ecuación de Wiener-Hopf para el primer canal de mezcla descendente es ?? (k, i) : (32) Los filtros son por consiguiente obtenidos como (33) en donde d = E {XiX¡} E {?',?'2*} - E [????] E {X X¡}¦ (34) La correlación cruzada entre las señales de entrada de micrófono Xi, X2 y los canales de mezcla descendente Yi,Y2 pueden ser expresadas por E{XiYf} = ???{8.$*} + ?·??{??*} E{x2v aWlE {SS*} + «¾ (??t? {NN*} (35) E{XiY¿} E{SS*}+w dmE{NN*} w2E {SS*} + w4E{NN*} En donde los pesos Wi han sido introducidos en (26) - (29) . 7.5 Selección entre filtración de un canal y filtración de dos canales En lo siguiente, se describirá un concepto que permite una selección señal-adaptable entre filtración de un canal y filtración de dos canales.
La filtración de dos canales, como se describe hasta ahora tiene el problema de que en la práctica algunas veces (o aun frecuentemente) produce filtros que introducen artefactos de audio. Siempre que el canal izquierdo y derecho están altamente correlacionados, la matriz de co-varianza en la ecuación de Wiener-Hopf es malamente acondicionada. La sensibilidad numérica resultante da como resultado entonces filtros que son irrazonables y provocan artefactos de audio. Para impedir esto, se usa la filtración de un solo canal, siempre que los dos canales exceden un cierto grado de correlación. Esto puede ser implementado al calcular los filtros como en dond en donde el umbral de coherencia/correlación T determina el grado de correlación en que la filtración de un solo canal es usada. Un valor de T = 0.9 produce buenos resultados.
En otras palabras, es posible cambiar selectivamente entre filtración de un canal y filtración de dos canales dependiendo del grado de correlación entre cualesquier señales de canal de la señal de micrófono de multicanal. Si la correlación es mayor que un valor de correlación predeterminada, se puede usar filtración de un canal en lugar de filtración de dos canales. 7.5 Caso general de multicanal En lo siguiente, se generalizara el cálculo mejorada de las señales de mezcla descendente estéreo surround de MPEG en base a un modelo de señal de multicanal de acuerdo con (10) a configuraciones de canal más generales. Análogamente a (10) el modelo de señal de multicanal generalizado que supone K de canales de altavoz es dado por Zfa i) = gt {k, i)S~ (k,, /) - ln(k, i)Ñi{k, i), (38) con 1 = 1, 2 K. Los factores de ganancia gi(k, i) dependen de la DOA del sonido directo y la posición del lth altavoz dentro de la configuración de reproducción. Los factores de ganancia hi pueden ser predeterminados y usados como se explica anteriormente. Zi representa señales de canal deseadas de una pluralidad de canales con 1 = 1,2, ...K.
El calculo de la señal Yj(k, i) de un canal de mezcla descendente deseado j es obtenido por una operación de mezcla apropiada de acuerdo con 25 Los pesos de mezcla m-j, representan una división o mapeo espacial especifica de áreas de reproducción, que están asociadas con la posición de lht altavoz al j-th de mezcla descendente.
Para dar un ejemplo: En el caso que de que un canal de altavoz L esto es a una cierta de reproducción, no contribuyera a la jht de mezcla descendente, el peso de la mezcla correspondiente rtij es ajustado a cero.
Análogamente a (23), (30) y (30), respectivamente, los canales de entrad de micrófono originales Xj(k, i) son modificados por filtros mejorados escogidos apropiadamente para aproximar los canales de mezcla descendentes deseados ITlj .
En el caso de un filtro de un solo canal, se tiene 15 ¾( ) = ff.( )¾( ). (40) Aquí, Y designa señales de canal reales de la señal de mezcla descendente de multicanal. ¡ Nótese que (40) puede también ser aplicada 'en el caso de que haya más de dos señales de micrófono de entrada disponibles. Los filtros resultantes también de los parámetros de pista espacial estimados. Asi, sin embargo, no se discute la estimación de los parámetros de pista espacial en base a más de dos canales de entrada de micrófono, ya que esto no es una parte esencial de la invención.
Es posible derivar las ecuaciones requeridas para los filtros mejorados de mezcla descendente de multicanal generales análogamente a (30), (30). Suponiendo M señales de entrada de micrófono, el jth canal de mezcla descendente deseado Yj(k, i) es aproximado al aplicar N filtros mejorados a las señales de micrófonos mejorados Xm(k, i): Yj{k,i) = H (fc,*)X(fc}¿), (41) X(fc, i) = [Xi(k, i). X<¿(fc, i), ... tXM(k,i)]T, (42) H¿.( ) = [Hj k.^.H^ik.Í)......Hj.uík.i.)}1' (43) El canal de mezcla descendente deseado correspondiente Yj(k, i) puede ser obtenido de (39) utilizando el modelo de señal generalizado (38).
Los elementos de la matriz mejorada de multicanal Hj (k, i) pueden ser obtenidos al resolver la ecuación de Wiener-Hopf correspondiente E {X(A;, i)X" (k, i)} Hj(fe, ¿) = E {X(/,:: i)Y*(k. i)} . (44) en donde H denota el ermitaño de un operando.
Se debe mencionar que el método descrito anteriormente puede ser considerado como un supresor de diafonia de micrófono general basado en la información de pista espacial si el . numero de altavoces K en el modelo de señal de multicanal (38) es escogido grande. En este caso, la posición del altavoz puede ser directamente ser considerado como una DOA correspondiente del sonido directo. Aplicando la invención, un supresor de diafonia flexible puede ser implementado utilizando uno o más filtros de supresión. 8. Pre-procesamiento de las señales de micrófono Hasta ahora, solamente se consideró el caso en donde las señales Xj(k, i) representan las señales de salida de micrófonos. El nuevo concepto, o método propuesto puede ser alternativamente ser aplicado a señales de micrófono pre-procesados en lugar de esto. El procedimiento correspondiente es ilustrado en la Figura 5.
El pre-procesamiento puede ser implementado al aplicar formación de las no variantes en el tiempo fija (véase, por ejemplo referencia [8] en base a las señales de entrada de micrófono originales). Como resultado del pre-procesamiento, alguna parte de las fugas de señal indeseables a ciertas señales de micrófono pueden ya ser mitigadas,' antes de la aplicación de los filtros mejorados.
. Los filtros mejorados basados en los canales de entrada pre-procesados pueden ser derivados análogamente a los filtros discutidos anteriormente, al reemplazar Xj(k, i) por la señales de salida de la etapa de pre-procesamiento Xj mod ( k, ? ) . 9. Aparato de acuerdo con la Figura 3 La Figura 3 muestra un diagrama de bloques esquemático de un aparato 300 para generar una señal de mezcla descendente mejorada en base a una señal de micrófono de multicanal de acuerdo con otra modalidad de la invención.
EL aparato 300 comprende dos micrófonos 306, 308 que proveen una señal de micrófono de dos canales 310, que comprende una señal del primer canal, que es representada por una representación de dominio de tiempo-frecuencia Xi (k, i) y una señal del segundo canal que es representada por una segunda representación de tiempo-frecuencia X2 (k, i) . El aparato 300 también comprende un análisis espacial 320 que recibe la señal de micrófono de dos canales 310 y provee, en base a la misma, parámetros de pista espacial 322. El análisis espacial 320 puede tomar la funcionalidad del analizador espacial 320 o del analizado de señal 220, de tal manera que los parámetros de pista espacial 322 pueden ser equivalentes a los parámetros de pista espacial 122 o a la información de energía compuesta 122a y la información de dirección 122b. El aparato 300 también comprende un dispositivo de control 316 que recibe los parámetros de pista espacial 322 y que también recibe la señal de micrófono de dos canales 310. La unidad de control 316 también recibe un modelo de señal de multicanal 318 o comprende parámetros de tal modelo de señal de multicanal 318. El dispositivo de control 316 provee parámetros de filtro mejorados 332 al dispositivo de mejora de mezcla descendente 340. El dispositivo de control 316 puede por ejemplo tomar la funcionalidad del calculador de filtro 130 o del calculador de filtro 230, de tal manera que los parámetros de filtro mejorados 332 pueden ser equivalentes a los parámetros de filtro mejorados 132 o los parámetros de filtro mejorados 232. El dispositivo de mejora de mezcla descendente 340 recibe la señal de micrófono de dos canales 310 y también los parámetros de filtro mejorados 332 y provee, en base a los mismos, la señal de mezcla descendente de multicanal mejorada 312. Un señal del primer canal de la señal de mezcla descendente mejorada de multicanal 312 es representada por una representación de tiempo-frecuencia Yi (k, i) y una señal de segundo canal de la señal de mezcla descendente de multicanal mejorada 312 es representada por una representación de tiempo-frecuencia Y2 (k, i) . Se debe notar que el dispositivo de mejora de mezcla descendente 340 puede tomar la funcionalidad del filtro 140 o del¦ proveedor de señal de audio de dos canales 240. 10. Aparato de acuerdo con la Figura 5 La Figura 5 muestra un diagrama de bloques esquemático de un aparato 500 para generar una señal de mezcla descendente mejorada en base a la señal de micrófono de multicanal. El aparato 500 de acuerdo con la Figura 5 es muy similar al aparato 300 de acuerdo con la Figura 3, de tal manera que los medios y señales idénticos son designados con números de referencia iguales y no serán explicados otra vez. Sin embargo, además de los bloques funcionales del aparato 300, el aparato 500 también comprende un pre-procesamiento 580 que recibe la señal de micrófono de multicanal 310 y provee en base, a la misma una versión pre procesada 310' de la señal de micrófono de multicanal. En este caso, la mejora de mezcla de descendente 340 recibe la versión procesada 310' de la señal de micrófono de multicanal 210, en lugar de la señal de micrófono de multicanal 310 misma. También, el dispositivo de control 316 recibe la versión procesada 310' de la señal de micrófono de multicanal, en lugar de la señal de micrófono de multicanal 310 misma. Sin embargo, la funcionalidad de la mejora de mezcla descendente 340 y del dispositivo de control 316 no es afectada sustancialmente por esta modificación. 11. Asignación de señales de canal a señales de mezcla descendente de acuerdo con la Figura 4 Como se discute anteriormente, el modelado de la mezcla descendente, que es usado para derivar los canales de mezcla descendente deseados Yi, Y2 o algunas de las características estadísticas de los mismos, comprende un mapeo de un componente de sonido directo (por ejemplo, S (k, i) ) y de componente de sonido difuso (por ejemplo, N, (k, i) sobre señales de canal (por ejemplo, L (k, i), R (k, i), C (k, i), Ls (k, i), Rs (k, i) o Zi (k, i))) y un mapeo de señales de canal de altavoz sobre las señales de canal de mezcla descendente .
Con respecto al primer mapeo del componente de sonido directo y el componente de sonido difuso sobre las señales de canal de altavoz, un mapeo dependiente de la dirección puede ser usado, que es descrito por los factores de ganancia gi. Sin embargo, con respecto al mapeo de las señales de canal de altavoz sobre las señales de canal de mezcla descendente, se pueden usar suposiciones fijas que pueden ser descritas por una matriz de mezcla descendente. Como se ilustra en la Figura 4 se puede suponer que solamente las señales de canal de altavoz C, L y Ls deben contribuir a la primera señal de canal de mezcla descendente Yi y que solamente las señales de canal de altavoz C, R y Rs deben contribuir a la señal de canal de mezcla descendente Y2.
Esto es ilustrado en la Figura 4. 12. Flujo de procesamiento de señal de acuerdo con la Figura 6 En lo siguiente, se describirá el: flujo del procesamiento de señal en una modalidad de acuerdo con la invención con referencia a la Figura 6. La Figura 6 muestra una representación esquemática del flujo de procesamiento de señal para derivar los parámetros de filtro mejorados H a partir de la señal de micrófono de multicanal representada por ejemplo, por representaciones de tiempo-frecuencia Xi y x2.
El flujo de procesamiento 600 comprende por ejemplo como una primera etapa, un análisis espacial 610 que puede tomar la funcionalidad de un cálculo de parámetro de pista espacial. Asi, una, información de potencia del sonido directo (o información de energía del sonido directo), E {SS*}, una información de potencia del sonido difuso (o información de energía del sonido difuso) E {NN*} y una información de dirección a, a puede ser obtenida en base a la señales de micrófono de multicanal. Detalles con respecto a la derivación de la información de potencia de sonido directo (o información de energía de sonido directo) de la información de potencia de sonido difuso (o información de energía de sonido difuso) y la información de dirección han sido discutidos anteriormente.
EL flujo de procesamiento 600 también comprende un mapeo del factor de ganancia 320, en la cual la información de dirección es mapeada sobre una pluralidad de factores de ganancia (por ejemplo, factores de ganancia gi a g5) . El mapeo de factor de ganancia 620 puede por ejemplo ser efectuado utilizando una ley de toma panorámica de amplitud de multicanal como se describe anteriormente.
El flujo de procesamiento 600 también comprende un cálculo del parámetro de filtro 630, en el cual los parámetros de filtro mejorados H son derivados a partir de la información de potencia del sonido directo, la información de potencia del sonido difuso, la información de dirección y los factores de ganancia. El cálculo del parámetro de filtro 630 puede usar adicionalmente uno o más parámetros constantes que describen por ejemplo un mapeo deseado de canales de altavoz sobre señales de canal de mezcla descendente. También, se pueden aplicar parámetros predeterminados que describen un mapeo del componente del sonido difuso sobre las señales de altavoz.
El cálculo del parámetro de filtro comprende, por ejemplo un mapeo W632. En el mapeo w, que puede ser efectuado de acuerdo con las ecuaciones 26 a 29 se pueden obtener valores wi a w4 que pueden servir como cantidades intermedias. El cálculo del parámetro de filtro 630 comprende además un mapeo H 634 que puede ser efectuado por ejemplo de acuerdo con la ecuación 25. En el mapeo H 634, los parámetros de filtro mejorados H pueden ser determinados. Para el mapeo H, valores de correlación cruzada deseados E {??, YX*},E {X2 Y2*} entre canales de la señal de micrófono y los canales de la señal de mezcla descendente pueden ser usados. Estos valores de correlación cruzada deseados pueden ser obtenidos en base a la información de potencia de sonido directo E {SS*} y E {NN*}, como se puede ver en el numerador de las ecuaciones (25), que es idéntico al numerador de las ecuaciones (24) .
Para concluir, el flujo de procesamiento de la Figura 6 puede ser aplicado para derivar los parámetros de filtro mejorados H a partir de la señal de micrófono de multicanal representada por las señales de canal ??, X2. 13. Flujo de procesamiento de señal de acuerdo con la Figura 7 La Figura 7 muestra una representación esguemática de un flujo de procesamiento de señal 700 de acuerdo con otra modalidad de la invención. El flujo de procesamiento de señal 700 puede ser usado para derivar parámetros de filtro mejorado H a partir de una señal de micrófono de multicanal.
El flujo de procesamiento de señal 700¦ comprende un análisis espacial 710 que puede ser idéntico al análisis espacial 610. También, el flujo de procesamiento de señal 700 comprende un mapeo del factor de ganancia 720,¦' que puede ser idéntico al mapeo de facto de ganancia 620.
El flujo de procesamiento de señal 700 también comprende un cálculo del parámetro de filtro 730. El cálculo del parámetro de filtro 730 puede comprender un mapeo w 732 que puede ser idéntico al mapeo w 632 en algunos casos. Sin embargo, se pueden usar diferentes mapeos w si se aprecia que es apropiado.
El cálculo del parámetro de filtro 730 también comprende un cálculo de correlación cruzada deseada 734, en el curso del cual una correlación cruzada deseada entre canales de la señal de micrófono de multicanal y canales de la señal de mezcla descendente deseada son calculados. Este cálculo puede ser efectuado por ejemplo de acuerdo con la ecuación 35. Se debe notar que se puede aplicar un modelo de una señal de mezcla descendente deseada en el cálculo de correlación cruzada deseada 734. Por ejemplo, suposiciones en como el componente de sonido directo de la señal de micrófono de multicanal debe ser mapeado a una pluralidad de señales de altavoz en dependencia de la información de dirección pueden ser aplicadas en el cálculo de correlación cruzada deseada 734. Además, suposiciones de como los componentes de sonido difuso de la señal de micrófono de multicanal deben ser reflejados en las señales de altavoz pueden también ser evaluadas en el cálculo de correlación cruzada deseada 734. Además, suposiciones con respecto a un mapeo deseado de canales de altavoz múltiples sobre la señal de mezcla descendente pueden también ser aplicadas al cálculo de correlación cruzada deseada 734. Asi, una correlación cruzada deseada E {Xi Yj*} entre canales de la señal dé micrófono y canales de la señal de mezcla descendente (deseada) puede ser obtenida en base a la información de potencia de sonido directo, la información de potencia de sonido difuso, la dirección de información y factores de ganancia dependientes de la dirección (en donde la última información puede ser combinada para obtener valores de w intermedios) .
El cálculo del . parámetro de filtro 730 también comprende una solución de la ecuación de Wiener-Hopf 736, que puede por ejemplo ser efectuado de acuerdo con las ecuaciones 33 y 34. Para este propósito, la ecuación de Wiener-Hopf puede ser ajustada en dependencia de la información dé potencia de sonido directo, la información de potencia del sonido difuso y la correlación cruzada deseada entre canales de la señal de micrófono de multicanal y canales de la señal de mezcla descendente (deseada) . Como una solución de la ecuación de Wiener-Hopf (por ejemplo, la ecuación 32) se tienen parámetros de filtro mejorados H.
Para resumir lo anterior, la determinación de los parámetros de filtro mejorado H puede comprender etapas separadas de cálculo de una correlación cruzada deseada y de establecimiento y solución de una ecuación de Wiener-Hopf (etapa 736) en algunas modalidades. 14. Conclusiones Para resumir lo anterior, las modalidades de acuerdo con la invención crean un concepto y métodos mejorados para calcular una señal de c deseada de codificadores de audio espacial paramétricos en base a señales de entrada de micrófono. Un ejemplo importante es dado por la conversión de una señal de micrófono estéreo a una mezcla de descendente surround de MPEG correspondiente a los parámetros de MPS calculados. La señal de mezcla descendente mejorada conduce a una calidad de audio espacial significativamente mejorada y propiedad de localización después de la descodificación de MPS en comparación con el caso del estado del arte propuesto en la referencia [2]. Una modalidad simple de acuerdo con la invención comprende las siguientes etapas 1 a : (1) recibir señales de entrada de micrófono; (2) calcular parámetros de pista espacial; (3) determinar filtros mejorados de mezcla descendente en base al modelo de los canales de mezcla descendente deseados, un modelo de señal de altavoz de multicanal para la salida del descodificador y parámetros de pista 1 espacial y (4) aplicar los filtros mejorados a las señales de entrada de micrófono para obtener señales de mezcla descendente mejoradas para uso con micrófonos de audio espacial .
Otra modalidad simple de acuerdo con la invención crea un aparato, un método o un programa de computador para generar una señal de mezcla descendente, el aparato, método o programa de computadora comprende un calculador de filtro para calcular parámetros de' filtro mejorados en base a información de señal de micrófono o en base a información en un montaje de reproducción propuesto y el aparato, método o programa de computadora comprende un arreglo' de filtro (o etapa de filtración) para filtrar señales de micrófono utilizando los parámetros de filtro mejorados para obtener la señal de mezcla descendente mejorada.
Este aparato, método o programa de computadora puede opcionalmente puede ser mejorado en que el calculador de filtro esta configurado para calcular los parámetros de filtro mejorados en base a un modelo de los canales de mezcla descendentes deseados, modelo de señal de altavoz de multicanal para la salida del descodificador o' parámetros de pista espacial. 15. Alternativas de implementacion Aunque algunos aspectos han sido descritos en el contexto de un aparato, es claro que estos aspectos también representan una descripción del método correspondiente, en donde un bloque o dispositivo corresponde a 1 una etapa de método o un elemento de una etapa del método.! Análogamente, aspectos descritos en el contexto de una etapa de método también representan una descripción de un bloque o ítem o elemento correspondiente de un aparato correspondiente. Algunas o todas las etapas de método pueden ser ejecutadas por (o usando) un aparato de elementos físicos como por ejemplo un microprocesador, una computadora programable o un circuito electrónico. En algunas modalidades, algunas o más de las etapas de método más importantes pueden ser ejecutadas por tal aparato.
La señal de audio codificada de la invención puede ser almacenada en un medio de almacenamiento digital o puede ser transmitida en un medio de transmisión tal como un medio de transmisión inalámbrico o un medio de transmisión cableado tal como internet.
Dependiendo de ciertos requerimientos de implementación, modalidades de la invención pueden ser implementados en elementos físicos o en elementos de programación. La implementación puede ser efectuada utilizandq un medio de almacenamiento digital, por ejemplo un disco flexible, un DVD, un blue-ray, un cd, un ROM, un PROM, un EPROM, un EEPROM o una memoria instantáneas, que tiene señales de control que se pueden leer electrónicamente almacenadas en el mismo que cooperan (o son aptas de cooperar) con un sistema de computadora programable de tal manera que el método respectivo es efectuado. Por consiguiente, [ el medio de almacenamiento digital se puede leer por computadora.
Algunas modalidades de acuerdo con ,1a invención comprenden un portador de datos que tiene señales de control que se pueden leer electrónicamente que son aptas de cooperar un sistema de computadora . programable, de tal manera que uno de los métodos descritos en la presente es efectuado.
En general, las modalidades de la presente invención pueden ser implementadas como un producto de programa de computadora con códigos de programa, los códigos de programa son operativos para efectuar uno de los métodos cuando el producto de programa de computadora se ejecuta en una computadora. Los códigos de programa pueden por ejemplo ser almacenados en un portador que se puede leer por la máquina.
Otras modalidades comprenden el programa de computadora para efectuar uno de los métodos descritos en la presente, almacenados en un portador que se puede leer por maquina.
En otras palabras, una modalidad del método de la invención es por consiguiente un programa de computadora que tiene códigos de programa para efectuar uno de los métodos descritos en la presente, cuando el programa de computadora se ejecuta en una computadora. 1 Una modalidad adicional de los métodos de la invención es por consiguiente un portador de datos ; (o medio de almacenamiento digital o medio que se puede leer por computadora) que comprende registrarlos en el mismo, el programa de computadora para efectuar uno de los métodos descritos en la presente. El portador de datos, medios de almacenamiento digital o el medio grabado son comúnmente tangibles y/o sin transición.
Una modalidad adicional del método de la invención es por consiguiente una corriente de datos o una secuencia de señales que representan el programa de computadora para efectuar uno de los métodos descritos en la presente. La corriente de datos o la secuencia de señales pueden por ejemplo estar configuradas para ser transferidas vía una colección de comunicación . de datos, por ejemplo vía internet.
Una modalidad adicional comprende : medios de procesamiento, por ejemplo una computadora o un dispositivo lógico programable configurado para o apto para efectuar uno de los métodos descritos en la presente.
Una modalidad adicional comprende una computadora que tiene instalado en la misma el programa de computadora para efectuar uno de los métodos descritos' en la presente.
Una modalidad adicional de acuerdo con¦ la invención comprende un aparato o un sistema configurado para transferir (por ejemplo, electrónica u ópticamente) un programa de computadora para efectuar uno de los métodos descritos en la presente a un receptor. El receptor puede ser por ejemplo, una computadora, un dispositivo móvil, un dispositivo de memoria o los semejantes. El aparato o sistema puede comprender por ejemplo un servidor de archivos para transferir programas de computadora al receptor., En algunas modalidades, se puede usar un dispositivo lógico programable (por ejemplo, un arreglo , de compuerta programable en el campo) para efectuar algunas o todas las funcionalidades de los métodos descritos en la presente. En algunas modalidades, un arreglo de compuerta programable al campo puede cooperar con un microprocesador con el fin de efectuar uno de los métodos descritos en la, presente. En general los métodos son preferiblemente efectuados mediante cualquier aparato de elementos físicos.
Las modalidades descritas anteriormente son solamente ilustrativas para los principios de la presente1 invención. Se entenderá que modificaciones y variaciones de los arreglos y los detalles descritos en la presente serán evidentes para otros experimentados en el arte. Es la intención por consiguiente estar limitado solamente por el alcance de las reivindicaciones de patente pendientes y no por los detalles específicos presentados a manera de descripción y explicación de las modalidades en la presente.

Claims (17)

REIVINDICACIONES
1. Un aparato para generar una señal de mezcla descendente mejorada en base a una señal de micrófono de micro canal, el aparato esta caracterizado porque comprende: un analizador espacial configurado para calcular un conjunto de parámetros de pista espacial que comprenden una información de dirección que describe una dirección de llegada del sonido directo, una información de potencia del sonido directo y una información de potencia del sonido difuso, en base a la señal de micrófono de multicanal'; un calculador de filtro para calcular parámetros de filtro mejorados en dependencia de la información de dirección que describe la dirección de llegada del sonido directo, en dependencia de la información de, potencia del sonido directo y en dependencia de la información de patente del sonido difuso y un filtro para filtrar la señal de micrófono o una señal derivada de la misma, utilizando los parámetros de filtro mejorados para obtener la señal de mezcla descendente mejorada; en donde el calculador de filtro esta configurado para calcular los parámetros de filtro mejorados en dependencia de los factores de ganancia dependientes de la dirección que describen contribuciones deseadas de un componente de sonido directo de la señal de micrófono de multicanal a una pluralidad de señales de altavoz y en dependencia de uno o más valores de matriz de mezcla descendente que describen contribuciones deseadas de una pluralidad de canales de audio a uno o más canales de la señal de mezcla descendente mejorada.
2. El aparato de acuerdo con la reivindicación 1, caracterizado porque el calculador de filtro esta configurado para calcular los parámetros de filtro mejorados de tal manera que la señal de mezcla descendente mejorada se aproxima a una señal de mezcla descendente deseada.
3. El aparato de acuerdo con la reivindicación 1 o la reivindicación 2, caracterizado porque el calculador de filtro esta configurado para calcular valores ele correlación cruzada deseados entre señales de canal de, la señal de micrófono de multicanal y señales de canal deseadas de la señal de mezcla descendente en dependencia de los parámetros de pista espacial y : en donde el calculador de filtro esta configurado para calcular los parámetros de filtro mejorados en dependencia de los valores de correlación cruzada deseados. 1
4. El aparato de acuerdo con la reivindicación 3, caracterizado porque el calculador de filtro esta configurado para calcular los valores de correlación cruzada deseados en dependencia de los factores de ganancia dependientes de la dirección que describen contribuciones deseadas de un componente del sonido directo de la señal de micrófono de multicanal a una pluralidad de señales de altavoz.
5. El aparato de acuerdo con la reivindicación 4, caracterizado porque el calculador de filtro esta configurado para mapear la dirección de información sobre un conjunto de factores de ganancia dependiente de la dirección.
6. El aparato de acuerdo con cualquiera de las reivindicaciones 3 a 5, caracterizado porque el, calculador de filtro esta . configurado para considerar la información de potencia del sonido directo y la información dé potencia del sonido difuso para calcular los valores de correlación cruzada deseados.
7. El aparato de acuerdo con la reivindicación 6, caracterizado porque el calculador de filtro esta configurado para ponderar la información de potencia del sonido directo en dependencia de la información de dirección y para aplicar una ponderación predeterminada que es independiente de la información de dirección a la información de potencia del sonido difuso con el fin de calcular los valores de correlación cruzada deseados.
8. El aparato de acuerdo con cualquier de las reivindicaciones 1 a 7, caracterizado porque el 1 calculador de filtro esta configurado para calcular los coeficientes de filtro Hi, H2 de acuerdo con ! en donde E{SS*} es información de potencia del sonido directo, en donde E{NN*} es información de potencia del sonido difuso, ; en donde Wi y w2 son coeficientes que son dependientes de la información de dirección y en donde w3 y w4 son coeficientes determinados por las ganancias del sonido difuso (hi, i 2 , h3, h4, h5) y en donde el filtro esta configurado para determinar una señal del primer canal Y i (k,i) y una señal del segundo canal Y 2 (k,i) de la señal de mezcla descendente mejorada en dependencia de la señal del primer canal Xi(k,i) y la señal del segundo canal X2(k,i) de la señal de ; micrófono de multicanal de acuerdo con , fi (k,Í) = Hl (k,i)Xi (k,i) ' Y2 (k, i) = H2 (k, i)X2 (k,i)
9. El aparato de acuerdo con cualquiera de las reivindicaciones 1 a 7, caracterizado porque el calculador de filtro esta configurado para calcular coeficientes de filtro (Hi, Hi 2, H2 i y H2#2) de acuerdo con en donde en donde Xi designa, una señal del primer canal de la señal de micrófono de multicanal, X2 designa una señal del segundo canal de la señal de micrófono de multicanal, E{ . } designa una operación de promediación de tiempo corto, * designa una operación conjugada compleja, ?{?]??*}, ?{?2? }, E{XIY2*} y E{X2Y2*} designan valores de correlación cruzada entre señales de canal Xi, X2 de la señal de micrófono de multicanal de señales de canal deseados Yi, Y2 de la señal de mezcla descendente mejorada. '
10. El aparato de acuerdo con la cualquiera de las reivindicaciones 1 a 9, caracterizado porque el calculador de filtro esta configurado para calcular los parámetros de filtro mejorados Hj,i(k,i) a H-¡fM(k,i) de tal manera que las señales de canal Yj(k,i) de la señal de mezcla descendente mejorada obtenida mediante filtración de señales de canal (Xi, X?) de la señal de micrófono de multicanal de acuerdo con los parámetros de filtro mejorados, se aproxima con respecto a una medida de similaridad estadística, a señales de canal Yj(k,i) deseadas definidas como con 2, {k, i) = g, (k, i)S(k, i) + h,{k, i)N, {k, i). en donde gi son factores de ganancia que son dependientes de la información de dirección (a, a) y que representan contribuciones deseadas de un componente del sonido directo S de la señal de micrófono de multicanal a una pluralidad de señales de altavoz (Zi) ; 1 en donde hi son valores predeterminados ,que describen contribuciones deseadas del componente de sonido difuso ( N ) de la señal de micrófono de multicanal a una pluralidad de señales de altavoz.
11. El aparato de acuerdo con cualquiera de las reivindicaciones 1 a 10, caracterizado porque el calculador de filtro está configurado para evaluar una ecuación de Wiener-Hopf para derivar los parámetros de filtro mejorados, en donde la ecuación de Wiener-Hopf ¦ describe una relación entre los valores de correlación ?{????*}, ?{???2*}, E{X2Xi*}, E{X2X2*}, tales valores de correlación describen una relación entre diferentes pares de canal de la señal de micrófono de multicanal, parámetros de filtro mejorados (Hi(1, Hi,2, H2/i, H2/2) y valores de correlación cruzada deseados (E{XiYi*}f ?{?2? .}, E{XIY2*}, E{X2Y2*}) entre señales de canal (Xi, X2) de' señal de micrófono de multicanal , y señales .de canal deseadas (Yi,Y2) de la señal de mezcla descendente.
12. El aparato de acuerdo con cualquiera de las reivindicaciones 1 a 11, caracterizado porque el calculador de filtro esta configurado para calcular los ^parámetros de filtro mejorados en dependencia de un modelo de los canales de mezcla descendentes deseados.
13. El aparato de acuerdo con cualquiera de las reivindicaciones 1 a 12, caracterizado porque el calculador de filtro está configurado para efectuar selectivamente una filtración de un solo canal en la cual un primer canal ( Yl ) de la señal de mezcla descendente mejorada es derivado mediante una filtración de un primer canal (Xi) de la señal de micrófono de multicanal y en la cual un segundo canal ( Y2 ) de la señal de mezcla descendente mejorada es derivado mediante filtración de un segundo canal (X2) de la señal de micrófono de multicanal mientras que se evita la diafonia del primer canal de la señal de micrófono de multicanal al segundo canal de la señal de mezcla descendente mejorada y del segundo canal de la señal de micrófono de multicanal al primer canal de la señal de mezcla descendente mejorada o una filtración de dos canales en la cual un primer canal ( F, ) de la señal de mezcla descendente mejorada es derivado mediante filtración de un primero y un segundo canal (Xi, X2) de la señal de micrófono de multicanal y en la cual un segundo canal ( Y2 ) de la señal de mezcla descendente mejorada es derivado mediante filtración de un primero yi segundo canal (Xi, X2) de la señal de micrófono de multicanal,1 en dependencia de un valor de correlación que describe una correlación entre el primer canal (X2) de la señal de micrófono de multicanal y el segundo canal (Xi) de la señal de micrófono de multicanal.
14. Un método para generar una señal de mezcla descendente mejorada en base a una señal de micrófono de multicanal, el método esta caracterizado porque ¡ comprende : Calcular un conjunto de parámetros de pista espacial que comprenden información de dirección que describe la dirección de llegada del sonido directo, información de1 potencia del sonido directo e información de potencia de sonido difuso en base a la señal de micrófono de multicanal, calcular parámetros de filtro mejorados en dependencia de la información de dirección que describe la dirección de llegada del sonido directo, en dependencia de la información de potencia del sonido directo y en dependencia de la información de potencia del sonido difuso y filtrar la señal de micrófono o una señal derivada de la misma utilizando los parámetros de filtro mejorados para obtener la señal de mezcla descendente mejorada; en donde los parámetros de filtro mejorados (??, H2; ??,?, HI,2Í H2(i, H2.2) son calculados en dependencia de los factores de ' ganancia dependientes de la dirección (gi, g2, g3, q^, gs) que describen contribuciones deseadas de un componente del sonido directo (S) de la señal de micrófono dé multicanal a una pluralidad de señales de altavoz (L, R, C, Ls, Rs; Zi) y en dependencia de uno o más valores de matriz de mezcla descendente (gs; que describen contribuciones deseadas I de una pluralidad de canales de audio (gs; , a ), a uno o más canales de la señal de mezcla descendente mejorada.
15. Un aparato para generar una señal de mezcla descendente mejorada en base a la señal de micrófono de multicanal, el aparato esta caracterizado porque comprende: un analizador espacial configurado para; calcular un conjunto de parámetros de pista espacial, (E{NN*}, E{SS*}, a, a) que comprende información de dirección (a, a) que describe la dirección de llegada del sonido directo, información de potencia del sonido directo (E{SS*}) de información de potencia del sonido difuso (E{NN*}), en base a la señal de micrófono de multicanal; un calculador de filtro para calcular parámetros de filtro mejorados en dependencia de la información de dirección (a, a) que describe la dirección de llegada del sonido directo en dependencia de la información de potencia del sonido directo (E{SS*}) y en dependencia de la información de potencia del sonido difuso (E{NN*}) y un filtro para filtrar la señal de micrófono o una señal derivada de la misma, utilizando los parámetros de filtro mejorados para obtener la señal de mezcla descendente mejorada; en donde el calculador de filtro esta configurado para efectuar selectivamente filtración de un solo canal, en la cual un primer canal (7,) de mezcla descendente mejorada es derivado mediante filtración de un primer canal (Xi) de la señal de micrófono de multicanal y en la cual un segundo canal (Y2) de la señal de mezcla descendente mejorada es derivado mediante filtración de un segundo canal (X2) de la señal de micrófono de multicanal en tanto que, se filtra la diafonia del primer canal de la señal de > micrófono de multicanal al segundo canal de la señal de mezcla descendente mejorada y del segundo canal de la señal de micrófono de multicanal al primer canal de la señal de mezcla descendente mejorada o una filtración de dos canales en la cual un primer canal ( Y ) de la señal de mezcla descendente mejorada es derivado mediante filtración de un primero y un segundo¦ canal ( Xi , X2 ) de la señal de micrófono de mult icanal y en la cual un segundo canal ( Y2 ) de la seña l de me zcla de scendente mej orada es derivado mediante f i ltración un primero y ' segundo canal (Xi , X2 ) de la señal del micrófono de multicanal , en dependencia de un valor de correlación que describe una correlación entre el primer canal (Xi ) de la seña l de micrófono del mult icanal y el segundo canal ( X2 ) de la señal de micrófono de mult icanal .
16. Un método para generar una señal de mezcla descendente mejorada en base a una señal de micrófono de multicanal, el método esta caracterizado porque comprende : calcular un conjunto de parámetros de pista espacial que describe información de dirección que describe la dirección de llegada del sonido directo, información de potencia del sonido directo e información de potencia del sonido difuso en base ¦ a la señal de micrófono de multicanal; 1 calcular parámetros de filtro mejorados en dependencia de la información de dirección que describe la dirección de llegada del sonido directo en dependencia de información de potencia del sonido directo y en dependencia de la información de potencia del sonido difuso y filtrar la señal de micrófono o una señal derivada de la misma utilizando los parámetros de filtro mejorado para obtener la señal de mezcla descendente mejorada; en donde el método comprende efectuar selectivamente filtración de un solo canal, en la cual un primer canal (Yt ) de la señal de mezcla descendente mejorada es derivado mediante filtración de un primer canal (Xi) de la señal de micrófono de multicanal y en la cual un segundo canal ( Y2 ) de la señal de mezcla descendente mejorada es derivado mediante filtración de un segundo canal (X2) de la señal de micrófono de multicanal mientras que se evita la diafonia del primer canal de la señal de micrófono de multicanal al segundo canal de la señal de mezcla descendente mejorada y del segundo canal de la señal de micrófono de multicanal al primer canal de la señal de mezcla descendente mejorada o una filtración de dos canales en la cual un primer canal ( Y{ ) de la señal de mezcla descendente mejorada es derivado mediante filtración de un primero y un segundo canal (Xi, X2) de la señal 1 de micrófono de multicanal y en la cual un segundo canal ( Y2 ) de la señal de mezcla descendente mejorada es derivado mediante filtración de un primero y segundo canal (Xi, X2) de la señal de micrófono de multicanal, en dependencia de un valor de correccional que describe una correlación entre el primer canal (Xi) de la señal de micrófono de multicanal y el segundo canal (X2) de la señal de micrófono de multicanal .
17. Un programa de computadora para efectuar un método de acuerdo con la reivindicación 14' o la reivindicación 16, cuando el programa de computadora se ejecuta en una computadora.
MX2012009785A 2010-02-24 2011-02-15 Aparato para generar señal de mezcla descendente mejorada, metodo para generar señal de mezcla descendente mejorada y programa de computadora. MX2012009785A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US30755310P 2010-02-24 2010-02-24
PCT/EP2011/052246 WO2011104146A1 (en) 2010-02-24 2011-02-15 Apparatus for generating an enhanced downmix signal, method for generating an enhanced downmix signal and computer program

Publications (1)

Publication Number Publication Date
MX2012009785A true MX2012009785A (es) 2012-11-23

Family

ID=43652304

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2012009785A MX2012009785A (es) 2010-02-24 2011-02-15 Aparato para generar señal de mezcla descendente mejorada, metodo para generar señal de mezcla descendente mejorada y programa de computadora.

Country Status (12)

Country Link
US (1) US9357305B2 (es)
EP (1) EP2539889B1 (es)
JP (1) JP5508550B2 (es)
KR (1) KR101410575B1 (es)
CN (2) CN102859590B (es)
AU (1) AU2011219918B2 (es)
BR (1) BR112012021369B1 (es)
CA (1) CA2790956C (es)
ES (1) ES2605248T3 (es)
MX (1) MX2012009785A (es)
RU (1) RU2586851C2 (es)
WO (1) WO2011104146A1 (es)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9084058B2 (en) 2011-12-29 2015-07-14 Sonos, Inc. Sound field calibration using listener localization
RU2014133903A (ru) * 2012-01-19 2016-03-20 Конинклейке Филипс Н.В. Пространственные рендеризация и кодирование аудиосигнала
EP2665208A1 (en) * 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
US9106192B2 (en) 2012-06-28 2015-08-11 Sonos, Inc. System and method for device playback calibration
US9219460B2 (en) 2014-03-17 2015-12-22 Sonos, Inc. Audio settings based on environment
CN103596116B (zh) * 2012-08-15 2015-06-03 华平信息技术股份有限公司 一种视频会议系统中自动调节实现立体声效果的方法
US9554203B1 (en) 2012-09-26 2017-01-24 Foundation for Research and Technolgy—Hellas (FORTH) Institute of Computer Science (ICS) Sound source characterization apparatuses, methods and systems
US10175335B1 (en) 2012-09-26 2019-01-08 Foundation For Research And Technology-Hellas (Forth) Direction of arrival (DOA) estimation apparatuses, methods, and systems
US20160210957A1 (en) 2015-01-16 2016-07-21 Foundation For Research And Technology - Hellas (Forth) Foreground Signal Suppression Apparatuses, Methods, and Systems
US10136239B1 (en) 2012-09-26 2018-11-20 Foundation For Research And Technology—Hellas (F.O.R.T.H.) Capturing and reproducing spatial sound apparatuses, methods, and systems
US9549253B2 (en) * 2012-09-26 2017-01-17 Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) Sound source localization and isolation apparatuses, methods and systems
US9955277B1 (en) 2012-09-26 2018-04-24 Foundation For Research And Technology-Hellas (F.O.R.T.H.) Institute Of Computer Science (I.C.S.) Spatial sound characterization apparatuses, methods and systems
US10149048B1 (en) 2012-09-26 2018-12-04 Foundation for Research and Technology—Hellas (F.O.R.T.H.) Institute of Computer Science (I.C.S.) Direction of arrival estimation and sound source enhancement in the presence of a reflective surface apparatuses, methods, and systems
MY179136A (en) 2013-03-05 2020-10-28 Fraunhofer Ges Forschung Apparatus and method for multichannel direct-ambient decomposition for audio signal processing
WO2014168618A1 (en) * 2013-04-11 2014-10-16 Nuance Communications, Inc. System for automatic speech recognition and audio entertainment
PL3429233T3 (pl) 2013-07-30 2020-11-16 Dts, Inc. Dekoder matrycowy z panoramowaniem parami o stałej mocy
WO2015081293A1 (en) * 2013-11-27 2015-06-04 Dts, Inc. Multiplet-based matrix mixing for high-channel count multichannel audio
EP2884491A1 (en) * 2013-12-11 2015-06-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Extraction of reverberant sound using microphone arrays
US9264839B2 (en) 2014-03-17 2016-02-16 Sonos, Inc. Playback device configuration based on proximity detection
EP2942982A1 (en) * 2014-05-05 2015-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. System, apparatus and method for consistent acoustic scene reproduction based on informed spatial filtering
WO2015172854A1 (en) 2014-05-13 2015-11-19 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for edge fading amplitude panning
US9952825B2 (en) 2014-09-09 2018-04-24 Sonos, Inc. Audio processing algorithms
CN106688248B (zh) * 2014-09-09 2020-04-14 搜诺思公司 音频处理算法和数据库
DE102015203855B3 (de) * 2015-03-04 2016-09-01 Carl Von Ossietzky Universität Oldenburg Vorrichtung und Verfahren zum Ansteuern des Dynamikkompressors und Verfahren zum Ermitteln von Verstärkungswerten für einen Dynamikkompressor
JP6434165B2 (ja) 2015-03-27 2018-12-05 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 前面ラウドスピーカによって個別の三次元音響を達成する、車内再生のためのステレオ信号を処理する装置および方法
GB2540175A (en) * 2015-07-08 2017-01-11 Nokia Technologies Oy Spatial audio processing apparatus
US9693165B2 (en) 2015-09-17 2017-06-27 Sonos, Inc. Validation of audio calibration using multi-dimensional motion check
CN108028985B (zh) 2015-09-17 2020-03-13 搜诺思公司 用于计算设备的方法
US11432095B1 (en) * 2019-05-29 2022-08-30 Apple Inc. Placement of virtual speakers based on room layout
US9743207B1 (en) 2016-01-18 2017-08-22 Sonos, Inc. Calibration using multiple recording devices
US10003899B2 (en) 2016-01-25 2018-06-19 Sonos, Inc. Calibration with particular locations
US11106423B2 (en) 2016-01-25 2021-08-31 Sonos, Inc. Evaluating calibration of a playback device
US11234072B2 (en) 2016-02-18 2022-01-25 Dolby Laboratories Licensing Corporation Processing of microphone signals for spatial playback
EP4235646A3 (en) 2016-03-23 2023-09-06 Google LLC Adaptive audio enhancement for multichannel speech recognition
US9860662B2 (en) 2016-04-01 2018-01-02 Sonos, Inc. Updating playback device configuration information based on calibration data
US9864574B2 (en) 2016-04-01 2018-01-09 Sonos, Inc. Playback device calibration based on representation spectral characteristics
US9763018B1 (en) 2016-04-12 2017-09-12 Sonos, Inc. Calibration of audio playback devices
CN106024001A (zh) * 2016-05-03 2016-10-12 电子科技大学 一种提高麦克风阵列语音增强性能的方法
US11589181B1 (en) * 2016-06-07 2023-02-21 Philip Raymond Schaefer System and method for realistic rotation of stereo or binaural audio
US11032660B2 (en) * 2016-06-07 2021-06-08 Philip Schaefer System and method for realistic rotation of stereo or binaural audio
US9794710B1 (en) 2016-07-15 2017-10-17 Sonos, Inc. Spatial audio correction
US10372406B2 (en) 2016-07-22 2019-08-06 Sonos, Inc. Calibration interface
US10459684B2 (en) 2016-08-05 2019-10-29 Sonos, Inc. Calibration of a playback device based on an estimated frequency response
GB2559765A (en) * 2017-02-17 2018-08-22 Nokia Technologies Oy Two stage audio focus for spatial audio processing
CN106960672B (zh) * 2017-03-30 2020-08-21 国家计算机网络与信息安全管理中心 一种立体声音频的带宽扩展方法与装置
GB201718341D0 (en) 2017-11-06 2017-12-20 Nokia Technologies Oy Determination of targeted spatial audio parameters and associated spatial audio playback
CN110047478B (zh) * 2018-01-16 2021-06-08 中国科学院声学研究所 基于空间特征补偿的多通道语音识别声学建模方法及装置
GB2572650A (en) 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
GB2574239A (en) 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
US11206484B2 (en) 2018-08-28 2021-12-21 Sonos, Inc. Passive speaker authentication
US10299061B1 (en) 2018-08-28 2019-05-21 Sonos, Inc. Playback device calibration
CN109326296B (zh) * 2018-10-25 2022-03-18 东南大学 一种非自由场条件下的散射声有源控制方法
US10734965B1 (en) 2019-08-12 2020-08-04 Sonos, Inc. Audio calibration of a portable playback device

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5307405A (en) 1992-09-25 1994-04-26 Qualcomm Incorporated Network echo canceller
DE4320990B4 (de) * 1993-06-05 2004-04-29 Robert Bosch Gmbh Verfahren zur Redundanzreduktion
US5978473A (en) 1995-12-27 1999-11-02 Ericsson Inc. Gauging convergence of adaptive filters
US6973184B1 (en) * 2000-07-11 2005-12-06 Cisco Technology, Inc. System and method for stereo conferencing over low-bandwidth links
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
EP1459596A2 (en) * 2001-12-05 2004-09-22 Koninklijke Philips Electronics N.V. Circuit and method for enhancing a stereo signal
ES2323294T3 (es) 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
JP4247037B2 (ja) * 2003-01-29 2009-04-02 株式会社東芝 音声信号処理方法と装置及びプログラム
EP1606970A1 (en) * 2003-03-21 2005-12-21 Technische Universiteit Delft Circular microphone array for multi channel audio recording
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
ATE521143T1 (de) 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
KR100588218B1 (ko) * 2005-03-31 2006-06-08 엘지전자 주식회사 모노 보강 스테레오 시스템 및 그 신호 처리 방법
US20090252339A1 (en) * 2005-09-22 2009-10-08 Pioneer Corporation Signal processing device, signal processing method, signal processing program, and computer readable recording medium
CA2646961C (en) * 2006-03-28 2013-09-03 Sascha Disch Enhanced method for signal shaping in multi-channel audio reconstruction
US8126152B2 (en) * 2006-03-28 2012-02-28 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for a decoder for multi-channel surround sound
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
KR100917843B1 (ko) * 2006-09-29 2009-09-18 한국전자통신연구원 다양한 채널로 구성된 다객체 오디오 신호의 부호화 및복호화 장치 및 방법
EP2054875B1 (en) * 2006-10-16 2011-03-23 Dolby Sweden AB Enhanced coding and parameter representation of multichannel downmixed object coding
US8290167B2 (en) * 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
CN102037507B (zh) * 2008-05-23 2013-02-06 皇家飞利浦电子股份有限公司 参数立体声上混合设备、参数立体声译码器、参数立体声下混合设备、参数立体声编码器
KR101572793B1 (ko) * 2008-06-25 2015-12-01 코닌클리케 필립스 엔.브이. 오디오 처리
US8155714B2 (en) 2008-06-28 2012-04-10 Microsoft Corporation Portable media player having a flip form factor
JP5520300B2 (ja) * 2008-09-11 2014-06-11 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マイクロホン信号に基づいて一組の空間手がかりを供給する装置、方法およびコンピュータ・プログラムと2チャンネルのオーディオ信号および一組の空間手がかりを供給する装置
US8023660B2 (en) * 2008-09-11 2011-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
IL195613A0 (en) 2008-11-30 2009-09-01 S P F Productions Ltd Compact gear motor assembly
WO2010092568A1 (en) * 2009-02-09 2010-08-19 Waves Audio Ltd. Multiple microphone based directional sound filter
JP5605573B2 (ja) * 2009-02-13 2014-10-15 日本電気株式会社 多チャンネル音響信号処理方法、そのシステム及びプログラム
EP2249334A1 (en) 2009-05-08 2010-11-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio format transcoder

Also Published As

Publication number Publication date
JP2013520691A (ja) 2013-06-06
US20130216047A1 (en) 2013-08-22
US9357305B2 (en) 2016-05-31
AU2011219918B2 (en) 2013-11-28
BR112012021369A2 (pt) 2020-10-27
CA2790956A1 (en) 2011-09-01
CN103811010A (zh) 2014-05-21
CA2790956C (en) 2017-01-17
WO2011104146A1 (en) 2011-09-01
EP2539889B1 (en) 2016-08-24
JP5508550B2 (ja) 2014-06-04
CN103811010B (zh) 2017-04-12
CN102859590B (zh) 2015-08-19
CN102859590A (zh) 2013-01-02
AU2011219918A1 (en) 2012-09-27
EP2539889A1 (en) 2013-01-02
RU2586851C2 (ru) 2016-06-10
ES2605248T3 (es) 2017-03-13
BR112012021369B1 (pt) 2021-11-16
KR101410575B1 (ko) 2014-06-23
KR20120128143A (ko) 2012-11-26
RU2012140890A (ru) 2014-08-20

Similar Documents

Publication Publication Date Title
MX2012009785A (es) Aparato para generar señal de mezcla descendente mejorada, metodo para generar señal de mezcla descendente mejorada y programa de computadora.
US20200335115A1 (en) Audio encoding and decoding
JP6626581B2 (ja) 1つの広帯域アライメント・パラメータと複数の狭帯域アライメント・パラメータとを使用して、多チャネル信号を符号化又は復号化する装置及び方法
CN101410889B (zh) 对作为听觉事件的函数的空间音频编码参数进行控制
RU2419249C2 (ru) Аудиокодирование
MX2011002626A (es) Aparato, metodo y programa de computadora para proveer un conjunto de pistas espaciales en base a una señal de microfono y aparato para proveer una señal de audio de dos canales y un conjunto de pistas especiales.
TWI313857B (en) Apparatus for generating a parameter representation of a multi-channel signal and method for representing multi-channel audio signals
EP2834813A1 (en) Multi-channel audio encoder and method for encoding a multi-channel audio signal
KR20080078882A (ko) 입체 오디오 신호 디코딩
CN108369810A (zh) 用于对多声道音频信号进行编码的自适应声道缩减处理
US11856389B2 (en) Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to DirAC based spatial audio coding using direct component compensation
RU2427978C2 (ru) Кодирование и декодирование аудио
Hold et al. Optimizing higher-order directional audio coding with adaptive mixing and energy matching for ambisonic compression and upmixing
RU2779415C1 (ru) Устройство, способ и компьютерная программа для кодирования, декодирования, обработки сцены и других процедур, связанных с пространственным аудиокодированием на основе dirac с использованием диффузной компенсации

Legal Events

Date Code Title Description
FG Grant or registration