MX2011002626A - Aparato, metodo y programa de computadora para proveer un conjunto de pistas espaciales en base a una señal de microfono y aparato para proveer una señal de audio de dos canales y un conjunto de pistas especiales. - Google Patents

Aparato, metodo y programa de computadora para proveer un conjunto de pistas espaciales en base a una señal de microfono y aparato para proveer una señal de audio de dos canales y un conjunto de pistas especiales.

Info

Publication number
MX2011002626A
MX2011002626A MX2011002626A MX2011002626A MX2011002626A MX 2011002626 A MX2011002626 A MX 2011002626A MX 2011002626 A MX2011002626 A MX 2011002626A MX 2011002626 A MX2011002626 A MX 2011002626A MX 2011002626 A MX2011002626 A MX 2011002626A
Authority
MX
Mexico
Prior art keywords
channel
signal
microphone
information
microphone signal
Prior art date
Application number
MX2011002626A
Other languages
English (en)
Inventor
Christof Faller
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of MX2011002626A publication Critical patent/MX2011002626A/es

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/02Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

Se describe un aparato para proveer un conjunto de pistas espaciales asociadas con una señal de audio de mezcla ascendente que tiene más de dos canales, en base a una señal de micrófono de dos canales que comprende un analizador de señales y generador de información lateral espacial. El analizador de señales está configurado para obtener una información de energía componente e información de dirección en base a la señal de micrófono de dos canales, de tal manera que la información de energía componente describe valores estimativos de energías de un componente de sonido directo de la señal de micrófono de dos canales y de un componente de sonido difuso de la señal de micrófono de dos canales y de tal manera que la información direccional describe un valor estimativo de la dirección de la cual el componente de sonido directo de la señal de micrófono de dos canales se origina. El generador de información lateral especial está configurado para mapear la información de energía componente y la información de dirección sobre una información de pista especial que describe el conjunto de pistas espaciales asociadas con una señal de audio de mezcla ascendente que tiene más de dos canales.

Description

APARATO, METODO Y PROGRAMA DE COMPUTADORA PARA PROVEER UN CONJUNTO DE PISTAS ESPACIALES EN BASE A UNA SEÑAL DE MICRÓFONO Y APARATO PARA PROVEER UNA SEÑAL DE AUDIO DE DOS CANALES Y UN CONJUNTO DE PISTAS ESPACIALES ANTECEDENTES DE LA INVENCIÓN Las modalidades de acuerdo con la invención son concernientes con un aparato para proveeri un conjunto de pistas I espaciales asociadas con una señal j de audio de mezcla i ascendente que tiene más de dos canales ! en base a una señal de micrófono de dos canales. Modalidades adicionales de acuerdo con la invención son concernientes con un método correspondiente y con un programa de computadora correspondiente. Modalidades adicionales de acuerdo con la invención son concernientes con un aparato para proveer una i señal de, audio de dos canales procesada o sin procesar y un . . . I connunto de pistas espaciales. ' Otra modalidad de acuerdo ícon la invención es concerniente con un extremo frontal de micrófono . para •codificadores de audio espaciales. | En lo siguiente, se dará una introducción al campo de representación paramétrica de señales de ' audio.
La representación paramétrica de señales de audio estéreo y surround . ha sido desarrollada en las pocas últimas décadas y ha alcanzado un estatus maduroj. Estéreo de intensidad (R. Waal and R. Veldhuis, "Subband coding of stereophonic I 2 i i digital audio signáis", Proc. IEEE ICASSP 1991, pp. 3601-3604, i 1991.), (J. Herré, K. Brandenburg, and ;D. Lederer, "Intensity stereo coding" , 96th AES Conv., Feb. 1994, Amsterdam (preprint 3799), 1994) es usado en MP3 (ISO Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/s - Part 3:. Audio. ISO/IEC 11172-3 International Standard, 1993, jTCl/SC29/WGll . ) , -2 AAC (—, Generic coding of moving pictures and associated audio Information - Part 7: Advanced Audio Coding. 13818-7 i International Standard, 1997, jTCl/SC29 /WG11. ) , y otros I codificadores de audio. Estéreo- de intenisidad es la técnica de codificación estéreo paramétrica original, que representa señales estéreo por medio de una mezcla descendente e información de diferencia de nivel. Codificación de Pista Binaural (BCC) (C. Faller and F. ¡Baumgarte, "Efficient I representation of spatial audio using perceptual parametrization" , in Proc. IEEE Workshop on , Appl . Of Sig. Proc. to Audio and Acoust., Oct. 2001, pp . 199-202.), (—, "Binaural Cue Coding - Part Schemes and applications" , IEEE Trans . on Speech and Audio Proc, vol . 11, no. 6, pp. 520-531, Nov. 2003) i a permitido mejora significativa de caliclad de audio por medio del uso de un banco de filtros diferentes para codificación i estéreo / surround paramétrica que para , codificación de audio Baumgarte , and Faller, "Why Binaural Cue Coding is better i than Intensity Stereo Coding", in Preprint 112th Conv. Aud.
Eng. Soc, May 2002 . ) , esto es, puede ser visto como un pre- y post-procesador a un codificador de audio convencional. Además, usa pistas espaciales adicionales para jla parametrización que solamente diferencias de nivel, esto es,; también diferencias de tiempo y coherencia de inter-canal. Estéreo Paramétrico (PS) (E. Schuijers, J. Breebaart, H. Purnhagen, and J. Engdegard, i "Low, complexity parametric stereo coding", in Preprint lllth Conv. Aud. Eng. Soc, May 2004 . ) , que es estandarizado en MPEG de IEC/ISO, usa diferencias de fase! en contraposición a diferencias de tiempo, que tiene la véntaja de que síntesis libre de artefactos es obtenida más fácil que para síntesis de retardo de tiempo. Los conceptos estéreo: paramétricos descritos fueron también aplicados al sonido surround mediante BCC. El surround de MP3 (J. Herré, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, and C. Spenger, WMP3 Surround: Efficient and i compatible coding of multi-channel audio", in Preprint 116th Conv. Aud. Eng. Soc, May 2004 . ) , (G. Faller, "Coding of spatial audio compatible with different playback formats", in Preprint lllth. Conv. Aud. Eng. Soc, Octbber 2004 . ) , y Surround de MPEG (J. Herré, K. Kjórling, J. Breebaart, C. Faller, S. Disen, H. Purnhagen, J. Koppens, J. Hilpert, J. Ródén, W.
Oomen, K. Linzmeier, and K. S. Chong, ! "Mpeg surround - the i iso/mpeg standard for efficient and compatible multi-channel audio coding", in Preprint 122th Conv: Aud. Eng. Soc, May 2007 ) codificadores de audio introdujéron síntesis espacial basada en una mezcla descendente ¡ estéreo, permitiendo compatibilidad hacia atrás estéreo y calidad de audio más alta. Un codificador de audio de multicanal j paramétrico, tal como BCC, MP3 Surround y MPEG Surround, es frecuentemente denominado como Codificador de Audio Espacial (SAC) .
Recientemente, una técnica fue propuesta denotada presentación de respuesta, de impulso! espacial (SIRR) (J.
Merimaa and V. Pulkki, "Spatial impulse response rendering i: I Analysis and synthesis", J". Aud. Eng. Soc , vol . 53, no. 12, I 2005.), (V. Pulkki and J. Merimaa, "Spatial impulse response rendering ii: Reproduction of diffus sound and listening tests", J. Aud. Eng. Soc, vol. 54, no. 1, 2006), que sintetiza respuesta de impulso en cualquier dirección (en relación con la posición del micrófono) en base a un solo canal de audio (W-signal of Bformat (M. A. Gerzon, "Periphóny: Width-Height Sound I Reproduction", J. Aud. Eng. Soc, vol . j 21, no. 1, pp. 2-10, 1973.), (K. Farrar, "Soundfield microphone", Wireless World, pp. 48-50, Oct . 1979) más información espacial obtenida de las señales de formato B. Esta técnica fue más tarde también aplicada a señales de audio en contraposición a respuestas de impulso y el llamado codificación de audio direccional (DirAC) (V. Pulkki and C. Faller, "Directional aüdio coding: Filterbank and STFTbased design", in Preprint 120th Conv. Aud. Eng. Soc, May 2006, p. preprint 6658). DirAC puede1 ser visto como un SAC, i que es aplicable directamente a señales de micrófono. Varias configuraciones de micrófono han sido propuestas para uso con DirAC (J. Añonen, G. D. Galdo, M. Kallinger, F. Küch, V.
Pulkki, and R. Schultz-Amling, "Analysis and adjustment of j planar microphone arrays for application in directional audio coding", in Preprint 124th Conv. Aud. Eng. Soc, May. 2008.), (J. Añonen, M. Kallinger, F. Küch, V. P¡ulkki, and R. Schultz- Amling, "Directional analysis of sound field with linear microphone array and applications in spund reproduction" , in Preprint 124th Conv. Aud. Eng. Soc, May. 2008.). DirAC está siempre basado en señales de formato B¡ y las señales de las varias configuraciones de micrófono son procesadas para obtener el formato B, que luego es usado, en el análisis direccional de DirAC. j i En vista de lo anterior, es el objetivo de la presente invención crear un concepto computacionalmente eficiente para obtener información de pista espacial, en tanto i que se mantiene el esfuerzo de la transducción de sonido razonablemente pequeño.
I ¡ BREVE DESCRIPCIÓN DE LA INVENCIÓN Este problema es resuelto por un aparato para proveer, un conjunto de pistas espaciales asociadas' con una señal de audio de mezcla ascendente que tiene más de dos canales en base a una señal de micrófono de dos canales de acuerdo con la reivindicación 1, por un aparato para ¡ proveer una señal de audio de dos canales y un conjunto ' de pistas espaciales I asociadas con una señal de audio de mezcla ascendente que tiene más de dos canales de acuerdo con la reivindicación 10, por un aparato para proveer una señal de audio de dos canales I procesada y un conjunto de pistas espaciales asociadas con una señal de mezcla ascendente que tiene más¡ de dos canales en base i a una señal de micrófono de dos canales de acuerdo con la I reivindicación 11, por un método para proveer un conjunto de pistas espaciales asociadas con una señal de audio de mezcla i ascendente que tiene más- de dos canales ,en base a una señal de micrófono de dos canales de acuerdo con ,1a reivindicación 12 y por un programa de computadora de acuerdo con la reivindicación 13. j l Una modalidad de acuerdo con la invención crea un aparato para proveer un conjunto de pistas espaciales asociadas con una señal de audio de mezcla ascendente que tiene más de dos canales en base a una señal de micrófono de dos canales . El aparato comprende un analizador de señales configurado para obtener un componente de información de¡ energía e información de dirección en base a la señal de micróf Iono de dos canales, de tal manera que la información de energía componente describe valores estimativos de energías de un: componente de sonido I directo de la señal de micrófono de j dos canales y de un componente de sonido difuso de la señal de micrófono de dos I canales, y de tal manera que la información de dirección describe un valor estimativo de una dirección de la cual el I componente de sonido directo de la señál de micrófono de dos canales se origina. El aparato también comprende un generador de información lateral espacial configurado para mapear el componente de información de energía dej la señal de micrófono de dos canales y la información de dilección de la señal de micrófono de dos canales sobre una j información de pista espacial que describe un conjunto de pistas espaciales asociadas con una señal de audio de mezcla ascendente que tiene I más de dos canales . ; Esta modalidad está basada en el hallazgo de que pistas espaciales de la señal de audio de mezcla ascendente. pueden ser calculadas de una manera particularmente eficiente i I si valores estimativos de energías de un componente de sonido directo y un componente de sonido difuso y la información de i dirección son extraídos de una señal de idos canales y mapeados sobre las pistas espaciales, debido a : que el componente de información de energía y la información de dirección pueden comúnmente ser extraídos con esfuerzo computacional moderado de una señal de audio que tiene solamente! dos canales pero, no obstante, constituye una base muy buena para el cálculo de pistas espaciales asociadas con una señal de mezcla ascendente que tiene más de dos canales. En otras palabras, aunque el componente de información de energía ; y la información de dirección están basados en la señal !de dos canales, esta información es apropiada para un cálculo directo de las pistas espaciales sin realmente usar los canales de audio de mezcla ascendente como una cantidad intermedia. I En una modalidad preferida, el generador de información lateral espacial está configurado para mapear la información de dirección sobre un conjunto de factores de ganancia que describen un mapeo de sonido directo dependiente de la dirección a canal de audio surround. Además, el generador de información lateral espacial está configurado para obtener valores estimativos de intensidad de, canal que describen i intensidades estimadas de más de dos canales surround en base a la información de energía componente y los factores de i ganancia. En este caso, el generador de información lateral espacial está configurado preferiblemente para determinar las pistas espaciales asociadas con la señal de audio de mezcla ascendente en base a los valores estimativos de intensidad de canal. Esta modalidad está basada en el hallazgo de que una señal de micrófono de dos canales permite una extracción de i información de dirección, que puede ser mapeada con buenos i resultados sobre un conjunto de factores de ganancia que describen el mapeo de la dirección de scjnido dependiente de la dirección al canal de audio surround, de tal manera que es posible obtener valores estimativos de intensidad de canal significativos que describen la señal; de audio de mezcla I ascendente y forman la base para el cálculo de la información de pista espacial. j En una modalidad preferida, el generador de i información lateral espacial también ¡está configurado para j obtener información de correlación de canal que describe una correlación entre diferentes canales de la señal de mezcla ascendente en base a la información de energía componente y los factores de ganancia. En esta modalidad, el generador de información lateral espacial está configurado preferiblemente para determinar pistas espaciales asociadas con la señal de mezcla ascendente en base a uno o más ¡valores estimativos de i intensidad de canal y la información de correlación de canal.
Se ha encontrado que la información de energía componente y los factores de ganancia constituyen una información, que es suficiente para el cálculo de la información de correlación de canal, de tal manera que la información de correlación de canal puede preferiblemente ser calculada sin usar cualesquier variables adicionales (con la excepción i de algunas constantes que reflejan una distribución del sonido difuso a los canales i de la señal de mezcla ascendente) . Además, se ha reconocido que I es fácilmente posible determinar pistas espaciales que describen una correlación de inter-canal ] de la señal de mezcla j ascendente tan pronto como los valores estimativos de intensidad de canal y la información de correlación de canal i son conocidos. ¡ I En otra modalidad preferida, el generador de información lateral espacial está configurado para combinar linealmente un. valor estimativo de una intensidad de un componente de sonido directo de la señal de micrófono de dos canales y un valor estimativo de üna intensidad de un componente de sonido difuso de la señal de micrófono de dos j canales con el fin de obtener los valores estimativos de intensidad de canal. En esta modalidad, . el generador de I información lateral espacial está configurado preferiblemente para ponderar el valor estimativo de la ' intensidad del i componente de sonido directo en dependencia de los factores de ganancia y en dependencia de Opcionalmente, el generador de puede estar configurado además para ponderar el valor estimativo de la intensidad del componente de sonido difuso en dependencia de valores constantes que reflejan una distribución I del componente de sonido difuso a los canales diferentes de la señal de audio de mezcla ascendente. Se ha reconocido que es posible derivar los valores estimativos ¡de intensidad de canal mediante una operación matemática muy ; simple, es decir una combinación lineal de la información de ¡ energía de componente, i en donde los factores de ganancia, qué pueden ser derivados eficientemente de la señal de micrófono de dos canales, I constituyen factores de ponderación apropiados.
Otra modalidad de acuerdo co la invención crea un aparato para proveer una señal de audib de dos canales y un i conjunto de pistas espaciales asociadas, con una señal de audio de mezcla ascendente que tiene más de dos canales. El aparato comprende un arreglo de micrófono qué comprende un primer micrófono direccional y un segundo micrófono direccional, en donde el primer micrófono direccional y el segundo micrófono I direccional están preferiblemente separados por no más de 30 centímetros (o aún por no más de 5 centímetros) , y en donde el primer micrófono direccional y el segundó micrófono direccional están orientados de tal manera que una característica direccional del segundo micrófono direccional es una versión i girada de una característica direccional del primer micrófono direccional . El aparato para proveer una señal de audio de dos canales comprende un aparato para proveer un conjunto de pistas espaciales asociadas con una señal de audio de mezcla ascendente que tiene más de dos canales en base a una señal de micrófono de dos canales, como se discute anteriormente. El aparato para proveer un conjunto de pistas espaciales asociadas con una señal de audio de mezcla ascendente está configurado preferiblemente para recibir las señalejs de micrófono de los primeros y segundos micrófonos direccionales como la señal de micrófono de dos canales, y para proveer el conjunto de pistas espaciales en base a la misma. El aparato para proveer la señal de audio de dos canales también comprendé un proveedor de señal de audio de dos canales configurado para 'proveer las señales de micrófono de los primeros y segundos micrófonos direccionales, i o versiones procesadas de los mismos, como la señal de audio de dos canales. De acuerdo con la invención, esta modalidad está basada en el hallazgo de que los micrófonos que tienen una distancia pequeña pueden ser usados para! proveer información de pista espacial apropiada si las características direccionales de los micrófonos son giradas entre sí.j Así, se ha reconocido que es posible calcular pistas espaciales significativas i asociadas con una señal de audio de mezcla ascendente que tiene más1 de dos canales en base a un arreglo físico, que es comparativamente pequeño. Notablemente, se ha encontrado que la información de energía componente y la información de dirección, que permiten un cálculo eficiente de la información de pista espacial, pueden ser extraídos con poco esfuerzo si los dos micrófonos que proveen la señal de micrófono de dos canales son dispuestos con una separación comparativamente pequeña (por ejemplo, que no excede de 30 centímetros) y consecuentemente comprenden información ! de sonido difuso muy similar. Además, se ha encontrado que j el uso de micrófonos direccionales que tienen características! direccionales giradas entre sí permite el cálculo de la información de energía i componente y la información de dirección, debido a que las características direccionales diferentes permiten una separación entre el sonido direccional y !sonido difuso. i Otra modalidad de acuerdo con| la invención crea un aparato para proveer una señal de audio de dos canales j i I procesada y un conjunto de pistas espaciales asociadas con una j señal de mezcla ascendente que tiene más de dos canales en base a una señal de micrófono de dos canales . El aparato para proveer la señal de audio de dos canales! procesada comprende un aparato para proveer un conjunto de pistas espaciales asociadas también comprende un proveedor de señal ele audio de dos canales configurado para proveer la señal de j audio de dos canales procesada en base a la señal de micrófono de dos canales . El promotor de señales de audio de dos canales está configurado 1 < preferiblemente para escalar una primera señal de audio de la señal de micrófono de dos canales utilizando uno .o más de primeros factores de escalamiento de señal de micrófono para obtener una primera señal de audio procesada de la señal de audio de dos canales procesada. El proveedor de señales de audio de dos canales también está configurado preferiblemente para escalar una segunda señal de audio de la señal de micrófono de dos canales utilizando uno ó más segundos factores de escalamiento de señal de micrófono para obtener una segunda señal de audio procesada de la señal de audio de dos canales procesada. El proveedor de señales de audio de dos canales está configurado preferiblemente para calcular uno o más de primeros factores de escalamiento de señal de micrófono y uno o más segundos factores de escalamiento de señal de micrófono en base a la información de energía componente provista por el analizador de señales del aparato para proveer un conjunto de i pistas espaciales, de tal manera que tanto las pistas espaciales como los factores de escalamiento de señal de micrófono son determinados por la información de energía í componente. Esta información está basada en la idea de que es eficiente usar información de energía componente provista por el analizador de señales tanto para el cálculo del conjunto de pistas espaciales como para un escalamiento apropiado de las señales de micrófono, en donde el escalamiento apropiado de las señales de micrófono puede dar como resultado la adaptación de i las señales de micrófono y las pistas espaciales, de tal manera que la información combinada que comprende tanto las señales de micrófono procesadas como las pistas espaciales se conforma con un estándar industrial de codificación de audio espacial deseado (por ejemplo, MPEG surround) , proporcionando mediante i esto la posibilidad de reproducir el contenido de audio en un descodificador de codificación de audiOj espacial convencional (por ejemplo, un descodificador surround e MPEG convencional) . 1 Otra modalidad de la invención crea un método para proveer un conjunto de pistas espaciales asociadas con una señal de audio de mezcla ascendente que tiene más de dos i canales en base a una señal de micrófono de dos canales .
Todavía otra modalidad de acuerdo con la invención crea un programa de computadora para llevar a cabo el método.
BREVE DESCRIPCION DE LAS FIGURAS Modalidades de acuerdo con la invención serán descritas subsecuentemente con referencia a las Figuras adjuntas, en las cuales: i La Figura 1 muestra un 'diagrama de bloques esquemático de un aparato para proveer [ un conjunto de 'pistas espaciales asociadas con una señal ¡ de audio de mezcla i ascendente que tiene más de dos canales !en base a una señal de micrófono de dos canales, de acuerdo con una modalidad de la i invención; ; La Figura 2 muestra un ! diagrama de bloques esquemático de un aparato para proveer j un conjunto de pistas espaciales asociadas con una señal ; de audio de mezcla ascendente que tiene más de dos canales, de acuerdo con otra modalidad de la invención; La Figura 3 muestra un |diagrama de bloques esquemático de un aparato para proveer \uxi conjunto de pistas espaciales asociadas con una señal de audio de mezcla ascendente que tiene más de dos canales, de acuerdo con otra modalidad de la invención; j La Figura 4 muestra una representación gráfica de las respuestas direccionales de dos micrófonos de dipolo, que I pueden ser usadas en modalidades de la invención; La Figura 5a muestra una representación gráfica de una proporción de amplitud entre izquierda y derecha como función de dirección de llegada del sonido para el micrófono estéreo de dipolo; j La Figura 5b muestra una representación gráfica de la potencia total como función de la dirección de llegada de sonido para el micrófono estéreo dipolo; 1 La Figura 6 muestra una representación gráfica de I respuestas direccionales de dos micrójfonos cardioides, que pueden ser usados en algunas modalidades de la invención; La Figura 7a muestra una representación gráfica de una proporción de amplitud entre izq ierda y derecha como función de dirección de llegada del sonido para un micrófono estéreo cardioide; j La Figura 7b muestra una representación gráfica de la I potencia total como función de' la dirección de llegada de sonido para el micrófono estéreo cardioide; La Figura 8 muestra una representación gráfica de respuestas direccionales de dos micrófonos super-cardioides , que pueden ser usados en algunas de las modalidades de la invención; ! La Figura 9a muestra una representación gráfica de una proporción de amplitud entre izquierda y derecha como función de dirección de llegada de sonido para el micrófono estéreo super-cardioide; ! La Figura 9b muestra una representación gráfica de la potencia total como función de la dirección de llegada de sonido para el micrófono estéreo super-cardioide; La Figura 10a muestra una representación gráfica de una modificación de ganancia como función de la dirección de llegada de sonido para el micrófono estéreo cardioide; La Figura 10b muestra una representación gráfica de la potencia total (líneas continuas : j Sin modificación de ganancia, discontinuas: Con modificacion de ganancia) como función de la dirección de llegada del s†nido para el micrófono estéreo cardioide; La Figura lia muestra una representación gráfica de una modificación de ganancia como función de la dirección de llegada del sonido para el micrófono estéreo super-cardioide; La Figura 11b muestra una representación gráfica de la potencia total (líneas continuas: ¡ Sin modificación de ganancia, líneas discontinuas: Con modificación de ganancia) i como función de la dirección de llegada del sonido para el micrófono estéreo super-cardioide; ] La Figura 12 muestra un ¡diagrama de bloques esquemático de un aparato para proveer :un conjunto de pistas espaciales asociadas con una señal 1 de audio de mezcla ascendente que tiene más de dos canalesj, de acuerdo con otra i modalidad de l invención; La Figura 13 muestra un i diagrama de bloques esquemático de un codificador, que cjonvierte la señal de micrófono estéreo a mezcla descendente! compatible con SAC e información lateral y también un descodificador de SAC correspondiente (convencional); 1 La Figura 14 muestra un ! diagrama de bloques esquemático de un codificador, que convierte la señal de micrófono estéreo a información lateral espacial SAC compatible y también un diagrama de bloques esquemático del descodificador de SAC correspondiente con procesamiento j de mezcla descendente; La Figura 15 muestra un .' diagrama de bloques esquemático de un descodificador de SAC ciego, que puede ser i alimentado directamente con señales de micrófono estéreo, en I donde la información de mezcla descendente de SAC e información i lateral espacial de SAC son obtenidas mediante procesamiento de análisis de la señal de micrófono estéreo; y La Figura 16 muestra un diagrama de flujo de un método para proveer un conjunto de pistas espaciales de acuerdo con una modalidad de la invención. j i I ! DESCRIPCIÓN DETALLADA DE LAS MODALIDADES La Figura 1 muestra un diagrama de bloques esquemático de un aparato 100 para proveer un conjunto, de pistas espaciales asociadas con una señíal de audio de mezcla ascendente que tiene más de dos canales ¡en base a una señal de micrófono de dos canales. El aparato 100 está configurado para recibir una señal de micrófono de dos canales, que puede por ejemplo comprender una señal de primer canal 110 (también I designada con i) y una señal de segundo canal 112 (también designada con x2) . El aparato 100 está configurado además para proveer información de pista espacial 120. Él aparato 100 comprende un analizador de señales 130, que está configurado para recibir la señal del primer canal 110 y la señal del segundo canal j 112. El analizador de señales 130 está configurado para obtener información de energía componente 132 e información de1 dirección 134 en base de las señales de micrófono de dos canales, esto es, en base a la señal del primer canal 110 y la señal ¡del segundo canal 112. Preferiblemente, el analizador de señales 130 está configurado para obtener la información de energía componente 132 y la información de dirección 134, de tal manera que la información de energía componente 132 describe valores estimativos de energías de un componente de sonido' directo de la señal de micrófono de dos canales y de un componente de sonido difuso de la señal de micrófono de dos canales, y de tal manera que la información de dirección 134 describe un valor estimativo de la dirección de la cual el componente de j sonido directo de la señal de micrófono de dos canales 110, 112 se origina..
El aparato 100 también comprende un generador de información lateral espacial 140, que ¡está configurado para recibir la información de energía Componente 132 y la información de dirección 134 y para proveer, en base a las mismas, la información de pista espacial 120 . Preferiblemente, el generador de información lateral espacial 140 está configurado para mapear la información ! de energía componente 132 de la señal de micrófono de dos canales 110 , 112 y la información de dirección 134 de la señal de micrófono de dos j canales 110 , 112 sobre la información de pista espacial 120 . Así, la información lateral espacial 120 es obtenida de tal manera que la información de pista espacial 120 describe un conjunto de pistas espaciales asociadas con una señal de audio de mezcla ascendente que tiene más de dos canales.
Así, el aparato 120 permite un cálculo computacionalmente muy eficiente de la información de pista espacial, que está asociada con una señal de audio de mezcla ascendente que tiene más de dos canales en base a una señal de micrófono de dos canales. El analizador de señales 130 es apto de extraer una cantidad de información ¡grande a partir de la señal de micrófono de dos canales, es decir, una información de energía componente que describe tanto un valor estimativo de la energía de un componente de sonido directo como un valor estimativo de la energía de un componente de sonido difuso e información de dirección que describe un valor estimativo de la dirección de la cual el componente de sonido directo de la señal de micrófono de dos canales se origina. Se ha encontrado 2i ; Í que esta información, que puede ser obtenida por el analizador de señales en base a la señal de micrófono de dos canales 110, • ¦ i 112, es suficiente para derivar la { información de pista espacial aún para una señal de audio de mezcla ascendente que tiene más de dos canales. Importantemente, se ha encontrado que la energía componente 132 y la información de dirección 134 son suficientes para determinar directamente la información de pista espacial 120 sin usar realmente los canales de audio de mezcla ascendente como una cantidad intermedia.
I En lo siguiente, algunas extensiones del aparato 100 i serán descritas con referencia a las Figuras 2 y 3.
La Figura 2 muestra un , diagrama de bloques esquemático de un aparato 200 para proveer una señal de audio de dos canales y un conjunto de pistas espaciales asociadas con i una señal de audio de mezcla ascendente que tiene más de dos I canales. El aparato 200 comprende un arreglo de micrófono 210 I configurado para proveer una señal de micrófono de dos canales que comprende una señal de primer canal 212 y una señal de segundo canal 214. El aparato 200 comprende además un aparato 100 para proveer un conjunto de pistas ejspaciales asociadas con una señal de audio de mezcla ascendente que tiene más de dos canales en base a una señal de micrófono de dos canales, como se describe con referencia a la Figura ¡1. El aparato 100 está configurado para recibir, como sus señales de entrada, la señal del primer canal 212 y la señal del segundo canal 214 provistas I ? por el arreglo de micrófono 210. ¡El aparato 100 está configurado además para¦ proveer una | información de pista espacial 220, que puede ser idéntica a ía información de pista espacial 120. El aparato 200 comprende además un proveedor de señales de audio de dos canales 230, que está configurado para recibir la señal del primer canal 212 y la señal del segundo canal 214 provistas por el arreglo de \ micrófono 210, y para proveer la señal de micrófono del primer canal 212 y la señal de micrófono del segundo canal 214 o versiones procesadas de las mismas, como una señal de audio de dos canales 232.
El arreglo de micrófono 21d comprende un primer, micrófono direccional 216 y un segundo micrófono direccional 218. El primer micrófono direccional 216¡ y el segundo micrófono direccional 218 están preferiblemente separados por no más de 30 centímetros. Así, las señales recibidas por el primer i Í micrófono direccional 216 y el segundo micrófono direccional 218 están fuertemente correlacionadas, lo que se ha encontrado que es benéfico para el cálculo de la [información de energía componente y la información de dirección por el analizador de I señales 130. Sin embargo, el primer micrófono direccional 216 y el segundo micrófono direccional 218 están orientados de tal manera que una característica direccional 219 del segundo í micrófono direccional 218 es una versión girada de una característica direccional 217 del primer micrófono direccional 216. Así, la señal de micrófono del primer canal 212 y la señal I de micrófono del segundo canal 214 están fuertemente correlacionadas (debido a la proximidad espacial de los 1 micrófonos 216, 218) y aún diferentes (debido a las i I características direccionales diferentes 217, 219 de los i micrófonos direccionales 216, 218) . En, particular, una señal I direccional incidente sobre el arreglo de micrófono 210 de una dirección aproximadamente constante provoca componentes de señal fuertemente . correlacionados de la! señal de micrófono del primer canal 212 y la señal de micrófono del segundo canal 214 I que tienen una proporción de amplitud dependiente de la dirección temporalmente constante (o proporción de intensidad) .
I i Una señal de audio ambiental incidente sobre el arreglo de micrófono ' 210 de direcciones variables temporalmente provoca componentes de señal de la señal de micrófono del primer canal 212 y la señal de micrófono del segundó canal 214 que tienen una correlación significativa, pero proporciones de amplitud que fluctúan temporalmente (o proporcionas de intensidad) . Así, el arreglo de micrófono 210 provee una ; señal de micrófono de dos canales 212, 214, que permite que el analizador de señales 130 del aparato 100 distinga entre sonido directo y sonido difuso aunque los micrófonos tén separados estrechamente. Así, el aparato 200 constituye un proveedor de señales de audio, que puede ser implementado en una forma espacialmente compacta y que es, no obstante, apto de proveer pistas espaciales , asociadas con una señal de mezcla ascendente que tiene más de dos canales. Las pistas espaciales 220 pueden ser usadas en combinación con la señal de audio de dos canales provista 232 por un descodificador dé audio espacial para proveer una señal de salida de sonido surround.
La Figura' 3 muestra un ' diagrama de bloques esquemático de un aparato 300 para proveer un señal de audio de dos canales procesada y un conjunto de pistas espaciales asociadas con una señal de mezcla ascenjdente que tiene más de dos canales en base a una señal de micrófono de dos canales . El aparato 300 está configurado para recibir una señal de micrófono de dos canales que comprende- una señal del primer canal 312 y una señal de segundo canal 314. El aparato 300 está configurado para proveer información de| pista espacial 316 en base a la señal de micrófono de dos canales 312, 314. Además, el aparato 300 está configurado para proveer una versión procesada de la^señal de micrófono de dós canales, en donde la versión procesada de la señal de micrófono de dos canales comprende una señal de primer canal 322 y una señal de segundo canal 324.
El aparato 300 comprende un aparato 100 para proveer un conjunto de pistas espaciales asociadas con una señal de audio de mezcla ascendente que tiene más ! de dos canales en base i a la señal de dos canales 312, 314. En el aparato 300, el aparato 100 está configurado para recibir, en sus señales de entrada 110, 112, la señal del primer canal 312 y la señal del segundo canal 314. Además, la información de pista espacial 120 provista por el aparato 100 constituye la información de salida 316 del aparato 300.
Además, el aparato 300 comprende un proveedor de i señales de audio de dos canales 340, que está configurado para recibir la señal del primer canal 312 y la señal del segundo canal 314. El proveedor de señales de audio de dos canales 340 i está configurado además para también recibir información de i energía componente 342, que es provista por el analizador de señales 130 del aparato 100. El proveedor de señales de audio de dos canales 340 está configurado además para proveer la señal del primer canal 322 y la señal de segundo canal 324 de la señal de audio de dos canales procesada.
El proveedor de señales de ' audio de dos canales comprende preferiblemente un -escalador 350, que está configurado para recibir la señal del primer canal 312 de la señal de micrófono de dos canales, y para escalar la señal del primer canal 312 o binarios de tiempo/frecuencia individuales de los mismos, para obtener la señal del primer canal 322 o la señal de audio de dos canales procesada. El escalador 350 también está configurado para recibir ; la señal del segundo canal 314 de la señal de micrófono de dos canales y para escalar la señal del segundo canal' 314 o binarios de tiempo/frecuencia individuales de las mismas, para obtener la señal del segundo canal 324 de la señal de audio de dos canales procesada. ! El proveedor de señales de audio de dos canales 340 también comprende un calculador de factor de escalamiento 360, que está configurado para calcular fact'ores de escalamiento a ser usados por el escalador- 350 en base a la información de energía componente 342. Así, la información de energía componente 342, que describe valores estimativos de energías de un componente de sonido directo de la señal de micrófono de dos i canales y también de un componente de sonido difuso de la señal i de micrófono de dos canales, determina | el escalamiento de la señal del primer canal 312 y la señal del segundo canal 314 de la señal de micrófono de dos canales; tal escalamiento es I aplicado para derivar la señal del primer canal 322 y la señal del segundo canal 324 de la señal de , audio de dos canales procesada a partir de la señal de mic ófono de dos canales . Así, la misma información de energía componente es usada para determinar el escalamiento de la señal del primer canal 312 y de la señal del segundo canal 314 de la: señal de micrófono de dos canales y también la información de pista espacial 120. Se ha encontrado que el uso doble de la información de energía componente 342 es una' solución computacionalmente muy eficiente i y también asegura buena consistencia entre la señal de audio de ? dos canales procesada y la información de pista espacial. Así, es posible generar la señal de audio de dos canales procesada y la información de pista espacial de tal manera que permiten una reproducción surround de un contenido de audio representado por las señales de micrófono de dos canales 312, 314 utilizando un descodificador surround estandarizado. ! i I Detalles de Implementación -Micrófonos Estéreo y su Conveniencia para Grabación Surround ! En esta sección, varias configuraciones de micrófono de dos canales son discutidas con respecto a su conveniencia I , para generar señal de sonido surround por medio de post-procesamiento. La siguiente secóión aplica estos discernimientos al uso de codificación de audio espacial (SAC) con micrófonos estéreo.
Las configuraciones de micrójfono descritas en la presente pueden ser usada por ejemplo para obtener la señal de micrófono · de dos canales 110, 112 o la! señal de micrófono de í dos canales 212, 214 o la señal de micrófono de dos canales 312, 314. Las configuraciones de micrófono descritas en la presente pueden ser usadas en el arreglo 'de micrófono 210.
Puesto que la ubicación de fuentes humanas ' depende extensamente del sonido directo, debido1 a la "ley del primer i frente de onda" (J. Blauert, Spatial Hearing: The Psychophysics of Human Sound Localization, revised ed. Cambridge, Massachusetts, USA: The MI Press, 1997), el análisis en esta sección se lleva a cabo para un sonido de campo lejano directo que llega desde un ángulo a específico ! al micrófono en campo I libre (sin reflejo) . Sin pérdida j de generalidad, por j simplicidad, se supone que los micrófonos son coincidentes, esto es, las dos cápsulas de micrófono (por ejemplo, los micrófonos direccionales 216, 218) están ubicadas en el mismo i punto. Dadas estas suposiciones, las i señales de micrófono izquierda y derecha pueden ser escritas como: en donde n es el índice de tiempo discreto, s (n) corresponde a la presión de sonido en la ubicación del micrófono, ri(a) es la respuesta direccional del micrófono izquierdo para sonido que llega del ángulo , y r2(o¡) es la respuesta correspondiente del micrófono derecho. La proporción de amplitud de señal entre el derecho e izquierdo es Nótese que la proporción de; amplitud captura la t diferencia de nivel e información de sil las señales están en fase (a(a) > 0) o fuera de fase (a(or)j < 0). Si se usa una representación de señal compleja (por ejemplo, las señales de micrófono xi(n), x2(n)), de tal manera que una transformada de Fourier de tiempo corto, la fase de a(a) da información acerca de la diferencia de fase entre las señales e información acerca del retardo. Esta información es útil cuando los micrófonos no son coincidentes .
La Figura 4 ilustra las respuestas direccionales de dos micrófonos dipolo coincidentes (figure de ocho) que apuntan hacia ±45 grados en relación con el eje x hacia adelante. Las partes de las respuestas marcadas con una + captura el sonido con un signo positivo y las partes marcadas con un - capturan i sonido con un signo negativo. La proporción de amplitud como función de dirección de llegada del sonido es mostrada en la Figura 5(a). Nótese que la proporción de amplitud a (a) no es i una función invertible, esto es, para cada valor de proporción de amplitud existen dos direcciones d llegada que podrían haber resultado en aquella proporción de| amplitud. Si el sonido llega solamente de direcciones frontalejs, esto es, dentro de ±90 grados en relación con la dirección . positiva x en la Figura 4, la proporción de amplitud indica de manera única de donde el sonido llegó. Sin embargo, para cada dirección en el frente existe una dirección en la parte posterior resultante en la misma proporción de amplitud que capturaj la diferencia de nivel y proporción de amplitud. La Figura 5 (bj) muestra la respuesta total de los dos dipolos en dB, esto' es j ! Nótese que los dos micrófonos de dipolo capturan sonido con la misma respuesta total de todas direcciones (0 dB) .
A partir de la discusión anterior, se puede concluir que dos micrófonos de dipolo con respuestas como se muestra en la Figura 4 no son apropiados para la generación de señal de i sonido surround debido a estas razones: j • Solamente para un intervalo! angular de 180 grados la proporción de amplitud determina de manera única la dirección de llegada del sonido. j • El sonido posterior y frontal es capturado con la misma respuesta total. No hay rechazo de sonido de direcciones fuera del intervalo en el cual la proporción de amplitud es única. i La siguiente configuración de| micrófono considerada consiste de dos cardioides que apuntanj hacia ±45 grados con respuestas como se muestra en la Figura, 6. El resultado de un análisis similar como se muestra previamente en la Figura 7. La Figura 7(a) muestra a(a) como función de dirección de llegada del sonido. Nótese que para direcciones entre -135 y 135 grados i a( ) determina de manera única la dirección de llegada del I sonido en los micrófonos. La Figura 7(b) muestra la respuesta ! i total como función de la dirección de llegada. Nótese que el sonido de las direcciones frontales es capturado más fuertemente y el sonido es capturado más débilmente mientras más llega de la parte posterior.
A partir de esta discusión, se !puede concluir que dos micrófonos cardioides como se muestraj en la Figura 6 son apropiados para generación de sonido surround por las j siguientes razones: | i • Tres cuartos de todas las direcciones de llegada posibles ( 270 grados) pueden ser determinados de manera única por medio, de medición de la proporción Jde amplitud a(a), esto es, sonido gue llega de las¦ direcciones entre ±135 grados.
• El sonido gue llega de direcciones que no pueden ser determinada de manera única, esto es1, de la parte posterior I entre 135 y 225 grados, es atenuado, mitigando parcialmente el efecto negativo de interpretar estos sonidos como que llegan de direcciones frontales . ; Una configuración de micrófono particularmente apropiada involucra el uso de micrófonos super-cardioides u otros micrófonos con un lóbulo posterior negativo. Las respuestas de dos micrófonos super-ca!rdioides , que apuntan hacia aproximadamente ±60 grados, son mostradas en la Figura 8 . La proporción de amplitud como función del ángulo de llegada es mostrada en la Figura (a) . Nótese 'que la proporción de amplitud determina de manera única la dirección de llegada del sonido. Esto es así debido a que se ha escogido direcciones de micrófono de tal manera que ambos micrófonos tienen una i respuesta nula a 180 grados. Las otras respuestas nulas son aproximadamente ± 60 grados.
Nótese que esta configuracicjn de micrófono capta sonido en fase {a (a) > 0) para direcciones frontales en el intervalo de aproximadamente ± 6 0 grados . I El sonido posterior es í capturado fuera de fase (a(a) < 0 ) , ¡esto es con un signo diferente. La codificación de sonido matriz (J. M. Eargle, I "Multic annel s'tereo matrix systems: An i overview" , IEEE Trans . on Speech and Audio Proc. , vol . 19 , noL 7 , pp . 552 -559 , July 197 1 . ) , ( K . Gundry, "A new active matrijx decoder for surround sound", in Proc. AES 19th Int. Conf. , June 2001 ) da pistas de proporción de amplitud similares (C. Faller, "Matrix surround revisited", in Proc. 30th Int. Conv. IAUCZ . Eng. Soc, March 2 0 07 ) en las señales de dos canales codificadas por matriz. Desde esta perspectiva, esta configuración de micrófono es apropiada para la generación de una señal de sonido surround por medio de procesamiento de las señales capturadas .
La Figura 9 (b) ilustra la respuesta total de la configuración de micrófono como función de dirección de llegada. En un gran intervalo de direcciones , El sonido es j capturado con intensidad similar. Hacia ¡la parte posterior, la respuesta total está decayendo hasta qije llega a cero (menos infinito dB) a 18 0 grados'. | La función ; ¦<¾ = fía) ! (4) produce la dirección de llegada del sonido como función de la proporción de amplitud j entre las señales de micrófono. La función en (4) es obtenida; al invertir la función dado en ( 2 ) dentro del intervalo deseado en el cual ( 2 ) es i invertible. i Para el ejemplo de dos cardioildes como se muestra en la Figura 6, la dirección de llegada estiará en el intervalo de ±135 grados. Si el sonido llega fuera ¡de este intervalo, su proporción de amplitud será interpretada equivocadamente y una dirección en el intervalo entre ±135 groados será devuelta por la función. Para el ejemplo de dos micrófonos super-cardioides como se muestra en la Figura 8 , la I dirección de llegada determinada puede ser de cualquier valor excepto 180 grados, i puesto que ambos micrófonos tienen su nulo a 180 grados.
Como una función de dirección de llegada, la ganancia de las señales de micrófono pueden necesitar ser modificadas con el fin de capturar sonido con la misma intensidad dentro de un intervalo deseado de direcciones. La modificación de la i ganancia de las señales de micrófono puede ser efectuada antes i del procesamiento de las señales de micrófono en el aparato 100 , por ejemplo, dentro del arreglo !de micrófono 210 . La I modificación de ganancia como función dé dirección de llegada I es 1 g(a) = uún{-p(á), G} , ( (5) en donde G determina un límite 'superior en dB para la modificación de ganancia. Tal límite superior es frecuentemente necesario para impedir que las señales sean escaladas por un facto demasiado grande.
Las lineas continuas en la Figura 10(a) muestran la modificación de ganancia dentro de la¡ dirección deseada de intervalo de llegada de ±135 para ¡el caso de los dos i cardioides. La línea discontinua en la Figura 10(a) indica la modificación de ganancia que es aplicada al sonido de direcciones posteriores, esto es, entre 135 y 225 grados, en donde (4) produce una dirección froJtal (equivocada) . Por ejemplo para una dirección de llegada 3e = 180 grados, la dirección estimada de llegada (4) esj á = o grados. Por consiguiente, la modificación de ganancia es la misma como para a = 0 grados, esto es 0 dB. La Figura 10(b) muestra la respuesta total de los dos cardioides (líneas continuas) y la respuesta total si se aplica la modificación de ganancia (líneas discontinuas) . El límite G en (4) fue escogido para ser de 10 dB, pero no es alcanzado como se indica por los datos en la Figura 7(a). 1 Un análisis similar se lleva a cabo para el caso del i par de micrófonos supercardioides . La Figura 11(a) muestra la modificación de ganancia para este caso. Nótese que cerca de i 180 grados, el límite de G - 10 dB es alcanzado. La Figura 11(b) muestra la respuesta total (líneas continuas) y la respuesta total si se aplica la modificación de ganancia (líneas discontinuas) . Debido a la limitación de la modificación de ganancia, la respuesta total está disminuyendo hacia la parte posterior (debido a los nulos a 180 grados, se requeriría modificación infinita) . Después de la modificación de ganancia, el sonido es capturado con pleno nivel (0 dB) aproximadamente en un intervalo de 160j grados, haciendo esta configuración de micrófono estéreo en principio muy apropiada para capturar señales a ser convertidas a señales de sonido i surround. I I El análisis previo muestra !que en principio dos i i micrófonos pueden ser usados para capturar señales, que contienen información suficiente para generar señales de audio de sonido surround. En lo siguiente, se explica como usar la codificación de audio especial (SAC) para obtener aquello.
Detalles de implementación - Uso de Micrófonos Estéreo con Codificadores de Audio Especiales En lo siguiente, el concepto! de la invención será j. descrito en detalle con referencia a la j Figura 12, que muestra una modalidad de un aparato para proveer tanto una señal de micrófono procesada como una información de pista espacial que describe un conjunto de pistas espaciales asociadas con una señal de audio de mezcla ascendente que tiene más de dos canales en base a una señal de audio de 1 entrada de dos canales (comúnmente una señal de micrófono de dos canales) .
El aparato 1200 de la Fijgura 12 ilustra las funcionalidades involucradas. Sin embargo, tres configuraciones diferentes serán descritas en como usar un micrófono estéreo i con un codificador de audio espacial (SAC) para generar una señal surround de multi-canal. Las trejs configuraciones, que serán explicadas con referencia a las Figuras 13, 14 y 15 pueden comprender funcionalidades idénticas, en donde los bloques que implementan dichas funcionalidades están distribuidos diferentemente a un lado de codificador y un lado de descodificador .
También se debe notar que en sección previa, dieron dos ejemplos de configuraciones1 de micrófono estéreo apropiadas (es decir, el arreglo que comprende dos micrófonos cardioides y el arreglo que comprende | dos micrófonos super-cardioides) . Sin embargo, otros arregloJ de micrófono, como el arreglo que comprende micrófonos de dipoio, pueden naturalmente ser usados, aunque el desempeño puede ser un tanto degradado.
Sistema SAC Plenamente Compatible Hacia Atrás La primera posibilidad es usiar un codificador que genera una mezcla descendente y corriente de bits compatible con un SAC. Las Figuras 12 y 13 ilustran codificadores SAC 1220, 1320, que es compatible con el descodificador de SAC 1370. Adicionalmente, las dos señales de micrófono xi(t), x2(t) .· í son procesadas para generar una señal | de mezcla descendente 1322 compatible con el descodificador de SAC 1370.
Nótese que no hay necesidad de generar una señal de audio surround en el codificador 1200, 1300, dando como resultado baja complejidad computacional'^ y bajos requerimientos de memoria.
Sistema SAC Plenamente Compatible Hacia Atrás - Análisis de Señal de Micrófono ¡ En lo siguiente, se describirá un análisis de señal de micrófono, que puede ser- efectuado por el analizador de señales 1212 o por la unidad de análisis 1312.
Las . representaciones de tiempo-frecuencia (por' ejemplo, transformada de Fourier de jtiempo corto) de las señales de micrófono ?? (n) y x2(n) (o xi('t) y x2(t) son Xi(2, i) y X2(k,. i), en donde k e i son índices ole tiempo y frecuencia. Se supone que Xi(k, i) y X2(k, i) pueden ser modelados como: (6) en donde a(k, i) es un factor de ganancia, S(k, i) es sonido directo, y Ni (k, i) y N2(k, i) representan sonido difuso. Nótese que, en lo siguiente,! por simplicidad de notación, frecuentemente se ignoran los índices de tiempo y frecuencia k e i . El modelo de señal ( 6; ) es similar al modelo de señal usado para el análisis de señal estéreo en (—, "Multi-loudspeaker playback of stereo signáis", J. of the Aud. Eng. Soc, vol. 54 , no. 11 , pp. 1051-1064 , Nov. 2006 . ) , excepto que Ni y N2 no se supone que son independientes .
Usado más tarde, el coeficiente de correlación cruzada normalizado entre las dos señales de micrófono es definido como en donde * denota conjugado complejo y E{ . } es una operación de promediación. ' Para sonido difuso horizontalmente, F es (8) I Como puede fácilmente ser ¡ verificado utilizando suposiciones similares, como se usa en (—, "A highly directive 2-capsule based microphone system", in Preprint 123rd Conv. Aud. Eng. Soc, Oct. 2007 ) para cálculo de coeficiente de correlación cruzada normalizado.
La señal de mezcla descendente de SAC e información lateral son calculadas como función de j a, E{SS*} , ?????*} , y i?{N2N2*} , en donde E{ . } es una operación de promediación de tiempo corto. Estos valores son derivados en lo siguiente.
De (6) se sigue que . B{XrX} = .nE{5á.-} + E{ÍY,ÍV2'}. (9) I Se supone que la cantidad de sonido difuso en ambas i señales de micrófono es la misma, esto es EÍNiNi*}, = E{N2N2*} = E{NN*} y que el coeficiente de correlación cruzada normalizado I entre Ni y N2 es Odiff (8) . Dadas estas suposiciones, (9) puede ser escrita co eliminación E{SS*} y a en (9) produce la ecuación cuadrática <¾E{N.N*}2 - BR{lN*} + G = 0 (11) con (12) Luego E{NN } es una de las dos jsoluciones de (11), físicamente posible una vez, esto es ¡ i ! (13) La otra solución de (11) produce una potencia de sonido difuso más grande que la potencia de . la señal de micrófono, que es físicamente imposible. ¡ Dado (13), es fácil calcular a 'y E{SS*}: (14) La dirección de llegada del sonido dirección a(k, i) es calculada utilizando a(k, i) en (4) . ' Para resumir lo anterior, una jinformación de energía de sonido directo E{SS*} , una información de energía de sonido difuso E{NN) y una información de dirección a, a es obtenido por el analizador de señales 1212 o la unidad de análisis 1312. El conocimiento de la característica .direccional de los micrófonos es aprovechado en la presente: El conocimiento de la características direccionales de los micrófonos que proveen la señal de micrófono de dos canales permite el cálculo de un coeficiente de correlación estimado <E><aiff (por ejemplo, de acuerdo con la ecuación (8)), que refleja el hecho de que las señales de sonido difuso exhiben diferentes características de correlación cruzada que los componentes jde sonido direccional . El conocimiento de las características del micrófono pueden ser aplicados ya sea a un tiempo de diseño del analizador de señales 1212, 1312 o puede ser aprovechado en un tiempo de operación. En algunos casos, el analizádor de señales 1212, 1312 puede estar configurado para recibir una información que describe las características direccionales de los micrófonos, de tal manera que el analizador de señales 1212, 1312 puede ser adaptado dinámicamente a las características del micrófono.
Para resumir lo anterior, se puede decir que el I analizador de señales 1212, 1312 está configurado para resolver un sistema de ecuaciones que describen: | (1) una relación entre una inergía (o intensidad) estimada de una señal del micrófono de primer canal de la señal de micrófono de dos canales, la energía ^(o intensidad) estimada del componente de sonido directo de la ' señal- de micrófono de dos canales, y la energía estimada del componente de sonido difuso de la señal de micrófono de dos canales; (2) una relación entre una energía- (o intensidad) i estimada de una señal de micrófono del segundo canal de la j señal de micrófono de dos canales, la energía (o intensidad) estimada del componente de sonido directo de la señal de micrófono de dos canales, y la energía¦ estimada del componente de sonido difuso de la señal de micrófono de dos canales, y; (3) una relación entre un ¡valor de correlación cruzada estimado de la señal de micrófono del primer canal y la segunda señal de micrófono, la energía (o intensidad) estimada del componente de sonido directo de la señal de micrófono de dos canales y la energía (o intensidad) estimada del componente i de sonido difuso de la señal de micrófono de dos canales; (véase ecuación (10) .
Cuando se resuelve este sistema de ecuaciones, el analizador de señales puede tomar en cuenta la suposición de que la energía del componente de sonido, difuso es igual en la señal de micrófono del primer canal y la: señal de micrófono del segundo canal. Además, se puede tomar en cuenta que la proporción de energías del componente d;e sonido directo en la i primera señal de micrófono y la segunda señal de micrófono es dependiente de la dirección. Además, se puede tomar en cuenta que un coeficiente de correlación cruzada normalizado entre los componentes de sonido difusos en la primera señal de micrófono y la segunda señal de micrófono toma un valor constante menor de 1, tal valor constante es dependientej de las características direccionales de los micrófonos que proveen la primera señal de micrófono y la segunda señal de micrófono. El coeficiente de correlación cruzada, que es dado en la 'ecuación (8) puede ser pre-calculado al tiempo de diseño o puede ser calculado en el tiempo de operación en base a la información que describe las características del micrófono. í Así, es posible en primer lugar calcular la auto- i correlación de la primera señal de micrófono i, la autocorrelación de la segunda señal de micrófono x2 y la correlación cruzada entre la primera señal de micrófono i y la segunda señal de micrófono x2, y derivar la información de energía componente y la informació de ¡ dirección a partir de los valores de autocorrelación obtenidos y el valor de correlación cruzada obtenido, por ejemplo utilizando las ecuaciones (12) , (13) y (14) . | El análisis de señal de: micrófono discutido anteriormente puede por ejemplo ser efectuado por el analizador de señales 1212 o por la unidad de análisis 1312.
Sistema de SAC Plenamente Compatible Hacia Atrás - Generación de Señal de Mezcla Descendente de SAC I En una modalidad preferida! el aparato de la invención comprende un generador dé señales de mezcla descendente de SAC 1214, 1314, que está configurado para efectuar un procesamiento de mezcla descendente con el fin de i proveer una señal de mezcla descendente de SAC 1222, 1322 en base a la señal de micrófono de dos cjanales xi, x2. Así, el generador, de señales de mezcla descendente de SAC 1214 y el procesamiento de mezcla descendente! 1314 pueden estar configurados para procesar o modificar la señal de micrófono de dos canales xi, x2 de tal manera que la versión procesada 1222, i 1322 de la señal de micrófono de dos cánales ??, x2 comprenden las características de una señal de mezcla descendente de SAC y pueden ser aplicadas como una señál de entrada a un descodificador de SAC convencional. Sin embargo, se debe notar que el generador de mezcla descendente de SAC 1214 y el ? procesamiento de mezcla descendente 1314: deben ser considerados como opcionales . j Las señales de micrófono (??, x2) algunas veces no son i directamente apropiadas como una señal ¡de mezcla descendente, puesto que el sonido directo ya sea de lado y la parte posterior es atenuado en relación al sonido que llega de direcciones delanteras. El sonido directo contenido en las señales de micrófono (xi, x2) necesita ser compensado en ganancia por g(ot) dB (5), esto es, : idealmente la mezcla descendente de SAC debe ser cantidad supone que una matriz de mezcla descendente es usada por el SAC con los mismos pesos para los canales lateral frontal y posterior. Si se usan pesos más pequeños para los canales posteriores, como es recomendado opcionalmente por ITU (Rec.
ITU-R BS.775, Multi-Channel Stereophonic Sound System wíth or without Accompanying Picture. ITU, 1993; http://www.itu.org.), esto tiene que ser considerado adicionalmente) .
Filtros de Wiener (S. Haykin, Adaptive Filter Theory {third edition) . Prentice Hall, 1996) son usados para estimar la señal de mezcla descendente deseada, (16) donde los filtros de Wiener es de vez.
Los coeficientes de filtro dé Wiener, por ejemplo, como se dan en la ecuación (18) puedén ser calculados, por ? ejemplo por el calculador de coeficiente de filtro (o calculador de factor de escalamiento) 1214a del generador de señales de mezcla descendente de SAC 1214. Generalmente hablando, los coeficientes de filtro jde Wiener pueden ser I calculados mediante el procesamiento de mezcla descendente 1314. Además, los Coeficientes de filtro de Wiener pueden ser j aplicados a la señal de micrófono de dos canales xi, x2 por el filtro (o escalador) 1214b para obtener: la señal de audio de dos canales procesada o procesada a la ¡ señal de micrófono de canal 1222 que comprende una señal de primer canal procesada ¾ I ? y una segunda señal micrófono procesada Ja . Generalmente hablando, los coeficientes de filtro 'de Wiener pueden ser aplicados al procesamiento de mezcla idescendente 1314 para derivar la señal de mezcla descendente de SAC 1322 a partir de i la señal de micrófono de dos canales xi, ;x2.
Sistema de SAC Plenamente Compatible Hacia Atrás - Generación de Información Lateral Espacial En lo siguiente, se describirá como se obtiene información de pista espacial por el generador información lateral espacial 1216 del aparato 1200, y como se obtiene la información lateral de SAC 1320 por la unidad de análisis 1312 del aparato 1300. Se debe notar que tanto el generador de información lateral espacial 1216 como la unidad de análisis 1312 pueden estar configurados para proveer la misma información de salida, de tal manera que la información de pista espacial 1220 puede ser equivalente a la información lateral de SAC 1320. ; Dados los resultados del análisis de la señal I i estéreo, esto es, los parámetros a respectivamente ex (4), E{SS*} , y E{NN* } , parámetros especiales compatibles con el descodificador de SAC 1220, 1320 son generados por el generador de información lateral espacial 1216 o ¡la unidad de análisis 1312. Una manera de hacer esto es considerar un modelo de señal i de multicanal, por ejemplo: ' •5 en donde se supone que la potencia de las señales a 5 es igual a E{NN) y que a Ñ5 son mutualmente independientes . Si se desean más de ! 5 canales de audio surround, un modelo y un SAC con más canales son usados . 0 En una primera etapa, como función de dirección de llegada de sonido directo a(k, i), una 'ley de toma panorámica de amplitud de multicanal (V. Pulkki ,. j "Virtual sound source i positioning using Vector Base Amplitude Panning", J. Audio Eng.
I Soc, vol. 45, pp. 456-465, June 1997.), (D. Griesinger, 5 "Stereo and surround panning in practice", in Preprint 112th Conv. Aud. Eng. Soc, May 2002) es aplica para determinar los • factores de ganancia gi a g5. Este cálculo puede ser efectuado por el calculador de factor de ganancia ¡1216a del generador de información lateral espacial 1216. ; Luego, se' usa un 0 procedimiento heurístico para determinar las ganancias de sonido difuso hi a h5. Los valores constantes h± a ?$ que pueden ser escogidos al tiempo de diseño, son una elección razonable, esto es, el ambiente es igualmente distribuido a la parte frontal y posterior, mientras que el canal es generado como una 5 señal seca. i Dado el modelo de señal surround (19), el análisis de pista espacial del SAC específico usado! es aplicado al modelo I de señal para obtener las pistas espaciales. En lo siguiente, se derivan las pistas necesarias para MPEG Surround, que pueden ser obtenidas por el generador de información lateral espacial 1216 como una información de salida ±220 o que pueden ser obtenidas como la información lateral de j SAC 1320 por la unidad de análisis 1312. \ El espectro de potencia de la's señales definidas en (19) son Estos espectros de potencia pueden ser calculados por el calculador de valores estimativos de intensidad de canal 1216b en base a la información provista por el analizador de señales 1212 y el calculator de factor de ganancia 1216, por ejemplo, tomando en consideración valores constante para hi a h5. Alternativamente, estos espectros dje potencia pueden ser calculados por la unidad de análisis 1312.
Los espectros cruzados, necesarios en lo siguiente son *Ú.( ) ' = 9 (l + a2)E{SS*} fl2&(l+a?)B{SS*} (21) Los espectros cruzados pueden ¡ también ser calculados por el calculador de valores estimativos de intensidad de canal 1216b. Alternativamente, los espectros cruzados pueden ser calculados por la unidad de análisis 1312.
La primera caja de dos a uno ,(???) de MPEG Surround usa diferencia de nivel de inter-canal j(ICLD) y coherencia de inter-can estar configura ICCLLs como se lores estimativ zados provistos por el calculador estimativo de intensidad de canal 1216b. Alternativamente, la unidad de análisis 1312 puede calcular las pistas espaciales como se define en la ecuación (22).
Similarmente, las ICLD e ICC del segundo bloque de TTO para R y Rs son calculados : PMk- ) 1 ?? '<) (23) Así, el calculador de pista ¡ espacial 1216c puede estar configurado para calcular las pistas espaciales ICLDRRS e ICCRRs como se define en la ecuación (23)' en base a los valores estimativos de intensidad de canal ¡y. espectros cruzados I provistos por el calculador estimativo de intensidad de canal ' I 1216b. Alternativamente, la unidad de análisis 1312 puede calcular las pistas espaciales ICLDRRS y ICCRRs como se define en estar configurado para calcular las pistas espaciales ICLDi y ICLD2 como se define en la ecuación (24 ): en base a los valores estimativos de intensidad de canal provistos por el calculador de valores estimativos de intensidad de canal 1216b.
Alternativamente, la unidad de análisis 1312 puede calcular las i pistas espaciales ICLDi, ICLD2 como se ¡define en la ecuación (24) .
Nótese que los índices i y k han sido dejados otra vez por brevedad de notación.
Naturalmente, no es determinante que el calculador de pista espacial 1216c calcule todas las pistas mencionadas anteriormente ICLDLLS, ICLDRRS, ICLD1( ICLD2, ICCLLS, ICCRRs. Más i bien, es suficiente si el calculador de pista espacial 1216c (o la unidad de a'nálisis 1312) calcula uii subconjunto de estas pistas espaciales, lo que sea requerido en la aplicación real. i Similarmente, no es necesario que el estimador de intensidad de canal 1216b (o la unidad de análisis 1312) calcule todos los I valores estimativos de intensidad de canal PL, PR, PC, PLS PRs y espectros cruzados PLLS/ PRRS mencionados anteriormente. Más i bien, es naturalmente suficiente si el calculador estimativo de intensidad de canal 1216b calcula aquellos valores estimativos de intensidad de canal y espectros cruzados, que son requeridos para el cálculo subsecuente de las pistjas espaciales deseadas por el calculador de pista espacial 1216 Sistema que usa Señales de Micrófono como Mezcla Descendente El escenario descrito previamente de usar un codificador 1200, 1300, generar una mezcla descendente i compatible con SAC 1222, 1322 e información lateral espacial 1220, 1320, tiene la ventaja de que un i descodificador de SAC convencional 1320 puede ser usado para generar la señal de I audio surround. I i Si la compatibilidad hacia atrás no juega un papel y si por alguna razón se desea usar las señales de micrófono sin i modificar ?, x2 como señales de mézcla descendente, el "procesamiento de mezcla descendente" jpuede ser movido del codificador 1300 al decodificador 1370 , ¡como se ilustra en la Figura 14. Nótese que en este escenario, la información necesaria para el procesamiento de mezcla descendente, esto es ( 18 ) , tiene que ser transmitida al decodificador además de la I información lateral espacial (a no ser que un algoritmo heurístico sea diseñado exitosamente que derive esta información a partir de la información lateral espacial) . i I En otras palabras, la Figura 14 muestra un diagrama i de bloques esquemático de un codificador de codificación de audio espacial y un descodificador de [codificación de audio espacial. El codificador 1400 comprende ¡una unidad de análisis i 1410 , que puede ser idéntica a la unidad de análisis 1310 , y que puede por consiguiente comprender j la funcionalidad del analizador de señales 1212 y del gen'erador de información lateral espacial 1216 . de la Figura 14 , una señal transmitida del codificador 14|oo al descodificador extendido 1470 comprende la señal de micrófono de dos canales xi, x2 (o una representación codificada ¡de la misma) . Además, la señal transmitida del codificador Í400 al ' descodificador extendido 1470 también comprende información 1413 , que puede por ejemplo comprender la información 'de energía de sonido directo E{SS*}, y la información de energía de sonido difuso E{NN* } (o una versión codificada de la misma) . Además, la i información transmitida del codificador 1400 al descodificador extendido 1470 comprende información lateral de SAC 1420, que puede ser idéntica a la información de pista espacial 1220 o a la información lateral de SAC 1320. En la modalidad de la Figura 14, el descodificador extendido 1470 comprendé un procesamiento de mezcla descendente 147j2, que puede tomar la funcionalidad del generador de señal de¡ mezcla descendente de SAC 1214 o del procesador dé mezcla | descendente 1314. El descodificador extendido 1470 puede también comprender un descodificador de SAC convencional 1480, 'que puede ser idéntico en función al descodificador de SAC 1370. El descodificador de SAC 1480 puede estar configurado por consiguiente para recibir la información lateral de SAC 1420, que es provista por la unidad de análisis 1410 del codificador ¡1400, e información de mezcla descendente de SAC 1474, que! es provista por el procesamiento de mezcla descendente 1472 del decodificador en base a la señal de micrófono de dos canales Xi, x2 provista por el codificador 1400 y la información adicional 1413 provista por el codificador 1400. La información, de mezcla descendente de SAC 1474 puede ser equivalente a la1 información de mezcla descendente de SAC 1322. El descodificador de SAC 1480 puede estar configurado por consiguiente para proveer una señal de salida de sonido surround que comprende ! más de dos canales de audio en base a la señal de mezcla descendente de SAC 1474 y la información lateral de SAC 1420. ! I Sistema Ciego | El tercer escenario que es descrito, para usar SAC con micrófonos estéreo, es un descodificador de SÁC "ciego" modificado, que puede ser alimentado ! directamente con las señales de micrófono i, x2 para generar señales de sonido surround. Esto corresponde a mover no solamente el bloque de "Procesamiento de mezcla descendente" '1314 sino también el I bloque de "Análisis" 1312 del codificador 1300 al decodificador ? 1370, como se ilustra en la Figura 15. En contraste a los decodificadores de los primeros dos sistemas propuestos, el descodificador de SAC ciego necesita información en cuanto a la I configuración de micrófono específico qué es usado.
I Un diagrama de bloques ¡ esquemático de tal descodificador de SAC ciego modificado es mostrado en la Figura 15. Como se puede ver, el descodificador de SAC ciego modificado 1500 está configurado para recibir las señales de micrófono xi, x2 y opcionalmente una dirección de respuesta direccional que caracteriza la respuesta direccional del arreglo dé. micrófono que produce las señales de micrófono xi, x2. Como se puede ver en la Figura j 15, el decodificador i comprende una unidad de análisis 1510, que es equivalente a la unidad de análisis 1310 y a la unidad de j análisis 1410. Además, el descodificador de SAC ciego 1500 comprende un procesamiento de mezcla descendente 1514, que es idéntico al procesamiento de mezcla descendente 1314, 1472. Además, eí descodificador de SAC ciego modificado 1500 comprende una sínjtesis de SAC 1570 , que puede ser igual al descodificador de SAC 1370 , 1480 . Así, la funcionalidad del descodificador de SAC ¡ciego 1500 es idéntica a la funcionalidad del sistema de codlificador/descodificador 1300 , 1370 y el sistema de codificador/descodificador 1400 , 1470 , con la excepción de que todos los componentes descritos anteriormente 1510 , 1514 , 1540 , 1570 están arreglados en el lado del decodificador . Por consiguiente, las señales de micrófono sin procesar' xi( x2 son recibidas preferiblemente por el descodificador de SAC ciego 1500 en lugar de las señales de micrófono procesadas 1322 , que son recibidas por el descodificador de SAC 1370 . Además, el ' descodificador de SAC ciego 1500 está configurado para derivar j la información lateral i de SAC en forma de pistas espaciales de SAC por sí mismo en lugar de recibirlos de un codificador. , Con a los descodificadores de ^ SAC 1370 , 1480 , 1570 , se debe notar que esta unidad es responsable de proveer una señal de salida de sonido surround en base a la señal de audio de mezcla descendente y las pistas espaciales 1320 , 1420 , 1520 . Así, el descodificador de SAC 1370 , 14j80 , 1570 comprende un mezclador ascendente configurado para sjintetizar la señal de salda de sonido surround (que comprende ¡ comúnmente más de dos canales de audio, y preferiblemente comprende 6 o más canales de audio (por ejemplo 5 canales surround y 1 un canal de baja frecuencia) ) en base a la señal de mezcla descendente (por ejemplo, la señal de micrófono de dos canales sin procesar o procesadas) utilizando la información ele pista espacial, en donde la información de pista espacial comprende comúnmente uno o más de los siguientes parámetros: Diferencia de nivel de inter-canal (ICLD) , correlación de inter-jcanal (ICC) .
Método i La Figura 16 muestra un diagrama de flujo de un método 1600 para proveer un conjunto i de pistas espaciales asociadas con una señal de audio de mezcla ascendente que tiene más de dos canales en base a una señal de micrófono de dos canales. El método 1600 comprende una primera etapa 1610 de obtener información de energía componente y una información de dirección en base a la señal de micrófono de dos canales, de tal manera que la información de energía componente describe valores estimativos de energías de un componente de sonido I directo de la señal de micrófono de dos canales y de un componente de sonido difuso de la señal de micrófono de dos canales, y de tal manera que la información de dirección i describe un valor estimativo de una dirección de la cual el i componente de sonido directo de la señal de micrófono de dos ¡ canales se origina.. El método 1600 también comprende una etapa 1620 de mapeo de la información de energía componente de la señal de micrófono de dos canales y la información de dirección de la señal de micrófono de dos canales > sobre una información de pista espacial que describe pistas espaciales asociadas con una señal de audio de mezcla ascendente que tiene más de dos canales. Naturalmente, el método 1600 puede ser complementado por cualquiera de los elementos y funcionalidades del aparato de la invención descrito en la presente.
Implementación por Computadora Aunque algunos aspectos han ¡sido descritos en el contexto de un aparato, es claro que estos aspectos también representan una descripción de del méto|do correspondiente, en donde un bloque o dispositivo corresponde a una etapa de método o un elemento. de una etapa de método. Análogamente, aspectos descritos en el contexto de una etapa de método también representan una descripción de un bloque o ítem o elemento i correspondiente de un aparato correspondiente.
La señal de audio codificada de la invención, por ejemplo, la señal de mezcla descendente de SAC 1322 en combinación con la información lateral de SAC 1320 o las i señales de micrófono xi, x2 en combinación con la información 1413, y la información lateral de SAC ¡1420 o las señales de I micrófono xi, x2, pueden ser almacenadas en un medio de almacenamiento digital o pueden ser transmitidas en un medio de transmisión tal como un medio de transmisión inalámbrico o un I medio de transmisión cableado tal cómo Internet.
Dependiendo de ciertos requerimientos de implementación, , modalidades de la invención pueden ser implementadas en elementos físicos ¡ o en elementos de programación. La implementación puede se'r efectuada utilizando un medio de almacenamiento digital, por ejemplo un disco flexible, un DVD, un Blue-Ray, un CD, un ROM, un PROM, un i EPROM, un EEPROM o una memoria instantánea, que tiene señales de control que se pueden leer electrónicamente almacenadas en ¦ I el mismo, que cooperan (o son aptas de cooperar) con un sistema de computadora programable, de tal manera que el método respectivo es efectuado. Por consiguiente, el medio de almacenamiento digital se puede leer por computadora.
Algunas modalidades de acuerdo con la invención i comprenden un portador de datos que tiene señales de control que se pueden leer electrónicamente, que1 son aptas de cooperar con los sistemas de computadora programable, de tal manera que uno de los métodos descritos en la presente es efectuado.
En general, las modalidades dej la presente invención pueden ser implementadas como un producto de programa de computadora con un código de programa, el código de programa es operativo para efectuar uno de los métodos cuando el producto de programa de computadora se ejecuta en una computadora. El i código de programa puede ser almacenado por ejemplo en un portador que se puede por la máquina. j i Otras modalidades comprenden . el programa de i computadora para efectuar uno de los métodos descritos en la presente, almacenados en un portador que se puede leer por la máquina . 1 En otras palabras, una modalidad del método de la invención es por consiguiente un programa de computadora que tiene un código de programa para efectuar uno de los métodos descritos en la presente, cuando el programa de computadora se ejecuta en una computadora. ' Una modalidad adicional de ¡ los métodos de la invención es por consiguiente un portador de datos (o un medio de . almacenamiento digital o un medio que se puede leer por computadora) que comprende, grabadas en j el mismo, el programa de computadora para efectuar uno de los métodos descritos en la presente .
Una modalidad adicional del método de la invención es, por consiguiente, una corriente de datos o una secuencia de señales que representan el programa ; de computadora para efectuar uno de los métodos descritos en la presente. La corriente de datos o la secuencia de señales pueden por ejemplo estar configurados para ser transferidos vía una conexión de comunicación de datos, por ejemplo vía Internet.
Una modalidad adicional comprende un medio de procesamiento, por ejemplo una computadora o un dispositivo lógico programable, configurado para o adaptado para efectuar uno de los métodos descritos en la presente.
Una modalidad adicional comprende una computadora que tiene instalado en la misma el programa de computadora para efectuar uno de los métodos descritos en; la presente.
En algunas modalidades, se puede usar un dispositivo lógico programable (por ejemplo un arreglo de compuerta programable en el campo) para efectuar algunas o todas las funcionalidades de los métodos descritos en la presente. En algunas modalidades, un arreglo de compuerta programable en el campo puede cooperar con un microprocesador con el fin de efectuar uno de los métodos descritos en »la presente. En general, los métodos son efectuados preferiblemente por i cualquier aparato de elementos físicos. i Las modalidades descritas anteriormente son solamente ilustrativas para los principios de la Jpresente invención. Se i comprenderá que modificaciones y variaciones de los arreglos y los detalles descritos en la presenté serán evidentes para otros experimentados en el arte, Es el intento, por consiguiente, estar limitados solamente por el alcance de las reivindicaciones de patente pendientes y no por los detalles específicos presentados a manera de descripción y explicación t de las modalidades de la. presente.
! Conclusión I I La conveniencia de micrófonos estéreos para grabación de sonido surround por medio del uso dé codificación de audio espacial (SAC) fue discutida. Se presentaron tres sistemas que usan SAC para generar audio surround de multi-canal en base a señales de micrófono estéreo. Uno de esjtos sistemas, es decir el sistema de pistas de acuerdo con la Figuras 12 y 13, es de corriente de bits y descodificador j compatible con SAC existentes, en donde un codificador especializado genera la I señal estéreo de mezcla descendente compatible e información lateral directamente a partir de la señal de micrófono estéreo.
El segundo sistema propuesto, que ha sido descrito con referencia a la Figura 14, usa la señal1 estéreo del micrófono j directamente como una señal de mezcla descendente de SAC y el I tercer sistema, que ha sido descrito coni referencia a la Figura 15, es un descodificador de SAC "ciego" |que convierte la señal de micrófono estéreo directamente a una señal de audio surround de multicanal. ' I Se han descrito tres configuraciones diferentes en como usar un micrófono estéreo con un codificador de audio í espacial (SAC) para generar señales de audio surround de multicanal. En la sección previa, se dieron dos ejemplos de configuraciones de micrófono estéreo particularmente apropiadas . ! Modalidades de acuerdo con la invención crean un número de extremos frontales de micrófono a base de dos cápsulas para uso con SAC convencionales para directamente capturar y codificar sonido surround. Elementos de los esquemas propuestos son: • Las configuraciones de micrófono pueden ser i micrófonos estéreos convencionales o específicamente para este propósito micrófonos estéreo optimizados • Sin la necesidad de generar! una señal surround en i el codificador, se generan mezcla descendente compatible con SAC e información lateral .
• Se genera una señal de mezcla descendente estéreo de alta calidad, usada por el descodificador de SAC para generar el sonido surround. j • Si no se desea codificación, se puede usar un descodificador de SAC "ciego" modificado para convertir directamente las ' señales de micrófono ¡a una señal de audio surround .
El la presente descripción, la conveniencia de diferentes configuraciones de micrófono estéreo para capturar información de sonido surround ha sido; discutida. En base a estos discernimientos, tres sistemas para uso de SAC con micrófono estéreos han sido propuestos y se han presentado algunas conclusiones .
La conveniencia de diferentes configuraciones de micrófono estéreo para capturar información de sonido surround ha sido discutida bajo la sección intitulada "Micrófonos I estéreo y su conveniencia para grabación surround" . Se han descrito tres sistemas en la sección intitulada "Uso de micrófonos estéreo con codificadores de espacial".
Para resumir adicionalmente, codificadores de audio espacial, tales como MPEG Surround, han habilitado una baja velocidad de bits y estéreo hacia atrás compatible con la codificación de audio surround de multi-canal. La codificación de audio direccional (DirAC) puede ser vista como codificación de audio espacial diseñada alrededor de extremos frontales de micrófono específicos. DirAC está basadO| en análisis de sonido espacial de formato B y no tiene compatibilidad hacia atrás estéreo. La presente invención crea lin número de extremos frontales de micrófono compatibles con estéreo a base de dos cápsulas y modificaciones de codificador de audio espacial correspondientes, que permiten el uso de codificadores de audio espacial para directamente capturar y codificar sonido surround.
V

Claims (13)

REIVINDICACIONES
1. Un aparato para proveer un conjunto de pistas espaciales asociadas con una señal Jde audio de mezcla ascendente que tiene más de dos canales en base a una señal de micrófono de dos canales, el aparato está caracterizado porque comprende : Un analizador de señales configurado para obtener una I información de energía componente y j una información de dirección en base a la señal de micrófqno de dos canales, de tal manera que la información de energía componente describe i valores estimativos de energías de un I componente de sonido I directo de la señal de micrófono de Idos canales y de un componente ' de sonido difuso de la señal de micrófono de dos canales, y de tal manera que la información de dirección describe un valor estimativo de una dirjección de la cual el componente de sonido directo de la señal de micrófono de dos canales se origina; y un generador de ' información lateral espacial configurado para mapear la información de energía componente de la señal de micrófono de dos canales y la información de dirección de la señal de micrófono de 'dos canales sobre una información de pista espacial que describe el conjunto de pistas espaciales asociadas con una señal de audio de mezcla ascendente que tiene más de dos canales . i
2. El aparato de conformidad con la reivindicación 1, caracterizado porque el generador información lateral espacial está configurado para mapear directamente la información de energía componente de la ¡ señal de micrófono de i dos canales y la información de dirección de la señal de micrófono de dos canales sobre la información de pista espacial i que describe el conjunto dé pistas espaciales asociadas con una señal de audio de mezcla ascendente que tiene más de dos I canales . ¡
3. El aparato de conformidad con la reivindicación 1 I ó 2, caracterizado porque el generador 'de información lateral í espacial está configurado para mapear la , información de energía componente de la señal de micrófono de dos canales y la información de dirección de la señal de micrófono de dos canales sobre la información de pista espacial que describe el conjunto de pistas espaciales asociadas con una señal de audio i de mezcla ascendente que tiene más de dos canales, sin realmente usar el canal de audio de mezcla ascendente como una cantidad intermedia. i
4. El aparato de conformidad con cualquiera de las reivindicaciones 1 a 3, caracterizado porque el generador de información lateral espacial está configurado para mapear la información de dirección sobre un conjunto de factores de ganancia que describen un mapeo de sonido directo dependiente de dirección a canal de audio surround; y en donde el generador de información lateral espacial está también configurado para obtener palores estimativos de intensidad de canal que describen intensidades estimadas de más de dos canales surround en base a la información de energía componente y los factores de ganancia; y en donde el generador de información lateral espacial está configurado para determinar lás pistas espaciales i asociadas con la señal de audio de mezcla ascendente en base a i los valores estimativos de intensidad de panal.
5. El aparato de conformidad con la reivindicación 4, caracterizado porque el generador información lateral espacial está también configurado para obtener información de i correlación de canal que describe una correlación entre diferentes canales de la señal de mezcla ascendente en base a la información de energía ' componente j y los factores de ganancia; y j en donde el generador de información lateral espacial también está configurado para determinar pistas espaciales i asociadas con la señal de mezcla ascendente en base a uno o más de los valores estimativos de intensidad de canal . y la . i información de correlación de canal . >
6. El aparato de conformidad con la reivindicación 4 ó 5, caracterizado porque el generador de información lateral i espacial está configurado para combinar! linealmente un valor estimativo de la intensidad de un componente de sonido directo de la señal de micrófono de dos canales ; y un valor estimativo de la intensidad de un componente de sonido difuso de la señal i de micrófono de dos canales con el fin de obtener los valores estimativos de intensidad de canal, y ¡ en donde el generador de información lateral espacial está configurado para ponderar el valor estimativo de la intensidad del componente de sonido directo en dependencia de los factores de ganancia y en dependencia de la información de dirección.
7. El aparato de conformidad con cualquiera de las reivindicaciones 4 a 6, caracterizado jorque el generador de información lateral espacial está configurado para obtener un valor de espectro de potencia estimado PL de un canal surround frontal izquierdo de la señal de audio de mezcla ascendente de acuerdo con: para obtener un valor de espectro de potencia estimado PR de un canal surround frontal derecho de la señal de audio de mezcla para spectro de potencia estimado PL de de la señal de audio de mezcla ascen para obtener un valor de espectro de potencia estimado PLs de un canal surround posterior izquierdo de la señal de audio de mezcla ascendente de acuerdo con: para obtener un valor de espectro de potencia estimado PRs de un canal surround posterior derecho de acuerdo con donde el generador información lateral espectral también está configurado para calcular una pluralidad de diferentes diferencias de nivel de inter-canal (ICLDLLs, ICLDRRS, ICLDI, ICLD2) utilizando los valores de espectro de potencia estimados, en donde gi, g2, g3, g4, g$ son factores de ganancia I " que .describen un mapeo de sonido directo dependiente de dirección a canal de audio surround, en donde f(a) es un factor de corrección de amplitud dependiente de la dirección, en donde E{SS*} es informaciónj de energía componente que describe un valor estimativo de la energía de un componente de sonido directo (S) de la señal de micrófono de dos canales en donde E{M *} es información de energía de componente que describe un valor estimativo de la energía de un componente de sonido difuso (N) de la señal de micrófono de dos canales (Xi, X2) ; y 1 en donde hi , h2 , I13 , h4 , son factores de distribución de sonido difuso que describen un mapeo de sonido difuso a canal de audio
8. El aparato reivindicaciones 4 a 7, en donde el generador de información lateral espacial está configurado paraj obtener un valor de espectro de correlación cruzada estimado PLLS entre un canal surround frontal izquierdo y un canal surround posterior izquierdo de la señal de audio de mezcla; ascendente de acuerdo con: y para obtener un valor de espectro de correlación i ¡ cruzada estimado PRRs entre un canal surround frontal derecho y un canal surround posterior derecho de acuerdo con: f{a)E{sS*}, para combinar los valores de espectro de correlación 1 cruzada estimados con valores de espectro de potencia estimados (PL, PLs; PR, PRs) de canales surround de la señal de audio de mezcla ascendente para obtener pistas de coherencia de intercana1 (ICCLLs ICCRRs) , en donde gx, g2/ g^, gs son factores de ganancia que describen un mapeo de canal de audio surround de potencia de sonido directo dependiente de la dirección, en donde f(a) es un factor de corrección de amplitud dependiente de la dirección, en donde E{SS*} es información de energía componente que describe un valor estimativo de la energía de un componente de sonido directo (S) de la señal de micrófono de dos canales (Xi, 2) ; ; en donde E{ *} es información1 de energía componente que describe un valor estimativo de la energía de un componente de sonido difuso (N) de la señal de micrófono de dos canales ( (Xi, X2) . j i
9. El aparato de conformidad j con cualquiera de las reivindicaciones 1 a 8, caracterizado pjorque el analizador de señales está configurado para resolver un sistema de ecuaciones i que describe: ! i (A) una relación entre una energía estimada (E{XiXi*}) I de una señal de micrófono de primer canal (Xi) de la señal de micrófono de dos canales, la energía estimada (E{SS }) del componente de sonido directo (S) de la señal de micrófono de dos canales, y la energía estimada (E{N *} ) del componente de sonido difuso (N) de la señal de micrófono de dos canales, (B) una relación entre una energía estimada (E{X2X2*}) de una señal de micrófono del segundo canal (X2) de la señal de 1 micrófono de dos canales, la energía estimada (E{SS*>) del componente de sonido directo (S) de la señal de micrófono de dos canales, y la energía estimada (E{ N*}) del componente de sonido difuso (N) de la señal de micrófono de dos canales, y (C) una relación entre un j valor de correlación j cruzada estimado (E{XiX2*}) de la señal de micrófono del primer canal (Xi) y la señal de micrófono del j segundo canal (X2) , la energía éstimada (E{SS*}) del componente de sonido directo (S) de la señal de micrófono de dos canales; y la energía estimada (E{N *}) del componente de sonido difuso (N) de la señal de micrófono de dos canales, tomando en cuenta las suposiciones de que la energía (E{N *}) del componente de sonido difuso (N) es idéntica en la señal de micrófono del primer canal i (Xi) y la señal de micrófono del segundo canal (X2) , que la proporción de energías (E{SS*}, a2 E{SS*}) del componente de sonido directo (S) en! la primera señal de I micrófono (??) y la. segunda señal jde micrófono (X2) es dependiente de la dirección, y ¡ que un coeficiente de correlación cruzada normalizado (F) entre los componentes de sonido I difuso (Ni,N2) en la primera señal de micrófono (??) y la segunda señal de micrófono i (X2) toma un valor constante menor de uno, tal valor constante es dependiente de las características| direccionales de los micrófonos que proveen la primera señal j de micrófono (Xi) y la i segunda señal de micrófono (X2) .
10. Un aparato para proveer una señal de audio de dos canales y un conjunto de pistas espaciales (ICLDLLs, ICCLLS ICLDRRS, ICCRRS, ICLDÍ, ICLD2) asociadas con una señal de audio de mezcla ascendente que tiene más de dos canales, el aparato está caracterizado porque comprende: j Un arreglo de micrófono que comprende un primer micrófono direccional y un segundo micrófono direccional, en donde el primer micrófono direccional y el segundo ¡ micrófono direccional están separados por no más de 30 cm, y en donde el primer micrófono direccional y el segundo micrófono direccional están orientados de tral manera que una característica direccional del segundo micrófono direccional es una versión girada de una característica direccional de los primeros micrófonos direccionales ,- y ¡ i un aparato para proveer un conjunto de pistas espaciales (ICLDLLS, ICCLLS ICLDRRS, ICCRRS, ICLDX, ICLD2) asociadas con una señal de audio de mezcla ascendente que tiene más de dos canales en base a una señal de micrófono de dos canales (??, X2) , de acuerdo con; cualquiera de las reivindicaciones 1 a 9, ¡ i en donde el . aparato para proveer un conjunto de pistas espaciales asociadas con una señal de audio de mezcla ascendente está configurado para recibir las señales de micrófono (Xi, X2) de los primeros y segundos micrófonos direccionales como la señal de micrófonq de dos canales, y para 73 proveer el conjunto de pistas espaciales! en base a lo mismo; y un proveedor de señales de audio de dos canales configurado para proveer las señales dé micrófono (xi, x2) de los primeros y segundos micrófonos diréccionales , o versiones procesadas de las mismas, como la señal de audio de dos canales . ¦
11. Un aparato para proveer una señal de audio de dos canales procesada y un conjunto de pistas, espaciales (ICLDLLs, ICCLLS ICLDRRS, ICCRRS, ICLDI, ICLD2) asociada con una señal de mezcla ascendente que tiene más de dos j canales en base a una señal de micrófono de dos canales (??) X2) , el aparato está caracterizado porque comprende: j un aparato para proveer un conjunto de pistas espaciales (ICLDLLS, ICCLLS ICLDRRS, |ICCRRS, ICLDI., ICLD2) asociadas con una señal de audio de mezcla ascendente que tiene más de dos canales en base a las señales de micrófono de dos canales (??, X2) , de acuerdo con cualquiera de las reivindicaciones 1 a 9 ,- y un proveedor de señales de : audio de dos canales configurado para proveer la señal de audio de dos canales I procesada en base a la señal de micrófono de dos canales (Xi, X2), en donde la proveedor de seríales de audio de dos canales está configurado para escalar1 una primera señal de I audio (??) de la señal de micrófono de ! dos canales utilizando uno o más primeros factores de escalamiento de señal de micrófono (Hi) , para obtener una primera señal de audio procesada (?) ) de la señal de audio de dos canales procesada, j en donde la proveedor de señales de audio de dos canales está también configurado para escalar una segunda señal de audio (X2) de la señal de micrófono de dos canales utilizando uno o más segundos factores de escalamiento de señal de micrófono (H2) , para obtener una segunda señal de audio procesada (^2) ) de la señal de audio de dos canales procesada, en donde el proveedor de señales de audio de dos j canales está configurado para calcular ' el uno o más primeros factores de escalamiento de señal de micrófono (??) y el uno o más segundos factores de escalamiento de señal de micrófono (H2) en base a la información de energía componente (E{SS*}( I E{ N*}) provista por el analizador de señales del aparato para proveer un conjunto de pistas espaciales, de tal manera que tanto las pistas espaciales como los factores de escalamiento de la señal de micrófono (¾, H2) son determinados por la información de energía componente. | I
12. Un método para proveer jun conjunto de pistas espaciales asociadas con una señal j de audio de mezcla ascendente que tiene más de dos canales ¡ en base a una señal de micrófono de dos canales, el método está caracterizado porque comprende : obtener información de energía componente información de dirección en base a la señi al de micrófono de dos canales, de tal manera que la información de energía componente describe valores estimativos de energías de un componente de sonido directo de la señal de micrófono ¡ de dos canales y de un componente de sonido difuso de la señal de micrófono de dos canales, y de tal manera que la información de dirección I describe un valor estimativo de la dirección de la cual el componente de sonido directo de la señal de micrófono de dos canales se origina; y ! mapeo de la información de energía componente de la señal de micrófono de dos canales y la información de dirección de la señal de micrófono de dos canales sobre una información I de pista espacial que describe pistas espaciales asociadas con j una señal de audio de mezcla ascendente que tiene más de dos canales .
13. Un programa de computadora para efectuar el método de conformidad con la reivindicación 12, caracterizado porque el programa de computadora , se ejecuta en una computadora . I
MX2011002626A 2008-09-11 2009-09-04 Aparato, metodo y programa de computadora para proveer un conjunto de pistas espaciales en base a una señal de microfono y aparato para proveer una señal de audio de dos canales y un conjunto de pistas especiales. MX2011002626A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US9596208P 2008-09-11 2008-09-11
PCT/EP2009/006457 WO2010028784A1 (en) 2008-09-11 2009-09-04 Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues

Publications (1)

Publication Number Publication Date
MX2011002626A true MX2011002626A (es) 2011-04-07

Family

ID=41395014

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2011002626A MX2011002626A (es) 2008-09-11 2009-09-04 Aparato, metodo y programa de computadora para proveer un conjunto de pistas espaciales en base a una señal de microfono y aparato para proveer una señal de audio de dos canales y un conjunto de pistas especiales.

Country Status (10)

Country Link
EP (1) EP2347410B1 (es)
JP (1) JP5520300B2 (es)
KR (2) KR101392546B1 (es)
CN (1) CN102209988B (es)
AU (1) AU2009291259B2 (es)
BR (1) BRPI0913460B1 (es)
CA (1) CA2736709C (es)
MX (1) MX2011002626A (es)
RU (1) RU2493617C2 (es)
WO (1) WO2010028784A1 (es)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101410575B1 (ko) * 2010-02-24 2014-06-23 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 강화 다운믹스 신호를 생성하는 장치, 강화 다운믹스 신호를 생성하는 방법 및 컴퓨터 프로그램
US9456289B2 (en) 2010-11-19 2016-09-27 Nokia Technologies Oy Converting multi-microphone captured signals to shifted signals useful for binaural signal processing and use thereof
US9055371B2 (en) 2010-11-19 2015-06-09 Nokia Technologies Oy Controllable playback system offering hierarchical playback options
US9313599B2 (en) 2010-11-19 2016-04-12 Nokia Technologies Oy Apparatus and method for multi-channel signal playback
PL2647222T3 (pl) 2010-12-03 2015-04-30 Fraunhofer Ges Forschung Pozyskiwanie dźwięku za pomocą ekstrakcji informacji geometrycznej z estymacji kierunku nadejścia sygnału
AU2011334840B2 (en) * 2010-12-03 2015-09-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for spatially selective sound acquisition by acoustic triangulation
CN108810744A (zh) 2012-04-05 2018-11-13 诺基亚技术有限公司 柔性的空间音频捕捉设备
EP2941770B1 (en) * 2013-01-04 2017-08-30 Huawei Technologies Co., Ltd. Method for determining a stereo signal
US10635383B2 (en) 2013-04-04 2020-04-28 Nokia Technologies Oy Visual audio processing apparatus
EP2997573A4 (en) 2013-05-17 2017-01-18 Nokia Technologies OY Spatial object oriented audio apparatus
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
EP3483881A1 (en) 2013-11-13 2019-05-15 Fraunhofer Gesellschaft zur Förderung der Angewand Encoder for encoding an audio signal, audio transmission system and method for determining correction values
CN103702258B (zh) * 2013-12-27 2017-02-22 深圳泰山在线科技有限公司 麦克风装置及消除近场声源干扰的麦克风设置方法
EP3222053B1 (en) * 2014-12-18 2019-11-27 Huawei Technologies Co. Ltd. Surround sound recording for mobile devices
DE102015104699A1 (de) * 2015-03-27 2016-09-29 Hamburg Innovation Gmbh Verfahren zur Analyse und Dekomposition von Stereoaudiosignalen
US10708701B2 (en) * 2015-10-28 2020-07-07 Music Tribe Global Brands Ltd. Sound level estimation
CN106019230B (zh) * 2016-05-27 2019-01-08 南京邮电大学 一种基于i-vector说话人识别的声源定位方法
EP3321709A1 (en) * 2016-11-11 2018-05-16 Fraunhofer Gesellschaft zur Förderung der Angewand User equipment localization in a mobile communication network based on delays and path strengths
GB2559765A (en) * 2017-02-17 2018-08-22 Nokia Technologies Oy Two stage audio focus for spatial audio processing
WO2018173266A1 (ja) 2017-03-24 2018-09-27 ヤマハ株式会社 収音装置および収音方法
WO2018173267A1 (ja) * 2017-03-24 2018-09-27 ヤマハ株式会社 収音装置および収音方法
GB2572650A (en) * 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
CN110068797B (zh) * 2019-04-23 2021-02-02 浙江大华技术股份有限公司 一种校准麦克风阵列的方法、声源定位方法及相关设备
CN111256238A (zh) * 2020-01-21 2020-06-09 金文睿 负离子发生仪的方向调整方法、系统及负离子发生仪系统
WO2022016533A1 (zh) * 2020-07-24 2022-01-27 深圳市大疆创新科技有限公司 音频处理方法和电子设备

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04158000A (ja) * 1990-10-22 1992-05-29 Matsushita Electric Ind Co Ltd 音場再生システム
US6154549A (en) * 1996-06-18 2000-11-28 Extreme Audio Reality, Inc. Method and apparatus for providing sound in a spatial environment
CA2437764C (en) * 2001-02-07 2012-04-10 Dolby Laboratories Licensing Corporation Audio channel translation
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
JP4195267B2 (ja) * 2002-03-14 2008-12-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声認識装置、その音声認識方法及びプログラム
JP4247037B2 (ja) * 2003-01-29 2009-04-02 株式会社東芝 音声信号処理方法と装置及びプログラム
FR2858403B1 (fr) * 2003-07-31 2005-11-18 Remy Henri Denis Bruno Systeme et procede de determination d'une representation d'un champ acoustique
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
AU2006255662B2 (en) * 2005-06-03 2012-08-23 Dolby Laboratories Licensing Corporation Apparatus and method for encoding audio signals with decoding instructions
PL1905006T3 (pl) * 2005-07-19 2014-02-28 Koninl Philips Electronics Nv Generowanie wielokanałowych sygnałów audio
EP1761110A1 (en) * 2005-09-02 2007-03-07 Ecole Polytechnique Fédérale de Lausanne Method to generate multi-channel audio signals from stereo signals
JP4670682B2 (ja) * 2006-02-28 2011-04-13 日本ビクター株式会社 オーディオ装置及び指向音生成方法
ATE505912T1 (de) * 2006-03-28 2011-04-15 Fraunhofer Ges Forschung Verbessertes verfahren zur signalformung bei der mehrkanal-audiorekonstruktion
US20080004729A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Direct encoding into a directional audio coding format

Also Published As

Publication number Publication date
BRPI0913460B1 (pt) 2024-03-05
CN102209988A (zh) 2011-10-05
KR20130031923A (ko) 2013-03-29
BRPI0913460A2 (pt) 2023-03-28
KR20110063826A (ko) 2011-06-14
KR101392546B1 (ko) 2014-05-08
AU2009291259A1 (en) 2010-03-18
CN102209988B (zh) 2014-01-08
KR101296757B1 (ko) 2013-08-14
CA2736709A1 (en) 2010-03-18
JP5520300B2 (ja) 2014-06-11
EP2347410B1 (en) 2018-04-11
WO2010028784A1 (en) 2010-03-18
RU2011113850A (ru) 2012-10-20
JP2012502570A (ja) 2012-01-26
CA2736709C (en) 2016-11-01
RU2493617C2 (ru) 2013-09-20
EP2347410A1 (en) 2011-07-27
AU2009291259B2 (en) 2013-10-31

Similar Documents

Publication Publication Date Title
CA2736709C (en) Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
US9183839B2 (en) Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
CA2790956C (en) Apparatus for generating an enhanced downmix signal, method for generating an enhanced downmix signal and computer program
US8265284B2 (en) Method and apparatus for generating a binaural audio signal
JP5133401B2 (ja) 出力信号の合成装置及び合成方法
US9093063B2 (en) Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
JP2009503615A (ja) 聴覚事象の関数としての空間的オーディオコーディングパラメータの制御
JP2016525716A (ja) 適応位相アライメントを用いたマルチチャネルダウンミックスにおけるコムフィルタアーチファクトの抑制
Jansson Stereo coding for the ITU-T G. 719 codec
WO2022074202A2 (en) Apparatus, method, or computer program for processing an encoded audio scene using a parameter smoothing
AU2021358432A1 (en) Apparatus, method, or computer program for processing an encoded audio scene using a parameter conversion
AU2021357840A1 (en) Apparatus, method, or computer program for processing an encoded audio scene using a bandwidth extension

Legal Events

Date Code Title Description
FG Grant or registration