MXPA05004091A - Captura y reproduccion de sonido dinamico biauricular. - Google Patents

Captura y reproduccion de sonido dinamico biauricular.

Info

Publication number
MXPA05004091A
MXPA05004091A MXPA05004091A MXPA05004091A MXPA05004091A MX PA05004091 A MXPA05004091 A MX PA05004091A MX PA05004091 A MXPA05004091 A MX PA05004091A MX PA05004091 A MXPA05004091 A MX PA05004091A MX PA05004091 A MXPA05004091 A MX PA05004091A
Authority
MX
Mexico
Prior art keywords
listener
microphones
microphone
output
head
Prior art date
Application number
MXPA05004091A
Other languages
English (en)
Inventor
Thompson Dennis
Original Assignee
Univ California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ California filed Critical Univ California
Publication of MXPA05004091A publication Critical patent/MXPA05004091A/es

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S1/005For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S3/004For headphones

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Stereophonic System (AREA)
  • Stereophonic Arrangements (AREA)

Abstract

Se describe un nuevo enfoque o procedimiento para la captura y reproduccion de sonido en vivo o grabado en tres dimensiones. Llamado MTB, debido a sus siglas en ingles, "Biauricular Seguido por el Movimiento", el metodo emplea varios microfonos (14), un seguidor de cabeza (18) y procedimientos especiales de procesamiento de senal para mezclar las senales capturadas por los microfonos (14). El MTB alcanza un alto grado de realismo mediante la colocacion efectiva de los oidos del escucha en el espacio donde los sonidos estan sucediendo, a traves del movimiento de los oidos virtuales en sincronia con los movimientos de la cabeza del escucha. El MTB tambien proporciona un formato universal para la grabacion de sonido espacial.

Description

CAPTURA Y REPRODUCCION DE SONIDO DINAMICO BIAURICULAR Campo de la Invención Esta invención se refiere, de manera general, a la captura y reproducción de sonido espacial, y de manera más particular, a métodos y sistemas para la captura y reproducción de las características dinámicas del sonido espacial en tres dimensiones.
Antecedentes de la Invención Existe un número de enfoques o procedimientos alternativos para la captura y reproducción del sonido espacial, y el procedimiento particular utilizado por lo regular está en función si las fuentes de sonido son naturales o generadas por computadora. Una vista general excelente de la tecnología de sonido espacial para la grabación y reproducción de sonidos naturales puede ser encontrada en F. Rumsay, Spatial Audio (Focal Press, Oxford, 2001) , y una vista general comparable de métodos basados por computadora para la generación y la "entrega" en tiempo real de fuentes virtuales de sonido, pueden ser encontradas en D. B. Begault, 3-D Sound for Virtual Reality and Multimedia (AP Professional , Boston, 1994) . El siguiente es un resumen de algunos de los enfoques o procedimientos mejor conocidos. REF.163410 El sonido envolvente o sonido ' surround' (por ejemplo, el sonido estéreo, cuadrafónico , Dolby® 5.1, etc.) es por mucho el procedimiento más popular para la grabación y reproducción de sonido espacial. Este procedimiento es conceptualmente simple; a saber, se coloca un altavoz en cualquier lugar que la persona desee que se origine el sonido, y el sonido se originará en esta posición. Sin embargo, en la práctica esto no es tan simple. Es difícil realizar sonidos que parecen provenir de posiciones entre los altavoces, en particular, a lo largo de los costados. Si el mismo sonido se originará a partir de más de un altavoz, el efecto precedente originaría el sonido que da la sensación de provenir del altavoz más cercano, lo cual es particularmente desafortunado para la gente que se encuentra sentada junto a un altavoz. Los mejores resultados restringen al escucha a permanecer junto a un "lugar sin ruido" casi pequeño. Asimismo, la necesidad de múltiples altavoces de alta calidad es inconveniente y costosa y para uso en el hogar, mucha gente encuentra que el empleo de más de dos altavoces es inaceptable . Existen modos alternativos para darse cuenta que el sonido envolvente disminuye sus limitaciones. Por ejemplo, los sistemas de teatro en casa ( "home theater" ) normalmente proporcionan una mezcla de dos canales que incluye efectos psico-acústicos para expandir la etapa de sonido más allá del espacio entre los dos altavoces. También es posible evitar la necesidad que múltiples altavoces transformen las señales del altavoz en señales de auriculares, la cual es la técnica empleada en los auriculares así llamados Dolby'5¦. No obstante, cada una de estas alternativas también posee sus propias 1 imitac iones . Los sistemas de sonido envolvente o ' surround' son buenos para la reproducción de sonidos que provienen de una distancia, aunque por lo regular no son generalmente capaces de producir el efecto de una fuente que se encuentra muy cerca, tal como alguien que cuchichea o susurra una cosa a otra persona en el oído. Finalmente, la elaboración de una grabación efectiva de sonido envolvente es un trabajo para un ingeniero' profesional de sonido; el procedimiento es inadecuado para la teleconferencia o para un novato. Otro procedimiento es Ambiso ies'' ~' . Mientras que no es ampliamente utilizado el procedimiento Ambisonics para el sonido envolvente resuelve mucho del problema de la elaboración de las grabaciones (M. A. Gerzon, "Ambisonics in multichannel broadeasing and video", Preprint 2034, 74th Convent ion of the Audio Engineering Soc ety (New York, 8-12 de Octubre, 1383) ; publicada, en forma subsiguiente en J. Aud. Eng. S c. , Vol . 33, N . li; pp . 859-371 (Octubre de 1585)) . Se ha descrito, en forma abstracta, como un método para la aproximación le un campo incidental de sonido por medio de sus armónicas esféricas de bajo orden (J. S. Bamford and J. Vanderkooy, "Ambisonics sound for us" , Preprint 4138, 99th Convention of the Audio Engineermg Society (New York, 6-9 de Octubre, 1995)) . Las grabaciones Ambisonics utilizan una serie o conjunto especial de micrófonos compactes denominado un micrófono Sound FieldM para la detección de la presión local además de las diferencias de presión en tres direcciones ortogonales. El procedimiento básico Ambisonics ha sido extendido para permitir la grabación a partir de más de tres direcciones, proporcionando una mejor resolución angular con un correspondiente aumento en la complejidad. Del mismo modo que con otros métodos de sonido envolvente, Ambisonics utiliza métodos de transmisión con matrices o combinación con matrices para excitar una serie de altavoces, y por lo tanto, tiene todas las otras ventajas y desventajas de los sistemas de múltiples altavoces. Además, todos los altavoces son utilizados para la reproducción del componente local de presión. Como consecuencia, cuando el escucha se encuentra situado en el lugar sin ruido, éste componente tiende a ser escuchado como si éste estuviera en el interior de la cabeza del escucha, y el movimiento de la cabeza introduce artefactos de distracción de timbre (W. G. Gardner, 3-D Audio Using Loudspeakers (Kluwer Academic Publishers, Boston, 199S) , p. 18) . La síntesis de campo ondulatorio es otro procedimiento , aunque no es un procedimiento muy práctico . En teoría, con una cantidad suficiente de micrófonos y de altavoces, es posible utilizar sonidos capturados por los micrófonos en una superficie envolvente a fin de reproducir los campos de presión de sonido que están presentes a través del interior del espacio en donde se realizó la grabación (M. M. Boone , "Acoustic rendering with wave field synthesis", Proc. ACM SIGGRAPH and Eurographics Campfiré : Acoustic Rendering for Virtual Environments , Snowfoird, UT, 26-29 de Mayo de 2001) ) . Aunque los requerimientos teóricos son diversos (es decir, cientos de miles de altavoces) , los sistemas que utilizan conjuntos de más de 100 altavoces han sido construidos y se dice que son efectivos . No obstante, este enfoque o procedimiento se observa con claridad que no es de costo efectivo. La captura biauricular o estereofónica es todavía otro procedimiento. Es bien conocido que no es necesario tener cientos de canales para capturar el sonido en tres dimensiones; de hecho, son suficientes dos canales. Las grabaciones biauriculares o de "cabeza de modelo" , las cuales son la analogía acústica de la repx~oducción estereoscópica de imágenes de 3-D, han sido utilizadas durante mucho tiempo a fin de capturar el sonido espacial (J. Sunier, "Binaural overview: Ears here the mikes are. Part I", Audio, Vol . 73, No. 11, pp . 75-84 (Kov. 1989) ; J. Sunier, "Binaural overview: Ears here the mikes are. Pare II", Audio, Vol . 73, No. 12, pp. 49-57 (Dic. 1989) ; K. Genuit, K. . Gierlich and U. Künzli, "Improved possibilities of binaural recording and piayback techniques" , Preprint 3332, 92nd Convention Audio Engineering Society (Vienna, Mar. 1992)) . La idea básica es simple. La fuente primaria de información utilizada por el cerebro humano para percibir las características espaciales del sonido proviene de las ondas de presión que alcanzan los tímpanos de les oídos izquierdo y derecho. Si estas ondas de presión pudieran ser reproducidas, el escucha debería oír el sonido con exactitud como si el escucha estuviera presente cuando fuera producido el sonido original. Las ondas de presión que alcanzan los tímpanos están influenciadas por diversos factores, que incluyen (a) la fuente de sonido, (b) el medio ambiente de escucha, y (c) la reflexión, difracción y dispersión de las ondas incidentes por el propio cuerpo del escucha. Si un maniquí que tiene exactamente el mismo tamaño, forma y propiedades acústicas que el escucha estuviera equipado con micrófonos situados en los canales del oído en donde se sitúan los tímpanos humanos, las señales, que alcanzan ios tímpanos, pueden ser transmitidas o grabadas. Cuando las señales son escuchadas a través de auriculares (con una compensac ión adecuada para corregir la función de transferencia del transductor eiectroacústico o excitador de auricular a ios ímpanos) , las formas de onda de presión de sonido son reproducidas, y el escucha oye los sonidos con coda las propiedades espaciales correctas, como si el escucha estuviera en realidad presente en la posición y orientación del maniquí. El problema principal es corregir la resonancia de canal por oído. Debido a que el excitador del auricular se encuentra en el exterior del canal del oído, la resonancia del canal por oído aparece dos veces; una vez durante la grabación y una vez en la reproducción. Esto ha conducido a la recomendación de utilizar las grabaciones así llamadas de "meato bloqueado", en las cuales ios canales del oído son bloqueados y los micrófonos son nivelados con la entrada bloqueada (H. Moller, "Fundamentáis of binaural technology" , Applied Acoustics, Voi. 36, No. 5, pp. 171-218 (1992) . Con la captura biauricular, y en particular, en aplicaciones de telefonía, la reverberación de una habitación suena natural. Es una experiencia universal con los teléfonos de altavoz que el medio ambiente suena excesivamente hueco y reverberante, en particular, si la persona que habla no está cerca del micrófono. Cuando se escucha con un dispositivo de captura biauricular, la conciencia de esta reverberación de distracción desaparece, y el medio ambiente suena natural y claro. Todavía, existen problemas asociados con la captura y reproducción de sonido biauricular. Los problemas más obvios en realidad no siempre son los tr.ás importantes. Estos incluyen (a) el desajuste inevitable entre el tamaño, la forma y las propiedades acústicas de un maniquí y cualquier escucha particular, incluyendo los efectos del pelo y la ropa, (b) las diferencias entre el tímpano y un micrófono como un elemento de detección de presión, y (c) la influencia de los factores no acústicos tales como las señales visuales o táctiles sobre la posición percibida de las fuentes de sonido. En el maniquí de KEMAR>,K , por ejemplo, se entregó un esfuerzo considerable en la utilización del así llamado "acoplador de Z/isiocki" para estimular los efectos de la impedancia del tímpano (M. D. Burkhard and R. M. Sachs, "Anthrcpometric mar.ikin íor auditory research" , J. Acoust. Soc. Am. , Vol . 58, pp. 214-222 (1975) . KEMAR es manufacturado por la empresa Knowies Electronics, 1151 aplewood, Drive, Itasca, Illinois, ¡50143) ¦ Sin embargo, será apreciado que los micrófonos prácticamente no podrían ser equi alentes a los tímpanos como transductores. Una limitación mucho más importante es la carencia de señales o indicaciones dinámicas que se generan a partir del movimiento de la cabeza del escucha. Se supone que una fuente de sonido es situada a la izquierda del maniquí. El escucha también oirá el sonido que proviene del lado izquierdo del escucha . Sin embargo, se supone que el escucha voltea la cara hacia la fuente mientras aue el sonido está activo. Debido a que la grabación no cieñe conocimiento del movimiento del escucha; -el sonido continuará pareciendo que proviene del lado izquierdo del escucha. A partir de la perspectiva del escucha, esto es como si la fuente de sonido fuera movida alrededor en el espacio para permanecer sobre el lado izquierdo. Si existieran muchas fuentes de sonido activas, cuando el escucha se moviera, la experiencia es que la totalidad , del mundo acústico se desplazaría en una sincronía exacta con el escucha. Para tener un sentido de "presencia virtual" es decir, de estar presente en realidad en el medio ambiente en donde se realizó la grabación, las fuentes fijas de sonido deben permanecer fij as cuando se mueve el escucha. Para decirlo de otro modo, las posiciones espaciales de las fuentes virtuales auditivas deben- ser estables e independientes de los movimientos del escucha. Existe una razón para creer que los efectos del movimiento del escucha son ios responsables de otro defecto de las grabaciones biauriculares . Es una experiencia universal cuando se escuchan grabaciones biauriculares que suenan a la izquierda o a la derecha que parecen estar a una distancia natural, aunque los sonidos que están directamente hacia adelante parecen estar mucho más cerca. De hecho, algunos escuchas experimentan la fuente de sonido co o si estuviera en el interior de sus cabezas, o incluso en la espalda. Varias razones han sido formuladas para esta pérdida de "externalización frontal". Un argumento es que esperamos ver las fuentes de sonido que están directamente adelante de nosotros, y cuando la indicación visual de confirmación está ausente, tendemos a proyectar la posición de la fuente de sonido detrás de nosotros. En su lugar, en situaciones de la vida real, es frecuentemente difícil decir si una fuente de sonido se encuentra en la parte frontal o posterior de nosotros, lo cual es la causa por la cual volteamos para buscar alrededor cuando no estamos seguros. Sin embargo, no es necesario voltear por completo alrededor para determinar la ambigüedad frontal/posterior. Se supone que una fuente de sonido está situada en cualquier lugar en el plano medio vertical. Debido a que nuestros cuerpos se encuentran básicamente simétricos alrededor de este plano, los sonidos que alcanzan los dos oídos serán esencialmente los mismos. Aunque se supone que volteamos nuestras cabezas una pequeña cantidad hacia la izquierda. Si la fuente en realidad estuviera en la parte frontal, el sonido ahora alcanzaría el oído derecho antes de llegar al oído izquierdo, mientras que si la fuente de sonido estuviera en la parte posterior, lo opuesto sería el caso. Este cambio en la diferencia interauricular de tiempo es a menudo suficiente para determinar la ambigüedad frontal/posterior. Aunque es notorio que sucede con una grabación estándar biauricular. Cuando la fuente se encuentra directamente adelante, recibimos la misma señal, tanto en el oído izquierdo como en el oído derecho. Debido a que la grabación no tiene conocimiento del movimiento del escucha, las dos señales continúan siendo las mismas cuando movemos nuestras cabezas. Ahora, si uno se preguntara asimismo en donde podría estar posiblemente la fuente de sonido sí los sonidos en los dos oídos permanecieran idénticos sin considerar el movimiento de la cabeza, la respuesta sería "en el interior de su cabeza" . Las señales o indicaciones dinámicas son muy poderosas. Las grabaciones estándares biauriculares no toman en cuenta estas señales dinámicas, lo cual es una razón principal para el "colapso frontal". Un modo para arreglar estos problemas es utilizar un servomecanismo que hace girar la cabeza patrón o modelo cuando gira la cabeza del escucha. En su lugar, este sistema fue implementadc por Horbach et al. (U. Horbach, A. Karamustaf oglu, . Peliegrini, P. Mackensen and G. Theile, "Desing and Applications of a data-based aural i zat ion system for surround sound" , Preprmt 4975, i06th Convention of the Audio Engineering Society (Munich, Alemania, Mayo 8-11, 1999) . Se reportó' que su sistema produjo un sonido extremadamente natural y que eliminó, de manera virtual, las confusiones frontal /posterio . Aunque su sistema fue muy efectivo, este es claramente limitado de uso para un solo escucha a la vez, y no puede ser utilizado en absoluto Dará la grabación. También existen muchos sistemas de Espacio-Auditivo-Virtual (sistemas VAS, por sus siglas en inglés) que utilizan métodos de rastreo o seguimiento de la cabeza para conseguir las siguientes ventajas para entregar los sonidos generados por computadora: (i) establecer posiciones para las fuentes virtuales auditivas, independientes del movimiento de la cabeza del escucha; (ii) una buena externalización frontal; y (iii) poca o ninguna confusión frontal/posterior. Sin embargo, los sistemas VAS requieren: (i) señales aisladas para cada fuente de sonido; (ii) el conocimiento de la posición de cada fuente de sonido; (iii) tantos canales como fuentes existentes de sonido; (iv) funciones de transferencia relacionadas con la cabeza (HRTFs) con el fin de espacializar cada fuente por separado; y (v) adicionar el procesamiento de señal para aproximar los efectos de los ecos y la reverberación de la habitación. Es posible aplicar las técnicas VAS para las grabaciones que se pretenden escuchar a través de altavoces, tales como grabaciones estéreo o de sonido envolvente. En este caso, las fuentes de sonido (los altavoces) son aislados, y su número y posiciones son conocidos. Las grabaciones proporcionan los canales separados y las fuentes de sonido son altavoces simulados que se encuentran situados en un cuarto o habitación simulada. El sistema VAS da origen a estas señales de sonido justo como lo harían las señales generadas por computadora. ?? su lugar, existen productes comerciales (tales como los auriculares MDR-DS8000 de Sony) que emplean el seguimiento de la cabeza para las grabaciones de sonido envolvente justo de este modo. No obstante, lo mejor que estos sistemas pueden "nacer es recrear a través de los auriculares, la experiencia de escucha en los altavoces. Estos no pueden ser aplicados con facilidad a las grabaciones en vivo, y son totalmente inadecuados para la teleconferencia. Estos sistemas heredan todos los muchos problemas de los sistemas de sonido envolvente y Ambisonics , además, ahora la necesidad de múltiples altavoces. También existen muchos métodos para la grabación y reproducción del sonido espacial en vivo mediante la utilización de más de dos micrófonos. No obstante, sabemos solo de un sistema que captura el sonido en vivo que es diseñado para la reproducción de auriculares y que responde los movimientos dinámicos del escucha. Este sistema, al cual nos referimos como el sistema McGrath, es descrito en la Patente de los Estados Unidos No. 5, 021,206 y en la Patente de los Estados Unidos No. 6 , 259,795. La diferencia principal entre estas patentes es que la primera se refiere a un escucha único, ientras que la segunda patente se refiere a múltiples escuchas. Ambas de estas patentes se refieren al grado espacial biauricular de las grabaciones elaboradas con el micrófono SoundField (?. Rumsey, Spatial Audio (Focal Press, Oxford, 2001) , pp 204-205) . El sistema McGrath tiene las siguientes características (i) cuando el sonido es grabado, es desconocida la orientación de la cabeza del escucha; (ii) la posición de la cabeza del escucha es medida con el seguidor de la cabeza; (iii) un procedimiento de procesamiento de señal es utilizado para convertir la grabación de múltiples canales a una grabación biauricular ; y íiv) el objetivo principal es producir fuentes virtuales cuyas posiciones no cambien cuando el escucha mueva su cabeza. Se observa que la grabación Ambisonic como es utilizada en el sistema McGrath intenta capturar el campo de sonido que sei~ía desarrollado en la posició'n del escucha cuando el escucha está ausent ; ésta grabación no captura el campo de sonido en la posición del escucha cuando el escucha está presente. Tampoco la grabación Ambisonic captura directamente las diferencias mter-au iculares de tiempo, las diferencias ínter-auriculares de nivel y los cambios espectrales introducidos por la función de transferencia relacionada con la cabera (HRTF) para una cabeza esférica. Por lo tanto, el sistema McGrath debe utilizar las señales grabadas para reconstruir las ondas de entrada que provienen de múltiples direcciones y debe utilizar HRTFs para espaciaiizar cada onda de entrada por separado. Aunque el sistema McGrath puede emplear un HTRF individualizado, el sistema es complejo y la reconstrucción todavía sufre de todas las limitaciones asociadas con Ambiosonics .
Sumario de la Invención La presente invención supera muchas de las limitaciones precedentes y resuelve los tres problemas más serios de las grabaciones estáticas biauriculares : (a) la sensitividad de las posiciones de las fuentes virtuales auditivas al giro de la cabeza; (b) la debilidad de la external ización del plano medio; y (c) la presencia de una seria confusión frontal/posterior. Además, la invención puede ser aplicada para un escucha o para muchos escuchas que oyen al mismo tiempo y para la escucha y la grabación remota. Finalmente, la invención proporciona un "formato universal" para la grabación de sonido espacial en el siguiente sentido. Los sonidos generados por cualquier tecnología de sonido espacial (por ejemplo, el sonido estéreo, cuadrafónico, Dolby 6.1, Ambisonics, síntesis de campo ondulatorio, etc.) pueden ser transformados en el formato de la presente invención y de manera subsiguiente, pueden ser leídos para reproducir los mismos efectos espaciales que la técnica original podría proporcionar. Por lo tanto, la herencia o legado sustancial de las grabaciones existentes puede ser preservada con poca o ninguna pérdida de calidad.
En términos generales, la presente invención captura las características dinámicas de tres dimensiones del sonido espacial. Referido en este documento como "Biauri cular Í Seguido por el Movimiento" y abreviado como "MT3" , la invención puede ser utilizada, ya sea para la escucha remota (per ejemplo, la telefonía) o para la grabación y reproducción. En efecto, el TB permite que uno o más escuchas coloquen sus oídos en el espacio en donde el sonido está sucediendo (para la escucha distante) o estuvo sucediendo (para la grabación) . Además, la invención permite que cada escucha voltee su cabeza, de manera independiente, mientras que está oyendo, de modo que los distintos escuchas puedan tener sus cabezas orientadas en diferentes direcciones. Ai hacerlo de este modo, la invención toma en cuenta, en forma correcta y eficiente, los efectos precept uaimenee muy importantes del movimiento de la cabeza. El MTB consigue un alto grado de realismo mediante la colocación, de manera efectiva, de los oídos del escucha en el espacio en donde I03 sonidos están (o estuvieron) sucediendo, y el movimiento de los oídos virtuales en sincronía con los metimientos ce la cabeza del escucha. Para conseguir esto, la invención utiliza múltiples micrófonos situados sobre una superficie cuyo tamaño es aproximadamente el tamaño de una cabeza humana. Por motivos de simplicidad, alguien puede asumir que la superficie sobre la cual son montados los micrófonos es una esfera. No obstante, la invención no es limitada de este modo y puede ser implementada en varias otras maneras. Los micrófonos pueden cubrir la superficie de manera uniforme o no uniforme. Además, el número de micrófonos requeridos es pequeño. La serie o conjunto de micrófonos es normalmente colocada en una posición en el espacio de escucha en donde, presumiblemente, le gustaría estar al escucha. Por ejemplo, para una teleconferencia, el escucha podría estar colocado en el centro de la mesa de conferencias . Para la grabación orquestal, el escucha podría estar colocado en el mejor asiente en la sala de conciertos. Para un aparato de reproducción de teatro en casa, el escucha podría estar colocado en el mejor asiento en un cine del estado de la técnica . Los sonidos capturados por los micrófonos son tratados de manera distinta para la escucha remota que para la grabación. En una aplicación de escucha remota o distante, las señales del micrófono son di ectamente enviadas hacia el escucha, mientras que en una aplicación de grabación, las señales son almacenadas en una grabaciem de múltiples pistas. Cada escucha es equipado con un seguidor de recorrido de la cabeza con la finalidad de medir en forma dinámica la orientación de su cabeza. El origen de las coordenadas para la cabeza del escucha siempre se supone que será coincidente con el origen de las coordenadas para el cor.junto de micrófonos. Por lo tanto, no imperta cuanto se mueva el escucha, el sistema de reproducción de sonido siempre conocerá en donde se encuentran situados los oídos del escucha con relación a los micrófonos. En una modalidad de la invención, el sistema busca los dos micrófonos cue están más cerca a los oídos del usuario y enruta las señales adecuadamente amplificadas desde aquellos dos micrófonos hacia un par de auriculares que se encuentran en la cabeza del escucha. Del mismo modo que con la captura de sonido, existen muchos modos posibles para la itnplementación del aparato de reproducción . En particular, debe observarse que aunque sedo se describe la escucha de auriculares, también es posible emplear las técnicas así llamadas de "cancelación por cruce o interferencia de canales" para utilizar altavoces en lugar de auriculares (G. Gardner, 3-D Audio Using Loudspeakars (Kluwer Academic Publishers, Boston, 1998), la cual se incorpora en este documento como referencia) . En una modalidad preferida, un procedimiento más elaborado de procesamiento de señal basado en la forma psico-acústica es utilizado para permitir una interpolación continua de señales de micrófono, con lo cual se elimina cualquiera de los "ruidos ligeros o clics" u otros artefactos que suceden a medida que el escucha mueve su cabeza, incluso con un número pequeño de micrófonos. De acuerdo con un aspecto de la invención, el seguidor de recorrido de la cabeza es utilizado con el fin de modificar el procesamiento de la señal para compensar la rotación del escucha de su cabeza. Con motivos de simplificación, se supone que el escucha voltea su cabeza a través de un ángulo T en el plano horizontal, y se considera que la señal es enviada a un oído específico de los dos oídos del escucha. En una modalidad, la unidad de procesamiento de señal utiliza el ángulo T para cambiar entre los micrófonos, siempre empleando el micrófono que está más cerca a la posición del oído del escucha. Bn otra modalidad, la unidad de procesamiento de señal utiliza el ángulo 0 para interpolar o "intercalar" entre la señal que proviene del micrófono más cercano y el siguiente micrófono más cercano. Todavía en otra modalidad, la unidad de procesamiento de señal utiliza procedimientos de filtrado lineal que cambian con el ángulo 0 para combinar las señales del micrófono más cercano y el siguiente mi eró' fono más cercano. En esta tercera modalidad, es obtenida una señal complementaria, cuyo uso es descrito más adelante, ya sea a partir de un micrófono físico o a partir de un micrófono virtual que combina las salidas de los micrófonos físicos. En una modalidad, la señal complementaria es obtenida a partir de un micrófono adicional, distinto de aquellos en la' serie o conjunto de micrófonos, aunque situado en el mismo campo de sonido. En otra modalidad, la señal complementaria es obtenida a partir de un micrófono oarticuiar del conjunto de micrófonos. En otra modalidad, la señal complementaria es obtenida mediante el cambio dinámico entre el conjunto de micrófonos. En otra modalidad, la señal complementaria es obtenida mediante la interpolación espectral de las salidas del conjunto de micrófonos cambiados en forma dinámica. Todavía en otra modalidad, son obtenidas dos señales complementarias, una para el oído izquierdo y otra para el oído derecho, utilizando cualquiera de los métodos descritos con anterioridad para una señal única complementaría. De acuerdo con un aspecto de la invención, un aparato de reproducción de sonido comprende una unidad de procesamiento de señal que tiene una salida que se conecta con un disposi ivo de salida de audio y una entrada que se conecta con un dispositivo de rastreo o seguimiento de la cabeza, el cual es configurado para proporcionar una señal que representa el movimiento de la cabeza del escucha. La unidad de procesamiento de señal es configurada a fin de recibir las señales representa ivas de la salida de una pluralidad de micrófonos situados para muestrear un campo de sonido en los puntos que representan las posibles posiciones de los oídos del escucha si la cabeza de los escuchas estuvieran situadas en el campo de sonido y en la posición de los micrófonos. La unidad de procesamiento de serial además es configurada para seleccionar entre las señales de salida del micrófono y para presentar una o más señales seleccionadas al dispositivo de salida de audio en respuesta al movimiento de la cabeza del escucha como se indica a través del disposicivo de seguimiento de la cabeza. El dispositivo de salida de audio y el dispositivo de seguimiento de la cabeza pueden ser conectados, de manera opcional, directamente con la unidad de procesamiento de señal o pueden ser inalámbricos . De acuerdo con otro aspecto de la invención, la unidad de procesamiento de señal es configurada para combinar, en respuesta a la rotación de la cabeza del escucha como se indica a través del dispositivo de seguimiento de la cabeza, las señales representativas de la salida de un micrófono más cercano y un siguiente micrófono más cercano en la pluralidad de micrófonos con relación a la posición de los oídos del escucha en el campo de sonido si la cabeza del escucha estuviera situada en el campo de sonido y para presentar la salida combinada al dispositivo de salida de audio . De acuerdo con otro aspecto de la invención, la unidad de procesamiento de señal incluye un filtro contra el paso de bajas frecuencias o de paso bajo asociado con cada una de las señales de salida del micrófono y un medio, tal como un sumador, que combina las salidas de los filtros de paso bajo a fin de producir una señal combinada de salida para el oído izquierdo del escucha y una salida combinada de salida para el oído derecho del escucha, en donde cada señal combinada de salida comprende una combinación de señales que son representativas de la salida del micrófono más cercano y el siguiente micrófono más cercano con relación a la posición del oído del escucha en el campo de sonido si la cabeza del escucha estuviera situada en el campo de sonido. De acuerdo con otro aspecto.' de la invención, la unidad de procesamiento de señal incluye un filtro de paso alto que es configurado a fin de proporcionar una salida que proviene de un micrófono complementario real o virtual que se encuentra situado en el campo de sonido, y un medio tal como un sumador que mezcla las señales de salida que provienen del filtro de paso alto con las señales combinadas de salida para el oído derecho del escucha y con las señales combinadas de salida para, el oído izquierdo del escucha. En -ana modalidad, la misma señal de alta frecuencia es utilizada para ambos oídos. En otra modalidad, un filtro de paso alto de oído derecho es configurado a fin de proporcionar una salida que proviene de un micrófono complementario real o virtual de oído derecho que se encuentra situado en el campo de sonido y un filtro de paso alto de oído izquierdo que es configurado a fin de proporcionar una salida que proviene del micrófono complementario real o virtual de oído izquierdo que se encuentra situado en el campe de sonido . En esta última modalidad, las señales de salida del filtre de paso alto del oído derecho son mezcladas con las salidas combinadas de salida para el oído derecho del escucha, y las señales de salida del filtro de paso aleo del oído izquierdo sor. mezcladas con las señales combinadas de salida para el oído izquierdo del escucha. De acuerdo con otro aspecto de la invención, un aparato de captura y reproducción de sonido dinámico biauricular comprende una pluralidad de micrófonos situados para muescrear un campo de sonido en los puntos que representan las posibles posiciones de los oídos de un escucha si la cabeza del escucha estuviera situada en el campe de sonido. La unidad de procesamiento de señal puede recibir las señales del micrófono directamente de los micrófonos, por medio de las señales transmitidas a través de un enlace de comunicaciones, o mediante la lectura y/o reproducción de los medios en los cuales son grabadas las señales del micrófono. Un objetivo de la presente invención es proporcionar la reproducción de sonido con un sentido de realismo que excede en gran medida la tecnología actual; es decir, un sentido real que indica que "esc s aquí". Otro objetivo de la invención es conseguir esto con una complejidad adicional rela ivamente modesta, tanto para la captura, almacenamiento o transmisión de sonido co o para la reproducción del mismo. Los obietivos v aspectos adicionales de la invención serán presentados en las siguientes porciones de la especificación, en donde la descripción detallada es con el propósito de describir por completo las modalidades preferidas de la invención sin colocar limitaciones en las mismas .
Breve Descripción de las Figuras La invención será entendida de manera más completa con referencia a las siguientes figuras, las cuales son solamente con propósitos ilustrativos: La Figura 1 es un diagrama esquemático de una modalidad de un sistema de captura y reproducción de sonido dinámico biauricular de acuerdo con la presente invención. La Figura 2 es un diagrama esquemático del sistema mostrado en la Figura 1 que ilustra el seguimiento de la cabeza . La Figura 3 es un diagrama esquemático de una modalidad del sistema mostrado en la Figura 2 configurado para una teleconferencia. La Figura 4 es un diagrama esquemático de una modalidad del sistema mostrado en la Figura 2 configurado para la grabación y reproducción. La Figura 5 es un diagrama que muestra una primera modalidad de un método de seguimiento de la cabeza de acuerdo con la presente invención.
La Figura 6 es un diagrama que muestra una segunda modalidad de un método de seguimiento de la cabeza de acuerdo con la presente invención. Las Figuras 7A-7B son diagramas que muestran una tercera modalidad de un método de seguimiento de la cabeza de acuerdo con la presente invención. Las Figuras 8A-8B son diagramas esquemáticos que ilustran el seguimiento de la cabeza de acuerdo con el método ilustrado en las Figuras 7A-7B. La Figura 9 es un diagrama de bloque que muestra una modalidad del procesamiento de señal asociado con el método de seguimiento de la cabeza que se ilustra en las Figuras 7A-7B y en las Figuras 8A-8B. La Figura 10 es un diagrama esquemático de una configuración enfocada de micrófono de acuerdo con la presente invención. La Figura 11 es un diagrama esquemático de una configuración de micrófono de búsqueda de dirección de acuerdo con la presente invención.
Descripción Detallada de la Invención Con referencia de manera más específica a las figuras, con propósitos ilustrativos, la presente invención es incluida en el aparato y método generalmente mostrado en las Figuras 1-11. Se observará a partir de las mismas, así como también de la descripción en este documento, que la modalidad preferida de la invención (1) utiliza más de dos micrófonos para la captura de sonido (aunque algunos efectos útiles pueden ser conseguidos sólo con dos micrófonos como será discutido posteriormente) ; (2) utiliza un dispositivo de rastreo o seguimiento de la cabeza para medir la orientación de la cabeza del escucha; y (3) utiliza técnicas de procesamiento de señal basadas en la psico-acúst ica a fin de combinar, de manera selectiva, las señales de salida de los micrófonos . Con referencia en primer lugar a las Figuras i y 2, se muestra una modalidad de un sistema de captura y reproducción de sonido dinámico bi auricular 10 de acuerdo con la presente invención. En la modalidad mostrada, el sistema comprende una serie o con unto de micrófonos de forma circular 12 que tiene una pluralidad de mi crófortos 14, una unidad de procesamiento de señal 16, un seguidor de cabeza 18 y un dispositivo de salida de audio tai como el auricular izquierdo 20 y el auricular derecho 22. El arreglo de micrófonos mostrado en estas figuras es denominado una configuración panorámica. Como será discutido' posteriormente, existen tres distintas clases de aplicaciones, las cuales llama os aplicaciones omnidireccionales , panorámicas y enfocadas. Sedo por medio de ejemplo, la invención es ilustrada en la siguiente discusión para una aplicación panorámica . En la modalidad mostrada, el conjunto de micrófonos 12 comprende ocho micrófonos 14 (numerados de 0 a 7) separados la misma distancia alrededor de un círculo cuyo radio a es aproximadamente el mismo que el radio b de la cabeza del escucha 24. Debe apreciarse que un objetivo de la invención es proporcionar al escucha la impresión que el/ella está (o estuvo) en realidad presente en la posición del conjunto de micrófonos. Con el fin de realizarlo de este modo, el círculo alrededor del cual son colocados los micrófonos debe ser aproximadamen del tamaño de la cabeza de un escucha . Ocho micrófonos son utilizados en la modalidad mostrada. A este respecto, se observa que la invención puede funcionar con tan pocos como dos micrófonos, así como también con un número más grande de micrófonos. No obstante, el uso sólo de dos micrófonos no produce una experiencia sensitiva tan real co o con ocho micrófonos, produciendo sus mejores efectos para fuentes de sonido que están cerca al eje interauricular o interauditivo . Y mientras que más micrófonos puedan ser utilizados, ocho es un número conveniente de micrófonos debido a que un equipo de grabación con ocho canales está disponible con facilidad. Las señales producidas por esos ocho micrófonos son combinadas en la unidad de procesamiento de señal 16 a fin de producir dos señales que sean dirigidas hacia los auriculares izquierdo 20 y derecho 22. Por ejemplo, con la cabeza del escucha en la orientación mostrada en la Figura 1, la señal que proviene del micrófono #6 sería enviada hacia el oído izquierdo, y la señal que proviene del micrófono #2 sería enviada hacia el oído derecho. Esto sería esencialmente equivalente a lo que es realizado con las grabaciones estándares biauriculares . Ahora se considera la situación que se ilustra en la Figura 2, en donde el escucha ha girado su cabeza a través de un ángulo 0. Este ángulo es detectado por el seguidor de recorrido de la cabeza 18 y poste iormente, es utilizado para modificar el procesamiento de señal. Los seguidores de recorrido de la cabeza se encuentran ccmerciaim.ente disponibles y ios detalles de ios mismos no serán descritos. Es suficiente observar que un seguidor de recorrido de la cabeza producirá una señal de salida que es representa iva del movimiento rotacional . Si el ángulo T fuera un múl iplo exacto de 45°, la unidad de procesamiento de señal 16 simplemente seleccionaría el par ce micrófonos que estuvieran en registro con los oídos del escucha. Por ejemplo, si el ángulo 0 fuera exactamente de 90°, la unidad de procesamiento de señal 16 dirigiría la señal que proviene del micrófono #0 hacia el oído izquierdo y la señal que proviene del micrófono #4 hacia el oído derecho. En otras palabras, la unidad de procesamiento de señal 16 seleccionaría los pares de micrófonos que tienen las posiciones correspondientes con una rotación en sentido contrario de las manecillas del reloj de 90° a través del conjunto de micrófonos con relación a la posición "recta de la cabeza" que se muestra en la Figura 1. Sin embargo, en general el ángulo T no es un múltiplo exacto de 45°, y la unidad de procesamiento de señal 16 debe combinar las salidas del micrófono a fin de proporcionar las señales para los auriculares, como será descrito más adelante . Será apreciado que el seguidor de recorrido de la cabeza de la persona proporciona las señales que representan los cambios en la orientación de la cabeza del escucha con relación a una orientación de referencia. La orientación es normalmente representada por tres ángulos de Euler ( inclinación , balanceo y oscilación) , aunque otras coordenadas angulares también pueden ser utilizadas. De preferencia, las mediciones son realizadas a una alta velocidad de maestreo, tal como cien veces por segundo, aunque también pueden ser utilizadas otras velocidades. La orientación de referencia, que define la orientacic»n "sin inclinación, sin balanceo, recta hacia adelante" normalmente será iniciada en el comienzo del proceso, aunque podría ser cambiada por el escucha en cualquier momento que lo desee. Con referencia a la Figura 1, se supone que el oído izquierdo del escucha se encuentra en la posición del micrófono #6 y que el oído derecho del escucha se encuentra en la posición del micrófono 2. Posteriormente, si el escucha se desplazar alrededor sin voltear, la posición del escucha íy las posiciones -xyz de los oídos del escucha) no tendrían efecto sobre la reproducción de sonido. Por otro lado, si el escucha volteara su cabeza, con lo cual cambia las posiciones de sus oídos con relación a sus posiciones iniciales en el sistema de coordenadas cuyo origen siempre se encuen ra en el centro de la cabeza del escucha y cuya orientación nunca cambia, la unidad de procesamiento de señal .16 compensaría este cambio de orientación como se ilustra en la Figura 2. En general, cuando el escucha se mueve alrededor, existe un componente de traslación y un componente de rotación del movimiento. Será apreciado que el sistema MTB ignora el componente de traslación. ?1 centro de la cabeza del escucha siempre se supone que es coincidente con el centro del conjunto de micrófonos KT3. Por lo tanto, no importa cuanto se mueva el escucha, las señales proporcionadas por el seguidor de cabeza 18 permiten que la unidad de procesamiento de señal 16 siempre conozca donde se encuentra la "posición" de los oídos del escucha con relación a los micrófonos. Mientras que el término "posición" a menudo es entendido que significa la posición absoluta de un punto en el espacio (por ejemplo, sus coordenadas -xyz en algún cuadro definido de referencia) , es importante observar que el sistema MTB de la presente invención no necesita conocer las posiciones absolutas de los oídos del escucha, sólo sus posiciones relativas. Antes de describir como la unidad de procesamiento de señal 16 combina las señales de micrófono tomando en cuenta la rotación de la cabeza, debe observarse que las Figuras 1 y 2 representan las salidas del micrófono que alimentan directamente la unidad de procesamiento de señal 16. Sin embargo, ésta conexión directa sólo es mostrada con propósitos ilustrativos, y no necesita reflejar la configuración actual utilizada. Por ejemplo, la Figura 3 ilustra una configuración de una teleconferencia . En la modalidad mostrada, las salidas de micrófono alimentan una unidad de muItiplexión/transmisión 26, la cual transmite las señales hacia una unidad de desmuí tiplexión/recepción remotamente situada 28 a través de un enlace de comunicaciones 30. La conexión o enlace de comunicaciones podría ser un enlace inalámbrico, un enlace óptico, un enlace telefónico, o similares. Esto origina ue el escucha experimenta el sonido capturado de los mi eró' fonos como si el escucha estuviera en realidad situado en la. posición del micrófono. Por otro lado, la Figura 4 ilustra una configuración de grabación. En la modalidad mostrada, las salidas del micrófono alimentan una unidad de grabación 32, la cual guarda la grabación en un medio de alracenamiento 34, tal como un disco, una cinta, una tarjeta de memoria, un CD-ROM, o similares. Para la reproducción posterior, el medio de almacenamiento es accesado por una unidad de computación/reproducción 36 que alimenta la unidad de procesamiento de señal 16. Como puede observarse, la unidad de procesamiento de señal 16 requiere por lo tanto de una entrada de audio y la entrada puede ser de cualquier forma convencional tal como un enchufe, una entrada inalámbrica, una entrada óptica, una conexión alambrada y así sucesi amente. Lo mismo es cierto con respecto a la entrada para el seguidor de cabeza 13, así como también para la salida de audio. De esta manera, será apreciado que las conexiones entre la unidad de procesamiento de señal 16 y otros dispositivos, y que ios términos "entrada" y "salida" como se utilizan en ese documento, no son limitados a alguna forma particular. A continuación, cor: referencia a las Figuras 5-7, ahora se describen los distintos procedimientos para la combinación de las señales de micrófono de acuerdo con la presente invención. Por motivos de simplicidad, las descripciones sólo son proporcionadas para un oído, con el entendimiento que el mismo procedimiento será aplicado al otro oído, mutatis mutandis. Cada uno de estos procedimientos es útil en distintas circunstancias, y a su vez, cada une de los cuales es discutido. Uno de estos procedimientos 100 es mostrado en la Figura 5 y es referido en este documento como el Procedimiento 1. En este procedimiento, la unidad de procesamiento de señal 16 utilizaría el ángulo T para cambiar entre los micrófonos, siempre empleando el micrófono que está más cerca a la posición del oído del escucha. Este es el procedimiento más simple de implementar. No obstante, es insensible a los pequeños movimientos de la cabeza, lo cual degrada el desempeño o requiere un numero grande de micrófonos, con lo cual aumenta la complejidad. Además, el cambio tendría que ser combinado con un filtrado sofisticado para evitar los ruidos o clics audibles. Una posible "charla" que sucedería cuando la orientación de la cabeza se mueve hacia atrás y hacia adelante a través de un límite de cambio puede ser eliminada si se utiliza la técnica estándar de cambio de histéresis. Otro procedimiento 120 se muestra en la Figura 6 y es referido en este documento como el Procedimiento 2. En este procedimiento, la unidad de procesamiento de señal 16 utilizaría el ángulo tí para interpolar o "intercalar" entre la señal del micrófono más cercano y el siguiente micrófono más cercano. El Procedimiento 2, el cual es el movimiento intercalado entre los micrófonos, es sensible a los pequeños movimientos de la cabeza y es adecuado para algunas aplicaciones. Este procedimiento está basado esencialmente en el mismo principio que es explotado en las grabaciones intercaladas estéreo por amplitud para producir una fuente fantasma entre dos altavoces (B. J. Bauer, "Phasor analysis of some stereophonie phenomena" , J. Accuscic Soc . Am. , Voi . 33, No. 11, pp. 1536-1539 (Nov., 1961)) . Para expresar este principio en forma matemática, se permite que x(t) sea la señal en el tiempo t capturada por el micrófono más cercano, y se permite que x(t-T) sea la señal capturada por el siguiente micrófono más cercano, en donde T es el tiempo que toma para qué la onda de sonido se propague de un micrófono al otro. Por motivos de sir.pl i icacicn , se ignoraron cualquier tipo de cambios en la forma de onda debido a la difracción de la onda incidente conforme ésta viaja alrededor de la superficie de montan e. Estos cambios serían relativamente pequeños si los micrófonos estuvieran razonablemente cerca entre sí. Si x(c) no tuviera frecuencias por encima de alguna frecuencia f.Tax, si el tiempo de retraso G fuera menor aproximadamente que 1 / ( fr.a>_) , y si el coeficiente w estuviera entre 0 y 1, entonces, puede mostrarse que (l-w)x(t) + wx(t-T) * x(t-wT). Por lo tanto, al cambiar el coeficiente de intercalado w de acuerdo con el ángulo entre un rayo al oído y un rayo al micrófono más cercano, puede obtenerse una señal cuyo recraso de tiempo sea correspondiente entre los retrasos de tiempo de las señales de los dos micrófonos. Existen dos fuentes de error en el Procedimiento 2. El primero es el rompimiento' en la aproximación cuando T> 1/ ?f:ax) . El segundo es la coloración espectral que sucede en cualquier lugar que las salidas de los dos micrófonos sean linealmente combinadas o "mezcladas". Las limitaciones que se originan sobre las señales pueden ser expresadas en términos del número N de micrófonos en el conjunto. Se permite que a sea el radio del círculo, que c sea la velocidad del sonido y que d sea la distancia entre dos micrófonos adyacentes. Entonces, debido a que d = 2a sen (/T/'N) % 2~a./N y debido a que el valor máximo de G es d/c, éste sigue que la aproximación se rompe si la señal tuviera un contenido significante espectral por encima de f ax % Nc/ (8,7a) . (Se observa que la suposición que T = d/c corresponde con una situación del peor caso en el cual la fuente de sonido estuviera situada a lo largo de la línea que une los dos micrófonos . Si la dirección hacia la fuente de sonido fuera ortogonal a la línea entre los micrófonos, los frentes de onda llegarían al micrófono al mismo tiempo y no existiría error. Sin embargo, la situación del peor caso es un caso común que sucede por ejemplo, cuando una fuente se encuentra directarr.er.t e adelante y el escucha gira su cabeza a una posición en donde los oídos están a la mitad entre los micrófonos más cercanos. Se observa al pasar que la condición que T = d/c<l/ (4fmax) es equivalente a la condición en la que d sea menor que una longitud de onda de un cuarto. La teoría del muestreo sugiere que lo que estamos haciendo con los micrófonos es muescrear la forma de onda acústica en el espacio y que el rompimiento en la aproximación puede ser interpretado que es una consecuencia de solapamiento cuando el intervalo espacial de muestreo sea demasiado grande) . Utilizando los valores numéricos a = 0.0875 m, c = 343 m/s y N= 8 , obtenemos fmax ¾ 1.25 kHz. En otras palabras, con un conjunto de ocho micrófonos, el mezclado fallará en producir una señal adecuadamente retrasada si existiera un contenido espectral significante por encima de 1.25 kHz. Este límite puede ser elevado si se disminuye la distancia entre los micrófonos. Cuando las salidas de dos micrófonos sean linealmente combinadas, las diferencias en los tiempos de llegada también introducen un patrón de filtro de peine dentro del espectro que puede ser objetable. La muesca de frecuencia más baja del filtro de peine sucede en f0 = c/ (2d) . Una vez más, suponiendo que d - 2,ra/N, obtenemos f0 = Nc/(4xa) * 2fmax. Debido a que quisiéramos tener f0 que sea al menos de un octavo por encima de la frecuencia más alta de interés, observamos que ambas fuentes de error conducen esencialmente a la misma condición, es decir, el requerimiento de un contenido espectral no significante per encima de fmax * Nc/ (8tta) . La Tabla 1 muestra como varía esta frecuencia cor. N cuando a = 0.0875 m y c = 343 m/s. Si las señales no tuvieran una energía espectral significante por encima de fma:, el Procedimiento 2 generaría excelentes resultados. Si las señales tuvieran en una energía espectral significante por encima de fxax y si fmsx fuera lo suficientemente alto (por encima de 800 tíz) , el Procedimiento 2 aún podría ser aceptable. La razón es que la sensitividad humana a las diferencias interauriculares de tiempo declina a altas frecuencias. Este significa que el rompimiento en la aproximación deja de ser relevante. Es cierto que la coloración espectral se vuelve perceptible. Sin embargo, para aplicaciones tales como la vigilancia continua o la teleconferencia, en donde la reproducción de "alta fidelidad" podría no ser requerida, la simplicidad del Procedimiento 2 podría hacerla la elección preferida. Un tercer procedimiento y el procedimiento total preferido 140 se ilustra la Figura 7 y es referido en este documento como el Procedimiento 3. ?? este procedimiento, la unidad de procesamiento de señal 16 utiliza procedimientos de filtrado lineal que cambian con el ángulo T para combinar las señales del micrófono más cercano y el siguiente micrófono más cercano. El Procedimiento 3 combina las señales que utilizan el filtrado lineal motivado por la psico-acústica . Existen al menos dos modos para resolver los problemas provocados por el mués reo espacial. Uno es el aumento de la velocidad del muestreo espacial; es decir, el incremento del número de micrófonos. El otro es la aplicación de un filtro contra el solapamiento antes de combinar las señales del micrófono, y en cierto modo, antes de restaurar las altas frecuencias. El último procedimiento es la modalidad preferida del Procedimiento 3. El Procedimiento 3 toma la ventaja del hecho que los humanos no son sensibles a la diferencia interauricular de tiempo de alta frecuencia. Por sinusoides, la sensitividad interauricular de fase cae rápidamente para frecuencias por encima de SCO Hz, y es imperceptible por encima de 1.6 kHz (j. Blauert, Spatial Hearing (Edición Revisada) , p. 149 ( IT Press, Cambridge, A, 1996) , que se incorpora en este documento como referencia) . Con referencia a la Figura 7, así como también, a las Figuras S y 9, el siguiente es un ejemplo de las etapas de procesamiento asociadas con el Procedimiento 3 para una serie de -micrófonos , con N = 8 en esta modalidad: 1. En el bloque 142, se permite que x¡.:(t) sea la salida del micrófono' k'"n en el con] unto de micrófonos para k = 1, N. 2. En el bloque 144, se filtran las salidas de cada uno de los N micrófonos (por ejemplo, ocho micrófonos en esta modalidad) en el conjunto con filtros de paso bajo que tienen una atenuación progresiva sostenida por encima de la frecuencia de corte f- en el intervalo aproximadamente entre i. O y 1.5 kHz. Se permite que yk(t) sea la salida del filtro de paso bajo kZ' , k = 1, ...,N. 3. En el bloque 146 , se combinan las salidas de estos filtros como en el Procedimiento 2 a fin de producir la salida de paso bajo z[lP (t) . Por ejemplo, se considera la señal del oído derecho. Se permite que sea el ángulo entre el rayo 30 hacia el oído derecho 23 y el rayo 32 hacia el micrófono más cercano 14~ás c¾rcano (14riC3es. ) , y se permite que a. sea el ángulo entre ios rayos hacia dos micrófonos adyacentes; por ejemplo, el micrófono 14raaa cer ano y el micrófono 14sl<- ier.ce ás cercano ( 14r.ext_ciosest ) en este ejemplo. Se permite que yr;r,ás cerca o ( ) sea la salida del filtro de paso bajo 200 para el micrófono más cercano 14 , se permite que y«w;est« (t) sea la salida del filtro de paso bajo 202 para el siguiente micrófono más cercano 14Si{,uie- ejnás ce c no- A continuación, la salida de paso bajo para el oído derecho es dada por zLP (t) = (1 - a/ ?) y¿s cercan? (t) + ( /a0) ( t ) ¦ La salida de paso bajo para el oído izquierdo es similarmente producida y, debido a que los elementos de procesamiento para la señal del oído izquierdo son duplicados de aquellos descritos con anterioridad, estos han sido omitidos de la Fiaura 9 con prooósitos de claridad. 4. En el bloque 148, se introduce un micrófono complementario 300. La salida xc(t) del micrófono complementario es filtrada con un filtro complementario de paso aleo 204. Se permite que z P(t) sea la salida de este filtro de paso alto. El micrófono complementario podría ser un micrófono separado, uno de los micrófonos en el con] unto, o un micrófono "virtual" creado mediante la combinación de las salidas de los micrófonos en el conjunto. Además, los distintos micrófonos complementarios pueden ser utilizados para el oído izquierdo y para el oído derecho. Varias modalidades alternativas del micrófono (s) complementario (s) y las ventajas y desventajas de estas alternativas son discutidas más adelante. 5. A continuación, en el bloque 150, la salida de la señal complementaria filtrada de paso alto es agregada a la señal interpolada de as : bajo y la señal que se origina, z(t) = zLP(t) +???( t) , es enviada a ios auriculares. Una vez más, debe observarse que las señales para les oídos derecho e izquierdo deben ser procesadas por separado. En general, las señales ZLP(t! son diferentes para los oídos izquierdo y derecho. Para las Alternativas A, B y C de más adelante, las señales z ?(t) son las mismas para los dos oídos, aunque para la Alternativa D son diferentes. Se apreciará que el procesamiento de señal descrito con anterioridad sería llevado a cabo a través de la unidad de procesamiento de señal 16 y que los filtraos convencionales de paso bajo, el filtro (s) de paso alto, los adicionadores y otros elementos de procesamiento de señal serían empleados. Además, la unidad de procesamiento de señal 16 comprendería una computadora y la programación asociada para realizar el procesamiento de señal . Debe observarse que el Procedimiento 3 genera excelentes resultados . Aunque éste es más complejo de implementar que los Procedimientos 1 y 2 , éste es nuestra modalidad preferida para la reproducción de alta fidelidad debido a que este procedimiento generará una señal que cubre con exactitud el intervalo total espectral. Mientras que la diferencia interauricular de tiempo (ITD) para los componentes espectrales anteriores £. no sea controlado, el oído humano es insensible a la fase por encima de esta frecuencia. Por otro lado, la ITD por debajo de fc será corregida, conduciendo1 a las indicaciones o señales correctas de localización temporal para el sonido en la dirección i zquierca/derecha . Por encima de f~, la diferencia interauricular de nivel (ILD) proporciona la señal de localización más impor ante. La ILD de alta frecuencia está en función en la exactitud de cómo es obtenida l señal complementaria del micrófono. Esto se discute posteriormente, después del montaje físico y la configuración de los micrófonos, lo cual será discutido a con inuación. Como se mencionó' con anterioridad, los micrófonos en el conjunto de micrófonos pueden ser físicamente montados en distintos modos. Por ejemplo, estos podrían ser suspendidos, de manera efectiva, en el espacio si son soportados por alambres rígidos o varillas, estos podrían ser montados sobre la superficie de una esfera rígida, o podrían ser montados sobre cualquier superficie de revolución alrededor de un eje vertical, tai como un elipsoide rígido o un cilindro truncado o una caía octagonal. También es importante observar que, mientras las modalidades descritas con anterioridad emplean un conjunto de micrófonos, no es necesario separar los micrófonos de manera uni fo me . De acuerdo con la invención, también se distinguen tres distintas clases de aplicaciones, las cuales podemos llamar aplicaciones omnid i reccionale , panorámicas y enfocadas. Hasta ahora, las modalidades descritas han sido en el contexto de las aplicaciones panorámicas. Con las aplicaciones omnidireccionales , el escucha no tiene una orientación preferida, y ios micrófonos deben estar uniformemente separados con respecto a la superficie total (no se muestra) con las aplicaciones panorámicas como se describió con anterioridad, el eje vertical de la cabeza del escucha normalmente permanece vertical, aunque el escucha es probable que igualmente desee voltear la cara hacia cualquier dirección. En este punto, los micrófonos son separados, de preferencia, de manera uniforme alrededor de un círculo horizontal como se ilustró con anterioridad. Con las aplicaciones enfocadas (tipificadas mediante un concierto, un teatro, un cine, una televisión o una observación de monitor de computadora) , el usuario tiene una orientación fuertemente preferida. En este punto, los micrófonos pueden ser separados de manera más densa alrededor de las posiciones esperadas del oído como se ilustra en la Figura 10 a fin de reducir el número de micrófonos necesarios o para permitir el uso de una frecuencia de corte más alta. Cada una de estas clases al erna ivas de aplicaciones y configuraciones de micrófono y superficies de montaje producirán distintos retrasos de tiempo entre micrófonos y diferentes coloraciones espectrales. En particular, la suspensión de espacio libre conducirá a retrasos más cortos de tiempo que cualquiera de las elecciones de montaje por superficie que conducen a un requerimiento de un radio más grande. Con las elecciones montadas de superficie, la to a del micrófono ya nc será omnidireccional . En su lugar, está heredará las características de dispersión de sonido de la superficie. Por ejemplo, para una superficie esférica o una superficie truncada cilindrica, la respuesta de alta frecuencia será aproximadamente de 6-dB más grande que la respuesta de baja frecuencia para fuentes sobre el mismo lado del micrófono, y la respuesta de alta frecuencia será atenuada en mayor medida por la sombra de sonido de la superficie de monea e para las fuentes sobre el lado contrario del micrófono. Se observa que también el efecto de la superficie de montaje puede ser explotado para capturar las diferencias correctas interauriculares de nivel, así como también, las diferencias correctas interauriculares de tiempo. Es digno de observación que distintas configuraciones de montaje pueden conducir a diferentes requerimientos para el seguidor de la cabeza. Por ejemplo, tanto el ángulo azimutal como la elevación -deben ser seguidos para las aplicaciones omnidireccicnales . Para las aplicaciones panorámicas, las fuentes de sonido de interés serán situadas en o cerca del plano hori on al . En este caso, no importa cual sea la superficie utilizada para el montaje de los micrófonos, podría ser preferible situarlos alrededor de un círculo horizontal. Esto permitiría el uso de un seguidor más simple de la cabeza que mida sólo el ángulo azimutal . Hasta ahora, hemos asumido, en forma tácita, que el conjunto de micrófonos está fijo. Sin embargo, ésta no es una razón porque una serie o conjunto MTB no pudiera ser montado sobre un vehículo, un robot móvil o incluso una persona o un animal. Por ejemplo, las señales de una persona, que usa una banda en la cabeza o un collar soportando' los micrófonos, podrían ser transmitidas hacia otros escuchas, quienes entonces experimentarían lo que está escuchando la persona en movimiento. Para aplicaciones móviles, podría ser ventajoso incorporar un seguidor de posición en el conjunto MTB . De este modo, si el conjunto fuera girado, así como también, si fuera desplazado, la rotación del conjunto MTB podría ser combinada con cualquier rotación de la cabeza del escucha a fin de mantener las imágenes de sonido rotacionalmente estabilizadas . Se ha dicho que el tamaño de la superficie de montaje debe estar cercano al tamaño de la cabeza del escucha. Sin embargo, también existen otras posibles aplicaciones submarinas del MT3. Debido a que la velocidad del sonido en el agua es aproximadamente de 4.2 veces la velocidad del sonido en el aire, en consecuencia, el tamaño de la superficie de montaje debe estar a escala. Esto corregirá, tanto les cambios en la diferencia interauricular de tiempo como la diferencia interauricular de nivel introducidas por el medio. Paira la escucha remota submarina, el escucha podría estar sobre tierra, sobre un barco o también en el agua. En particular, un buzo podría tener un conjunto MTB incluido en su casco de buceo. Es bien conocido que los buzos tienen una gran dificultad para localizar las fuentes de sonido debido a las diferencias interauriculares anormalmente pequeñas de tiempo y de nivel que son experimentadas en el agua. Un conjunto MTB montado en un casco puede resolver este problema. Si el buzo fuera el único escucha, y si el casco pudiera girar con la cabeza del buzo, sería suficiente la utilización de dos micrófonos, y el seguimiento de la cabeza podría ser omitido o eliminado. Sin embargo, si otras personas quisieran escuchar lo que oye el buzo, o si el buzo quisiera girar su cabeza en el interior del casco, sería necesario un conjunto MT3 de múltiples micrófonos. Finalmente, en cuanto a las otras aplicaciones móviles, es deseable utilizar un seguidor de recorrido unido al conjunto MTB a fin de mantener las imágenes de sonido rotacicnalmente estabi 1 i zadas . Aunque una esfera podría parecer la superficie de montaje ideal, en particular para aplicaciones o nidireccicnaies , en realidad otras superficies podrían ser preferibles. La simetría extrema de una esfera origina el desarrollo de un "lugar brillante", el cual es una respuesta anormalmente fuerte en el lado de la esfera que es diametralmente opuesta a la fuente de sonido. Un elipsoide o un cilindro truncado tienen un lugar brillante más débil. La fabricación práctica y las consideraciones de montaje favorecen a un cilindro truncado, e incluso podría ser preferida una caja rectangular, hexagonal u octagonal. No obstante, por motivos de simplicidad, durante el resto de este documento se supone que el conjunto de micrófonos es colocado sobre una esfera rígida. Como se observó con anterioridad, un micrófono montado en una superficie hereda las características de dispersión de sonido de la superficie. La anisotropía que se origina en el comportamiento de respuesta es en realidad deseable para el conjunto de micrófonos, debido a que esto conduce a las diferencias adecuadas interauriculares de nivel. Sin embargo, la anisotropía podría crear un problema para el micrófono complementario que lleva la información de alta frecuencia, si quisiéramos que esta información sea independiente de la dirección del micrófono hacia la fuente de sonido. Esto nos trae a considerar modos alternativos para la implernentación del micrófono complementario utilizado en el Procedimiento 3. El propósito del micrófono complementario es restaurar la información de alta frecuencia que es removida por el filtrado de paso balo de las señales del conjunto de N micrófonos. Con referencia a la Figura 7B, como se ilustró en el bloque 152, existen al menos cinco maneras de obtener esta señal de micrófono complementario, cada una con sus propias ventajas y desventajas. Alternativa A: El uso de un micrófono separado complementario. En este punto, un micrófono separado es utilizado para capturar las señales de alta frecuencia . Por ejemplo, esto podría ser un micrófono omnidireccional mentado en la parte superior de la esfera. Aunque la captura sería oscurecida por la esfera para las fuentes de sonido que se encuentran por debajo de la misma, esto proporcionaría la cobertura uniforme para las fuentes de sonido en el plano horizontal . Ventaj as (1) Conceptualmente simple. (2) Un ancho de banda eficiente. Aunque el micrófono complementario requiere el ancho de banda total de audio (22.05 kHz para calidad de Di , cada uno del conjunto de N micrófonos requiere un ancho de banda solo de fc. Por ejemplo, si N = 3 y fc = 1.5 kHz, el conjunto de ocho micrófonos juntos requeriría un ancho de banda sólo de 12 kHz. Por lo tanto, el sistema total no requiere más ancho de banda que un CD estéreo normal de dos canales. Desventaj as (1; Requiere otro canal. Este es un inconveniente para el caso atractivo' de otro modo del conjunto de micrófonos de N = 6, debido a que las grabadoras de ocho pistas y los conver idores A/'D de ocho canales son productos comerciales comunes? , aunque ahora serían necesarios nueve canales . (2) Anisotropía. No existe lugar en donde un micrófono físico complementario pueda ser colocado sin que este se encuentre en la sombra de la esfera para alguna mitad de espacio. (3) ILD Incorrecta. Cuando sea utilizada la misma señal de alta frecuencia para ambos oídos izquierdo y derecho, no existirá una diferencia interauricular de nivel de alta frecuencia (ILD) . Aunque esto no provoca problemas para las fuentes de sonido sin energía de alta frecuencia, las fuentes de sonido sin energía de baja frecuencia tenderán a ser situadas en el centro de la cabeza del escucha. Además, existirán señales de conflicto para las fuentes de banda amplia. Por lo regular, esto aumenta la mancha de localización y puede conducir a la formación de "imágenes divididas"; es decir, la percepción que existen dos fuentes, una fuente de baja frecuencia en donde esta estaría y una fuente de alta frecuencia en el centro de la cabeza. Alternativa B: El uso de uno del conjunto de micrófonos. Se selecciona, de manera arbitraria, uno del conjunto de micrófonos como el micrófono complementario. Ventajas (1) Conceptuairnente simple. (2) Un ancho de banda eficiente. (Igual que para la alternativa A) . (3) Evita la necesidad de un canal adicional.
Desventajas (1) Para fuentes anisotrópicas en el plano horizontal. En cualquier lugar que sea seleccionado un micrófono para el micrófono complementario, este estará en la sombra de sonido de la esfera para las fuentes en el lado contrario del micrófono. Aunque esto podría ser aceptable o incluso deseable para las aplicaciones enfocadas, esto podría ser inaceptable para las aplicaciones omnidireccionales o panorámicas . (2) ILD Incorrecta. (Igual que para la alternativa A) . Alternativa C: Se utiliza un conjunto de micrófonos cambiado en forma dinámica. Se utiliza la salida del seguidor de la cabeza para seleccionar el micrófono que está más cerca de la nariz del escucha. Ventaj as (1) Evita la necesidad de canales adicionales. (2) La respuesta anisotrópica puede ser utilizada para obtener alguna mejora adicional en la diferenciación frontal/posterior. La sombra de la cabeza para las fuentes en la parte posterior sustituirá hasta algún grado la falta de la "sombra del pabellón de la oreja". Desventajas (1) El ancho de banda ya no es eficiente. Debido a que no existe modo de saber cual canal está siendo utilizado para el canal complementario, todos los canales tendrán que ser transmitidos o grabados en un ancho de banda de audio total . Sin embargo, la eficiencia del ancho de banda puede ser mantenida para una aplicación de usuario único, tal como la observación continua, debido a que el único canal de ancho de banda total necesario para este escucha puede ser cambiado, en forma dinámica, de micrófono a micrófono. (2) Requiere un procesamiento adicional de señal para eliminar los fenómenos transitorios de cambio, como se discute para la Alternativa D. (3) ILD Incorrecta. (Igual que para la alternativa A) . Alternativa D: Crea un micrófono virtual complementario a partir de 2 conjuntos de micrófonos de cambio dinámico. Esta opción utiliza distintas señales complementarias para el oído derecho y para el oído izquierdo. Para cualquier oído dado, la señal complementa ia es derivada a partir de los dos micrófonos que se encuentran más cerca al oído. Esto es muy similar al modo en el cual es obtenida la señal de baja frecuencia. Sin embargo, en lugar del intercalado entre los dos micrófonos (lo cual introduciría una coloración espectral inaceptable del filtro de peine) , se cambiaron entre ellos, eligiendo siempre el micrófono más cercano. Be este modo, la esfera proporciona, de manera automática, la diferencia correcta interauricular de nivel . Ventaj as (1) Evita la necesidad de canales adicionales. (2) ILD correcta. Desventaj as (1) El ancho de banda ya no es eficiente. (Igual que para la Alternativa C) . (2) Requiere un procesamiento adicional de señal para reducir los fenómenos transitorios de cambio. (3) El cambio en el espectro es audible. Si ia señal fuera cambiada repentinamente, el escucha normalmente oirá los clics producidos por la discontinuidad de ia señal. Esto será particularmente molesto si la posición de la cabeza estuviera esencialmente sobre un límite de cambio y las señales fueran cambiadas con rapidez hacia atrás y hacia adelante a medida que las pequeñas vibra iones provocan que la cabeza se mueva hacia atrás y hacia adelante a través del límite de cambio. Las series rápidas que se originan de los fenómenos transitorios de cambio pueden producir un sonido muy molesto de "charla" . El problema de la charla es resuelto con facilidad mediante la técnica estándar de introducción de histéresis; una vez que sea cruzado un límite de cambio, el conjunto de circuitos de cantío debe requerir algún movimiento mínimo angular hacia atrás en dirección de la región original antes de hacer el cambio de regreso. La discon inuidad inevitable que se presenta cuando se cambia de un micrófono a otro puede ser reducida mediante una simple técnica de reducción gradual . En lugar de cambiar instantáneamente, la señal puede ser derivada mediante la adición de una versión de reducción gradual de la primera señal hacia una versión de aumento gradual de la segunda señal. Los resultados estarán en función de la longitud del intervalo de tiempo T ed gradúa. ( f áe) con respecto al cual la primera señal es reducida en forma gradual y a la segunda señal que es aumentada en forma gradual. Los experimentos de simulación han mostrado que el fenómeno transitorio de cambio es muy débil cuando Tretí¡; :c;; S a<¡-¿ai = 10 ms y es inaudible cuando Tliá ~Ción = 20 ms . Estos números son totalmente compatibles con la velocidad de datos para el seguidor de la cabeza, la cual por lo regular se encuentra aproximadamente de 10 a 20 ms entre las muestras. Sin embargo, podría todavía ser posible escuchar el carabao en el espectro conforme el micrófono virtual complementario' sea cambiado, en particular, cuando la fuente se encuentre cerca del con] unto MT3. Alternativa E: Se crea un micrófono virtual complementario mediante la interpolación entre los espectros de dos conjuntos de micrófonos y la nueva síntesis de la señal temporal. Del mismo modo que con la Alternativa D, esta opción utiliza distintas señales complementarias para el oído derecho y para el oído izquierdo, y para cualquier oído dado, la señal complementaria es derivada de los dos micrófonos que están más cerca a este oído. La Alternativa E elimina el cambio espectral perceptible de la Alternativa D mediante la interpolación adecuada m s que mediante el cambio entre los dos micrófonos que están más cerca al oído. El problema es combinar suavemente la parte de alta frecuencia de las señales del micrófono sin encontrar efectos de cancelación de fase. La solución básica que explota la falta de sensitividad del oído en fase a altas frecuencias, involucra tres etapas: (a) la estimación del espectro de corto tiempo para las señales de cada micrófono, (b) la interpolación entre los espectros, y (c) la nueva síntesis de la forma de onda temporal de los espectros. El temía del procesamiento de señal mediante el análisis espectral, la modificación y la nueva síntesis es bien conocido en la comunidad de procesamiento de señal. Los métodos clásicos incluyen (a) el análisis y la nueva síntesis de la Transformada -Rápida-de Fcurier, y (b) el análisis y la nueva síntesis del banco de filtro. Ventaj as (1) Evita la necesidad de canales adicionales. (2) ILD incorrecta. (3) No existen fenómenos transitorios de cambio ni artefactos espectrales. Desventaj as (1) El ancho de banda ya no es eficiente. (Igual que para la Alternativa C) . (2) Grandes requerimientos computacicnales . Las circunstancias adecuadas que prefieren una o la otra de estas cinco modalidades alternativas pueden ser resumidas como sigue: la Alternativa A es preferible cuando la eficiencia del ancho de banda es la preocupación dominante; la Alternativa B proporciona un buen compromiso para aplicaciones enfocadas; la Alternativa C es atractiva para la escucha remora ('teleconferencia) si el costo del ancho de banda fuera aceptable; la Alternativa D proporciona un desempeño que puede estar cerca del desempeño de la Alternativa E a un costo computación^! mucho menor; y la Alternativa E es preferible cuando el máximo realismo sea la preocupación dominante. La Tabla 2 resume las ventajas y desventajas de los Procedimientos 1 y 2 , así como también el Procedimiento 3 para la Alternativa A y para la Al ernativa D. Se observa que MTB intenta capturar el campo de sonido que existiría en los oídos del escucha mediante la inserción de una superficie tal como una esfera en el campo de sonido y la det ección de la presión junto a los lugares en donde ios oídos del escucha estarían situados. Existen dos modos principales en los cuales esto podría producir una aproximación inadecuada : 1. El tamaño desajustado de la cabeza. Si la esfera fuera más pequeña que la cabeza del escucha, las diferencias interauriculares producidas serán más pequeñas que las que normalmente experimenta el escucha. Por el contraríe, si la esfera fuera más grande que la cabeza del escucha, las diferencias interauriculares producidas serán más grandes que lo normal. Además de producir errores de localización estática, esto conduce a la inestabilidad de las posiciones de las fuentes de sonido cuando el escucha voltee su cabeza. Si la esfera fuera más pequeña que la cabeza del escucha, la fuente parecerá girar ligeramente con el escucha, mientras que si la esfera fuera más grande, la fuente parecerá giraren sentido opuesto al movimiento del escucha. 2. Ausencia de señales del pabellón de la oreja. Es bien establecido que la creía exterior o pabellón de la oreja modifica el espectro de sonido que alcanza, de manera eventual, el tímpano, y que esta modificación varía con el ángulo azimutal y la elevación. Estos cambios espectrales producen señales del pabellón de la oreja que son par icularmente importantes para juzgar la elevación de una fuente. Su naturaleza exacta es complicada y varía, de manera significa iva, de persona a persona. Sin embargo, una característica principal es una muesca espectral cuya frecuencias central cambia sistemá icamente con la elevación. Las modificaciones espectrales son mínimas cuando la fuente está por encima de la cabeza. Deoidc a que la superficie MTB no incluye ninguno de les pabellones de ia oreja, no existe un correspondiente cambio espectral . Debido a que ningún cambio corresponde con la elevación de altura, la mayoría de escuchas perciben las fuentes que están elevadas en cierto modo, sin considerar sus elevaciones actuales. Ninguno de los procedimientos generales es conocido para corregir por completo estos dos problemas. No obstante, existen métodos útiles para situaciones especiales aunque también importantes. El tamaño desajustado de la cabeza puede ser corregido con facilidad para las aplicaciones enfocadas, en donde el escucha normalmente está observando más o menos en una dirección. Se permite que a sea el radio de la esfera, que b sea el radio de ia cabeza del escucha y que T sea el ángulo de rotación de la cabeza . A continuación, la posición aparente de la fuenne que se encuentra directamente colocada hacia delante puede ser estabilizada mediante la utilización de (b/a) 9 en lugar de 0 cuando se realice el procesamiento de los datos del micrófono. Esta simple corrección funciona bien para pequeños ángulos de la rotación de la cabeza. Además, no es necesario medir el radio de la cabeza del escucha para utilizar esta técnica, sólo se necesita utilizar ?.? en lugar de 0, y permitir que el escucha ajuste el coeficiente hasta que la imagen sea estabilizada. También es posible corregir la ausencia de las señales del pabellón del oído si ] as fuen_.es de sonido de interés estuvieran más o menos en el plano horizontal. En este caso, un filtro que se aproxima a la función de transf rencia del pabellón del oído es introducido en la trayectoria de la señal en cada oído, y se permite que el usuario ajuste los parámetros del filtre hasta que las imágenes de sonido parezcan estar en el plano horizontal. A partir de la descripción precedente, será apreciado que el concepto general por detrás de la invención es (a) utilizar múltiples micrófonos para maestrear el campo de sonido en los puntes cercanos a la posición de los oídos para codas las orientaciones posibles de la cabeza, (b) utilizar un seguidor de la cabeza para determinar las distancias de ios oíaos del escucha hacia cada uno de los micrófonos, (c) filtrar con el filtre de paso bajo las salidas del micrófono, (d) interpolar, en forma lineal (de manera equivalente: el peso, combinar, "intercalar") las salidas filtradas de pasó bajo para es imar la parte de baja frecuencia de las señales que serían capturadas por los micrófonos en las posiciones del oído: del escucha, y (e) re ntroducir el contenido de alta frecuencia. Este mismo concepto general puede ser ím lementado y extendido en una diversidad de modos .alt rnativos. Las siguientes se encuentran entre las alternativas: 1. Utilizar ya sea un numero muy pequeño o muy grande de micrófonos. Un número pequeño de micrófonos podría ser utilizado si la frecuencia de corte del filtro de pasó bajo fuera adecuadamente ajustada. Incluso con sólo dos micrófonos, es posible obtener les beneficios de la modificación dinámica con la condición que las fuentes no estén demasiado cerca al plano medio para los micrófonos. Enferma alterna, si un número grande de micrófonos pudiera ser económicamente empleado, el filtrado de pasó bajo y las etapas de restauración de alta frecuencia podrían ser eliminadas. Con una cantidad suficien.ee de micrófonos, el procedimiento de interpolación puede ser reemplazado mediante un cambio simple. 2. Generalizar la configuración mostrada en la Figura 8 mediante la fijación de los micrófonos sobre la superficie total de una esfera y si se utiliza el seguidor de la cabeza para detectar la elevación, así corno también el ángulo azimutal del escucha. Los micrc'fonos más cercanos y ios siguientes micrófonos más cercanos ya no necesitan estar en el plano horizontal, y las rotaciones arbitrarias de la cabeza pueden ser acomodadas. 3. Introducir un torso artificial por debajo de la cabeza. La dispersión de sonido a través del torso proporciona las señales adicionales de localización que podrían ser útiles para la elevación y la external izació . Aunque la inclus ión de un torso haría que el conjunto de micrófonos sea mucho más grande y más incómodo, esto podría ser justificado para aplicaciones particularmente demandantes . 4. Reemplazar cada micrófono por un conjunto de micrófonos para expeler o reducir la captura no deseada de sonido. Esto es particularmente atractivo cuando ios sonidos no deseados están a cualquier altura o más bien a bajas elevaciones y la superficie MTB es un cilindro truncado. En este caso, cada micrófono puede ser reemplazado por una columna vertical de micrófonos, cuyas salidas pueden ser combinadas a fin de reducir la sensitividad en el exterior del plano horizontal . 5. Para utilizar TE como un buscador de dirección acústica, se emplean dos conjuntos concéntricos MT3, por ejemplo, con los micrófonos 400 para el conjunto más pequeño que es montado en la esfera de tamaño de cabeza 402 y les micrófonos 404 para el conjunto más grande que es montado en las varillas rígidas 406 que se extienden a partir de la esfera como se muestra en la Figura 11. El conjunto más pequeño MT3 es utilizado como usual y el escucha gira para quedar frente a la fuente. Entonces, el escucha cambia hacia el conjunto más grande MTB. Si el escucha está directamente señalando a la Cuente, la imagen de la r ente aparecerá que se encuentra intercalada. Los pequeños movimientos de la cabeza oriqinarán movimientos amollados de la imaqen, lo cual hace más fácil la localización de la fuerte. Será apreciado que existen muchas técnicas alternativas para la grabación de sonido espacial, con sistemas de sonido envolvente que sen particularmente populares. Es deseable tener la capacidad de utilizar la invención a fin de reproducir las grabaciones existentes de sonido espacial a través de auriculares. Como se mencionó con anterioridad, un procedimiento directo sería volver a grabar una grabación existente, colocando el conjunto de micrófonos en el "punto sin ruido" de un sistema de sonido envolvente del estado de la técnica. Esto tiene la ventaja que esto proporcionarí al escucha la experiencia óptima de escucha. Por otro lado, la pasada experiencia comercial na mostrado que es indeseable presentar al público el mismo contenido en más de un formato. Un procedimiento alternativo es simular el proceso de volver a grabar, utili ando aIr.aveces simulados para excitar un conjunto simulado de micrófonos en una habitación simulada. En la situación más simple, un modelo de cabeza esférica V. _R. Algazi, R . C . Duda and D. M. Thompson, "The use of head-and-torso mcdels for improved spatiai sound synthesis" , Preprint 5712, 113th Convención of the Audio Engineering Society (Los Angeles, CA, 5-3 de Octubre, 2002, que se incorpora en éste documento como referencia) podría ser utilizada para calcular la señal que captaría un micrófono particular en el conjunco de micrófonos de cada uno de los altavoces virtuales. Para un realismo más granee, un modelo de habitación podría ser utilizado para simular los efectos de las reflexiones y la reverberación de una habitación (D. B. Begault, 3-D Sound for Virtual Reality and Multimedia (AF Prc ssional , Boston, 1994) , que se incorpora en este documento como referencia) . Este procedimiento de procesamiento de señal puede ser implementado con rapidez en el hardware especial de tiempo real que convierte las señales en el formato original de grabación en señales del formato MTB ¡Biauricular Seguido por el Movimiento) . Mediante el enru amiento de las señales de una unidad convencional de reproducción a través de este convertidor de formato, uno o muchos escuchas pueden escuchar cualquier CD o DVD a través de los auriculares y todavía disfrutar los ioeneficios de la sensibilidad del movimiento de la cabeza. Las mismas v ntaj as del MTB pueden ser realizadas para la entrega de sonidos generados en su totalidad per una computadora, tanto para la creación del espacio auditivo virtual como para la visual ización auditiva espacial i ada de los datos. Todo esto es requerido para calcular ios sonidos que serían capturados por un conjunto simulado de micrófonos MTB. Las señales calculadas del micrófono pueden ser entonces u ilizadas en lugar de las señales de los micrófonos tísicos, ce modo que uno o muchos escuchas pueden oír los sonidos virtuales a través de auriculares y todavía pueden disfrutar de los beneficios de la sensibilidad del movimiento de la cabeza. Para cubrir el uso de los micrófonos físicos en vivo, los micrófonos físicos grabados y los micrófonos simulados, en las reivindicaciones se hace referencia a las señales capturadas por los micrófonos físicos, las señales grabadas de los micrófonos físicos y las señales calculadas para los micrófonos simulados como señales "representativas" de las salidas del micrófono. Como puede observarse, por lo tanto, la modalidad preferida de la presente invención utiliza más de dos micrófonos para la captura de sonido; utiliza un dispositivo de seguimiento de la cabeza para medir la orientación de la cabeza del escucha; y emplea técnicas de procesamiento de señal basadas en la psico-acúst ica para combinar las salidas de los micrófonos. La presente invención tiene la capacidad de grabar cualquier sonido que sucede de manera natural (incluyendo las reflexiones y la reverberación de una habitación), y para resolver las limitaciones principales de la grabación biauricular estática, utilizando un número pequeño fijo de canales a fin de proporcionar al escucha posiciones estables para las fuentes auditivas virtuales, de manera independiente del movimiento de la cabeza del escucha; una buena external i zación frontal; y poca o ninguna confusión frontal/posterior. La presente invención además se dirige a ia grabación de sonidos en vivo. Con ios sonidos en vivo es difícil o imposible obtener señales separadas para todas las fuentes de sonido, no sin mencionar los ecos y la reverberación perceptualmente impor antes; y las posiciones de las fuentes por lo regular no son conocidas. Además, con la presente invención existe un número pequeño fijo de canales; las HRTFs próximas son automáticamente producidas por el conjunte de micrófonos; y les ecos y la reverberación complejos de la habitación actual son capturados , de manera automática . Aunque la descripción an erior contiene muchos detalles, éstos no deben ser interpretados que limitan el alcance de la invención, si no que proporcionan simplemente lustraciones de algunas de las modalidades actualmente preferidas de esta invención. Por lo tanto, será apreciado que el alcance de la presente invención incluye por completo otras modalidades que pueden ser obvias para aquellas personas expertas en la técnica y que en consecuencia, el alcance de la presente invención será limitado a nada más que las reivindicaciones adjuntas, en las cuales se hace referencia a un elemento en lo singular y no se pretende que signifique "uno y sólo uno" a menos que se indique de manera explícita, sino más bien "uno o más". Todos los equivalentes estructurales, químicos y funcionales a los elementos de la modalidad preferida descrita con anterioridad que son conocidos por aquellas personas de experiencia ordinaria en ¦la técnica se incorporan expresamente en éste documento como referencia y se pretende que sean incluidos por las presentes reivindicaciones. Además, no es necesario que un dispositivo o método se dirija a cada uno y a todos los problemas que se busca sean resueltos por la presente invención, para que sea incluido por las presentes reivindicaciones. Además, ningún elemento, componente ni etapa de método en la presente descripción se pretende que sea dedicado al público sin considerar si el elemento, componente o etapa de método sea señalado, de manera explícita, en las reivindicaciones. Ningún elemento de reivindicaciones de este documento debe interpretarse de acuerdo con las provisiones de 35 U.S.C. 112, sexto párrafo.', a menos que el elemento sea expresamente señalado que utiliza la frase "significa".
Tabla 1 N f:„i;,ÍH"; 2 312 3 468 4 624 5 780 6 936 7 1 , 092 8 1,248 9 1,404 10 1,560 11 1,716 12 1,872 13 2,023 14 2,184 15 2,340 16 2,496 Ventajas Procedimient Reproducción de sonido intensamente realista Puede ser aplicada ampliamente* (grabación v telefonía i Captura antas señales biauricu Lares principales ÍÍTD, 1LD) Reproduce fie.l mente los sonidos en todas las distancias Elimina la confusión f ontal/posterior Responde con exactitud al movimiento de la cabeza del escucha Produce imágenes estabilizadores de sonido Soporta cualquier número de escuchas simultáneos Proporciona un formato universal para otras técnicas-de captura Hace uso e iciente del ancho de banda >:o se requieren habilidades especiales para la realización de grabaciones Sistema de reproducción compacto y posiblemente económi * Juegos, radio, televisión, imágenes en movimiento, teatro en casa, grabación de música, teleconferencia , observación continua, realidad virtual, evaluación de sistema de audio, investigación psico- acústica, etcétera.
Tabla 2 (Continuación) Desventajas Procedimiento : 1 2 3A 3D Requiere un seguidor de la cabeza del escucha X X X x Requiere de auriculares para mejores resultados X X X X No podría reproducir en forma correcta la elevación de la fuente X X X X Requiere muchos micrófonos para el anche de banda total X X Podría introducir clics cuando la cabeza será movida Podría introducir una coloración espectral significante X Podría producir "imágenes divididas" con fuentes de banda ancha X Se hace constar que con relación, a esta fecha el r.ejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.

Claims (30)

REIVINDICACIONES Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes reivindicaciones:
1. Un aparato de reproducción de sonido, caracterizado porque comprende: una unidad de procesamiento de señal ; la unidad de procesamiento de señal tiene una salida que se conecta con un dispositivo de salida de audio; la unidad de procesamiento de señal tiene una entrada que se conecta con un dispositivo de seguimiento de la cabeza; la unidad de procesamiento de señal es configurada para recibir señales representativas de la salida de una pluralidad de micrófonos situados para muestrear un campo de sonido en los puntos que representan las posibles posiciones del oído del escucha si la cabeza de los escuchas estuvieran situadas en el campo de sonido en la posición de los micrófonos ; la unidad de procesamiento de señal es configurada para procesar las señales de salida del micrófono y para presentar una salida biauricular al dispositivo de salida de audio en respuesta a la orientación de la cabeza del escucha como se indica a través del dispositivo de seguimiento de cabeza.
2. El aparato de conformidad con la reivindicación 1, caracterizado porque la unidad de procesamiento de señal es configurada para combinar las señales representativas de la salida de un micrófono más cercano y un siguiente micrófono más cercano con relación a la posición de un oído del escucha en el campo de sonido si la cabeza del escucha estuviera situada en el campo de sonido en la posición de los micrófonos .
3. El aparato de conformidad con la reivindicación 1, caracterizado porque la unidad de procesamiento de señal comprende : un filtro de paso bajo asociado con cada una de las señales de salida del micrófono; y el medio que combina las salidas de los filtros de paso bajo a fin de producir una señal combinada de salida para un oído del escucha, en donde la señal combinada de salida comprende una combinación de las señales representativas de la salida de un micrófono más cercano y un siguiente micrófono más cercano con relación a la posición del oído del escucha en el campo de sonido si la cabeza del escucha estuviera situada en el campo de sonido en la posición de los micrófonos.
4. El aparato de conformidad con la reivindicación 3, caracterizado porque la unidad de procesamiento de señal además comprende : un filtro de paso alto configurado para proporcionar una señal de salida de un micrófono complementario situado en el campo de sonido; y el medio que mezcla la señal de salida del filtro de paso alto con la señal combinada de salida para la oreja del escucha .
5. Un aparato de reproducción de sonido, caracterizado porque comprende: una unidad de procesamiento de señal; la unidad de procesamiento de señal tiene una salida que se conecta con un dispositivo de salida de audio; la unidad de procesamiento de señal tiene una entrada que se conecta con un dispositivo de seguimiento de la cabeza; la unidad de procesamiento de señal es configurada para recibir las señales representativas de la salida de una pluralidad de micrófonos situados para muestrear un campo de sonido en los puntos que representan las posibles posiciones de los oídos izquierdo y derecho del escucha si la cabeza de los escuchas estuvieran situadas en el campo de sonido en la posición de los micrófonos; la unidad de procesamiento de señal es configurada para combinar las señales de salida del micrófono y para presentar una salida biauricular al dispositivo de salida de audio en respuesta a la orientación de la cabeza del escucha como se indica a través del dispositivo de seguimiento de cabeza .
6. El aparato de conformidad con la reivindicación 5, caracterizado porque: la unidad de procesamiento de señal es configurada para combinar las señales representativas de la salida de un micrófono más cercano y un siguiente micrófono más cercano con relación a la posición del oído izquierdo del escucha en el campo de sonido si la cabeza del escucha estuviera situada en el campo de sonido en la posición de los micrófonos; y la unidad de procesamiento de señal es configurada para combinar las señales representativas de la salida de un micrófono más cercano y un siguiente micrófono más cercano con relación a la posición del oído derecho del escucha en el campo de sonido si la cabeza del escucha estuviera situada en el campo de sonido en la posición de los micrófonos.
7. El aparato de conformidad con la reivindicación 5, caracterizado porque la unidad de procesamiento de señal comprende : un filtro de paso bajo asociado con cada una de las señales de salida del micrófono; el medio que mezcla las salidas de los filtros de paso bajo a fin de producir una señal combinada de salida para el oído izquierdo del escucha, en donde la señal combinada de salida comprende una mezcla de las señales representativas de la salida de un micrófono más cercano y un siguiente micrófono más cercano con relación a la posición del oído izquierdo del escucha en el campo de sonido si la cabera del escucha estuviera situada en el campo de sonido en la posición de los micrófonos; y el medio que mezcla las salidas de los filtros de paso bajo a fin de producir una señal combinada de salida para el oído derecho del escucha, en donde la señal combinada de salida comprende una mezcla de las señales representativas de la salida de un micrófono más cercano y un siguiente micrófono más cercano con relación a la posición del oído derecho del escucha en el campo de sonido si la cabeza del escucha estuviera situada en el campo de sonido en la posición de los micrófonos .
8. El aparato de conformidad con la reivindicación 7, caracterizado porque la unidad de procesamiento de señal además comprende : un filtro de paso alto de oído izquierdo que es configurado para proporcionar una salida de un micrófono complementario del oído izquierdo situado en el campo de sonido ; un filtro de paso alto de oído derecho que es configurado para proporcionar una salida de un micrófono complementario de oído derecho situado en el campo de sonido; el medio que mezcla la salida del filtro de paso alto de oído izquierdo con la salida combinada para el oído izquierdo del escucha; y el medio que mezcla la salida del filtro de paso alto de oído derecho con la salida combinada para el oído derecho del escucha.
9. Un aparato de reproducción de sonido, caracterizado porque comprende: una unidad de procesamiento de señal; la unidad de procesamiento de señal tiene una salida que se conecta con un dispositivo de salida de audio; la unidad de procesamiento de señal tiene una entrada que se conecta con un dispositivo de seguimiento de cabeza; la unidad de procesamiento de señal comprende el medio que recibe las señales representativas de la salida de una pluralidad de micrófonos situados para muestrear un campo de sonido en los puntos que representan las posibles posiciones del oído del escucha si la cabeza de los escuchas estuvieran situadas en el campo de sonido en la posición de los micrófonos, y para el procesamiento de las señales de salida del micrófono y la presentación de una salida biauricular al dispositivo de salida de audio en respuesta a la orientación de la cabeza del escucha como se indica a través del dispositivo de seguimiento de cabeza.
10. El aparato de conformidad con la reivindicación 9, caracterizado porque la unidad de procesamiento de señal además comprende el medio que combina mezcla las señales representativas de la salida de un micrófono más cercano y un siguiente micrófono más cercano con relación a la posición de un oído del escucha en el campo de sonido si la cabeza del escucha estuviera situada en el campo de sonido en la posición de los micrófonos .
11. El aparato de conformidad con la reivindicación 9, caracterizado porque la unidad de procesamiento de señal además comprende : un filtro de paso bajo asociado con cada una de las señales de salida del micrófono; y el medio que mezcla las salidas de los filtros de paso bajo a fin de producir una señal combinada de salida para un oído del escucha, en donde la señal combinada de salida comprende una mezcla de las señales representativas de la salida de un micrófono más cercano y un siguiente micrófono más cercano con relación a la posición del oído del escucha en el campo de sonido si la cabeza del escucha estuviera situada en el campo de sonido en la posición de los micrófonos.
12. El aparato de conformidad con la reivindicación 11, caracterizado porque la unidad de procesamiento de señal además comprende : un filtro de paso alto configurado para proporcionar una señal de salida de un micrófono complementario situado en el campo de sonido; y el medio que mezcla la señal de salida del filtro de paso alto con la señal combinada de salida para el oído del escucha .
13. Un aparato para la captura y reproducción del sonido dinámico biauricular, caracterizado porque comprende.- una pluralidad de micrófonos situados para muestrear un campo de sonido en los puntos que representan las posibles posiciones de un oído de un escucha si la cabeza del escucha estuviera situada en el campo de sonido en la posición de los micrófonos ; una unidad de procesamiento de señal; la unidad de procesamiento de señal tiene una salida que se conecta con el dispositivo de salida de audio; la unidad de procesamiento de señal tiene una entrada que se conecta con un dispositivo de seguimiento de cabeza; la unidad de procesamiento de señal es configurada para procesar las señales de salida del micrófono y para presentar una salida biauricular al dispositivo de salida de audio en respuesta a la orientación de la cabeza del escucha como se indica a través del dispositivo de seguimiento de cabeza .
14. El aparato de conformidad con la reivindicación 13, caracterizado porque los micrófonos son situados en un conjunto circular alrededor de una superficie que tiene un radio que se aproxima al radio de la cabeza del escucha.
15. El aparato de conformidad con la reivindicación 13, caracterizado porque la unidad de procesamiento de señal es configurada para combinar las señales representativas de la salida de un micrófono más cercano y un siguiente micrófono más cercano con relación a la posición de un oído del escucha en el campo de sonido si la cabeza del escucha estuviera situada en el campo de sonido en la posición de los micrófonos .
16. El aparato de conformidad con la reivindicación 13, caracterizado porque la unidad de procesamiento de señal comprende : un filtro de paso bajo asociado con cada una de las señales de salida del micrófono; y el medio que mezcla las salidas de los filtros de paso bajo a fin de producir una señal combinada de salida para un oído del escucha, en donde la señal combinada de salida comprende una mezcla de señales representativas de la salida de un micrófono más cercano y un siguiente micrófono más cercano con relación a la posición del oído del escucha en el campo de sonido si la cabeza del escucha estuviera situada en el campo de sonido en la posición de los micrófonos.
17. El aparato de conformidad con la reivindicación 16, caracterizado además porque comprende: un micrófono complementario situado en el campo de sonido; un filtro de paso alto configurado para proporcionar una señal de salida del micrófono complementario; y el medio que mezcla la señal de salida del filero de paso alto con la señal combinada de salida para el oído del escucha ; en donde el contenido de alta frecuencia removido por los filtros de paso bajo es reinsertado.
18. El aparato de conformidad con la reivindicación 17, caracterizado porque el micrófono complementario comprende un micrófono real o virtual que es seleccionado a partir del grupo que consiste, en esencia, de un micrófono que es separado de los micrófonos en la pluralidad de micrófonos, uno de los micrófonos en la pluralidad de micrófonos, un micrófono virtual creado a partir de las señales de una pluralidad de micrófonos de cambio dinámico en la pluralidad de micrófonos y un micrófono virtual creado por la interpolación espectral de señales de dos micrófonos en la pluralidad de micrófonos.
19. Un aparato para la captura y reproducción del sonido dinámico biauricular, caracterizado porque comprende: una pluralidad de micrófonos situados para muestrear un campo de sonido en los puntos que representan las posibles posiciones de los oídos izquierdo y derecho del escucha si la cabeza del escucha estuviera situada en el campo de sonido en la posición de los micrófonos; y una unidad de procesamiento de señal; la unidad de procesamiento de señal tiene una salida que se conecta con un dispositivo de salida de audio; la unidad de procesamiento de señal tiene una entrada que se conecta con un dispositivo de seguimiento de cabeza; la unidad de procesamiento de señal es configurada para mezclar las señales de salida de los micrófonos y para presentar una salida biauricular al dispositivo de salida de audio en respuesta a la orientación de la cabeza del escucha como se indica a través del dispositivo de seguimiento de cabeza .
20. El aparato de conformidad con la reivindicación 19, caracterizado porque los micrófonos son situados en un conjunto circular alrededor" de una superficie que tiene un radio que se aproxima al radio de la cabeza del escucha.
21. El aparato de conformidad con la reivindicación 19, caracterizado porque: la unidad de procesamiento de señal es configurada para combinar las señales representativas de la salida de un micrófono más cercano y un siguiente micrófono más cercano con relación a la posición del oído izquierdo del escucha en el campo de sonido si la cabeza del escucha estuviera situada en el campo de sonido en la posición de los micrófonos; y la unidad de procesamiento de señal es configurada para combinar las señales representativas de la salida de un micrófono más cercano y un siguiente micrófono más cercano con relación a la posición del oído derecho del escucha en el campo de sonido si la cabeza del escucha estuviera situada en el campo de sonido en la posición de los micrófonos.
22. El aparato de conformidad con la reivindicación 19, caracterizado porque la unidad de procesamiento de señal comprende : un filtro de paso bajo asociado con cada una de las señales de salida del micrófono; el medio que mezcla las salidas de los filtros de paso bajo a fin de producir una señal combinada de salida para el oído izquierdo del escucha, en donde la señal combinada de salida comprende una mezcla de señales representativas de la salida de un micrófono más cercano y un siguiente micrófono más cercano con relación a la posición del oído izquierdo del escucha en el campo de sonido si la cabeza del escucha estuviera situada en el campo de sonido en la posición de los micrófonos; y el medio que mezcla las salidas de los filtros de paso bajo a fin de producir una señal combinada de salida para el oído derecho del escucha, en donde la señal combinada de salida comprende una mezcla de señales representativas de la salida de un micrófono más cercano y un siguiente micrófono más cercano con relación a la posición del oído derecho del escucha en el campo de sonido si la cabeza del escucha estuviera situada en el campo de sonido en la posición de los micrófonos .
23. El aparato de conformidad con la reivindicación 22, caracterizado porque la unidad de procesamiento de señal además comprende : un filtro de paso alto de oído izquierdo que es configurado para proporcionar una salida de un micrófono complementario del oído izquierdo situado en el campo de sonido; un filtro de paso alto de oído derecho que es configurado para proporcionar una salida de un micrófono complementario de oído derecho situado en el campo de sonido; el medio que mezcla la salida del filtro de paso alto de oído izquierdo con la salida combinada para el oído izquierdo del escucha; y el medio que mezcla la salida del filtro de paso alto de oído derecho con la salida combinada para el oído derecho del escucha; en donde el contenido de alta frecuencia removido por los filtros de paso bajo es reinsertado.
24. El aparato de conformidad con la reivindicación 23, caracterizado porque el micrófono complementario comprende un micrófono real o virtual que es seleccionado a partir del grupo que consiste, en esencia, de un micrófono que es separado de los micrófonos en la pluralidad de micrófonos, uno de los micrófonos en la pluralidad de micrófonos, un micrófono virtual creado a partir de las señales de una pluralidad de micrófonos de cambio dinámico en la pluralidad de micrófonos y un micrófono virtual creado por la interpolación espectral de señales de dos micrófonos en la pluralidad de micrófonos.
25. Un aparato para la captura y reproducción del sonido dinámico biauricular, caracterizado porque comprende: una pluralidad de micrófonos situados para muestrear un campo de sonido en los puntos que representan las posibles posiciones de un oído de un escucha si la cabeza del escucha estuviera situada en el campo de sonido en la posición de los micrófonos; y una unidad de procesamiento de señal; la unidad de procesamiento de señal tiene una salida que se conecta con un dispositivo de salida de audio; la unidad de procesamiento de señal tiene una entrada que se conecta con un dispositivo de seguimiento de cabeza; la unidad de procesamiento de señal comprende el medio que procesa las señales de salida del micrófono y que presenta una salida biauricular al dispositivo de salida de audio en respuesta a la orientación de la cabeza del escucha como se indica a través del dispositivo de seguimiento de cabeza.
26. El aparato de conformidad con la reivindicación 25, caracterizado porque los micrófonos son situados en un conjunto circular alrededor de una superficie que tiene un radio que se aproxima al radio de la cabeza del escucha.
27. El aparato de conformidad con la reivindicación 25, caracterizado porque la unidad de procesamiento de señal además comprende el medio que mezcla las señales representativas de la salida de un micrófono más cercano y un siguiente micrófono más cercano con relación a la posición de un oído del escucha en el campo de sonido si la cabeza del escucha estuviera situada en el campo de sonido en la posición de los micrófonos.
28. El aparato de conformidad con la reivindicación 25, caracterizado porque la unidad de procesamiento de señal además comprende : un filtro de paso bajo asociado con cada una de las señales de salida del micrófono; y el medio que mezcla las salidas de los filtros de paso bajo a fin de producir una señal combinada de salida para un oído del escucha, en donde la señal combinada de salida comprende una mezcla de las señales representativas de la salida de un micrófono más cercano y un siguiente micrófono más cercano con relación a la posición del oído del escucha en el campo de sonido si la cabeza del escucha estuviera situada en el campo de sonido en la posición de los micrófonos.
29. El aparato de conformidad con la reivindicación 28, caracterizado además porque comprende: un micrófono complementario situado en el campo de sonido; un filtro de paso alto configurado para proporcionar una señal de salida del micrófono complementario; y el medio que mezcla la señal de salida del filtro de paso bajo con la señal combinada de salida para el oído del escucha ; en donde el contenido de alta frecuencia removido por los filtros de paso bajo es reinsertado.
30. El aparato de conformidad con la reivindicación 29, caracterizado porque el micrófono complementario comprende un micrófono real o virtual que es seleccionado a partir del grupo que consiste, en esencia, de un micrófono que es separado de los micrófonos en la pluralidad de micrófonos, uno de los micrófonos en la pluralidad de micrófonos, un micrófono virtual creado a partir de las señales de una pluralidad de micrófonos de cambio dinámico en la pluralidad de micrófonos y un micrófono virtual creado por la interpolación espectral de señales de dos micrófonos en la pluralidad de micrófonos.
MXPA05004091A 2002-10-18 2003-09-26 Captura y reproduccion de sonido dinamico biauricular. MXPA05004091A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US41973402P 2002-10-18 2002-10-18
US10/414,261 US7333622B2 (en) 2002-10-18 2003-04-15 Dynamic binaural sound capture and reproduction
PCT/US2003/030392 WO2004039123A1 (en) 2002-10-18 2003-09-26 Dynamic binaural sound capture and reproduction

Publications (1)

Publication Number Publication Date
MXPA05004091A true MXPA05004091A (es) 2005-06-08

Family

ID=32096117

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA05004091A MXPA05004091A (es) 2002-10-18 2003-09-26 Captura y reproduccion de sonido dinamico biauricular.

Country Status (8)

Country Link
US (1) US7333622B2 (es)
EP (1) EP1554910A4 (es)
JP (1) JP2006503526A (es)
KR (1) KR20050056241A (es)
AU (1) AU2003273363A1 (es)
CA (1) CA2502585A1 (es)
MX (1) MXPA05004091A (es)
WO (1) WO2004039123A1 (es)

Families Citing this family (116)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7415123B2 (en) * 2001-09-26 2008-08-19 The United States Of America As Represented By The Secretary Of The Navy Method and apparatus for producing spatialized audio signals
AU2003210624A1 (en) * 2002-01-18 2003-07-30 Polycom, Inc. Digital linking of multiple microphone systems
US7430300B2 (en) * 2002-11-18 2008-09-30 Digisenz Llc Sound production systems and methods for providing sound inside a headgear unit
US9841809B2 (en) * 2003-12-12 2017-12-12 Kurzweil Technologies, Inc. Virtual encounters
US20050130108A1 (en) * 2003-12-12 2005-06-16 Kurzweil Raymond C. Virtual encounters
US9971398B2 (en) * 2003-12-12 2018-05-15 Beyond Imagination Inc. Virtual encounters
US9948885B2 (en) * 2003-12-12 2018-04-17 Kurzweil Technologies, Inc. Virtual encounters
JP4192800B2 (ja) * 2004-02-13 2008-12-10 ソニー株式会社 音声集音装置と方法
JP2005333211A (ja) * 2004-05-18 2005-12-02 Sony Corp 音響収録方法、音響収録再生方法、音響収録装置および音響再生装置
GB2414369B (en) * 2004-05-21 2007-08-01 Hewlett Packard Development Co Processing audio data
EP1600791B1 (en) * 2004-05-26 2009-04-01 Honda Research Institute Europe GmbH Sound source localization based on binaural signals
US8687820B2 (en) * 2004-06-30 2014-04-01 Polycom, Inc. Stereo microphone processing for teleconferencing
US20060013409A1 (en) * 2004-07-16 2006-01-19 Sensimetrics Corporation Microphone-array processing to generate directional cues in an audio signal
US7720212B1 (en) * 2004-07-29 2010-05-18 Hewlett-Packard Development Company, L.P. Spatial audio conferencing system
US20060126927A1 (en) * 2004-11-30 2006-06-15 Vesely Michael A Horizontal perspective representation
US7928311B2 (en) * 2004-12-01 2011-04-19 Creative Technology Ltd System and method for forming and rendering 3D MIDI messages
US7505601B1 (en) * 2005-02-09 2009-03-17 United States Of America As Represented By The Secretary Of The Air Force Efficient spatial separation of speech signals
US20060212148A1 (en) * 2005-03-18 2006-09-21 Critech Enterprises Inc. Systems and methods for the evaluation of artistic performances
CN100495951C (zh) * 2005-05-09 2009-06-03 上海原动力通信科技有限公司 一种动态选择阵列天线结构的方法
WO2006126161A2 (en) * 2005-05-26 2006-11-30 Bang & Olufsen A/S Recording, synthesis and reproduction of sound fields in an enclosure
DE102005033239A1 (de) * 2005-07-15 2007-01-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Steuern einer Mehrzahl von Lautsprechern mittels einer graphischen Benutzerschnittstelle
KR101333031B1 (ko) * 2005-09-13 2013-11-26 코닌클리케 필립스 일렉트로닉스 엔.브이. HRTFs을 나타내는 파라미터들의 생성 및 처리 방법 및디바이스
US8340304B2 (en) * 2005-10-01 2012-12-25 Samsung Electronics Co., Ltd. Method and apparatus to generate spatial sound
US8130977B2 (en) * 2005-12-27 2012-03-06 Polycom, Inc. Cluster of first-order microphones and method of operation for stereo input of videoconferencing system
DE602006001051T2 (de) * 2006-01-09 2009-07-02 Honda Research Institute Europe Gmbh Bestimmung des entsprechenden Messfensters zur Schallquellenortung in Echoumgebungen
WO2007104882A1 (fr) * 2006-03-15 2007-09-20 France Telecom Dispositif et procede de codage par analyse en composante principale d'un signal audio multi-canal
FR2898725A1 (fr) * 2006-03-15 2007-09-21 France Telecom Dispositif et procede de codage gradue d'un signal audio multi-canal selon une analyse en composante principale
US8041041B1 (en) * 2006-05-30 2011-10-18 Anyka (Guangzhou) Microelectronics Technology Co., Ltd. Method and system for providing stereo-channel based multi-channel audio coding
EP1862813A1 (en) * 2006-05-31 2007-12-05 Honda Research Institute Europe GmbH A method for estimating the position of a sound source for online calibration of auditory cue to location transformations
DE102006029717A1 (de) * 2006-06-28 2008-01-03 Siemens Audiologische Technik Gmbh Hörvorrichtung mit orthogonal zueinander angeordneten Spulen
US8229754B1 (en) * 2006-10-23 2012-07-24 Adobe Systems Incorporated Selecting features of displayed audio data across time
US8401210B2 (en) * 2006-12-05 2013-03-19 Apple Inc. System and method for dynamic control of audio playback based on the position of a listener
DE602007009784D1 (de) * 2007-01-16 2010-11-25 Harman Becker Automotive Sys Vorrichtung und Verfahren zum Verfolgen von surround Kopfhörern unter Verwendung von Audiosignalen unterhalb der maskierten Hörschwelle
EP1962559A1 (en) * 2007-02-21 2008-08-27 Harman Becker Automotive Systems GmbH Objective quantification of auditory source width of a loudspeakers-room system
US7792674B2 (en) * 2007-03-30 2010-09-07 Smith Micro Software, Inc. System and method for providing virtual spatial sound with an audio visual player
US8229143B2 (en) * 2007-05-07 2012-07-24 Sunil Bharitkar Stereo expansion with binaural modeling
CN101448186B (zh) * 2007-11-26 2012-07-18 鸿富锦精密工业(深圳)有限公司 扬声器音效自动调整系统及方法
WO2009109217A1 (en) * 2008-03-03 2009-09-11 Nokia Corporation Apparatus for capturing and rendering a plurality of audio channels
US8315366B2 (en) * 2008-07-22 2012-11-20 Shoretel, Inc. Speaker identification and representation for a phone
US8094834B1 (en) * 2008-11-14 2012-01-10 The United States Of America As Represented By The Secretary Of The Air Force Remote auditory spatial communication aid
US8670583B2 (en) 2009-01-22 2014-03-11 Panasonic Corporation Hearing aid system
DE102009014672A1 (de) * 2009-03-27 2010-10-07 Rheinmetall Defence Electronics Gmbh Mikrofonanordnung zur Ortung von Schallquellen
DE102009019405A1 (de) * 2009-04-29 2010-11-18 Atlas Elektronik Gmbh Vorrichtung und Verfahren zur binauralen Wiedergabe von Audio-Sonarsignalen
US8737648B2 (en) * 2009-05-26 2014-05-27 Wei-ge Chen Spatialized audio over headphones
US8140715B2 (en) * 2009-05-28 2012-03-20 Microsoft Corporation Virtual media input device
US8553897B2 (en) * 2009-06-09 2013-10-08 Dean Robert Gary Anderson Method and apparatus for directional acoustic fitting of hearing aids
CN107071688B (zh) * 2009-06-23 2019-08-23 诺基亚技术有限公司 用于处理音频信号的方法及装置
US9101299B2 (en) * 2009-07-23 2015-08-11 Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust Hearing aids configured for directional acoustic fitting
US8879745B2 (en) * 2009-07-23 2014-11-04 Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust Method of deriving individualized gain compensation curves for hearing aid fitting
AU2010305313B2 (en) * 2009-10-07 2015-05-28 The University Of Sydney Reconstruction of a recorded sound field
CA2781702C (en) 2009-11-30 2017-03-28 Nokia Corporation An apparatus for processing audio and speech signals in an audio device
JP2011120028A (ja) * 2009-12-03 2011-06-16 Canon Inc 音声再生装置、及びその制御方法
EP2355559B1 (en) 2010-02-05 2013-06-19 QNX Software Systems Limited Enhanced spatialization system with satellite device
US9107021B2 (en) 2010-04-30 2015-08-11 Microsoft Technology Licensing, Llc Audio spatialization using reflective room model
US9332372B2 (en) 2010-06-07 2016-05-03 International Business Machines Corporation Virtual spatial sound scape
JP5555068B2 (ja) * 2010-06-16 2014-07-23 キヤノン株式会社 再生装置及びその制御方法及びプログラム
US9094496B2 (en) * 2010-06-18 2015-07-28 Avaya Inc. System and method for stereophonic acoustic echo cancellation
JP5376173B2 (ja) * 2010-08-03 2013-12-25 日本電信電話株式会社 放射指向特性推定方法とその装置とプログラム
TW201208335A (en) * 2010-08-10 2012-02-16 Hon Hai Prec Ind Co Ltd Electronic device
US9055382B2 (en) 2011-06-29 2015-06-09 Richard Lane Calibration of headphones to improve accuracy of recorded audio content
ITTO20110890A1 (it) * 2011-10-05 2013-04-06 Inst Rundfunktechnik Gmbh Interpolationsschaltung zum interpolieren eines ersten und zweiten mikrofonsignals.
US8942397B2 (en) 2011-11-16 2015-01-27 Dean Robert Gary Anderson Method and apparatus for adding audible noise with time varying volume to audio devices
WO2013091677A1 (en) * 2011-12-20 2013-06-27 Squarehead Technology As Speech recognition method and system
EP2829050A1 (en) 2012-03-23 2015-01-28 Dolby Laboratories Licensing Corporation Schemes for emphasizing talkers in a 2d or 3d conference scene
GB201211512D0 (en) * 2012-06-28 2012-08-08 Provost Fellows Foundation Scholars And The Other Members Of Board Of The Method and apparatus for generating an audio output comprising spartial information
US9094749B2 (en) 2012-07-25 2015-07-28 Nokia Technologies Oy Head-mounted sound capture device
US9237398B1 (en) 2012-12-11 2016-01-12 Dysonics Corporation Motion tracked binaural sound conversion of legacy recordings
ITTO20130028A1 (it) * 2013-01-11 2014-07-12 Inst Rundfunktechnik Gmbh Mikrofonanordnung mit verbesserter richtcharakteristik
US20140215332A1 (en) * 2013-01-31 2014-07-31 Hewlett-Packard Development Company, Lp Virtual microphone selection corresponding to a set of audio source devices
EP2974384B1 (en) 2013-03-12 2017-08-30 Dolby Laboratories Licensing Corporation Method of rendering one or more captured audio soundfields to a listener
US9681246B2 (en) * 2014-02-28 2017-06-13 Harman International Industries, Incorporated Bionic hearing headset
US10142761B2 (en) 2014-03-06 2018-11-27 Dolby Laboratories Licensing Corporation Structural modeling of the head related impulse response
KR20160020377A (ko) 2014-08-13 2016-02-23 삼성전자주식회사 음향 신호를 생성하고 재생하는 방법 및 장치
CN104393938B (zh) * 2014-11-05 2017-05-03 南京大学科技园发展有限公司 微波感知声音信号的方法与装置
EP3245796B1 (en) 2015-01-16 2019-10-16 Safariland, LLC Dual communications headset controller
US9584938B2 (en) * 2015-01-19 2017-02-28 Sennheiser Electronic Gmbh & Co. Kg Method of determining acoustical characteristics of a room or venue having n sound sources
DE102015201223A1 (de) * 2015-01-26 2016-07-28 Sennheiser Electronic Gmbh & Co. Kg Verfahren zum Betreiben eines Mikrofon-Arrays
EP3079074A1 (fr) * 2015-04-10 2016-10-12 B<>Com Procédé de traitement de données pour l'estimation de paramètres de mixage de signaux audio, procédé de mixage, dispositifs, et programmes d'ordinateurs associés
US20160330563A1 (en) * 2015-05-08 2016-11-10 Htc Corporation Virtual reality audio system and the player thereof, and method for generation of virtual reality audio
GB2540199A (en) * 2015-07-09 2017-01-11 Nokia Technologies Oy An apparatus, method and computer program for providing sound reproduction
JP6592838B2 (ja) * 2015-08-28 2019-10-23 日本電信電話株式会社 バイノーラル信号生成装置、方法及びプログラム
US10397710B2 (en) 2015-12-18 2019-08-27 Cochlear Limited Neutralizing the effect of a medical device location
US10142742B2 (en) 2016-01-01 2018-11-27 Dean Robert Gary Anderson Audio systems, devices, and methods
JP6569945B2 (ja) * 2016-02-10 2019-09-04 日本電信電話株式会社 バイノーラル音生成装置、マイクロホンアレイ、バイノーラル音生成方法、プログラム
US11722821B2 (en) 2016-02-19 2023-08-08 Dolby Laboratories Licensing Corporation Sound capture for mobile devices
WO2017143067A1 (en) 2016-02-19 2017-08-24 Dolby Laboratories Licensing Corporation Sound capture for mobile devices
US9986363B2 (en) 2016-03-03 2018-05-29 Mach 1, Corp. Applications and format for immersive spatial sound
CN107290711A (zh) * 2016-03-30 2017-10-24 芋头科技(杭州)有限公司 一种语音寻向系统及方法
CN106572425A (zh) * 2016-05-05 2017-04-19 王杰 音频处理装置及方法
WO2017191616A1 (es) 2016-05-06 2017-11-09 Universidad De Medellin Dispositivo de captura binaural de sonido
CN112954582A (zh) 2016-06-21 2021-06-11 杜比实验室特许公司 用于预渲染的双耳音频的头部跟踪
US9881647B2 (en) * 2016-06-28 2018-01-30 VideoStitch Inc. Method to align an immersive video and an immersive sound field
JP6634976B2 (ja) * 2016-06-30 2020-01-22 株式会社リコー 情報処理装置、及びプログラム
JP2018026701A (ja) * 2016-08-10 2018-02-15 株式会社カプコン 録音装置、映像音声処理プログラム及びゲーム装置
US10638250B2 (en) * 2016-09-23 2020-04-28 Apple Inc. Systems and methods for determining estimated head orientation and position with ear pieces
US10278003B2 (en) 2016-09-23 2019-04-30 Apple Inc. Coordinated tracking for binaural audio rendering
US10223821B2 (en) 2017-04-25 2019-03-05 Beyond Imagination Inc. Multi-user and multi-surrogate virtual encounters
US10516962B2 (en) 2017-07-06 2019-12-24 Huddly As Multi-channel binaural recording and dynamic playback
JP6841743B2 (ja) 2017-09-29 2021-03-10 Kddi株式会社 音響信号のミキシング装置及びプログラム
EP3695623A1 (en) * 2017-10-11 2020-08-19 Wai-Shan Lam System and method for creating crosstalk canceled zones in audio playback
US10250973B1 (en) * 2017-11-06 2019-04-02 Bose Corporation Intelligent conversation control in wearable audio systems
US10567888B2 (en) * 2018-02-08 2020-02-18 Nuance Hearing Ltd. Directional hearing aid
US10419853B2 (en) 2018-02-21 2019-09-17 Apple Inc. Binaural audio capture using untethered wireless headset
US20190324117A1 (en) * 2018-04-24 2019-10-24 Mediatek Inc. Content aware audio source localization
US10771913B2 (en) 2018-05-11 2020-09-08 Dts, Inc. Determining sound locations in multi-channel audio
US10477338B1 (en) * 2018-06-11 2019-11-12 Here Global B.V. Method, apparatus and computer program product for spatial auditory cues
DE102019107302A1 (de) * 2018-08-16 2020-02-20 Rheinisch-Westfälische Technische Hochschule (Rwth) Aachen Verfahren zum Erzeugen und Wiedergeben einer binauralen Aufnahme
US10805729B2 (en) * 2018-10-11 2020-10-13 Wai-Shan Lam System and method for creating crosstalk canceled zones in audio playback
CA3146517A1 (en) 2019-07-21 2021-01-28 Nuance Hearing Ltd. Speech-tracking listening device
US11659332B2 (en) 2019-07-30 2023-05-23 Dolby Laboratories Licensing Corporation Estimating user location in a system including smart audio devices
US11968268B2 (en) 2019-07-30 2024-04-23 Dolby Laboratories Licensing Corporation Coordination of audio devices
US11638111B2 (en) * 2019-11-01 2023-04-25 Meta Platforms Technologies, Llc Systems and methods for classifying beamformed signals for binaural audio playback
US11089428B2 (en) 2019-12-13 2021-08-10 Qualcomm Incorporated Selecting audio streams based on motion
WO2021194487A1 (en) * 2020-03-25 2021-09-30 Hewlett-Packard Development Company, L.P. Head-related transfer functions with antropometric measurements
US11743670B2 (en) 2020-12-18 2023-08-29 Qualcomm Incorporated Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications
US11774540B2 (en) * 2021-04-09 2023-10-03 LouStat Technologies, LLC Systems and methods for enhancing location of game in the field

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5230402A (en) * 1975-09-04 1977-03-08 Victor Co Of Japan Ltd Multichannel stereo system
US4388494A (en) * 1980-01-12 1983-06-14 Schoene Peter Process and apparatus for improved dummy head stereophonic reproduction
US4817149A (en) * 1987-01-22 1989-03-28 American Natural Sound Company Three-dimensional auditory display apparatus and method utilizing enhanced bionic emulation of human binaural sound localization
US4893342A (en) * 1987-10-15 1990-01-09 Cooper Duane H Head diffraction compensated stereo system
US5796843A (en) * 1994-02-14 1998-08-18 Sony Corporation Video signal and audio signal reproducing apparatus
US5570324A (en) * 1995-09-06 1996-10-29 Northrop Grumman Corporation Underwater sound localization system
AUPO099696A0 (en) * 1996-07-12 1996-08-08 Lake Dsp Pty Limited Methods and apparatus for processing spatialised audio
US6021206A (en) * 1996-10-02 2000-02-01 Lake Dsp Pty Ltd Methods and apparatus for processing spatialised audio
AUPO316096A0 (en) * 1996-10-23 1996-11-14 Lake Dsp Pty Limited Head tracking with limited angle output
US6243476B1 (en) * 1997-06-18 2001-06-05 Massachusetts Institute Of Technology Method and apparatus for producing binaural audio for a moving listener
US6084973A (en) * 1997-12-22 2000-07-04 Audio Technica U.S., Inc. Digital and analog directional microphone
JP3657120B2 (ja) * 1998-07-30 2005-06-08 株式会社アーニス・サウンド・テクノロジーズ 左,右両耳用のオーディオ信号を音像定位させるための処理方法
US6845163B1 (en) * 1999-12-21 2005-01-18 At&T Corp Microphone array for preserving soundfield perceptual cues
US7340062B2 (en) * 2000-03-14 2008-03-04 Revit Lawrence J Sound reproduction method and apparatus for assessing real-world performance of hearing and hearing aids
GB2374506B (en) * 2001-01-29 2004-11-17 Hewlett Packard Co Audio user interface with cylindrical audio field organisation
US6961439B2 (en) * 2001-09-26 2005-11-01 The United States Of America As Represented By The Secretary Of The Navy Method and apparatus for producing spatialized audio signals
JP4867121B2 (ja) * 2001-09-28 2012-02-01 ソニー株式会社 音声信号処理方法および音声再生システム

Also Published As

Publication number Publication date
CA2502585A1 (en) 2004-05-06
AU2003273363A1 (en) 2004-05-13
KR20050056241A (ko) 2005-06-14
US7333622B2 (en) 2008-02-19
EP1554910A4 (en) 2008-06-18
WO2004039123A1 (en) 2004-05-06
JP2006503526A (ja) 2006-01-26
US20040076301A1 (en) 2004-04-22
EP1554910A1 (en) 2005-07-20

Similar Documents

Publication Publication Date Title
US7333622B2 (en) Dynamic binaural sound capture and reproduction
US20080056517A1 (en) Dynamic binaural sound capture and reproduction in focued or frontal applications
US20070009120A1 (en) Dynamic binaural sound capture and reproduction in focused or frontal applications
Algazi et al. Headphone-based spatial sound
Kyriakakis Fundamental and technological limitations of immersive audio systems
Hacihabiboglu et al. Perceptual spatial audio recording, simulation, and rendering: An overview of spatial-audio techniques based on psychoacoustics
US8437485B2 (en) Method and device for improved sound field rendering accuracy within a preferred listening area
Theile et al. Wave field synthesis: A promising spatial audio rendering concept
US11750995B2 (en) Method and apparatus for processing a stereo signal
KR20170106063A (ko) 오디오 신호 처리 방법 및 장치
US20130243201A1 (en) Efficient control of sound field rotation in binaural spatial sound
US20190246230A1 (en) Virtual localization of sound
Malham Toward reality equivalence in spatial sound diffusion
Pelzer et al. 3D reproduction of room auralizations by combining intensity panning, crosstalk cancellation and Ambisonics
Naoe et al. Performance evaluation of 3D sound field reproduction system using a few loudspeakers and wave field synthesis
Kang et al. Realistic audio teleconferencing using binaural and auralization techniques
Omoto et al. Hypotheses for constructing a precise, straightforward, robust and versatile sound field reproduction system
GB2369976A (en) A method of synthesising an averaged diffuse-field head-related transfer function
Ranjan 3D audio reproduction: natural augmented reality headset and next generation entertainment system using wave field synthesis
Kapralos Auditory perception and virtual environments
Sontacchi et al. Audio interface for immersive 3D-audio desktop applications
Strauß et al. A spatial audio interface for desktop applications
Lee et al. Reduction of sound localization error for non-individualized HRTF by directional weighting function
Yao Influence of Loudspeaker Configurations and Orientations on Sound Localization
AU2002325063B2 (en) Recording a three dimensional auditory scene and reproducing it for the individual listener

Legal Events

Date Code Title Description
FA Abandonment or withdrawal