ES2359511T3 - Aparato y procedimiento para conformación de haz acústico. - Google Patents

Aparato y procedimiento para conformación de haz acústico. Download PDF

Info

Publication number
ES2359511T3
ES2359511T3 ES06765985T ES06765985T ES2359511T3 ES 2359511 T3 ES2359511 T3 ES 2359511T3 ES 06765985 T ES06765985 T ES 06765985T ES 06765985 T ES06765985 T ES 06765985T ES 2359511 T3 ES2359511 T3 ES 2359511T3
Authority
ES
Spain
Prior art keywords
signal
beam shaping
update
input signal
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES06765985T
Other languages
English (en)
Inventor
Ivo L. D. M. Merks
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Application granted granted Critical
Publication of ES2359511T3 publication Critical patent/ES2359511T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/18Methods or devices for transmitting, conducting or directing sound
    • G10K11/26Sound-focusing or directing, e.g. scanning
    • G10K11/34Sound-focusing or directing, e.g. scanning using electrical steering of transducer arrays, e.g. beam steering
    • G10K11/341Circuits therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

Aparato para conformación de haz acústico, comprendiendo el aparato medios (101) para generar una primera señal de entrada a partir de una primera entrada de audio; medios (103) para generar una segunda señal de entrada a partir de una segunda entrada de audio; medios (105) de conformación de haz que comprenden un filtro de conformación de haz para filtrar la primera y segunda señal de entrada para generar una señal con conformación de haz combinada; medios (107) de actualización para actualizar el filtro de conformación de haz si se cumple un criterio de actualización; un filtro (111) adaptativo para filtrar la primera señal de entrada para generar una primera señal filtrada; medios (113) para generar una señal de diferencia para la segunda señal de entrada y la primera señal filtrada; medios (115) para adaptar el filtro adaptativo para minimizar la señal de diferencia; y medios (109) de modificación para modificar el criterio de actualización en respuesta a la señal de diferencia.

Description

La invención se refiere a un aparato y procedimiento para conformación de haz acústico y, en particular, aunque no exclusivamente, para conformación de haz para fuentes de voz.
La conversión de audio en señales eléctricas en un proceso importante que se usa en la actualidad en numerosas aplicaciones y para muchos fines distintos. Por ejemplo, la conversión de señales de audio en señales muestreadas y digitalizadas ha pasado a ser la base para un gran número de servicios y aplicaciones de comunicación. Por ejemplo, comunicación de voz soportada por sistemas de comunicación tales como los sistemas de telefonía fija tradicionales, los sistemas de comunicación celulares o redes basadas en paquetes (por ejemplo Internet) han pasado a ser una parte esencial de la prestación de servicios de comunicación en la mayoría de los países.
Para lograr una alta calidad del servicio de comunicación, es esencial conseguir una conversión de la señal deseada con una relación señal a ruido elevada. Sin embargo, cada vez más se usan terminales de comunicación en entornos difíciles y en condiciones desafiantes. Por ejemplo, la creciente popularidad de las comunicaciones móviles ha dado como resultado un enorme aumento de conversaciones telefónicas que tienen lugar en ambientes ruidosos y rápidamente cambiantes. Como ejemplo típico, con frecuencia pueden realizarse llamadas de voz por móvil usando la operación de manos libres durante la conducción.
Está claro que en tales ambientes la generación de una señal convertida de alta calidad para la señal de voz deseada en lugar del ruido de fondo es una tarea que supone un desafío. Un enfoque que se ha propuesto es usar una pluralidad de micrófonos y procesar la pluralidad de señales para generar una conformación de haz acústico hacia la fuente de audio deseada. Tal conformación de haz puede aumentar efectivamente la relación señal a ruido deseada ya que la señal deseada puede amplificarse mientras que el ruido de fondo de otras fuentes y direcciones puede reducirse.
Se han propuesto diversos procedimientos y algoritmos para conformación de haz acústico. Sin embargo, un problema con el que se enfrentan estos algoritmos es cómo proporcionar un seguimiento preciso de una fuente de audio al tiempo que se garantiza que sólo se sigue la fuente de audio deseada.
Específicamente, dado que una fuente de audio puede moverse con respecto a los micrófonos, el algoritmo de conformación de haz acústico debe seguir tales movimientos para garantizar un rendimiento óptimo. Sin embargo, puesto que puede haber fuentes de ruido que interfieran, es importante que la adaptación del filtro de conformación de haz sólo siga la fuente de audio deseada y es deseable reducir el riesgo de que el algoritmo de conformación de haz se acople a una fuente de ruido fuerte. Este problema supone un desafío incluso mayor para fuentes de audio no continuas, tales como la voz humana, ya que el algoritmo de conformación de haz debe seguir las fuentes de voz deseadas en lugar de las fuentes interferentes incluso cuando la fuente de voz deseada está en silencio.
Un enfoque a este problema es restringir las actualizaciones a variaciones pequeñas y lentas y descargar variaciones grandes y bruscas. Específicamente, el algoritmo de conformación de haz puede comprender un criterio que permita actualizar las características de conformación de haz sólo si está presente una señal en haz significativa. Por tanto, puede evitarse la actualización si no están presentes señales en haz ya que se supone que cualquier fuente de audio fuera del haz son fuentes de ruido. Sin embargo, un enfoque de este tipo tiene varias desventajas y específicamente limita la capacidad del algoritmo de conformación de haz de seguir movimientos grandes o bruscos de la fuente de audio deseada y/o acoplarse a una nueva fuente de audio. Además, el diseño de un detector robusto para detectar de manera fiable audio en haz es difícil y tiende a ser un problema importante para la aplicación práctica de los conformadores de haz acústico adaptativos.
Algunos ejemplos prácticos de conformadores de haz acústico adaptativos se dan a conocer en el documento EP 1 475 997 A2 y en el documento EP 1 116 961 A2.
Por tanto, supondría una ventaja un sistema para conformación de haz acústico mejorado y, en particular, supondría una ventaja un sistema que permita un equilibrio mejorado entre el rendimiento de adquisición y de seguimiento, una precisión mejorada de la conformación de haz, una adaptación mejorada a variaciones grandes y/o bruscas para la fuente de audio deseada, un rendimiento de adquisición mejorado, una detección en haz mejorada, una implementación facilitada, un rendimiento de seguimiento mejorado y/o un rendimiento mejorado de la conformación de haz.
Por consiguiente, la invención trata preferiblemente de mitigar, paliar o eliminar una o más de las desventajas anteriormente mencionadas individualmente o en cualquier combinación.
Según un primer aspecto de la invención se proporciona un aparato para conformación de haz acústico, comprendiendo el aparato: medios para generar una primera señal de entrada a partir de una primera entrada de audio; medios para generar una segunda señal de entrada a partir de una segunda entrada de audio; medios de conformación de haz que comprenden un filtro de conformación de haz para filtrar la primera y segunda señal de entrada para generar una señal con conformación de haz combinada; medios de actualización para actualizar el filtro de conformación de haz si se cumple un criterio de actualización; un filtro adaptativo para filtrar la primera señal de entrada para generar una primera señal filtrada; medios para generar una señal de diferencia para la segunda señal de entrada y la primera señal filtrada; medios para adaptar el filtro adaptativo para minimizar la señal de diferencia; y medios de modificación para modificar el criterio de actualización en respuesta a la señal de diferencia normalizada.
La invención puede permitir una conformación de haz acústico mejorada. En particular, la invención puede permitir una adaptación mejorada a una nueva fuente de audio y/o a una fuente de audio con una ubicación que cambia sustancialmente y/o bruscamente. La invención puede permitir un algoritmo de conformación de haz con el que puede conseguirse un rendimiento de seguimiento y de adquisición eficaz. Puede conseguirse una implementación eficaz y/o de reducida complejidad.
La señal con conformación de haz combinada puede corresponder específicamente a una señal de voz. Los medios de conformación de haz pueden comprender un primer filtro adaptativo para filtrar la primera señal de entrada, un segundo filtro adaptativo para filtrar la segunda señal de entrada y medios de combinación para generar la señal con conformación de haz combinada combinando (por ejemplo sumando) las señales filtradas resultantes. La señal de diferencia puede ser, posiblemente, una señal de diferencia normalizada.
Según una característica opcional de la invención, los medios de conformación de haz están dispuestos para generar una señal de referencia de ruido para al menos una de la primera señal de entrada y la segunda señal de entrada con respecto a la señal con conformación de haz combinada.
Esto puede permitir un rendimiento mejorado e información adicional para controlar el funcionamiento del aparato. La señal de referencia de ruido puede generarse, por ejemplo, restando una componente correspondiente a la señal deseada de la primera y/o segunda señal de entrada. Por ejemplo, la señal de referencia de ruido puede ser una indicación de una diferencia entre la primera señal de entrada y/o la segunda señal de entrada y una señal correspondiente a una señal con conformación de haz combinada filtrada inversa en el tiempo, donde el filtrado inverso en el tiempo corresponde al filtrado de los medios de conformación de haz.
Según una característica opcional de la invención, el criterio de actualización comprende un criterio según el cual una medida de potencia de la señal con conformación de haz es superior a un umbral determinado en respuesta a la señal de referencia de ruido.
Esto puede permitir un control eficaz y práctico de la actualización de la señal con conformación de haz y proporciona un criterio de actualización que puede variarse de manera eficaz y práctica por los medios de modificación.
Según una característica opcional de la invención, los medios de modificación están dispuestos para modificar el umbral en respuesta a la señal de diferencia.
Esto puede permitir un control eficaz y práctico de la actualización para la señal con conformación de haz y proporciona un criterio de actualización que puede variarse de manera eficaz y práctica por los medios de modificación. Los medios de modificación pueden modificar, específicamente, el umbral para relajar el criterio de actualización cuando la amplitud de la señal de diferencia se reduce. Por ejemplo, el umbral puede reducirse si la señal de diferencia está por debajo de un valor dado.
Según una característica opcional de la invención, el criterio de actualización comprende un criterio según el cual una medida de potencia de la primera señal de entrada es superior a un umbral determinado en respuesta a la segunda señal de entrada.
Esto puede mejorar la operación de conformación de haz y en particular puede permitir un rendimiento de adaptación mejorado.
Según una característica opcional de la invención, los medios de modificación están dispuestos para modificar el umbral en respuesta a la señal de diferencia.
Esto puede permitir un control eficaz y práctico de la actualización para la señal con conformación de haz y proporciona un criterio de actualización que puede variarse de manera eficaz y práctica por los medios de modificación. Los medios de modificación pueden reducir, específicamente, el umbral para reducir la amplitud de las señales de diferencia. Por ejemplo, el umbral puede reducirse si la señal de diferencia está por debajo de un valor dado.
Según una característica opcional de la invención, los medios de modificación están dispuestos para relajar el criterio de actualización si la señal de diferencia está por debajo de un umbral.
Esto puede permitir un rendimiento mejorado del aparato de conformación de haz y puede permitir una adquisición mejorada de fuentes de audio nuevas o que se mueven de manera significativa. El criterio de actualización se relaja permitiendo un mayor número de combinaciones de parámetros para actualizar los medios de conformación de haz.
Según una característica opcional de la invención, el umbral se determina en respuesta a una señal de referencia de ruido para al menos una de la primera señal de entrada y la segunda señal de entrada con respecto a la señal con conformación de haz combinada.
Esto puede permitir un rendimiento mejorado del aparato de conformación de haz y puede permitir, específicamente, un equilibrio mejorado y que varía de manera dinámica entre el rendimiento de adquisición y de seguimiento.
Según una característica opcional de la invención, el umbral se determina en respuesta a la primera señal de entrada.
Esto puede permitir un rendimiento mejorado del aparato de conformación de haz y puede permitir, específicamente, un equilibrio mejorado y que varía de manera dinámica entre el rendimiento de adquisición y de seguimiento.
Según una característica opcional de la invención, el aparato comprende además medios para determinar una indicación de fiabilidad de la señal con conformación de haz combinada y los medios para modificar están dispuestos para modificar el criterio de actualización en respuesta a la indicación de fiabilidad.
Esto puede permitir un funcionamiento mejorado y más flexible. Por ejemplo, el aparato puede hacerse funcionar para operar en un modo de seguimiento y en un modo de adquisición y puede comprender medios para conmutar entre estos modos en respuesta a la indicación de fiabilidad. Los medios de modificación pueden disponerse para modificar el criterio de actualización en el modo de adquisición pero no en el modo de seguimiento. La indicación de fiabilidad puede indicar la probabilidad de que la conformación de haz genere un haz acústico que comprenda la fuente de audio deseada.
Según una característica opcional de la invención, los medios de modificación están dispuestos para sólo modificar el criterio de actualización si la indicación de fiabilidad está por debajo de un umbral.
Esto puede permitir un rendimiento mejorado del aparato de conformación de haz y puede permitir, específicamente, un equilibrio mejorado y que varía de manera dinámica entre el rendimiento de adquisición y de seguimiento.
Según un segundo aspecto de la invención, se proporciona una unidad de comunicación para un sistema de comunicación que comprende: medios para generar una primera señal de entrada a partir de una primera entrada de audio; medios para generar una segunda señal de entrada a partir de una segunda entrada de audio; medios de conformación de haz que comprende un filtro de conformación de haz para filtrar la primera y segunda señal de entrada para generar una señal con conformación de haz combinada; medios de actualización para actualizar el filtro de conformación de haz si se cumple un criterio de actualización; un filtro adaptativo para filtrar la primera señal de entrada para generar una primera señal filtrada; medios para generar una señal de diferencia para la segunda señal de entrada y la primera señal filtrada; medios para adaptar el filtro adaptativo para minimizar la señal de diferencia; y medios de modificación para modificar el criterio de actualización en respuesta a la señal de diferencia.
Según un tercer aspecto de la invención, se proporciona un procedimiento de conformación de haz acústico, comprendiendo el procedimiento: generar una primera señal de entrada a partir de una primera entrada de audio; generar una segunda señal de entrada a partir de una segunda entrada de audio; filtrar, un filtro de conformación de haz, la primera y segunda señal de entrada para generar una señal con conformación de haz combinada; actualizar el filtro de conformación de haz si se cumple un criterio de actualización; filtrar, un filtro adaptativo, la primera señal de entrada para generar una primera señal filtrada; generar una señal de diferencia para la segunda señal de entrada y la primera señal filtrada; adaptar el filtro adaptativo para minimizar la señal de diferencia; y modificar el criterio de actualización en respuesta a la señal de diferencia.
Estos y otros aspectos, características y ventajas de la invención resultarán evidentes y se dilucidarán a partir de y con referencia a la(s) realización(es) descritas a continuación en el presente documento.
Se describirán realizaciones de la invención, a modo de ejemplo únicamente, con referencia a los dibujos, en los que
la figura 1 ilustra un aparato de conformación de haz acústico según algunas realizaciones de la invención;
la figura 2 ilustra un ejemplo de un teléfono móvil que comprende medios para conformación de haz acústico según algunas realizaciones de la invención;
la figura 3 ilustra un diagrama de bloques para un ejemplo de una topología para generar señales usada en un aparato de conformación de haz acústico según algunas realizaciones de la invención; y
la figura 4 ilustra un procedimiento de conformación de haz acústico según algunas realizaciones de la invención.
La siguiente descripción se centra en realizaciones de la invención aplicables a señales de voz para una unidad de comunicación para un sistema de comunicación celular (tal como un teléfono móvil para un sistema global para comunicaciones móviles (GSM)). Sin embargo, se apreciará que la invención no está limitada a esta aplicación, sino que puede aplicarse a otros muchos dispositivos y aparatos incluyendo por ejemplo auriculares para manos libres.
La figura 1 ilustra un aparato de conformación de haz acústico según algunas realizaciones de la invención.
El aparato comprende un primer y un segundo elemento 101, 103 de entrada. En el ejemplo específico, cada uno de los elementos 101, 103 de entrada comprende un micrófono así como funcionalidad para muestrear y digitalizar la señal para generar una primera y segunda señal en forma de flujos de bits de valores digitales.
Los elementos de entrada primero y segundo están acoplados a un procesador 105 de conformación de haz que está dispuesto para generar una señal z con conformación de haz combinada. Específicamente, el procesador 105 de conformación de haz comprende un filtro de conformación de haz que filtra la primera y/o la segunda señal de entrada y las combina para generar una señal combinada correspondiente a un haz acústico dirigido hacia una fuente de audio deseada.
La señal z con conformación de haz puede procesarse entonces adicionalmente según sea necesario para la aplicación individual. Para el ejemplo específico de una unidad de comunicación celular, la señal z con conformación de haz puede alimentarse a un codificador de voz para codificación de voz y posterior transmisión a través de la interfaz aérea a una estación base, o antes de alimentarse al codificador de voz puede procesarse por un postprocesador espectral para una reducción de ruido adicional
A medida que la fuente de audio deseada se mueve, el filtrado del procesador 105 de conformación de haz se adapta de modo que el haz acústico resultante siga a la fuente de audio deseada. Con este fin, el aparato de conformación de haz comprende un procesador 107 de actualización que está acoplado al procesador 105 de conformación de haz.
El procesador 107 de actualización puede usar cualquier algoritmo adecuado para actualizar el filtrado del procesador 105 de conformación de haz y específicamente puede usar técnicas de optimización de filtrado adaptativo convencionales tal como se conocen ampliamente en la técnica, por ejemplo a partir de los aparatos de conformación de haz o aplicaciones similares tales como cancelación de ecos.
El procesador 107 de actualización está acoplado a un procesador 109 de criterio que evalúa un criterio de actualización. Si el criterio de actualización se cumple, el procesador 109 de criterio genera una señal de control para el procesador 107 de actualización que indica que el procesador 107 de actualización puede actualizar el procesador 105 de conformación de haz. Sin embargo, si el criterio de actualización no se cumple, el procesador 109 de criterio genera una señal de control para el procesador 107 de actualización que indica que el procesador 107 de actualización no puede actualizar el procesador 105 de conformación de haz.
El criterio de actualización puede ser normalmente una evaluación de la probabilidad de que la señal actual usada para actualizar el procesador 105 de conformación de haz sea de hecho la señal deseada. Específicamente, el procesador 107 de actualización puede actualizar el procesador 105 de conformación de haz en respuesta a la señal en haz (es decir suponiendo que la señal en el haz principal es de hecho la señal deseada). Por consiguiente, el procesador 109 de criterio puede evaluar un criterio que sea indicativo de si el procesador 105 de conformación de haz está siguiendo actualmente una fuente de audio activa.
El procesador 109 de criterio puede evitar efectivamente que el procesador 105 de conformación de haz se actualice a una fuente de voz no deseada (potencialmente fuerte) que se encuentra fuera del haz acústico. Puede proporcionar por tanto una fiabilidad mejorada y reducir la probabilidad de que el haz se dirija erróneamente a una fuente de voz no deseada, por ejemplo durante una pausa en el audio de la fuente principal. Sin embargo, este enfoque también puede reducir la capacidad del aparato de conformación de haz de formar un nuevo haz hacia una fuente de audio fuera del haz principal. Por tanto, el aparato de conformación de haz no sólo puede tener un rendimiento de adquisición reducido para nuevas fuentes de audio, sino que también puede perder una fuente de audio existente si ésta se mueve de pronto fuera del haz acústico.
El aparato de conformación de haz de la figura 1 comprende una funcionalidad que puede mitigar este problema.
El aparato de conformación de haz comprende un filtro 111 adaptativo que está acoplado al segundo elemento 103 de entrada. El filtro 111 adaptativo está además acoplado a un procesador 113 de diferencia que está además acoplado al primer elemento 111 de entrada. Por tanto, el procesador 113 de diferencia recibe una señal para el primer micrófono así como una señal filtrada para la segunda señal de entrada. El procesador 113 de diferencia puede generar específicamente la señal de diferencia como la diferencia directa entre estas señales, aunque se apreciará que en algunas realizaciones, las señales de entrada pueden procesarse adicionalmente (por ejemplo filtrarse) antes de determinarse una señal de diferencia.
El procesador 113 de diferencia está acoplado a un procesador 115 de adaptación que está dispuesto para adaptar el filtro adaptativo para minimizar la señal de diferencia. Por tanto, el procesador 115 de adaptación ajusta el filtro 111 adaptativo de manera que la diferencia entre la salida filtrada y la señal de entrada del otro micrófono se minimice. De esta manera, el filtro adaptativo puede adaptarse para compensar diferencias en los canales acústicos de una fuente de audio dominante respecto a los dos micrófonos. De hecho, en el caso idealizado y para una única fuente de audio, el filtro 111 adaptativo puede adaptarse de manera que la señal de diferencia sea sustancialmente cero. Además, otras fuentes de audio y en particular fuentes de ruido e interferencia pueden dar como resultado una señal de interferencia de potencia creciente.
Por tanto, la señal de diferencia, posiblemente normalizada, proporciona una indicación de si los micrófonos están actualmente captando una señal de una fuente de audio fuerte. Normalmente, una situación de este tipo puede producirse si por ejemplo un hablante está situado cerca de los micrófonos. Por ejemplo, si el aparato de conformación de haz forma parte de un teléfono móvil, la señal de diferencia, posiblemente normalizada, puede ser una buena indicación de si un usuario está actualmente hablando al micrófono desde una distancia cercana o si el audio actual es principalmente ruido de fondo.
En el ejemplo de la figura 1, el procesador 113 de diferencia está acoplado al procesador 109 de criterio y alimenta la señal de diferencia al procesador 109 de criterio. El procesador 109 de criterio está dispuesto para modificar el criterio de actualización en respuesta a la señal de diferencia.
Específicamente, el procesador 109 de criterio puede estar dispuesto para relajar el criterio de actualización si la señal de diferencia es muy próxima a cero, lo que indica que está presente una fuente de audio fuerte y cercana.
Por ejemplo, durante el funcionamiento normal, el procesador 109 de criterio puede ignorar la señal de diferencia y usar un criterio predeterminado para determinar si el procesador 105 de conformación de haz puede actualizarse. Sin embargo, si la señal de audio actual se pierde, por ejemplo porque un usuario cambia rápidamente de ubicación con respecto al aparato (por ejemplo el usuario de un teléfono móvil puede cambiar de un oído al otro), el procesador 109 de criterio puede entrar en un modo de adquisición en el que el criterio de actualización se controla en respuesta a la señal de diferencia.
Si la señal de diferencia es suficientemente baja, el procesador 109 de criterio puede controlar el procesador 107 de actualización de manera que se realice una actualización del procesador 105 de conformación de haz, mientras que si la señal de diferencia no es suficientemente baja, el procesador 109 de criterio puede evitar tal actualización.
Por tanto, modificando el criterio de actualización en respuesta a la señal de diferencia en lugar de meramente usando un criterio de actualización constante, puede lograrse un rendimiento de adquisición mejorado al tiempo que se mantiene un seguimiento eficaz.
Como ejemplo específico, si la señal con conformación de haz combinada generada por el procesador 105 de conformación de haz ha sido de amplitud baja durante un periodo de tiempo relativamente largo, esto puede ser, por ejemplo, porque la fuente de voz ha estado en silencio durante esa duración o porque la fuente de voz se ha movido con respecto a los micrófonos de manera que la fuente de voz está actualmente fuera del haz principal.
En este caso, el procesador 109 de criterio puede evitar la actualización si la señal de diferencia es suficientemente alta, indicando de ese modo que no se recibe ninguna fuente de audio dominante en los micrófonos. Puesto que esta situación lo más probable es que suceda si el hablante ha permanecido en silencio durante una larga duración, este enfoque puede permitir que el haz se mantenga en la misma ubicación permitiendo así capturar la señal de manera eficaz cuando el usuario comienza a hablar otra vez.
Sin embargo, si la señal de diferencia es suficientemente alta, indicando de ese modo que está presente una fuente de audio dominante pero fuera del haz principal, el procesador 109 de criterio puede permitir la actualización del procesador 105 de conformación de haz. Puesto que esta situación lo más probable es que suceda si el hablante se ha movido con respecto a los micrófonos, este enfoque puede permitir mover el haz a la nueva ubicación.
A continuación se describirá una descripción más detallada de una realización a modo de ejemplo usando un algoritmo de conformación de haz específico. En particular, se describirán realizaciones que usan el algoritmo de conformación de haz conocido como algoritmo Noise Void.
La figura 2 ilustra un ejemplo de un teléfono móvil que comprende medios para conformación de haz acústico según algunas realizaciones de la invención.
El teléfono móvil de la figura 2 comprende dos micrófonos 201, 203. Los micrófonos 201, 203 están acoplados a convertidores 205, 207 analógico a digital primero y segundo que muestrean y digitalizan las señales procedentes de los micrófonos 201, 203 para generar una primera y una segunda señal u1, u2 de entrada. El algoritmo Noise Void se implementa mediante un conformador 209 de haz y un postprocesador 211. El conformador 209 de haz es el conformador de haz de filtrado-suma (FSB) según se describe, por ejemplo, en la patente europea n.º: EP0954850-B: “Audio Processing disposition with multiple sources” (Disposición de procesamiento de audio con múltiples fuentes). El postprocesador 211 es el supresor dinámico de ruido no estacionario (DNNS) según se describe en la solicitud de patente conforme al Tratado de Cooperación en materia de Patentes n.º WO0358607: “Audio Enhancement system having a spectral power dependent processor” (Sistema de mejora de audio con un procesador dependiente de la potencia espectral).
Más específicamente, el FSB 209 filtra las señales u1 y u2 de micrófono con filtros f1 y f2 y estas señales filtradas se suman para dar la salida z del FSB.
En el dominio de la frecuencia, la salida z(k,l) del FSB viene dada por :
imagen1
donde F1 y F2 son la respuesta en frecuencia del filtro de conformación de haz y l indica un bloque de FFT.
Los filtros se actualizan de tal manera que la salida z(k,l) se maximiza mientras los pesos de los filtros se limitan, de manera que
imagen1
Los filtros pueden actualizarse específicamente tal como se conoce ampliamente para los filtros adaptativos en el campo del filtrado de señales acústicas.
Además de la señal con conformación de haz, el FSB 209 también produce dos señales de referencia, que son el complemento de la señal con conformación de haz. Específicamente, las referencias intentan minimizar la voz deseada y por tanto pueden considerarse señales de referencia de ruido ya que son indicativas de la presencia de otras componentes de señal de audio aparte de la fuente de audio deseada captada por los micrófonos 201, 203.
Las señales de referencia pueden calcularse como
imagen1
y
imagen1
donde ∆N(k) es un retardo de N muestras para compensar el retardo en los filtros. En el ejemplo específico sólo se usa la segunda señal de referencia de ruido. Esta señal puede expresarse como:
imagen1
que puede reescribirse como:
imagen1
Se apreciará que las señales de referencia de ruido x1 y x2 son indicativas de la magnitud de las fuentes de audio captadas por relativamente el primer y el segundo micrófono 201, 203 que no son de la fuente deseada.
Por ejemplo, suponiendo que sólo existe una única fuente de audio deseada y que está representada por las señales u1 y u2 de micrófono. En este caso, u1 y u2 se originan de la misma única fuente pero pueden haber estado sujetas a diferentes canales acústicos desde la única fuente hasta los micrófonos 201, 203. El funcionamiento y la conformación de haz tienen lugar de manera que los filtros f1 y f2 compensan estos diferentes canales acústicos de manera que se recibe una señal z combinada directamente correspondiente a la señal procedente de la señal de audio.
Filtrando la señal z combinada con el filtro inverso en el tiempo F1* del filtro f1, se genera una señal que, en este caso ideal, es sustancialmente idéntica a la generada por el primer micrófono 201. En otras palabras, f1 se adapta para tener la respuesta del filtro inverso de tiempo del canal acústico procedente de la fuente de audio hasta el primer micrófono 201 y así el filtro inverso en el tiempo de f1 corresponde inherentemente a la función de transferencia del canal acústico procedente de la fuente de audio hasta el primer micrófono 201. Puesto que z corresponde a la señal de audio original procedente de la fuente de audio, la salida del filtro inverso en el tiempo F1* será idéntica, en el caso ideal, a u1 y x1 será cero.
Sin embargo, para otras fuentes de audio, el filtro inverso en el tiempo F1* no corresponderá al canal acústico al que están sujetas y por consiguiente contribuirán con componentes de señal a x1. Además, en la práctica f1 no coincidirá exactamente con la respuesta de canal acústico, o bien debido a imprecisiones de estimación de canal (adaptación no ideal del filtro) o bien debido a imprecisiones de implementación, y esta desviación también introducirá componentes de señal a la señal de referencia x1.
Los principios anteriores se aplican del mismo modo a x2 y por tanto se apreciará que x1 y x2 son señales de referencia de ruido que son indicativas del ruido presente en la señal z con conformación de haz combinada.
En un sistema como el que se ha descrito, es deseable actualizar los filtros sólo cuando la señal acústica recibida sea principalmente la voz de la fuente deseada. Esto mejora el rendimiento de seguimiento y reduce el riesgo de falsos acoplamientos mediante la formación de nuevos haces a fuentes de audio no deseables. Por consiguiente, se desea un detector que puede detectar la presencia de voz deseada para el teléfono móvil descrito. Desafortunadamente, el diseño de un detector robusto no es sencillo y esto es un problema importante para la aplicación de conformadores de haz adaptativos en productos prácticos.
En el ejemplo, el teléfono móvil comprende funcionalidad para limitar la actualización del FSB 209 a cuando se encuentre hablando el hablante deseado. Esta detección del hablante deseado también se denomina detección en haz y detecta si el hablante deseado está en el haz (principal) del conformador de haz. Por tanto, el postprocesador 211 puede evaluar un criterio de actualización y el FSB 209 sólo se actualiza cuando se cumple este criterio.
En el ejemplo específico, la detección en haz se realiza en el postprocesador 211 mediante la salida z del FSB 209 que se compara con la señal de referencia x2. Específicamente, el criterio de actualización comprende un criterio según el cual una medida de potencia de la señal con conformación de haz es superior a un umbral determinado en respuesta a la señal de referencia de ruido. En más detalle, el postprocesador 211 requiere que Pz > WbUmbralPx2, donde Pz es la potencia en la señal z con conformación de haz combinada, Px2 es la potencia de la señal de referencia de ruido x2 y Wbumbral es un parámetro fijo. Wbumbral depende de la aplicación específica y del rendimiento requerido, aunque normalmente pueden establecerse valores entre dos y tres.
Además, el criterio de actualización comprende un criterio según el cual una medida de potencia de la primera señal de entrada es superior a un umbral determinado en respuesta a la segunda señal de entrada. Esta evaluación puede corresponder a una consideración directa de la potencia de las señales captadas por los micrófonos 201, 203.
Por ejemplo, para una aplicación de microteléfono o una aplicación de auriculares, normalmente puede suponerse que el primer micrófono está mucho más cerca de la boca del hablante deseado que el segundo micrófono. Cuando el hablante deseado está hablando, la potencia de la señal del primer micrófono es por tanto más grande que la potencia de la señal del segundo micrófono. Por tanto una consideración adicional incluye las potencias de los micrófonos y especialmente se requiere que Pu1 > MpUmbralPu2 para una detección en haz, donde Pu1 es la potencia de la señal del primer micrófono 201, Pu2 es la potencia de la señal del segundo micrófono 203 y Mbumbral es un parámetro fijo. El valor preferido de Mbumbral depende de la aplicación específica y del rendimiento requerido, aunque normalmente pueden establecerse valores entre dos y diez.
El criterio de actualización puede depender, naturalmente, de la aplicación específica. Por ejemplo para una aplicación de microteléfono o de auriculares, ambos requisitos deben cumplirse antes de poder actualizar el FSB 209. Sin embargo, para una aplicación de manos libres puede ser suficiente con que se cumpla el requisito de la detección en haz.
Sin embargo, aunque la restricción de la actualización del FSB 209 a situaciones en las que el detector indica que la fuente de audio deseada está en el haz principal proporciona un rendimiento mejorado y reduce el cambio de acoplamientos falsos, también presenta varias desventajas tal como se describió anteriormente. Específicamente, si el
5
10
15
20
25
30
35
40
hablante deseado está en una posición diferente a la que el conformador de haz espera que esté, el conformador de haz nunca podrá adaptarse. Al inicio, por ejemplo, el conformador de haz se inicializa con filtros que corresponden a un haz formado en la dirección de la posición esperada del hablante deseado. Sin embargo, si el hablante deseado está en otra posición, Además, si el hablante deseado mueve por ejemplo el teléfono durante una llamada de teléfono (y por tanto cambia su posición con respecto al teléfono móvil), el detector en haz y/o el detector de potencia no detectará que la fuente de voz es de hecho la fuente de voz deseada y por tanto el FBS 209 no se actualizará y no se adaptará a esta nueva posición.
En el ejemplo de la figura 2, estas desventajas se tratan mediante la inclusión de funcionalidad adicional. Específicamente, el teléfono móvil comprende un filtro 213 adaptativo que está acoplado a un restador 215 y al primer convertidor 205 analógico a digital. El restador 215 está acoplado además al segundo convertidor 207 analógico a digital.
Usando notación en el dominio de la frecuencia, la señal de salida del restador 215 genera por tanto una señal de diferencia dada por:
imagen1
donde H(k,l) representa la función de transferencia en el dominio de la frecuencia del filtro 213 adaptativo.
El filtro 213 adaptativo se adapta para minimizar la correlación entre u1 y u2 y en particular se adapta para minimizar la señal r de diferencia.
La señal de diferencia puede considerarse una buena indicación de si está presente una fuente de audio cercana. Por ejemplo, en un caso ideal, con una única fuente de audio solamente, las señales recibidas en los micrófonos 201, 203 sólo diferirán en función de la diferencia entre los canales acústicos entre la fuente de audio y los respectivos micrófonos 201, 203. Esta diferencia puede compensarse mediante el filtro 213 adaptativo y puede derivarse una señal r de diferencia sustancialmente igual a cero. Sin embargo, si no está presente ninguna fuente de audio dominante, las señales de los respectivos micrófonos no pueden cancelarse y se obtendrá como resultado una señal r de diferencia de amplitud significativa.
Normalmente puede suponerse que una fuente de voz cercana es de hecho la fuente de voz deseada y la señal r de diferencia puede por tanto proporcionar una indicación independiente de si está presente una fuente de voz deseada. Además, esta indicación es independiente del rendimiento de seguimiento del FSB 209 y no está sujeta al criterio de actualización como implementado por el postprocesador 209.
La figura 3 ilustra a diagrama de bloques para un ejemplo de una topología para generar las señales descritas.
En el sistema de la figura 2 el restador 215 está acoplado a un procesador 217 de modificación que recibe la señal de diferencia. El procesador 217 de modificación está dispuesto para determinar los umbrales usados por los algoritmos de detección del postprocesador 211. Específicamente, el procesador 217 de modificación determina los valores Wbumbral y Mbumbral que se usan para determinar los umbrales usados para determinar si el FSB 209 debe actualizarse.
En el ejemplo, el procesador 217 de modificación modifica los valores Wbumbral y Mbumbral en respuesta a la señal de diferencia dando por tanto como resultado la modificación de los umbrales para la detección en haz y para la detección de potencia de micrófono.
El procesador 217 de modificación específicamente considera la potencia de la señal de diferencia Pr con respecto a la potencia de la segunda señal de referencia de ruido Px2. Por ejemplo, puede determinarse el valor
.
Se apreciará que, en algunas realizaciones, Pr o Px2 pueden compensarse antes de una comparación de estos valores. Por ejemplo, comparando las ecuaciones para r y x2 puede decirse que u2(k,l) se multiplica por un factor ∆N(k)-F2(k,l)F2*(k,l). Para corregir este factor, Pr puede modificarse como:
imagen1
imagen1
5
10
15
20
25
30
35
Aunque no se trata de una aproximación exacta, se ha descubierto que proporciona un rendimiento deseable en la práctica.
Se apreciará que Ppcd es una indicación de los niveles de ruido relativos, de la cancelación del filtro adaptativo y del rendimiento de conformación de haz del FSB 207. Por tanto, para valores bajos de Ppcd, el filtro adaptativo puede cancelar de manera eficaz las señales entre los micrófonos 201, 203 mientras que el FSB 209 no puede hacerlo. Esto es indicativo de que está presente una fuerte señal de audio, pero fuera del haz acústico del FSB 209.
En el ejemplo de la figura 2, el procesador 217 de modificación puede, en tal caso, relajar el criterio de actualización del postprocesador 211 permitiendo de ese modo un rendimiento de adquisición mejorado. Una relajación del criterio puede considerarse que es una modificación del criterio de manera que al menos una combinación de parámetros para el aparato de conformación de haz que no habría permitido la actualización antes de la relajación, permitan ahora la actualización. Por tanto, en situaciones en las que el FSB 209 normalmente no se actualizaría porque no está presente ninguna señal en el haz, el criterio de actualización puede relajarse si la indicación independiente de la señal de diferencia indica que de hecho está presente una fuente de audio cercana. Esto puede permitir al FSB 209 capturar esta fuente de audio.
Otra medida útil es la magnitud de la cancelación en el filtro adaptativo. Una medida adecuada de la misma se denomina Ppcdz y se determina como
imagen1
Se apreciará que Ppcdz puede considerarse una medición normalizada de la potencia de la señal de diferencia y que cuanto más bajo sea el valor de Ppcdz mejor será la cancelación y por tanto más fuerte será la indicación de la presencia de una fuente de audio cercana.
En el ejemplo, el procesador 217 de modificación evalúa ambos parámetros. Específicamente, si tanto Ppcd como Ppcdz son suficientemente pequeños, los valores Wbumbral y Wbumbral se reducen. Si los valores son suficientemente pequeños, los requisitos del detector en haz y de potencia de micrófono se cumplirán y el criterio de actualización se cumplirá por tanto dando como resultado la actualización del FSB 209 y por tanto que se adapte a la fuente de audio fuerte. Una vez actualizado el FSB 209, los valores de Wbumbral y Wbumbral pueden volver a aumentarse. Cuando el FSB 209 ha convergido, el haz se dirige al hablante deseado y el criterio de actualización vuelve al valor nominal de manera que el conformador de haz no es sensible a otras fuentes de audio. Por tanto, puede lograrse automáticamente una variación temporal en el equilibrio entre rendimiento de seguimiento y rendimiento de adquisición.
Como ejemplo específico del funcionamiento del procesador 217 de modificación se da la siguiente secuencia de programa (usando lenguaje C):
si ( Ppcd < PpcdThr) && ( Ppcdz < PpcdzThr )
{
WbUmbral = MAX(WbUmbral - 0.1, 1);
MpUmbral = MAX(MpUmbral - 0.1, 0.5);
{
si no ( ( Update0n0ff!=0 ) II
( (Ppcd > 0) && ( Ppcdz< PpcdzThr ) ) ) {
WbUmbral = MIN(WbUmbral +0.02, WbUmbralMax );
MpUmbral = MIN(MpUmbral +0.02, MpUmbralMax );
}
Se apreciará que la modificación del criterio de actualización puede limitarse a situaciones en las que la conformación de haz se considere no fiable. Por ejemplo, la potencia de la señal de referencia de ruido x2 con respecto a la potencia de la señal de referencia combinada puede considerarse una indicación de fiabilidad para la señal con conformación de haz. Cuanto menor sea este valor, más fiable será la señal con conformación de haz.
En una realización sencilla, esta indicación de fiabilidad puede compararse con un umbral predeterminado. Si la indicación de fiabilidad está por debajo del umbral, el conformador de haz puede considerarse que está en un estado de seguimiento en el que efectivamente se sigue la fuente deseada, y el criterio de actualización puede mantenerse por tanto en los valores nominales.
Sin embargo, si la indicación de fiabilidad aumenta por encima del umbral (o un segundo umbral introduciendo de ese modo histéresis en la detección), puede considerarse que el conformador de haz ha perdido la señal y puede por tanto estar en un estado de adquisición en el que el criterio de actualización puede relajarse para mejorar los cambios de detección de una fuente deseada.
La figura 4 ilustra un procedimiento de conformación de haz acústico según algunas realizaciones de la invención.
El procedimiento se inicia en la etapa 401 en la que una primera señal de entrada se genera a partir de una primera entrada de audio y una segunda señal de entrada se genera a partir de una segunda entrada de audio en un intervalo de tiempo.
La etapa 401 va seguida de la etapa 403 en la que un filtro de conformación de haz filtra la primera y segunda señal de entrada para generar una señal con conformación de haz combinada.
La etapa 403 va seguida de la etapa 405 en la que un filtro adaptativo filtra la primera señal de entrada para generar una primera señal filtrada.
La etapa 405 va seguida de la etapa 407 en la que se genera una señal de diferencia entre la segunda señal de entrada y la primera señal filtrada.
La etapa 407 va seguida de la etapa 409 en la que el filtro adaptativo se adapta para minimizar la señal de diferencia.
La etapa 409 va seguida de la etapa 411 en la que el criterio de actualización se modifica en respuesta a la señal de diferencia.
La etapa 411 va seguida de la etapa 413 en la que se evalúa el criterio de actualización y si el criterio de actualización se cumple, el filtro de conformación de haz se actualiza.
Tras la etapa 413, el procedimiento vuelve a la etapa 401 para procesar el siguiente intervalo de tiempo.
Se apreciará que la descripción anterior para mayor claridad ha descrito realizaciones de la invención con referencia a diferentes unidades funcionales y procesadores. Sin embargo, será evidente que puede usarse cualquier distribución adecuada de la funcionalidad entre diferentes unidades funcionales o procesadores sin apartarse de la invención. Por ejemplo, la funcionalidad ilustrada como realizada por procesadores o controladores independientes puede realizarse por el mismo procesador o controlador. Por tanto, las referencias a unidades funcionales específicas deben considerarse únicamente como referencias a medios adecuados para proporcionar la funcionalidad descrita más que como indicación de una estructura u organización lógica o física estricta.
La invención puede implementarse de cualquier forma adecuada, incluyendo hardware, software, firmware o cualquier combinación de estos. La invención puede implementarse opcionalmente al menos en parte como software informático que se ejecuta en uno o más procesadores de datos y/o procesadores de señal digital. Los elementos y componentes de una realización de la invención pueden implementarse física, funcional y lógicamente de cualquier forma adecuada. De hecho la funcionalidad puede implementarse en una única unidad, en una pluralidad de unidades o como parte de otras unidades funcionales. Como tal, la invención puede implementarse en una única unidad o puede distribuirse física y funcionalmente entre diferentes unidades y procesadores.
Aunque la presente invención se ha descrito en conexión con algunas realizaciones, no pretende limitarse a la forma específica expuesta en el presente documento. Más bien, el alcance de la presente invención sólo se limita por las reivindicaciones adjuntas. Además, aunque una característica pueda aparecer descrita en conexión con realizaciones particulares, un experto en la técnica reconocerá que diversas características de las realizaciones descritas pueden combinarse según la invención. En las reivindicaciones, la expresión que comprende no excluye la presencia de otros elementos o etapas.
Además, aunque se enumeren de manera individual, una pluralidad de medios, elementos o etapas de procedimiento puede implementarse, por ejemplo, mediante una única unidad o procesador. Los símbolos de referencia en las reivindicaciones se proporcionan meramente como ejemplo clarificador y no deben interpretarse como que limitan el alcance de las reivindicaciones en modo alguno.

Claims (14)

  1. REIVINDICACIONES
    1.
    Aparato para conformación de haz acústico, comprendiendo el aparato medios (101) para generar una primera señal de entrada a partir de una primera entrada de audio; medios (103) para generar una segunda señal de entrada a partir de una segunda entrada de audio; medios (105) de conformación de haz que comprenden un filtro de conformación de haz para filtrar la primera y segunda
    señal de entrada para generar una señal con conformación de haz combinada; medios (107) de actualización para actualizar el filtro de conformación de haz si se cumple un criterio de actualización; un filtro (111) adaptativo para filtrar la primera señal de entrada para generar una primera señal filtrada; medios (113) para generar una señal de diferencia para la segunda señal de entrada y la primera señal filtrada; medios (115) para adaptar el filtro adaptativo para minimizar la señal de diferencia; y medios (109) de modificación para modificar el criterio de actualización en respuesta a la señal de diferencia.
  2. 2.
    Aparato según la reivindicación 1, en el que los medios (105) de conformación de haz están dispuestos para generar una señal de referencia de ruido para al menos una de la primera señal de entrada y la segunda señal de entrada con respecto a la señal con conformación de haz combinada.
  3. 3.
    Aparato según la reivindicación 2, en el que el criterio de actualización comprende un criterio según el cual una medida de potencia de la señal con conformación de haz es superior a un umbral determinado en respuesta a la señal de referencia de ruido.
  4. 4.
    Aparato según la reivindicación 3, en el que los medios (109) de modificación están dispuestos para modificar el umbral en respuesta a la señal de diferencia.
  5. 5.
    Aparato según la reivindicación 1, en el que el criterio de actualización comprende un criterio según el cual una medida de potencia de la primera señal de entrada es superior a un umbral determinado en respuesta a la segunda señal de entrada.
  6. 6.
    Aparato según la reivindicación 5, en el que los medios (109) de modificación están dispuestos para modificar el umbral en respuesta a la señal de diferencia.
  7. 7.
    Aparato según la reivindicación 1, en el que los medios (109) de modificación están dispuestos para relajar el criterio de actualización si la señal de diferencia está por debajo de un umbral.
  8. 8.
    Aparato según la reivindicación 7, en el que el umbral se determina en respuesta a una señal de referencia de ruido para al menos una de la primera señal de entrada y la segunda señal de entrada con respecto a la señal con conformación de haz combinada.
  9. 9.
    Aparato según la reivindicación 7, en el que el umbral se determina en respuesta a la primera señal de entrada.
  10. 10.
    Aparato según la reivindicación 1, en el que el aparato comprende además medios para determinar una indicación de fiabilidad de la señal con conformación de haz combinada y los medios (109) para modificar están dispuestos para modificar el criterio de actualización en respuesta a la indicación de fiabilidad.
  11. 11.
    Aparato según la reivindicación 10, en el que los medios (109) de modificación están dispuestos para sólo modificar el criterio de actualización si la indicación de fiabilidad está por debajo de un umbral.
  12. 12.
    Unidad de comunicación para un sistema de comunicación que comprende: medios (201, 205) para generar una primera señal de entrada a partir de una primera entrada de audio; medios (203, 307) para generar una segunda señal de entrada a partir de una segunda entrada de audio; medios (209) de conformación de haz que comprenden un filtro de conformación de haz para filtrar la primera y segunda
    señal de entrada para generar una señal con conformación de haz combinada; medios (211) de actualización para actualizar el filtro de conformación de haz si se cumple un criterio de actualización; un filtro (213) adaptativo para filtrar la primera señal de entrada para generar una primera señal filtrada; medios (215) para generar una señal de diferencia para la segunda señal de entrada y la primera señal filtrada;
    medios (213, 215) para adaptar el filtro (213) adaptativo para minimizar la señal de diferencia; y medios (217) de modificación para modificar el criterio de actualización en respuesta a la señal de diferencia.
  13. 13. Procedimiento de conformación de haz acústico, comprendiendo el procedimiento: generar (401) una primera señal de entrada a partir de una primera entrada de audio; 5 generar (401) una segunda señal de entrada a partir de una segunda entrada de audio;
    filtrar (403), con un filtro de conformación de haz, la primera y segunda señal de entrada para generar una señal con conformación de haz combinada; actualizar (405) el filtro de conformación de haz si se cumple un criterio de actualización; filtrar (407), con un filtro adaptativo, la primera señal de entrada para generar una primera señal filtrada;
    10 generar (409) una señal de diferencia para la segunda señal de entrada y la primera señal filtrada; adaptar (411) el filtro adaptativo para minimizar la señal de diferencia; y modificar (413) el criterio de actualización en respuesta a la señal de diferencia.
  14. 14. Producto de programa informático que, cuando se ejecuta en hardware, lleva a cabo el procedimiento según la reivindicación 13.
ES06765985T 2005-07-06 2006-07-03 Aparato y procedimiento para conformación de haz acústico. Active ES2359511T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP05106124 2005-07-06
EP05106124 2005-07-06

Publications (1)

Publication Number Publication Date
ES2359511T3 true ES2359511T3 (es) 2011-05-24

Family

ID=37604869

Family Applications (1)

Application Number Title Priority Date Filing Date
ES06765985T Active ES2359511T3 (es) 2005-07-06 2006-07-03 Aparato y procedimiento para conformación de haz acústico.

Country Status (8)

Country Link
US (1) US8103023B2 (es)
EP (1) EP1905268B1 (es)
JP (1) JP4955676B2 (es)
CN (1) CN101218848B (es)
AT (1) ATE497327T1 (es)
DE (1) DE602006019872D1 (es)
ES (1) ES2359511T3 (es)
WO (1) WO2007004188A2 (es)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5394373B2 (ja) * 2007-06-21 2014-01-22 コーニンクレッカ フィリップス エヌ ヴェ オーディオ信号を処理する装置及び方法
CN101843118B (zh) * 2007-10-16 2014-01-08 峰力公司 用于无线听力辅助的方法和系统
TW200826062A (en) * 2008-01-15 2008-06-16 Asia Vital Components Co Ltd System of inhibiting broadband noise of communication equipment room
US8812309B2 (en) * 2008-03-18 2014-08-19 Qualcomm Incorporated Methods and apparatus for suppressing ambient noise using multiple audio signals
US8401178B2 (en) * 2008-09-30 2013-03-19 Apple Inc. Multiple microphone switching and configuration
US8842851B2 (en) * 2008-12-12 2014-09-23 Broadcom Corporation Audio source localization system and method
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
EP2426949A3 (en) * 2010-08-31 2013-09-11 Samsung Electronics Co., Ltd. Method and apparatus for reproducing front surround sound
US8606249B1 (en) * 2011-03-07 2013-12-10 Audience, Inc. Methods and systems for enhancing audio quality during teleconferencing
CN102347027A (zh) * 2011-07-07 2012-02-08 瑞声声学科技(深圳)有限公司 双麦克风语音增强装置及其语音增强方法
CN102347028A (zh) * 2011-07-14 2012-02-08 瑞声声学科技(深圳)有限公司 双麦克风语音增强装置及方法
US20130114823A1 (en) * 2011-11-04 2013-05-09 Nokia Corporation Headset With Proximity Determination
US9111542B1 (en) * 2012-03-26 2015-08-18 Amazon Technologies, Inc. Audio signal transmission techniques
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
CN106797512B (zh) 2014-08-28 2019-10-25 美商楼氏电子有限公司 多源噪声抑制的方法、系统和非瞬时计算机可读存储介质
CN107112025A (zh) 2014-09-12 2017-08-29 美商楼氏电子有限公司 用于恢复语音分量的系统和方法
WO2016123560A1 (en) 2015-01-30 2016-08-04 Knowles Electronics, Llc Contextual switching of microphones
US9747920B2 (en) * 2015-12-17 2017-08-29 Amazon Technologies, Inc. Adaptive beamforming to create reference channels
RU2760097C2 (ru) * 2017-01-03 2021-11-22 Конинклейке Филипс Н.В. Способ и устройство для захвата аудиоинформации с использованием формирования диаграммы направленности
US10887691B2 (en) 2017-01-03 2021-01-05 Koninklijke Philips N.V. Audio capture using beamforming
BR112019013239A2 (pt) 2017-01-03 2019-12-24 Koninklijke Philips Nv aparelho de captura de áudio, e método de captura de áudio
US10580411B2 (en) * 2017-09-25 2020-03-03 Cirrus Logic, Inc. Talker change detection
CN107785029B (zh) * 2017-10-23 2021-01-29 科大讯飞股份有限公司 目标语音检测方法及装置
CN108419168A (zh) * 2018-01-19 2018-08-17 广东小天才科技有限公司 拾音设备的指向性拾音方法、装置、拾音设备及存储介质
US11290809B2 (en) * 2019-07-14 2022-03-29 Peiker Acustic Gmbh Dynamic sensitivity matching of microphones in a microphone array
DE102021118403B4 (de) * 2021-07-16 2024-01-18 ELAC SONAR GmbH Verfahren und Vorrichtung zum adaptiven Beamforming

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69526892T2 (de) * 1994-09-01 2002-12-19 Nec Corp Bündelerreger mit adaptiven Filtern mit beschränkten Koeffizienten zur Unterdrückung von Interferenzsignalen
JP3531084B2 (ja) * 1996-03-01 2004-05-24 富士通株式会社 指向性マイクロフォン装置
JP3194872B2 (ja) * 1996-10-15 2001-08-06 松下電器産業株式会社 マイクロホン装置
FI114422B (fi) 1997-09-04 2004-10-15 Nokia Corp Lähteen puheaktiviteetin tunnistus
US7146012B1 (en) 1997-11-22 2006-12-05 Koninklijke Philips Electronics N.V. Audio processing arrangement with multiple sources
US6449593B1 (en) 2000-01-13 2002-09-10 Nokia Mobile Phones Ltd. Method and system for tracking human speakers
JP2002099297A (ja) * 2000-09-22 2002-04-05 Tokai Rika Co Ltd マイクロフォン装置
WO2003058607A2 (en) 2002-01-09 2003-07-17 Koninklijke Philips Electronics N.V. Audio enhancement system having a spectral power ratio dependent processor
KR100480789B1 (ko) * 2003-01-17 2005-04-06 삼성전자주식회사 피드백 구조를 이용한 적응적 빔 형성방법 및 장치
EP1475997A3 (en) * 2003-05-09 2004-12-22 Harman/Becker Automotive Systems GmbH Method and system for communication enhancement in a noisy environment
US20050031141A1 (en) * 2003-08-04 2005-02-10 777388 Ontario Limited Timer ramp-up circuit and method for a sound masking system
CN101189656A (zh) * 2003-11-24 2008-05-28 皇家飞利浦电子股份有限公司 具有相对于不相关噪声的稳健性的自适应波束生成器
US7957542B2 (en) * 2004-04-28 2011-06-07 Koninklijke Philips Electronics N.V. Adaptive beamformer, sidelobe canceller, handsfree speech communication device
KR100619066B1 (ko) * 2005-01-14 2006-08-31 삼성전자주식회사 오디오 신호의 저음역 강화 방법 및 장치

Also Published As

Publication number Publication date
CN101218848A (zh) 2008-07-09
JP4955676B2 (ja) 2012-06-20
US8103023B2 (en) 2012-01-24
EP1905268B1 (en) 2011-01-26
ATE497327T1 (de) 2011-02-15
CN101218848B (zh) 2011-11-16
JP2009500938A (ja) 2009-01-08
DE602006019872D1 (es) 2011-03-10
EP1905268A2 (en) 2008-04-02
US20080192955A1 (en) 2008-08-14
WO2007004188A2 (en) 2007-01-11
WO2007004188A3 (en) 2007-05-03

Similar Documents

Publication Publication Date Title
ES2359511T3 (es) Aparato y procedimiento para conformación de haz acústico.
KR102352928B1 (ko) 가변 마이크로폰 어레이 방향을 갖는 헤드셋들을 위한 듀얼 마이크로폰 음성 프로세싱
US11657793B2 (en) Voice sensing using multiple microphones
JP4145323B2 (ja) 補聴器の受音特性の指向性制御方法および制御可能な指向特性を備える補聴器用の信号処理装置
US7010134B2 (en) Hearing aid, a method of controlling a hearing aid, and a noise reduction system for a hearing aid
US20170214996A1 (en) Sidetone generation using multiple microphones
WO2009141828A2 (en) A method and a system for processing signals
US9060232B2 (en) Hearing aid device with a directional microphone system and method for operating a hearing aid device having a directional microphone system
JP2011508494A (ja) ノイズレベルに基づく利得制御付きノイズキャンセル・システム
JP2006094522A (ja) ノイズ低減による多重チャンネル適応の音声信号処理
CN106448691B (zh) 一种用于扩音通信系统的语音增强方法
CN112188340B (zh) 主动降噪方法、主动降噪装置和耳机
CN110012378B (zh) 一种语音降噪的方法、耳塞和计算机存储介质
JP2003514264A (ja) 雑音抑圧装置
DK2611215T3 (en) A hearing with highlighted signal