ES2398407T3 - Sistema de supresión de ruidos de dos micrófonos robusto - Google Patents

Sistema de supresión de ruidos de dos micrófonos robusto Download PDF

Info

Publication number
ES2398407T3
ES2398407T3 ES08839767T ES08839767T ES2398407T3 ES 2398407 T3 ES2398407 T3 ES 2398407T3 ES 08839767 T ES08839767 T ES 08839767T ES 08839767 T ES08839767 T ES 08839767T ES 2398407 T3 ES2398407 T3 ES 2398407T3
Authority
ES
Spain
Prior art keywords
noise
voice
filter
beams
bss
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES08839767T
Other languages
English (en)
Inventor
Robert A. Zurek
Jeffrey M. Axelrod
Joel A. Clark
Holly L. Francois
Scott K. Isabelle
David J. Pearce
James A. Rex
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Mobility LLC
Original Assignee
Motorola Mobility LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Mobility LLC filed Critical Motorola Mobility LLC
Application granted granted Critical
Publication of ES2398407T3 publication Critical patent/ES2398407T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Noise Elimination (AREA)

Abstract

Un sistema para la reducción de ruido separando una señal de voz con respecto a un entorno acústico ruidoso,comprendiendo el sistema: una pluralidad de canales de entrada, recibiendo cada uno una o más señales acústicas; por lo menos un filtro de fuente (120) dispuesto para separar las una o más señales acústicas en haces de voz(140) y de ruido (150), en el que el filtro de fuente comprende por lo menos un filtro direccional de hipercardioide(130); por lo menos un filtro de separación de fuente ciega, BSS, 10 (410), en el que el filtro de separación de fuenteciega (410) puede accionarse para refinar los haces de voz y de ruido; y por lo menos un supresor de ruido de sustracción espectral de doble entrada, DINS, (440), en el que el supresorde ruido de sustracción espectral de doble entrada está dispuesto para eliminar el ruido del haz de voz (430,140).

Description

Sistema de supresión de ruidos de dos micrófonos robusto
Antecedentes de la invención
1. Campo de la invención
La presente invención se refiere a sistemas y a métodos para procesar múltiples señales acústicas, y más particularmente a separar las señales acústicas a través de filtrado.
2. Introducción
A menudo es difícil detectar y reaccionar a una señal de información en un entorno ruidoso. En una comunicación en la que los usuarios hablan a menudo en entornos ruidosos, es deseable separar las señales de voz del usuario con respecto al ruido de fondo. El ruido de fondo puede incluir numerosas señales de ruido generadas por el entorno general, señales generadas por las conversaciones de fondo de otras personas, así como reflexiones y reverberación generadas a partir de cada una de las señales.
En entornos ruidosos, la comunicación de enlace ascendente puede ser un serio problema. La mayoría de soluciones a este problema de ruido o bien solo funcionan sobre ciertos tipos de ruido, tal como ruido estacionario, o bien producen unos artefactos de audio significativos que pueden ser tan molestos para el usuario como una señal ruidosa. Todas las soluciones existentes tienen desventajas que conciernen a la ubicación del ruido y de la fuente y al tipo de ruido que se está intentando suprimir.
El objeto de la presente invención es la provisión de un medio que suprima todas las fuentes de ruido con independencia de sus características, ubicación o movimiento temporales. La publicación de solicitud PCT con n.º WO 2004/053839 describe un sistema y método para separar una mezcla de señal de audio en señales de audio deseadas (por ejemplo, voz) y una señal de ruido. Se colocan micrófonos para recibir las señales de audio mezcladas y un análisis de componentes independientes (ICA) procesa la mezcla de sonido usando restricciones de estabilidad. El proceso de ICA usa unas características predefinidas de la señal de voz deseada para identificar y aislar una señal de sonido objetivo. Los coeficientes del filtro se adaptan con una regla de aprendizaje y la dinámica de actualización de pesos de filtro se estabiliza para ayudar a la convergencia a un resultado de señal de ICA separado estable. La publicación de solicitud PCT con n.º WO 2004/083884 describe un método y un dispositivo para segregar señales acústicas de acuerdo con el cual dos señales mezcladas acústicas dependientes del tiempo se detectan con la ayuda de por lo menos dos sensores acústicos. Las señales mixtas acústicas se transforman en el intervalo de frecuencia con la ayuda de un dispositivo de procesamiento para formar unas señales mixtas dependientes de la frecuencia que se analizan entonces con la ayuda del dispositivo de procesamiento usando un análisis de formación de haz cero sobre la base de un método de retardo y suma, que se lleva a cabo en el intervalo de frecuencia, con el fin de formar unas señales de salidas segregadas. La publicación de solicitud de patente de los EE. UU. con n.º US 2007/0030982 describe técnicas para extraer una señal acústica a partir de una fuente seleccionada a la vez que se suprime la interferencia a partir de otras fuentes usando dos o más micrófonos. Esta solicitud de patente describe el uso de unos micrófonos de tipo cardioide o hipercardioide.
Sumario de la invención
De acuerdo con la presente invención, se proporciona un sistema y un método para la reducción de ruido tal como se indica en las reivindicaciones adjuntas.
Se da a conocer un sistema, método y aparato para separar una señal de voz con respecto a un entorno acústico ruidoso. El proceso de separación puede incluir un filtrado de fuente que puede ser filtrado direccional (formación de haz), separación de fuente ciega y supresión de ruidos de sustracción espectral de doble entrada. Los canales de entrada pueden incluir dos micrófonos omnidireccionales cuya salida se procesa usando un filtrado de retardo de fase para formar unas formas de haz de voz y de ruido. Además, las formas de haz pueden corregirse en frecuencia. La operación de formación de haz genera un canal que es sustancialmente solo ruido, y otro canal que es una combinación de voz y ruido. Un algoritmo de separación de fuente ciega aumenta la separación direccional a través de técnicas estadísticas. La señal de ruido y la señal de voz se usan entonces para ajustar características de proceso en un supresor de ruido de sustracción espectral de doble entrada (DINS) para reducir o eliminar de forma eficiente la componente de ruido. De esta forma, el ruido se elimina de forma efectiva de la señal de combinación para generar una señal de voz de buena calidad.
Breve descripción de los dibujos
Con el fin de describir la forma en la que pueden obtenerse las ventajas y características de la invención que se enumeran anteriormente, y otras, se dará una descripción más particular de la invención que se describe brevemente con anterioridad por referencia a realizaciones específicas de la misma, que se ilustran en los dibujos adjuntos. Entendiendo que estos dibujos representan solo realizaciones típicas de la invención y no ha de considerarse, por lo tanto, que sean limitantes de su alcance, la invención se describirá y explicará con especificidad y detalle adicionales a través del uso de los dibujos adjuntos, en los que:
La figura 1 es una vista en perspectiva de un formador de haz que emplea un filtro direccional de hipercardioide frontal para formar unas formas de haz de ruido y voz a partir de dos micrófonos omnidireccionales;
La figura 2 es una vista en perspectiva de un formador de haz que emplea un filtro direccional de hipercardioide frontal y un filtro direccional de cardioide posterior para formar unas formas de haz de ruido y voz a partir de dos micrófonos omnidireccionales;
La figura 3 es un diagrama de bloques de un supresor de ruido de sustracción espectral de doble entrada robusto (RDINS) de acuerdo con una posible realización de la invención;
La figura 4 es un diagrama de bloques de un filtro de separación de fuente ciega (BSS) y un supresor de ruido de sustracción espectral de doble entrada (DINS) de acuerdo con una posible realización de la invención;
La figura 5 es un diagrama de bloques de un filtro de separación de fuente ciega (BSS) y un supresor de ruido de sustracción espectral de doble entrada (DINS) que deriva la salida de voz de la BSS de acuerdo con una posible realización de la invención;
La figura 6 es un diagrama de flujo de un método para una estimación de ruido estático de acuerdo con una posible realización de la invención;
La figura 7 es un diagrama de flujo de un método para una estimación de ruido continua de acuerdo con una posible realización de la invención; y
La figura 8 es un diagrama de flujo de un método para un supresor de ruido de sustracción espectral de doble entrada robusto (RDINS) de acuerdo con una posible realización de la invención.
Descripción detallada de la invención
Características y ventajas adicionales de la invención se expondrán en la descripción que sigue, y en parte serán obvias a partir de la descripción, o pueden aprenderse por la práctica de la invención. Las características y ventajas de la invención pueden realizarse y obtenerse por medio de los instrumentos y combinaciones que se señalan particularmente en las reivindicaciones adjuntas. Estas y otras características de la presente invención serán más plenamente evidentes a partir de la siguiente descripción y de las reivindicaciones adjuntas, o pueden aprenderse por la práctica de la invención según se expone en el presente documento.
Varias realizaciones de la invención se analizan en detalle a continuación. A pesar de que se analizan implementaciones específicas, debería entenderse que esto se hace solo para fines de ilustración. Un experto en la técnica pertinente reconocerá que otros componentes y configuraciones pueden usarse sin alejarse del espíritu y alcance de la invención.
La invención comprende una variedad de realizaciones, tal como un método y aparato y otras realizaciones que se refieren a los conceptos básicos de la invención.
La figura 1 ilustra un diagrama a modo de ejemplo de un formador de haz 100 para formar unas formas de haz de ruido y voz a partir de dos micrófonos omnidireccionales de acuerdo con una posible realización de la invención. Los dos micrófonos 110 están separados uno de otro. Cada micrófono puede recibir una señal de entrada directa o indirecta y puede emitir una señal. Los dos micrófonos 110 son omnidireccionales de tal modo que reciben el sonido casi de igual forma desde todas las direcciones en relación con el micrófono. Los micrófonos 110 pueden recibir señales acústicas o energía que representan mezclas de sonidos de voz y de ruido y estas entradas pueden convertirse en una primera señal 140 que es, de forma predominante, voz, y una segunda señal 150 que tiene voz y ruido. A pesar de que no se muestra, los micrófonos pueden incluir un convertidor analógico a digital interno o externo. Las señales a partir de los micrófonos 110 pueden ponerse a escala o transformarse entre el dominio de la frecuencia y el del tiempo a través del uso de una o más funciones de transformada. La formación de haz puede compensar los diferentes tiempos de propagación de las diferentes señales recibidas por los micrófonos 110. Tal como se muestra en la figura 1, las salidas de los micrófonos se procesan usando filtrado de fuente o filtrado direccional 120 con el fin de corregir en cuanto a su respuesta en frecuencia las señales a partir de los micrófonos
110. El formador de haz 100 emplea un filtro direccional de hipercardioide frontal 130 para filtrar adicionalmente las señales a partir de los micrófonos 110. En una realización, el filtro direccional tendría unos valores de retardo de fase y de amplitud que varían con la frecuencia para formar la forma de haz ideal a través de todas las frecuencias. Estos valores pueden ser diferentes de los valores ideales que requerirían unos micrófonos colocados en el vacío.
La diferencia tendría en cuenta la geometría del alojamiento físico en el que están colocados los micrófonos. En el presente método, la diferencia de tiempo entre señales debido a la diferencia espacial de los micrófonos 110 se usa para potenciar la señal. Más particularmente, es probable que uno de los micrófonos 110 esté en una proximidad más inmediata a la fuente de voz (altavoz), mientras que el otro micrófono puede generar una señal que está relativamente atenuada. La figura 2 ilustra un diagrama a modo de ejemplo de un formador de haz 200 para formar unas formas de haz de voz 240 y de ruido 250 a partir de dos micrófonos omnidireccionales de acuerdo con una posible realización de la invención. El formador de haz 200 añade un filtro direccional de cardioide posterior 260 para filtrar adicionalmente las señales a partir de los micrófonos 110.
Los micrófonos omnidireccionales 110 reciben señales de sonido aproximadamente de igual forma desde cualquier dirección alrededor del micrófono. El patrón de detección (que no se muestra) muestra aproximadamente una potencia de señal recibida de igual amplitud desde todas las direcciones alrededor del micrófono. Por lo tanto, la salida eléctrica a partir del micrófono es la misma con independencia de desde qué dirección el sonido alcanza el micrófono.
El patrón de detección de hipercardioide frontal 230 proporciona un ángulo más estrecho de sensibilidad primaria en comparación con el patrón de cardioide. Además, el patrón de hipercardioide tiene dos puntos de sensibilidad mínima, ubicados aproximadamente a +– 140 grados con respecto a la parte frontal. En ese sentido, el patrón de hipercardioide suprime el sonido recibido tanto de los lados como de la parte posterior del micrófono. Por lo tanto, los patrones de hipercardioide están mejor adaptados para aislar instrumentos y vocalistas tanto del ambiente de la sala como uno de otro.
El patrón de detección de cardioide orientado hacia detrás o de cardioide posterior 260 (que no se muestra) es direccional, proporcionando una sensibilidad total cuando la fuente de sonido se encuentra en la parte posterior del par de micrófonos. El sonido recibido a los lados del par de micrófonos tiene aproximadamente la mitad de la salida, y el sonido que aparece en la parte frontal del par de micrófonos se ve sustancialmente atenuado. Este patrón de cardioide posterior se crea de tal modo que el nulo del micrófono virtual está apuntado hacia la fuente de voz deseada (altavoz).
En todos los casos, los haces se forman filtrando un micrófono omnidireccional con un filtro de retardo de fase, la salida del cual se suma entonces con la otra señal de micrófono omnidireccional para ajustar las ubicaciones de nulo, y entonces un filtro de corrección para corregir la respuesta en frecuencia de la señal resultante. Se usan unos filtros separados, que contienen el retardo dependiente de la frecuencia adecuado, para crear unas respuestas de Cardioide 260 y de Hipercardioide 230. Como alternativa, los haces podrían crearse creando en primer lugar unos haces de cardioide orientados hacia delante y hacia detrás usando el proceso que se menciona anteriormente, sumando la señal de cardioide para crear una señal omnidireccional virtual, y tomando la diferencia de las señales para crear un filtro bidireccional o de dipolo. Las señales de dipolo y omnidireccional virtual se combinan usando la ecuación I para crear una respuesta de Hipercardioide.
Hipercardioide = 0,25*(omni + 3*dipolo) EC. 1
Una realización alternativa utilizaría unas cápsulas de micrófono de Cardioide y de Hipercardioide de único elemento de directividad fija. Esto eliminaría la necesidad de la etapa de formación de haz en el procesamiento de señal, pero limitaría la adaptabilidad del sistema, ya que la variación de la forma de haz de un modo de uso en el dispositivo a otro sería más difícil, y una señal omnidireccional verdadera no se encontraría disponible para otro procesamiento en el dispositivo. En la presente realización, el filtro de fuente podría ser o bien un filtro correctivo en frecuencia, o un filtro simple con un pasabanda que reduce el ruido fuera de banda tal como un filtro de pasaaltos, un filtro antisolapamiento pasabajos, o un filtro pasabanda.
La figura 3 ilustra un diagrama a modo de ejemplo de un supresor de ruido de sustracción espectral de doble entrada robusto (RDINS) de acuerdo con una posible realización de la invención. La señal de estimada de voz 240 y la señal de estimada de ruido 250 se alimentan como entradas al RDINS 305 para aprovechar las diferencias en las características espectrales de la voz y el ruido para suprimir la componente de ruido de la señal de voz 140. El algoritmo para RDINS 305 se explica mejor con referencia a los métodos 600 a 800.
La figura 4 ilustra un diagrama a modo de ejemplo para un sistema de supresión de ruidos 400 que usa un filtro de separación de fuente ciega (BSS) y un supresor de ruido de sustracción espectral de doble entrada (DINS) para procesar las formas de haz de voz 140 y de ruido 150. Las formas de haz de ruido y voz se han corregido en cuanto a su respuesta en frecuencia. El filtro de separación de fuente ciega (BSS) 410 elimina la señal de voz restante de la señal de ruido. El filtro de BSS 410 puede producir solo una señal de ruido refinado 420 o las señales de voz y de ruido refinados (420, 430). La BSS puede ser un filtro de BSS de única fase que tiene dos entradas (voz y ruido) y el número deseado de salidas. Un filtro de BSS de dos fases tendría dos fases de BSS en cascada o conectadas junto con el número deseado de salidas. El filtro de separación de fuente ciega separa unas señales de fuente mezclada que se suponen estadísticamente independientes una de otra. El filtro de separación de fuente ciega 410 aplica una matriz de eliminación de mezclado de pesos a las señales mixtas multiplicando la matriz con las señales mixtas para producir unas señales separadas. Se asignan unos valores iniciales a los pesos en la matriz y se ajustan con el fin de minimizar la redundancia de la información. Este ajuste se repite hasta que la redundancia de la información de las señales de salida 420, 430 se reduce a un mínimo. Debido a que esta técnica no requiere información acerca de la fuente de cada señal, se hace referencia a la misma como separación de fuente ciega. El filtro de BSS 410 elimina estadísticamente la voz del ruido con el fin de producir una señal de ruido de voz reducida 420. La unidad de DINS 440 usa la señal de ruido de voz reducida 420 para eliminar el ruido de la voz 430 con el fin de producir una señal de voz 460 que se encuentre sustancialmente libre de ruido. La unidad de DINS 440 y el filtro de BSS 410 pueden integrarse como una única unidad 450 o pueden estar separados como componentes discretos.
La señal de voz 140 provista por las señales procesadas a partir de los micrófonos 110 se pasan como entrada al filtro de separación de fuente ciega 410, en el que una señal de voz procesada 430 y una señal de ruido 420 se emite al DINS 440, consistiendo la señal de voz procesada 430 completamente, o por lo menos esencialmente, en la voz de un usuario que se ha separado del sonido ambiente (ruido) por la acción del algoritmo de separación de fuente ciega que se lleva a cabo en el filtro de BSS 410. Tal procesamiento de señal de BSS utiliza el hecho de que las mezclas de sonido recogidas por el micrófono orientado hacia el entorno y el micrófono orientado hacia el altavoz consisten en mezclas diferentes del sonido ambiente y la voz del usuario, que son diferentes con respecto a la relación de amplitudes de estas dos fuentes o contribuciones de señal y con respecto a la diferencia de fase de estas dos contribuciones de señal de la mezcla.
La unidad de DINS 440 potencia adicionalmente la señal de voz procesada 430 y la señal de ruido 420, la señal de ruido 420 se usa como la estimada de ruido de la unidad de DINS 440. La estimada de ruido resultante 420 debería contener una señal de voz sumamente reducida debido a que los remanentes de la señal de voz deseada 460 serán desventajosos para el procedimiento de potenciación de la voz y, por lo tanto, reducirán la calidad de la salida.
La figura 5 ilustra un diagrama a modo de ejemplo para un sistema de supresión de ruidos 500 que usa un filtro de separación de fuente ciega (BSS) y un supresor de ruido de sustracción espectral de doble entrada (DINS) para procesar las forma de haz de voz 140 y de ruido 150. La estimada de ruido de la unidad de DINS 440 es aún la señal de ruido procesada a partir del filtro de BSS 410. La señal de voz 430, no obstante, no se procesa por el filtro de BSS 410.
Las figuras 6–8 son diagramas de flujo a modo de ejemplo que ilustran algunas de las etapas básicas para determinar estimadas de ruido estáticas para un método de un supresor de ruido de sustracción espectral de doble entrada robusto (RDINS) de acuerdo con una posible realización de la divulgación.
Cuando no se usa una BSS, la salida del filtrado direccional (240, 250) puede aplicarse directamente al supresor de ruido de doble canal (DINS), desafortunadamente el patrón de cardioide orientado hacia detrás 260 solo ubica un nulo parcial sobre el hablante deseado, lo que da como resultado una supresión de solo 3 dB a 6 dB del hablante deseado en la estimada de ruido. Para la unidad de DINS 440 por su cuenta, esta cantidad de fuga de voz da lugar a una distorsión inaceptable para la voz después de que esta se haya procesado. El RDINS es una versión del DINS diseñado para ser más robusto para esta fuga de voz en la estimada de ruido 250. Esta robustez se consigue usando dos estimadas de ruido separadas; una es la estimada de ruido continua a partir del filtrado direccional y la otra es la estimada de ruido estática que podría usarse también en un supresor de ruido de único canal.
El método 600 usa el haz de voz 240. Una estimada de voz continua se obtiene a partir del haz de voz 240, la estimada se obtiene durante los intervalos tanto de voz como libres de voz. El nivel de energía de la estimada de voz se calcula en la etapa 610. En la etapa 620, un detector de actividad de voz se usa para encontrar los intervalos libres de voz en la estimada de voz para cada trama. En la etapa 630, una estimada de ruido estática suavizada se forma a partir de los intervalos libres de voz en la estimada de voz. Esta estimada de ruido estática no contendrá voz alguna, debido a que la misma está congelada a lo largo de la duración de la voz de entrada deseada; no obstante, esto significa que la estimada de ruido no captura cambios durante un ruido no estacionario. En la etapa 640, se calcula la energía de la estimada de ruido estática. En la etapa 650, una relación señal–ruido estática se calcula a partir de la energía de la señal de voz continua 615 y la energía de la estimada de ruido estática. Las etapas 620 a 650 se repiten para cada sub–banda.
El método 700 usa la estimada de ruido continua 250. En la etapa 710, una estimada de ruido continua se obtiene a partir del haz de ruido 250, la estimada se obtiene durante los intervalos tanto de voz como libres de voz. Esta estimada de ruido continua 250 contendrá fuga de voz procedente del hablante deseado debido al nulo imperfecto. En la etapa 720, se calcula la energía para la estimada de ruido para la sub–banda. En la etapa 730, se calcula la relación señal–ruido continua para la sub–banda.
El método 800 usa la relación señal–ruido calculada de la estimada de ruido continua y la relación señal–ruido calculada de la estimada de ruido estática para determinar la supresión de ruidos a usar. En la etapa 810, si la SNR continua es más grande que un primer umbral, el control se pasa a la etapa 820, en la que la supresión se ajusta igual a la SNR continua. Si en la etapa 810, la SNR continua no es más grande que un primer umbral, el control pasa a la acción 830. En la acción 830, si la SNR continua es menos que un segundo umbral, el control pasa a la etapa 840 en la que la supresión se ajusta a la SNR estática. Si la SNR continua no es menos que el segundo umbral, entonces el control pasa a la etapa 850, en la que se usa un supresor de ruido de media ponderada. La media ponderada es el promedio de la SNR estática y continua. Para sub–bandas de SNR inferior (voz nula/ débil en relación con el ruido) la estimada de ruido continua se usa para determinar la cantidad de supresión de tal modo que la misma es efectiva durante un ruido no estacionario. Para sub–bandas de SNR más alta (voz fuerte en relación con el ruido), cuando la fuga domine en la estimada de ruido continua, úsese la estimada de ruido estática para determinar la cantidad de supresión para evitar que la fuga de voz de lugar a un exceso de supresión y a distorsión de la voz. Durante las sub–bandas de SNR media, combínense las dos estimadas para dar una transición de conmutación suave entre los dos casos anteriores. En la etapa 860 se calcula la ganancia de canal. En la etapa 870, la ganancia de canal se aplica a la estimada de voz. Las etapas se repiten para cada sub–banda. Las ganancias de canal se aplican entonces de la misma forma que para el DINS, de tal modo que los canales que tienen una SNR alta se pasan mientras que aquellos con una SNR baja se atenúan. En la presente implementación, la forma de onda de voz se reconstruye mediante la adición solapada de la FFT Inversa en ventanas.
En la práctica, un dispositivo de comunicación bidireccional puede contener múltiples realizaciones de la presente invención entre las cuales se conmuta dependiendo del modo de uso. Por ejemplo, una operación de formación de haz que se describe en la figura 1 puede combinarse con la fase de BSS y el DINS que se describen en la figura 4 para un caso de uso de modo privado o de habla cercana mientras que, en un modo de manos libres o de altavoz de teléfono, el formador de haz de la figura 2 puede combinarse con el RDINS de la figura 3. La conmutación entre estos modos de funcionamiento podría desencadenarse por una de muchas implementaciones conocidas en la técnica. A modo de ejemplo, y no de limitación, el método de conmutación podría ser a través de una decisión lógica sobre la base de proximidad, un conmutador eléctrico o magnético, o cualquier método equivalente que no se describa en el presente documento.
Las realizaciones dentro del alcance de la presente invención pueden incluir también soportes legibles por ordenador para portar o tener instrucciones ejecutables por ordenador o estructuras de datos almacenados en los mismos. Tales soportes legibles por ordenador pueden ser cualquier soporte disponible al que pueda acceder un ordenador de propósito general o de propósito especial. A modo de ejemplo, y no de limitación, tales soportes legibles por ordenador pueden comprender RAM, ROM, EEPROM, CD–ROM u otro almacenamiento en disco óptico, almacenamiento en disco magnético o otros dispositivos de almacenamiento magnético, o cualquier otro soporte que pueda usarse para portar o almacenar unos medios de código de programa deseados en la forma de instrucciones ejecutables por ordenador o estructuras de datos. Cuando se transfiere o se proporciona información a lo largo de una red o de otra conexión de comunicaciones (ya sea cableada, inalámbrica o una combinación de las mismas) a un ordenador, el ordenador ve adecuadamente la conexión como un soporte legible por ordenador. Por lo tanto, cualquier conexión de este tipo se denomina, adecuadamente, soporte legible por ordenador. Las combinaciones de lo anterior deberían incluirse también dentro del alcance de los soportes legibles por ordenador.
Las instrucciones ejecutables por ordenador incluyen, por ejemplo, instrucciones y datos que dan lugar a que un ordenador de propósito general, ordenador de propósito especial o dispositivo de procesamiento de propósito especial realice una cierta función o grupo de funciones. Las instrucciones ejecutables por ordenador también incluyen módulos de programa que se ejecutan por ordenadores en entornos autónomos o de red. En general, los módulos de programa incluyen rutinas, programas, objetos, componentes y estructuras de datos, etc. que realizan tareas particulares o implementan tipos de datos abstractos particulares. Las instrucciones ejecutables por ordenador, estructuras de datos asociadas y módulos de programa representan ejemplos de los medios de código de programa para ejecutar las etapas de los métodos que se dan a conocer en el presente documento. La secuencia particular de tales instrucciones ejecutables o estructuras de datos asociadas representa ejemplos de actos correspondientes para implementar las funciones que se describen en tales etapas.
A pesar de que la descripción anterior puede contener detalles específicos, los mismos no deberían interpretarse como limitantes de las reivindicaciones en modo alguno. Otras configuraciones de las realizaciones descritas de la invención son parte del alcance de la presente invención. Por ejemplo, los principios de la invención pueden aplicarse a cada usuario individual, caso en el que cada usuario puede desplegar de forma individual un sistema de este tipo. Esto posibilita que cada usuario utilice los beneficios de la invención incluso si una cualquiera del gran número de aplicaciones posibles no necesita la funcionalidad que se describe en el presente documento. En otras palabras, pueden existir múltiples ejemplares del método y los dispositivos en las figuras 1–8, procesando cada uno el contenido de varias formas posibles. Este no ha de ser, necesariamente, un sistema usado por todos los usuarios finales. Por consiguiente, las reivindicaciones adjuntas y sus equivalentes legales solo deberían definir la invención, en lugar de cualquiera de los ejemplos específicos que se proporcionan.

Claims (12)

  1. REIVINDICACIONES
    1. Un sistema para la reducción de ruido separando una señal de voz con respecto a un entorno acústico ruidoso, comprendiendo el sistema:
    una pluralidad de canales de entrada, recibiendo cada uno una o más señales acústicas; por lo menos un filtro de fuente (120) dispuesto para separar las una o más señales acústicas en haces de voz
    (140) y de ruido (150), en el que el filtro de fuente comprende por lo menos un filtro direccional de hipercardioide (130); por lo menos un filtro de separación de fuente ciega, BSS, (410), en el que el filtro de separación de fuente ciega (410) puede accionarse para refinar los haces de voz y de ruido; y por lo menos un supresor de ruido de sustracción espectral de doble entrada, DINS, (440), en el que el supresor de ruido de sustracción espectral de doble entrada está dispuesto para eliminar el ruido del haz de voz (430, 140).
  2. 2.
    El sistema de acuerdo con la reivindicación 1, en el que el filtro de fuente (120) usa filtrado de retardo de fase para formar haces de voz (140) y de ruido (150), y en el que los haces de voz y de ruido se corrigen en cuanto a su respuesta en frecuencia por el filtro de fuente.
  3. 3.
    El sistema de acuerdo con la reivindicación 1, en el que los haces de ruido (420) y de voz (430) refinados a partir del filtro de separación de fuente ciega, BSS, (410) se alimentan a un supresor de ruido de sustracción espectral de doble entrada, DINS, (440).
  4. 4.
    El sistema de acuerdo con la reivindicación 1, en el que un haz de ruido refinado (420) a partir del filtro de separación de fuente ciega, BSS, (410) y el haz de voz (140, 430) a partir del filtro de fuente (120) se alimentan al supresor de ruido de sustracción espectral de doble entrada, DINS, (440).
  5. 5.
    El sistema de acuerdo con la reivindicación 1, comprendiendo además el sistema:
    disponer en cascada dos filtros de separación de fuente ciega, BSS; en el que la entrada a la cascada son los haces de voz (140) y de ruido (150) a partir del filtro de fuente (120); en el que la salida de la cascada se alimenta al supresor de ruido de sustracción espectral de doble entrada, DINS, (440).
  6. 6.
    El sistema de acuerdo con cualquier reivindicación anterior, que además comprende:
    un par de micrófonos omnidireccionales para recibir las una o más señales acústicas.
  7. 7.
    El sistema de acuerdo con cualquier reivindicación anterior, en el que el supresor de ruido de sustracción espectral de doble entrada (440) está dispuesto para eliminar el ruido del haz de voz (140, 430) usando un haz de ruido refinado (420) a partir del filtro de separación de fuente ciega, BSS, (410) con uno del haz de voz (140) a partir del filtro de fuente (120) y un haz de voz refinada (430) a partir del filtro de separación de fuente ciega, BSS, (410).
  8. 8.
    Un método para la reducción de ruido, comprendiendo el método:
    recibir una o más señales acústicas a partir de una pluralidad de canales de entrada; separar con un filtro de fuente (120) las una o más señales acústicas en haces de voz (140) y de ruido (150), en el que el filtro de fuente comprende por lo menos un filtro direccional de hipercardioide (130); refinar los haces de voz y de ruido empleando por lo menos un filtro de separación de fuente ciega, BSS, (410), en el que el filtro de separación de fuente ciega (410) puede accionarse para refinar los haces de voz y de ruido; y eliminar el ruido del haz de voz (140, 430) a través de por lo menos un supresor de ruido de sustracción espectral de doble entrada, DINS, (440).
  9. 9.
    El método de acuerdo con la reivindicación 8, en el que eliminar el ruido incluye eliminar el ruido del haz de voz (140, 430) mediante el supresor de ruido de sustracción espectral de doble entrada, DINS, (440) usando un haz de ruido refinado (420) a partir del filtro de separación de fuente ciega, BSS, (410) con uno del haz de voz (140) a partir del filtro de fuente (120) y un haz de voz refinada (430) a partir del filtro de separación de fuente ciega, BSS, (410).
  10. 10.
    El método de acuerdo con la reivindicación 8, en el que la separación en el filtro de fuente (120) es a través de filtrado de retardo de fase, y en el que los haces de voz (140) y de ruido (150) se corrigen en cuanto a su respuesta en frecuencia.
  11. 11.
    El método de acuerdo con la reivindicación 8, en el que los haces de ruido (420) y de voz (430) refinados a partir del filtro de separación de fuente ciega, BSS, (410) se alimentan al supresor de ruido de sustracción espectral de doble entrada, DINS, (440).
  12. 12.
    El método de acuerdo con la reivindicación 8, en el que el haz de ruido refinado (420) a partir del filtro de separación de fuente ciega, BSS, (410) y el haz de voz (140) a partir del filtro de fuente (120) se alimentan al supresor de ruido de sustracción espectral de doble entrada, DINS, (440).
    5 13. El método de acuerdo con la reivindicación 8, comprendiendo además el método:
    disponer en cascada dos filtros de separación de fuente ciega, BSS; en el que la entrada a la cascada son los haces de voz (140) y de ruido (150) a partir del filtro de fuente (120); en el que la salida de la cascada se alimenta al supresor de ruido de sustracción espectral de doble entrada,
    10 DINS, (440).
ES08839767T 2007-10-18 2008-10-01 Sistema de supresión de ruidos de dos micrófonos robusto Active ES2398407T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US874263 1986-06-13
US11/874,263 US8046219B2 (en) 2007-10-18 2007-10-18 Robust two microphone noise suppression system
PCT/US2008/078395 WO2009051959A1 (en) 2007-10-18 2008-10-01 Robust two microphone noise suppression system

Publications (1)

Publication Number Publication Date
ES2398407T3 true ES2398407T3 (es) 2013-03-15

Family

ID=40564365

Family Applications (1)

Application Number Title Priority Date Filing Date
ES08839767T Active ES2398407T3 (es) 2007-10-18 2008-10-01 Sistema de supresión de ruidos de dos micrófonos robusto

Country Status (9)

Country Link
US (1) US8046219B2 (es)
EP (2) EP2183853B1 (es)
KR (2) KR101184806B1 (es)
CN (1) CN101828335B (es)
BR (1) BRPI0818401B1 (es)
ES (1) ES2398407T3 (es)
MX (1) MX2010004192A (es)
RU (1) RU2483439C2 (es)
WO (1) WO2009051959A1 (es)

Families Citing this family (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8140325B2 (en) * 2007-01-04 2012-03-20 International Business Machines Corporation Systems and methods for intelligent control of microphones for speech recognition applications
US8954324B2 (en) * 2007-09-28 2015-02-10 Qualcomm Incorporated Multiple microphone voice activity detector
US8054989B2 (en) * 2007-12-13 2011-11-08 Hyundai Motor Company Acoustic correction apparatus and method for vehicle audio system
US8223988B2 (en) * 2008-01-29 2012-07-17 Qualcomm Incorporated Enhanced blind source separation algorithm for highly correlated mixtures
KR101317813B1 (ko) * 2008-03-31 2013-10-15 (주)트란소노 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터판독 가능한 기록매체
KR101335417B1 (ko) * 2008-03-31 2013-12-05 (주)트란소노 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터판독 가능한 기록매체
US8589152B2 (en) * 2008-05-28 2013-11-19 Nec Corporation Device, method and program for voice detection and recording medium
JP5267573B2 (ja) * 2009-01-08 2013-08-21 富士通株式会社 音声制御装置および音声出力装置
EP2499839B1 (en) * 2009-11-12 2017-01-04 Robert Henry Frater Speakerphone with microphone array
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
KR101737824B1 (ko) * 2009-12-16 2017-05-19 삼성전자주식회사 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치
KR101107213B1 (ko) * 2009-12-30 2012-01-25 주식회사 테스콤 소음 및 진동 유입 방지용 측정 전처리장치
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
US8660842B2 (en) * 2010-03-09 2014-02-25 Honda Motor Co., Ltd. Enhancing speech recognition using visual information
US8473287B2 (en) * 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US8880396B1 (en) * 2010-04-28 2014-11-04 Audience, Inc. Spectrum reconstruction for automatic speech recognition
US8798992B2 (en) * 2010-05-19 2014-08-05 Disney Enterprises, Inc. Audio noise modification for event broadcasting
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
WO2013009949A1 (en) * 2011-07-13 2013-01-17 Dts Llc Microphone array processing system
US9666206B2 (en) * 2011-08-24 2017-05-30 Texas Instruments Incorporated Method, system and computer program product for attenuating noise in multiple time frames
US8712769B2 (en) 2011-12-19 2014-04-29 Continental Automotive Systems, Inc. Apparatus and method for noise removal by spectral smoothing
US9100756B2 (en) 2012-06-08 2015-08-04 Apple Inc. Microphone occlusion detector
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US20140278389A1 (en) * 2013-03-12 2014-09-18 Motorola Mobility Llc Method and Apparatus for Adjusting Trigger Parameters for Voice Recognition Processing Based on Noise Characteristics
KR102282366B1 (ko) 2013-06-03 2021-07-27 삼성전자주식회사 음성 향상 방법 및 그 장치
CN105493518B (zh) * 2013-06-18 2019-10-18 创新科技有限公司 麦克风系统以及用于麦克风系统中抑制不想要声音的方法
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
US9646626B2 (en) 2013-11-22 2017-05-09 At&T Intellectual Property I, L.P. System and method for network bandwidth management for adjusting audio quality
US9524735B2 (en) 2014-01-31 2016-12-20 Apple Inc. Threshold adaptation in two-channel noise estimation and voice activity detection
CN105096961B (zh) * 2014-05-06 2019-02-01 华为技术有限公司 语音分离方法和装置
US9467779B2 (en) 2014-05-13 2016-10-11 Apple Inc. Microphone partial occlusion detector
CN104167214B (zh) * 2014-08-20 2017-06-13 电子科技大学 一种双麦克风盲声源分离的快速源信号重建方法
WO2016033364A1 (en) 2014-08-28 2016-03-03 Audience, Inc. Multi-sourced noise suppression
DE112015004185T5 (de) 2014-09-12 2017-06-01 Knowles Electronics, Llc Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten
US9747922B2 (en) 2014-09-19 2017-08-29 Hyundai Motor Company Sound signal processing method, and sound signal processing apparatus and vehicle equipped with the apparatus
GB2532042B (en) * 2014-11-06 2017-02-08 Imagination Tech Ltd Pure delay estimation
CN104637494A (zh) * 2015-02-02 2015-05-20 哈尔滨工程大学 基于盲源分离的双话筒移动设备语音信号增强方法
KR20170025303A (ko) 2015-08-28 2017-03-08 이채원 미강, 찹쌀이 함유된 접착제 조성물
US20170150254A1 (en) * 2015-11-19 2017-05-25 Vocalzoom Systems Ltd. System, device, and method of sound isolation and signal enhancement
US9773495B2 (en) * 2016-01-25 2017-09-26 Ford Global Technologies, Llc System and method for personalized sound isolation in vehicle audio zones
CN105679329B (zh) * 2016-02-04 2019-08-06 厦门大学 可适应强烈背景噪声的麦克风阵列语音增强装置
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones
US10482899B2 (en) 2016-08-01 2019-11-19 Apple Inc. Coordination of beamformers for noise estimation and noise suppression
US9741360B1 (en) * 2016-10-09 2017-08-22 Spectimbre Inc. Speech enhancement for target speakers
EP3571514A4 (en) * 2017-01-18 2020-11-04 HRL Laboratories, LLC COGNITIVE SIGNAL PROCESSOR FOR SIMULTANEOUS INTERFERENCE SUPPRESSION AND BLIND SOURCE SEPARATION
US10366700B2 (en) 2017-02-08 2019-07-30 Logitech Europe, S.A. Device for acquiring and processing audible input
US10366702B2 (en) 2017-02-08 2019-07-30 Logitech Europe, S.A. Direction detection device for acquiring and processing audible input
US10362393B2 (en) 2017-02-08 2019-07-23 Logitech Europe, S.A. Direction detection device for acquiring and processing audible input
US10229667B2 (en) 2017-02-08 2019-03-12 Logitech Europe S.A. Multi-directional beamforming device for acquiring and processing audible input
CN106653044B (zh) * 2017-02-28 2023-08-15 浙江诺尔康神经电子科技股份有限公司 追踪噪声源和目标声源的双麦克风降噪系统和方法
US10803857B2 (en) * 2017-03-10 2020-10-13 James Jordan Rosenberg System and method for relative enhancement of vocal utterances in an acoustically cluttered environment
JP2018159759A (ja) * 2017-03-22 2018-10-11 株式会社東芝 音声処理装置、音声処理方法およびプログラム
JP6646001B2 (ja) * 2017-03-22 2020-02-14 株式会社東芝 音声処理装置、音声処理方法およびプログラム
CN109994120A (zh) * 2017-12-29 2019-07-09 福州瑞芯微电子股份有限公司 基于双麦的语音增强方法、系统、音箱及存储介质
US10847178B2 (en) * 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
CN110875054B (zh) * 2018-08-31 2023-07-25 阿里巴巴集团控股有限公司 一种远场噪声抑制方法、装置和系统
US11049509B2 (en) 2019-03-06 2021-06-29 Plantronics, Inc. Voice signal enhancement for head-worn audio devices
CN110021307B (zh) * 2019-04-04 2022-02-01 Oppo广东移动通信有限公司 音频校验方法、装置、存储介质及电子设备
US11270717B2 (en) * 2019-05-08 2022-03-08 Microsoft Technology Licensing, Llc Noise reduction in robot human communication
KR102218151B1 (ko) * 2019-05-30 2021-02-23 주식회사 위스타 음성 인식률을 향상시키기 위한 타겟 음성 신호 출력 장치 및 방법
WO2021043412A1 (en) * 2019-09-05 2021-03-11 Huawei Technologies Co., Ltd. Noise reduction in a headset by employing a voice accelerometer signal
KR20210062475A (ko) * 2019-11-21 2021-05-31 삼성전자주식회사 전자 장치 및 그 제어 방법
US11277689B2 (en) 2020-02-24 2022-03-15 Logitech Europe S.A. Apparatus and method for optimizing sound quality of a generated audible signal
CN111402917B (zh) * 2020-03-13 2023-08-04 北京小米松果电子有限公司 音频信号处理方法及装置、存储介质
US11308972B1 (en) * 2020-05-11 2022-04-19 Facebook Technologies, Llc Systems and methods for reducing wind noise
CN115132220B (zh) * 2022-08-25 2023-02-28 深圳市友杰智新科技有限公司 抑制电视噪声的双麦唤醒的方法、装置、设备及存储介质

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE505156C2 (sv) * 1995-01-30 1997-07-07 Ericsson Telefon Ab L M Förfarande för bullerundertryckning genom spektral subtraktion
US6167417A (en) 1998-04-08 2000-12-26 Sarnoff Corporation Convolutive blind source separation using a multiple decorrelation method
CA2407855C (en) * 2000-05-10 2010-02-02 The Board Of Trustees Of The University Of Illinois Interference suppression techniques
WO2003017718A1 (en) 2001-08-13 2003-02-27 Nanyang Technological University, Centre For Signal Processing Post-processing scheme for adaptive directional microphone system with noise/interference suppression
US8942387B2 (en) 2002-02-05 2015-01-27 Mh Acoustics Llc Noise-reducing directional microphone array
US20030160862A1 (en) 2002-02-27 2003-08-28 Charlier Michael L. Apparatus having cooperating wide-angle digital camera system and microphone array
US7106876B2 (en) 2002-10-15 2006-09-12 Shure Incorporated Microphone for simultaneous noise sensing and speech pickup
EP1570464A4 (en) 2002-12-11 2006-01-18 Softmax Inc SYSTEM AND METHOD FOR LANGUAGE PROCESSING USING AN INDEPENDENT COMPONENT ANALYSIS UNDER STABILITY RESTRICTIONS
US7474756B2 (en) 2002-12-18 2009-01-06 Siemens Corporate Research, Inc. System and method for non-square blind source separation under coherent noise by beamforming and time-frequency masking
DE10312065B4 (de) 2003-03-18 2005-10-13 Technische Universität Berlin Verfahren und Vorrichtung zum Entmischen akustischer Signale
US7099821B2 (en) * 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
US7190775B2 (en) 2003-10-29 2007-03-13 Broadcom Corporation High quality audio conferencing with adaptive beamforming
US20060135085A1 (en) 2004-12-22 2006-06-22 Broadcom Corporation Wireless telephone with uni-directional and omni-directional microphones
GB2429139B (en) * 2005-08-10 2010-06-16 Zarlink Semiconductor Inc A low complexity noise reduction method
KR100810275B1 (ko) * 2006-08-03 2008-03-06 삼성전자주식회사 차량용 음성인식 장치 및 방법
US8954324B2 (en) * 2007-09-28 2015-02-10 Qualcomm Incorporated Multiple microphone voice activity detector

Also Published As

Publication number Publication date
EP2207168A2 (en) 2010-07-14
EP2183853B1 (en) 2012-12-26
KR20100054873A (ko) 2010-05-25
CN101828335B (zh) 2015-06-24
EP2183853A4 (en) 2010-11-03
KR20100056567A (ko) 2010-05-27
US20090106021A1 (en) 2009-04-23
KR101171494B1 (ko) 2012-08-07
MX2010004192A (es) 2010-05-14
EP2183853A1 (en) 2010-05-12
EP2207168A3 (en) 2010-10-20
RU2010119709A (ru) 2011-11-27
WO2009051959A1 (en) 2009-04-23
RU2483439C2 (ru) 2013-05-27
BRPI0818401B1 (pt) 2020-02-18
BRPI0818401A2 (pt) 2015-04-22
US8046219B2 (en) 2011-10-25
EP2207168B1 (en) 2012-08-22
CN101828335A (zh) 2010-09-08
KR101184806B1 (ko) 2012-09-20

Similar Documents

Publication Publication Date Title
ES2398407T3 (es) Sistema de supresión de ruidos de dos micrófonos robusto
Cornelis et al. Performance analysis of multichannel Wiener filter-based noise reduction in hearing aids under second order statistics estimation errors
US7983907B2 (en) Headset for separation of speech signals in a noisy environment
US7464029B2 (en) Robust separation of speech signals in a noisy environment
JP5845090B2 (ja) 複数マイクロフォンベースの方向性音フィルタ
Yousefian et al. A dual-microphone speech enhancement algorithm based on the coherence function
KR102352927B1 (ko) 상관 기반 근접장 검출기
US8861745B2 (en) Wind noise mitigation
US8718290B2 (en) Adaptive noise reduction using level cues
US20150172807A1 (en) Apparatus And A Method For Audio Signal Processing
US20050074129A1 (en) Cardioid beam with a desired null based acoustic devices, systems and methods
US8290189B2 (en) Blind source separation method and acoustic signal processing system for improving interference estimation in binaural wiener filtering
Hadad et al. Binaural multichannel Wiener filter with directional interference rejection
Kocinski Speech intelligibility improvement using convolutive blind source separation assisted by denoising algorithms
As’ad et al. Robust minimum variance distortionless response beamformer based on target activity detection in binaural hearing aid applications
JP2022533391A (ja) 眼鏡デバイス、システム、装置、および方法のためのマイク配置
Anderson et al. TRINICON-BSS system incorporating robust dual beamformers for noise reduction
Madhu et al. Multi-channel source separation: Overview and comparison of mask-based and linear separation algorithms
Kim et al. Target-to-non-target directional ratio estimation based on dual-microphone phase differences for target-directional speech enhancement.
Mittal et al. Frame-by-frame mixture of beamformers for source separation
Grimm et al. Wind Noise Reduction for a Closely Spaced Microphone Array
Zhang et al. A compact-microphone-array-based speech enhancement algorithm using auditory subbands and probability constrained postfilter
Zhang et al. A frequency domain approach for speech enhancement with directionality using compact microphone array.
Li et al. Dual-channel optimally modified log-spectral amplitude estimator using spatial information