ES2454645T3 - Un método y circuito de supresión de ruido que incorpora una pluralidad de técnicas de supresión de ruido - Google Patents

Un método y circuito de supresión de ruido que incorpora una pluralidad de técnicas de supresión de ruido Download PDF

Info

Publication number
ES2454645T3
ES2454645T3 ES07871389.8T ES07871389T ES2454645T3 ES 2454645 T3 ES2454645 T3 ES 2454645T3 ES 07871389 T ES07871389 T ES 07871389T ES 2454645 T3 ES2454645 T3 ES 2454645T3
Authority
ES
Spain
Prior art keywords
noise
circuit
type
detected
rumor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES07871389.8T
Other languages
English (en)
Inventor
Jianming J. Song
Joel A. Clark
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Solutions Inc
Motorola Mobility LLC
Original Assignee
Motorola Mobility LLC
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Mobility LLC, Motorola Inc filed Critical Motorola Mobility LLC
Application granted granted Critical
Publication of ES2454645T3 publication Critical patent/ES2454645T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • G10L15/142Hidden Markov Models [HMMs]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Noise Elimination (AREA)
  • Telephone Function (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

Un circuito de supresión de ruido (300) para su uso en un circuito de procesamiento de señal de audio, comprendiendo el circuito de supresión de ruido: una pluralidad de diferentes tipos de detectores de actividad de voz (304) donde cada detector de actividad de voz está adaptado para detectar la presencia de un tipo diferente de ruido en una señal recibida, incluyendo rumor y ruido estacionario; y Un circuito de detección de tipo de ruido (312) que determina la presencia y el tipo de cualquier ruido sobre la base de los resultados de la pluralidad de diferentes tipos de detectores de actividad de voz (304); y una pluralidad de circuitos de reducción de diferentes tipos de ruido que incluyen un circuito de atenuación de ruido (316) y un circuito de sustracción de ruido (318), donde cada circuito de reducción de ruido está adaptado para eliminar un tipo de ruido detectado diferente, donde cada circuito de reducción de ruido respectivamente corresponde a uno de la pluralidad de detectores de actividad de voz (304) correspondiendo el circuito de atenuación de ruido (316) a la detección de ruido estacionario y correspondiendo el circuito de sustracción de ruido (318) a la detección del rumor; Donde cada uno de la pluralidad de detectores de actividad de voz (304) detecta la presencia de un tipo de ruido correspondiente en la señal recibida, el respectivo circuito de reducción de ruido es selectivamente activado para condicionar la señal recibida para reducir la cantidad de los tipos de ruido detectados.

Description

Un método y circuito de supresión de ruido que incorpora una pluralidad de técnicas de supresión de ruido
Referencia cruzada a aplicaciones relacionadas
Esta aplicación reivindica la prioridad de una Solicitud de Patente Provisional de US de Nº de Serie 60/882,926, presentada el 30 de Diciembre de 2006.
Campo de la invención
La presente invención se refiere en general a unos circuitos de supresión de ruido y a correspondientes métodos, y más particularmente, a un método y circuito de supresión de ruido que incorpora múltiples técnicas de supresión que incluyen un detector para detectar múltiples tipos de ruido y múltiples técnicas correspondientes para eliminar el ruido detectado.
Antecedentes de la invención
La presencia de ruido ambiente o de fondo tiene un efecto significativo en la calidad de audio experimentada por uno
o los dos participantes de una llamada, sobre todo si uno o los dos participantes están en un entorno ruidoso. Con respecto a la calidad del audio, la calidad y la inteligibilidad de voz son generalmente asuntos prominentes. No obstante, cuando se habla en un entorno ruidoso, el filtrado para eliminar el ruido ambiente que puede en ocasiones ser recogido por un micrófono además de la voz del usuario puede muy a menudo presentar muchas dificultades. Esto puede ser sobre todo cierto donde el ruido ambiente podría consistir en muchas personas hablando de fondo, lo que a menudo se denomina rumor. Esto es porque las voces de fondo tienen características que son similares a las señales de conversación deseada que son producidas por el usuario, y por lo tanto pueden ser más difíciles de distinguir y detectar.
Aunque históricamente las personas han buscado en ocasiones un ambiente tranquilo para hablar por teléfono, lo que intentaba mitigar los problemas de cualquier ruido ambiental evitándolo en su totalidad, un entorno tranquilo tal como una cabina telefónica no siempre está convenientemente disponible, y la necesidad de un ambiente tranquilo puede en ocasiones impactar negativamente en la movilidad y la conveniencia asociadas con utilizar un teléfono móvil y/o un teléfono acoplado a una línea terrestre en un entorno que es sólo algunas veces ruidoso.
Más recientemente, los intentos de reducir el ruido de ambiente y mejorar las relaciones de conversación a ruido se han centrado ampliamente en el ruido ambiente que es bastante estacionario, y/o que es ruido asociado con fuentes conocidas, tales como el ruido del motor de un coche. Algunos de estos planteamientos han intentado centrarse en los periodos de tiempo durante los cuales la voz de una persona es detectada como no actualmente presente, e intentando mitigar el ruido durante estos periodos. No obstante, se ha probado que los intentos de solucionar los tipos de ruido no estacionario, tal como el rumor, son más problemáticos. Muchos de los más recientes intentos han intentado aplicar técnicas basadas en un análisis acústico más instantáneo, que aplican modelos relativamente estáticos, que no son generalmente efectivos para tipos de ruido menos estacionarios. Además, las técnicas asociadas con solucionar casos en los cuales la conversación prevista no está presente, no son muy efectivas en la eliminación de ruido, que está superpuesto a la conversación prevista.
En consecuencia, los actuales inventores han reconocido que sería deseable distinguir entre diferentes tipos de ruido de la conversación prevista, tal como el rumor y/o el ruido estacionario, y poder implementar técnicas selectivamente aplicadas y específicamente adaptadas para solucionar cada tipo de ruido, cuando el mismo es detectado como presente, mientras que al mismo tiempo se evitan y/o mitigan los efectos de cualquier artefacto audible desagradable.
TAKESHI YAMADA1 EAT AL: "Integration of Noise Reduction Algorithms for Aurora2 Task", 20030901, 1 de Septiembre de 2003 (2003-09-01), página 1769, describe, con el objetivo de conseguir un alto rendimiento de reconocimiento para una amplia variedad de ruido y para una amplia gama de relaciones de señal a ruido, la integración de cuatro algoritmos de reducción de ruido: sustracción espectral con suavizado de la dirección de tiempo, mejora de la conversación basada en SVD de dominio temporal, estimación de conversación basada en GMM y filtrado combinado basado en KLT.
YUSUKE KIDA, TATSUYA KAWAHARA: "Voice Activity Detection Based on Optimally Weighted Combination of Multiple Features", INTERSPEECH'2005 - EUROSPEECH, 4 de Septiembre de 2005 (2005-09-04), páginas 26212624, presenta un esquema de detección de actividad de voz que es robusto frente al ruido, basándose en una combinación ponderada óptima de características.
YUSUKE KIDA, TATSUYA KAWAHARA: "Evaluation of Voice Activity Detection by Combining Multiple Features with Weight Adaptation", INTERSPEECH-2006, 17 de Septiembre de 2006 (2006-09-17), propone, para un reconocimiento de conversación automático robusto frente al ruido, un método de detección de actividad de voz basado en una combinación de múltiples características.
SRINIVASAN K ET AL: "Voice activity detection for cellular networks", 19931013; 19931013 - 19931015, 13 de Octubre de 1993 (1993-10-13), páginas 85-86, presenta algoritmos para la detección de actividad de voz en presencia de ruido de vehículos y de rumor.
Compendio de la invención
En un primer aspecto, la presente invención proporciona un circuito de supresión de ruido, de acuerdo con la reivindicación 1.
En otro aspecto, la presente invención proporciona un método para suprimir el ruido en una señal de audio, de acuerdo con la reivindicación 11.
Estas y otras características y ventajas de esta invención resultan evidentes a partir de la siguiente descripción de una o más de las realizaciones preferidas de esta invención, con referencia a los dibujos que se acompañan.
Breve descripción de los dibujos
La FIG. 1 es un diagrama de bloques de un circuito de procesamiento de señal de audio de ejemplo;
la FIG. 2 es un diagrama de bloques de un circuito de eliminación de ruido, asociado con al menos una técnica anterior de ejemplo;
la FIG. 3 es un diagrama de bloques de un circuito de supresión de ruido, de acuerdo con al menos una realización de la presente invención;
la FIG. 4 es un diagrama de bloques más detallado que ilustra un detector de voz de Modelo de Mezcla Gausiano de ejemplo, del tipo ilustrado como parte del circuito de supresión de ruido, ilustrado en la FIG. 3;
la FIG. 5 es un diagrama de bloques de un dispositivo de comunicación bidireccional de ejemplo, en el cual el circuito de supresión de ruido, ilustrado en la FIG. 3, puede ser implementado; y
la FIG. 6 es un método para la supresión de ruido en una señal de audio, de acuerdo con al menos una realización de la presente invención.
Descripción detallada de la realización o realizaciones preferida o preferidas
Aunque la presente invención es susceptible de ser realizada de varias formas, se muestran en los dibujos y se describirán ahora en lo que sigue en esta memoria realizaciones preferidas, entendiéndose que la presente descripción debe considerarse como un ejemplo de la invención y no pretende limitar la invención a las realizaciones específicas ilustradas.
La FIG. 1 ilustra un diagrama de bloques de un circuito de procesamiento de señal de audio 100 de ejemplo. El circuito de procesamiento de señal de audio 100 incluye una primera ruta dirigida a recibir un flujo de datos de audio entrante 102 y a reproducir la correspondiente señal de audio en un altavoz 104, y una segunda ruta dirigida a recibir una señal de audio en un micrófono 106 y a convertir la señal de audio recibida en el micrófono 106 en un flujo de datos de audio saliente 108.
La primera ruta incluye un circuito descodificador de conversación 110, que recibe el flujo de datos de audio entrante 102 que puede ser codificado como paquetes de datos adecuados para su transmisión a través de una interfaz de comunicación de frecuencia de radio, y recombina los paquetes de datos recibidos y convierte a los mismos en datos de conversación digitales. Los datos de conversación digitales son a continuación recibidos por un circuito de mejora de conversación 112, que lleva a cabo cualquier corrección de error o mejora de datos necesaria en los datos de audio como resultado de errores durante la transmisión de los datos y/o de cualquier paquete de datos faltante. El flujo de datos mejorado o corregido es a continuación convertido de una señal digital a una señal analógica a través de un convertidor analógico 114 y transportado a un altavoz 104 para la reproducción de la señal de audio que va a oír el usuario.
La segunda ruta incluye el micrófono 106, que detecta una señal de audio que incluye cualquier señal de voz que es producida por el usuario, así como cualquier ruido de fondo. La señal de audio detectada es a continuación convertida mediante un convertidor de analógico a digital 116 de una señal de audio analógica producida por el micrófono 106 a una señal de audio codificada digitalmente. La señal de audio codificada digitalmente es a continuación recibida por un circuito de eliminación de ruido 118, el cual intenta detectar la presencia de ruido e intenta eliminar al mismo.
Como parte de la detección de presencia de ruido e intentos de eliminación del mismo, en al menos algunos casos, un circuito de cancelación de eco 120 acoplado a la salida del circuito de mejora de conversación 112 de la primera ruta proporciona al circuito de eliminación de ruido 118 una representación de la señal de audio que es transportada al altavoz 104 para ser producida como una señal de audio. Esto a su vez permite que el circuito de eliminación de ruido 118 reconozca cualquier señal de audio producida en el altavoz 104, que puede haber sido subsiguientemente
detectada por el micrófono 106, y que ha sido entonces incorporada a la señal de audio detectada por el micrófono
106. La representación recibida desde el circuito de cancelación de eco 120 puede a continuación ser utilizada para eliminar el mismo de la señal de audio detectada por el micrófono 106.
La señal de audio resultante con el ruido eliminado, que es producida por el circuito de eliminación de ruido 118, es entonces acoplada a un circuito codificador de conversación 122, que toma la señal de audio recibida desde el circuito de eliminación de ruido 118 y codifica la señal de audio en paquetes de datos formando una señal de audio saliente, que es adecuada para transmisión a través de una interfaz de comunicación de radio inalámbrica.
La FIG. 2 ilustra un diagrama de bloques de un circuito de eliminación de ruido 200, asociado con al menos una técnica anterior de ejemplo; El circuito de eliminación de ruido 200 incluye un circuito de análisis de espectro 202, que analiza las diferentes características espectrales de la señal analógica convertida digitalmente detectada por el micrófono 106. Las características espectrales serían entonces transportadas a un detector de actividad de voz 204, el cual intentaría detectar la presencia o ausencia de conversación de usuario. En al menos algunos casos, el circuito de análisis de espectro 202 puede incluir una función de transformada de Fourier rápida y un circuito de análisis, así como circuitos de estimación de espectro de escala de Bark y circuitos de conversión de coeficiente Cepstrum.
Generalmente, el detector de actividad de voz 204, asociado con las técnicas anteriores, detectaría la presencia de cualquier ruido de tipo relativamente estacionario, asociado con una o más frecuencias, tal como el ruido asociado con el motor de un coche. Un circuito de atenuación de ruido 206, aplicaría entonces un nivel de atenuación proporcional a la amplitud detectada del ruido estacionario detectado durante los periodos de tiempo en los cuales no se ha detectado ninguna actividad de voz por parte del detector de actividad de voz 204 (es decir, la señal está comprendida principalmente por ruido estacionario). La conversación de ruido eliminado 208 resultante sería a continuación transportada al circuito codificador de conversación para formar una señal de audio saliente. No obstante, cuando hay otros tipos de ruido tales como ruido no estacionario, muchas veces el detector de actividad de voz sería incapaz de distinguir el ruido no estacionario de la actividad de voz del usuario, y no tendría lugar ninguna atenuación de ruido.
La FIG. 3 ilustra un diagrama de bloques de un circuito de supresión de ruido 300, de acuerdo con al menos una realización de la presente invención; Similar al circuito de supresión de ruido 200, ilustrado en la FIG. 2, el circuito de supresión de ruido 300 incluye un circuito de análisis de espectro 302, el cual determina las diferentes características espectrales de la señal analógica convertida digitalmente detectada por el micrófono 106. Las características espectrales son entonces transportadas a múltiples detectores de actividad de voz 304, que están generalmente dirigidos a detectar un tipo de ruido diferente. Además de un detector de actividad de voz del dominio del espectro 306 y de un detector de actividad de voz del dominio del tiempo 308, que separadamente y/o juntos están dirigidos a detectar varios tipos de ruidos generalmente estacionarios, los múltiples detectores de actividad de voz 304 incluyen adicionalmente un detector de actividad de voz de Modelo de Mezcla Gausiano (GMM - Gaussian Mixture Model, en inglés) 310.
El detector de actividad de voz de Modelo de Mezcla Gausiano 310 representa un detector de actividad de voz basado en un modelo estadístico, el cual está pre-entrenado utilizando una gran cantidad de muestras de rumor recogidas previamente. El detector de actividad de voz basado en un modelo estadístico está generalmente construido con un Modelo de Mezcla Gausiano, en el cual los parámetros del modelo son estimados a través de un procedimiento de entrenamiento de máxima probabilidad para caracterizar los datos del rumor. Se calcula entonces el log de una puntuación de probabilidad, cuando al menos un corto segmento de señal de audio detectada coincide con el Modelo de Mezcla Gausiano. La puntuación es entonces suavizada y utilizada para tomar una decisión acerca de si existe rumor durante el periodo de tiempo del segmento analizado correspondiente.
Los resultados de los múltiples detectores de actividad de voz 304 son entonces utilizados por un circuito de detección de tipo de ruido 312 (es decir, circuitos de decisión lógicos) para determinar la presencia y el tipo de cualquier ruido. Los resultados de los múltiples detectores de actividad de voz 304 son también utilizados por el circuito de estimación de ganancia de señal a ruido 314 para estimar una cantidad de cualquier ruido detectado. La determinación de la presencia, el tipo, y la cantidad de ruido es entonces utilizada por los circuitos de eliminación de ruido, los cuales en la realización ilustrada son en forma de un circuito de atenuación de ruido 316 y un circuito de sustracción de ruido 318, para eliminar ruido de la señal analógica convertida digitalmente detectada por el micrófono 106. El circuito de atenuación de ruido 316 está principalmente implicado en la eliminación de cualquier ruido de tipo estacionario detectado, y el circuito de sustracción de ruido 318 está principalmente implicado en la eliminación de cualquier ruido de tipo rumor detectado.
Más específicamente, el circuito de atenuación de ruido 316 atenúa aquellas bandas de frecuencia en las cuales la relación de señal a ruido es baja. El circuito de sustracción de ruido 318 sustrae componentes de ruido de la señal que se está procesando. Debido a que el circuito de atenuación de ruido 316 funciona de manera más continua en porciones sólo de ruido de la señal que se está procesando, y el circuito de sustracción de ruido 318 es capaz de eliminar ruido superpuesto con conversación, la combinación de los dos métodos ofrece un efecto sinérgico en la eliminación del ruido de manera más efectiva, produciendo con ello la conversación de ruido eliminado 320.
Ruido de comodidad es a continuación añadido a la conversación de ruido eliminado 320 utilizando un circuito sumador 322. El ruido de comodidad es producido por un circuito de fuente de ruido de comodidad 324, que determina el tipo y cantidad de ruido de comodidad sobre la base, al menos en parte, de las salidas del circuito de detección del tipo de ruido 312 y del circuito de estimación de ganancia de señal a ruido 314. El ruido de comodidad pretende enmascarar artefactos audibles que pueden ser introducidos como parte de la atenuación y/o de la sustracción del ruido. Por ejemplo, en ausencia del ruido de comodidad añadido, si el grado de falta de ruido no es el mismo todo el tiempo, se podría oír alguna forma de ruido de tono o de bombeo de ruido, junto con la prevista conversación limpia. El ruido de comodidad, una vez apropiadamente añadido, es generalmente percibido de manera mucho más tolerable que el ruido original, tal como cualquier rumor o ruido estacionario.
La FIG. 4 ilustra un diagrama de bloques más detallado que ilustra un detector de voz de Modelo de Mezcla Gausiano 400 de ejemplo, del tipo ilustrado como parte del circuito de supresión de ruido, ilustrado en la FIG. 3. El detector de actividad de voz 400 de Modelo de Mezcla Gausiano incluye un clasificador 402 Bayesiano de Modelo de Mezcla Gausiano, que está acoplado a un modelo de conversación de voz 404 y a un modelo de rumor 406, incluyendo cada uno un patrón para uno o varios tipos de conversación y de rumor, respectivamente. El clasificador 402 Bayesiano de Modelo de Mezcla Gausiano fundamentalmente se comporta como un circuito de coincidencia de patrón, el cual a su vez produce el anteriormente mencionado log de puntuación de probabilidad, sobre la base de los patrones contenidos en el modelo de conversación de voz 404 y el modelo de rumor 406.
El log de puntuación de probabilidad es a continuación suavizado utilizando un circuito de suavización de puntuación
408. Las puntuaciones suavizadas son entonces proporcionadas al circuito lógico de decisión 410 para determinar la presencia, tipo, y cantidad de rumor, si existiese alguno. Los circuitos 412 correspondientes determinan estadísticas de ruido, que a su vez son utilizadas por los circuitos de atenuación y de sustracción de ruido 316 y 318.
Cuando se detecta rumor con razonable confianza, las estadísticas de ruido son acumuladas por los correspondientes circuitos 414 y analizadas. El análisis resultante es entonces utilizado por los correspondientes circuitos 416 para producir actualizaciones para el modelo de rumor 406, y potencialmente el modelo de conversación de voz 404. Las actualizaciones pretenden mantener el modelo de rumor 406 y el modelo de conversación de voz 404 actualizados, y adaptar los modelos para detectar con más facilidad los tipos de rumor que es más probable que encuentren, sobre la base de la actual experiencia de uso.
La FIG. 5 ilustra un diagrama de bloques de un dispositivo de comunicación de dos sentidos 500 de ejemplo, en el cual el circuito de supresión de ruido, ilustrado en la FIG. 3, puede ser implementado; En la realización ilustrada, el dispositivo de comunicación bidireccional incluye un circuito de procesamiento de señal de audio, que podría ser del tipo ilustrado en la FIG. 1, y que incluye un circuito de supresión de ruido del tipo ilustrado en la FIG. 3. Un altavoz 104 y un micrófono 106 están acoplados al circuito de procesamiento de señal de audio 100, para convertir entre señales de audio producibles y detectables por un usuario y una representación de las mismas en forma de una señal eléctrica. El circuito de procesamiento de señal de audio 100 está adaptado para recibir y producir un flujo de datos de audio que es codificado como paquetes de datos adecuados para transmisión a través de una interfaz de comunicación de frecuencia de radio inalámbrica. El circuito de procesamiento de señal de audio 100 está acoplado a un transceptor 502, el cual a su vez está acoplado a una antena 504, que juntos son capaces de comunicarse con una fuente de radio remota.
Aunque el circuito de supresión de ruido 300 se muestra específicamente como capaz de ser implementado como parte de un dispositivo de comunicación bidireccional, resultará fácilmente evidente para un experto en la materia que el circuito de supresión de ruido 300 podría alternativamente ser utilizado junto con cualquier tipo de dispositivo que sea capaz de recibir una señal de audio, sobre todo en el que la señal de audio pueda tener al menos una porción prevista y una porción no prevista (es decir, ruido), que podría ser detectado con la porción prevista.
La FIG. 6 ilustra un método 600 para la supresión de ruido en una señal de audio, de acuerdo con al menos una realización de la presente invención. El método incluye detectar 602 la presencia de una pluralidad de tipos diferentes de ruido utilizando una pluralidad de detectores de diferentes tipos de ruido. El tipo de ruido detectado en la señal de audio es entonces suprimido 604 utilizando uno de una pluralidad de circuitos de reducción de diferentes tipos de ruido, cuando se detecta el correspondiente tipo de ruido.
Aunque las realizaciones preferidas de la invención han sido ilustradas y descritas, resultará evidente que la invención no está así limitada. Numerosas modificaciones, cambios, sustituciones y equivalentes se les ocurrirán a los expertos en la materia sin separarse del alcance de la presente invención tal como está definida por las reivindicaciones adjuntas.

Claims (11)

  1. REIVINDICACIONES
    1. Un circuito de supresión de ruido (300) para su uso en un circuito de procesamiento de señal de audio, comprendiendo el circuito de supresión de ruido:
    una pluralidad de diferentes tipos de detectores de actividad de voz (304) donde cada detector de actividad de voz está adaptado para detectar la presencia de un tipo diferente de ruido en una señal recibida, incluyendo rumor y ruido estacionario; y
    Un circuito de detección de tipo de ruido (312) que determina la presencia y el tipo de cualquier ruido sobre la base de los resultados de la pluralidad de diferentes tipos de detectores de actividad de voz (304); y
    una pluralidad de circuitos de reducción de diferentes tipos de ruido que incluyen un circuito de atenuación de ruido
    (316) y un circuito de sustracción de ruido (318), donde cada circuito de reducción de ruido está adaptado para eliminar un tipo de ruido detectado diferente, donde cada circuito de reducción de ruido respectivamente corresponde a uno de la pluralidad de detectores de actividad de voz (304) correspondiendo el circuito de atenuación de ruido (316) a la detección de ruido estacionario y correspondiendo el circuito de sustracción de ruido
    (318) a la detección del rumor;
    Donde cada uno de la pluralidad de detectores de actividad de voz (304) detecta la presencia de un tipo de ruido correspondiente en la señal recibida, el respectivo circuito de reducción de ruido es selectivamente activado para condicionar la señal recibida para reducir la cantidad de los tipos de ruido detectados.
  2. 2.
    Un circuito de supresión de ruido de acuerdo con la reivindicación 1, en el que la detección de ruido estacionario incluye un detector de actividad de voz del dominio del espectro (306) y un detector de actividad de voz del dominio del tiempo (308).
  3. 3.
    Un circuito de supresión de ruido de acuerdo con la reivindicación 1, en el que la detección del rumor incluye un modelo de mezcla Gausiano.
  4. 4.
    Un circuito de supresión de ruido de acuerdo con la reivindicación 3, en el que el modelo de mezcla Gausiano incluye un modelo de conversación (404) para detectar la presencia de una señal de voz deseada, y un modelo de ruido (406) para detectar la presencia de rumor.
  5. 5.
    Un circuito de supresión de ruido de acuerdo con la reivindicación 4, en el que la señal de voz detectada y el rumor detectado se utilizan para formular una señal para ser utilizada para uno correspondiente de los circuitos de reducción de ruido.
  6. 6.
    Un circuito de supresión de ruido de acuerdo con la reivindicación 4, en el que el rumor detectado se utiliza para actualizar el modelo de ruido.
  7. 7.
    Un circuito de supresión de ruido de acuerdo con la reivindicación 1, que comprende también una fuente de ruido de comodidad (324) para producir una señal de ruido de comodidad, y un mezclador (322) para combinar la señal de ruido de comodidad con la señal recibida, que ha sido acondicionada para reducir la cantidad de tipos de ruido detectados.
  8. 8.
    Un circuito de supresión de ruido de acuerdo con la reivindicación 1, en el que el circuito de supresión de ruido está incorporado en un dispositivo de comunicación bidireccional (500) que incluye un micrófono (106) y un altavoz (104).
  9. 9.
    Un circuito de supresión de ruido de acuerdo con la reivindicación 8, que comprende también un circuito de cancelación de eco (120) para recibir una señal para ser reproducida por el altavoz (104) y eliminar cualquier señal reproducida por el altavoz detectada por el micrófono (106).
  10. 10.
    Un circuito de supresión de ruido de acuerdo con la reivindicación 1, en el que el circuito de supresión de ruido es incorporado como parte de un teléfono de radio frecuencia.
  11. 11.
    Un método para suprimir ruido en una señal de audio, comprendiendo el método:
    detectar, con una pluralidad de diferentes tipos de detectores de actividad de voz (304), la presencia de un tipo de ruido diferente en una señal recibida, incluyendo rumor y ruido estacionario; y
    determinar, con un circuito de detección de tipo de ruido (312) que determina la presencia y el tipo de cualquier ruido sobre la base de los resultados de la pluralidad de diferentes tipos de detectores de actividad de voz (304);
    suprimir (604) el tipo de ruido detectado en la señal de audio utilizando uno de una pluralidad de circuitos de reducción de diferentes tipos de ruido que incluyen un circuito de atenuación de ruido (316) y un circuito de sustracción de ruido (318), donde cada circuito de reducción de ruido está adaptado para eliminar un tipo diferente de ruido detectado, donde cada circuito de reducción de ruido respectivamente corresponde a uno de una pluralidad de detectores de actividad de voz, correspondiendo el circuito de atenuación de ruido a la detección de ruido estacionario y correspondiendo el circuito de sustracción de ruido a la detección de rumor, cuando el respectivo detector detecta la presencia del correspondiente tipo de ruido activando selectivamente el respectivo circuito de reducción de ruido.
ES07871389.8T 2006-12-30 2007-11-07 Un método y circuito de supresión de ruido que incorpora una pluralidad de técnicas de supresión de ruido Active ES2454645T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US842305 1992-02-26
US88292606P 2006-12-30 2006-12-30
US882926P 2006-12-30
US11/842,305 US9966085B2 (en) 2006-12-30 2007-08-21 Method and noise suppression circuit incorporating a plurality of noise suppression techniques
PCT/US2007/083906 WO2008082793A2 (en) 2006-12-30 2007-11-07 A method and noise suppression circuit incorporating a plurality of noise suppression techniques

Publications (1)

Publication Number Publication Date
ES2454645T3 true ES2454645T3 (es) 2014-04-11

Family

ID=41296707

Family Applications (1)

Application Number Title Priority Date Filing Date
ES07871389.8T Active ES2454645T3 (es) 2006-12-30 2007-11-07 Un método y circuito de supresión de ruido que incorpora una pluralidad de técnicas de supresión de ruido

Country Status (6)

Country Link
US (1) US9966085B2 (es)
EP (1) EP2100295B1 (es)
KR (1) KR101121489B1 (es)
CN (1) CN101583996B (es)
ES (1) ES2454645T3 (es)
WO (1) WO2008082793A2 (es)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10223934B2 (en) 2004-09-16 2019-03-05 Lena Foundation Systems and methods for expressive language, developmental disorder, and emotion assessment, and contextual feedback
US9240188B2 (en) 2004-09-16 2016-01-19 Lena Foundation System and method for expressive language, developmental disorder, and emotion assessment
US9355651B2 (en) 2004-09-16 2016-05-31 Lena Foundation System and method for expressive language, developmental disorder, and emotion assessment
US8938390B2 (en) * 2007-01-23 2015-01-20 Lena Foundation System and method for expressive language and developmental disorder assessment
US8078465B2 (en) * 2007-01-23 2011-12-13 Lena Foundation System and method for detection and analysis of speech
WO2008091947A2 (en) * 2007-01-23 2008-07-31 Infoture, Inc. System and method for detection and analysis of speech
US8208917B2 (en) * 2007-10-29 2012-06-26 Bose Corporation Wireless and dockable audio interposer device
US8060014B2 (en) * 2007-10-30 2011-11-15 Joji Ueda Wireless and dockable audio interposer device
US8660055B2 (en) * 2007-10-31 2014-02-25 Bose Corporation Pseudo hub-and-spoke wireless audio network
EP2058797B1 (en) 2007-11-12 2011-05-04 Harman Becker Automotive Systems GmbH Discrimination between foreground speech and background noise
NO328622B1 (no) * 2008-06-30 2010-04-06 Tandberg Telecom As Anordning og fremgangsmate for reduksjon av tastaturstoy i konferanseutstyr
CN102150206B (zh) * 2008-10-24 2013-06-05 三菱电机株式会社 噪音抑制装置以及声音解码装置
US9706282B2 (en) * 2009-02-23 2017-07-11 Harman International Industries, Incorporated Earpiece system
FR2945689B1 (fr) * 2009-05-15 2011-07-29 St Nxp Wireless France Terminal de communication audio bidirectionnelle simultanee.
WO2010146711A1 (ja) * 2009-06-19 2010-12-23 富士通株式会社 音声信号処理装置及び音声信号処理方法
EP2652737B1 (en) * 2010-12-15 2014-06-04 Koninklijke Philips N.V. Noise reduction system with remote noise detector
EP3493205B1 (en) * 2010-12-24 2020-12-23 Huawei Technologies Co., Ltd. Method and apparatus for adaptively detecting a voice activity in an input audio signal
EP2494545A4 (en) * 2010-12-24 2012-11-21 Huawei Tech Co Ltd METHOD AND DEVICE FOR DETECTING LANGUAGE ACTIVITIES
US9264804B2 (en) 2010-12-29 2016-02-16 Telefonaktiebolaget L M Ericsson (Publ) Noise suppressing method and a noise suppressor for applying the noise suppressing method
WO2012107561A1 (en) 2011-02-10 2012-08-16 Dolby International Ab Spatial adaptation in multi-microphone sound capture
US20140006019A1 (en) * 2011-03-18 2014-01-02 Nokia Corporation Apparatus for audio signal processing
US20140278389A1 (en) * 2013-03-12 2014-09-18 Motorola Mobility Llc Method and Apparatus for Adjusting Trigger Parameters for Voice Recognition Processing Based on Noise Characteristics
MY178710A (en) * 2012-12-21 2020-10-20 Fraunhofer Ges Forschung Comfort noise addition for modeling background noise at low bit-rates
CN103077725B (zh) * 2012-12-31 2015-12-23 东莞宇龙通信科技有限公司 语音处理的方法及装置
US20140278393A1 (en) * 2013-03-12 2014-09-18 Motorola Mobility Llc Apparatus and Method for Power Efficient Signal Conditioning for a Voice Recognition System
CN110351623A (zh) * 2013-05-02 2019-10-18 布佳通有限公司 耳机有源噪声控制
CN104283599B (zh) * 2013-07-10 2018-11-06 南京中兴新软件有限责任公司 一种基站、终端以及干扰抑制的方法、装置
CN104378774A (zh) * 2013-08-15 2015-02-25 中兴通讯股份有限公司 一种语音质量处理的方法及装置
US9721580B2 (en) * 2014-03-31 2017-08-01 Google Inc. Situation dependent transient suppression
US9412393B2 (en) * 2014-04-24 2016-08-09 International Business Machines Corporation Speech effectiveness rating
WO2016108166A1 (en) * 2014-12-28 2016-07-07 Silentium Ltd. Apparatus, system and method of controlling noise within a noise-controlled volume
CN104575509A (zh) * 2014-12-29 2015-04-29 乐视致新电子科技(天津)有限公司 语音增强处理方法及装置
US9754576B2 (en) * 2015-03-23 2017-09-05 Ford Global Technologies, Llc Control system for noise generated by functional hardware components
CN106251572A (zh) * 2016-08-26 2016-12-21 深圳大学 基于振动检测的智能家居监控方法及系统
US10650621B1 (en) 2016-09-13 2020-05-12 Iocurrents, Inc. Interfacing with a vehicular controller area network
EP3425923B1 (en) * 2017-07-06 2024-05-08 GN Audio A/S Headset with reduction of ambient noise
CN107507621B (zh) * 2017-07-28 2021-06-22 维沃移动通信有限公司 一种噪声抑制方法及移动终端
US10511806B2 (en) * 2017-09-30 2019-12-17 International Business Machines Corporation Mitigating effects of distracting sounds in an audio transmission of a conversation between participants
WO2019113477A1 (en) 2017-12-07 2019-06-13 Lena Foundation Systems and methods for automatic determination of infant cry and discrimination of cry from fussiness
CN111713120B (zh) * 2017-12-15 2022-02-25 Gn奥迪欧有限公司 具有降低环境噪声系统的耳机
JP7043344B2 (ja) * 2018-05-17 2022-03-29 株式会社トランストロン エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
CN109003620A (zh) * 2018-05-24 2018-12-14 北京潘达互娱科技有限公司 一种回音消除方法、装置、电子设备及存储介质
CN109087659A (zh) * 2018-08-03 2018-12-25 三星电子(中国)研发中心 音频优化方法及设备
US11138334B1 (en) * 2018-10-17 2021-10-05 Medallia, Inc. Use of ASR confidence to improve reliability of automatic audio redaction
KR102569365B1 (ko) * 2018-12-27 2023-08-22 삼성전자주식회사 가전기기 및 이의 음성 인식 방법
US11011182B2 (en) * 2019-03-25 2021-05-18 Nxp B.V. Audio processing system for speech enhancement
US11222625B2 (en) * 2019-04-15 2022-01-11 Ademco Inc. Systems and methods for training devices to recognize sound patterns
CN111445894A (zh) * 2020-03-02 2020-07-24 北京航天晨信科技有限责任公司 一种方舱的降噪方法
CN113096677B (zh) * 2021-03-31 2024-04-26 深圳市睿耳电子有限公司 一种智能降噪的方法及相关设备
US11915715B2 (en) 2021-06-24 2024-02-27 Cisco Technology, Inc. Noise detector for targeted application of noise removal

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4185168A (en) * 1976-05-04 1980-01-22 Causey G Donald Method and means for adaptively filtering near-stationary noise from an information bearing signal
US5097510A (en) * 1989-11-07 1992-03-17 Gs Systems, Inc. Artificial intelligence pattern-recognition-based noise reduction system for speech processing
GB2271247B (en) * 1992-10-05 1997-02-19 Motorola Israel Ltd A radio telephone for a vehicle
US5933495A (en) * 1997-02-07 1999-08-03 Texas Instruments Incorporated Subband acoustic noise suppression
DE19736517A1 (de) * 1997-08-22 1999-02-25 Alsthom Cge Alcatel Verfahren zur Reduzierung von Störungen bei der Übertragung eines elektrischen Nachrichtensignals
US6163608A (en) 1998-01-09 2000-12-19 Ericsson Inc. Methods and apparatus for providing comfort noise in communications systems
US6148078A (en) 1998-01-09 2000-11-14 Ericsson Inc. Methods and apparatus for controlling echo suppression in communications systems
US6424938B1 (en) * 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
US6618701B2 (en) * 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
WO2001052524A1 (en) * 2000-01-13 2001-07-19 Koninklijke Philips Electronics N.V. Noise reduction
US6760435B1 (en) * 2000-02-08 2004-07-06 Lucent Technologies Inc. Method and apparatus for network speech enhancement
TW473704B (en) * 2000-08-30 2002-01-21 Ind Tech Res Inst Adaptive voice recognition method with noise compensation
JP4244514B2 (ja) * 2000-10-23 2009-03-25 セイコーエプソン株式会社 音声認識方法および音声認識装置
US6993481B2 (en) 2000-12-04 2006-01-31 Global Ip Sound Ab Detection of speech activity using feature model adaptation
CA2341834C (en) * 2001-03-21 2010-10-26 Unitron Industries Ltd. Apparatus and method for adaptive signal characterization and noise reduction in hearing aids and other audio devices
GB0112319D0 (en) * 2001-05-21 2001-07-11 Univ Belfast Interpretation of features for signal processing and pattern recognition
US7787956B2 (en) * 2002-05-27 2010-08-31 The Bionic Ear Institute Generation of electrical stimuli for application to a cochlea
US7318030B2 (en) 2003-09-17 2008-01-08 Intel Corporation Method and apparatus to perform voice activity detection
US7065206B2 (en) * 2003-11-20 2006-06-20 Motorola, Inc. Method and apparatus for adaptive echo and noise control
US7725314B2 (en) 2004-02-16 2010-05-25 Microsoft Corporation Method and apparatus for constructing a speech filter using estimates of clean speech and noise
US7492889B2 (en) * 2004-04-23 2009-02-17 Acoustic Technologies, Inc. Noise suppression based on bark band wiener filtering and modified doblinger noise estimate
JP4876378B2 (ja) * 2004-08-27 2012-02-15 日本電気株式会社 音声処理装置、音声処理方法及び音声処理プログラム
KR100640865B1 (ko) * 2004-09-07 2006-11-02 엘지전자 주식회사 음성 품질 향상 방법 및 장치
US7383179B2 (en) * 2004-09-28 2008-06-03 Clarity Technologies, Inc. Method of cascading noise reduction algorithms to avoid speech distortion
US20060217970A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for noise reduction
US7873114B2 (en) * 2007-03-29 2011-01-18 Motorola Mobility, Inc. Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate

Also Published As

Publication number Publication date
WO2008082793A3 (en) 2008-08-28
WO2008082793B1 (en) 2008-10-23
US20080159560A1 (en) 2008-07-03
EP2100295A4 (en) 2012-02-08
CN101583996A (zh) 2009-11-18
CN101583996B (zh) 2013-11-06
US9966085B2 (en) 2018-05-08
EP2100295A2 (en) 2009-09-16
KR20090096484A (ko) 2009-09-10
WO2008082793A2 (en) 2008-07-10
EP2100295B1 (en) 2014-03-12
KR101121489B1 (ko) 2012-02-28

Similar Documents

Publication Publication Date Title
ES2454645T3 (es) Un método y circuito de supresión de ruido que incorpora una pluralidad de técnicas de supresión de ruido
US8600454B2 (en) Decisions on ambient noise suppression in a mobile communications handset device
ES2337956T3 (es) Circuito de reduccion del eco acustico para un dispositivo "manos libres" utilizable con un telefono movil.
CN104052526B (zh) 用于声学回声抵消器的基于倒谱距离的消波
US8433564B2 (en) Method for wind noise reduction
US20100082339A1 (en) Wind Noise Reduction
ES2341500T3 (es) Procedimiento de reduccion del eco acustico residual tras la supresion de eco en un dispositivo manos libres.
US9100756B2 (en) Microphone occlusion detector
US8914282B2 (en) Wind noise reduction
US20090022335A1 (en) Dual Adaptive Structure for Speech Enhancement
US8447595B2 (en) Echo-related decisions on automatic gain control of uplink speech signal in a communications device
US9711162B2 (en) Method and apparatus for environmental noise compensation by determining a presence or an absence of an audio event
KR20070085729A (ko) 바크 밴드 위너 필터 및 선형 감쇠를 이용한 노이즈 감소및 컴포트 노이즈 이득 제어
US6487529B1 (en) Audio processing device, receiver and filtering method for filtering a useful signal and restoring it in the presence of ambient noise
US20110135107A1 (en) Dual Adaptive Structure for Speech Enhancement
CN106448691A (zh) 一种用于扩音通信系统的语音增强方法
US20150063592A1 (en) Voice signals improvements in compressed wireless communications systems
GB2558164A (en) Real-time wind buffet noise detection
KR20170032237A (ko) 즉각적인 바람 잡음을 감소시키는 것
US8170229B2 (en) Audio privacy apparatus and method
CN109218879A (zh) 头戴式耳机、用于头戴式耳机的方法以及计算机可读介质
US9491543B1 (en) Method and device for improving audio signal quality in a voice communication system
CN108965539A (zh) 增强使用者听到手机外放扬声器音量的装置及方法
Wu et al. Efficient speech enhancement using spectral subtraction for car hands-free applications
ES2351773T3 (es) Dispositivo telefónico para cancelar el ruido de fondo en el altavoz.