ES2492698T3 - Procedimiento y sistema de reducción del ruido - Google Patents

Procedimiento y sistema de reducción del ruido Download PDF

Info

Publication number
ES2492698T3
ES2492698T3 ES12163679.9T ES12163679T ES2492698T3 ES 2492698 T3 ES2492698 T3 ES 2492698T3 ES 12163679 T ES12163679 T ES 12163679T ES 2492698 T3 ES2492698 T3 ES 2492698T3
Authority
ES
Spain
Prior art keywords
noise
signal
module
output
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES12163679.9T
Other languages
English (en)
Inventor
Pascal Saguin
Karim Maouche
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Adeunis RF SA
Original Assignee
Adeunis RF SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Adeunis RF SA filed Critical Adeunis RF SA
Application granted granted Critical
Publication of ES2492698T3 publication Critical patent/ES2492698T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Noise Elimination (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

Procedimiento de reducción del ruido en una señal acústica con ruido y(t) procedente de un micrófono que está funcionando en un medio ruidoso, que comprende las etapas sucesivas siguientes: a) conversión de la señal acústica con ruido y(t) dentro del dominio temporal en una señal con ruido Yk,l dentro del dominio de la frecuencia, mediante segmentación temporal de la señal acústica con ruido y(t) en señales muestreadas yl dentro de tramas temporales I sucesivas, enventanado de las señales muestreadas yl por aplicación de una ventana de ponderación, y aplicación de una transformada de Fourier discreta, con extracción del módulo al cuadrado Yk,l , y eventualmente de la fase θk,l, de la señal con ruido Yk,l; b) estimación de una componente de ruido D k,l contenida dentro de la señal con ruido Yk,l a partir del módulo al cuadrado 2 Yk,l , mediante un algoritmo de estimación de la densidad espectral de potencia de la componente de ruido según un método de promediado recursivo de los mínimos controlados denominado "MCRA"; caracterizado por que comprende además, después de la etapa b), las etapas sucesivas siguientes: c) segmentación de la banda frecuencial en varias sub-bandas frecuenciales SBi>=[ei, bi], seguida por una descomposición multi-banda del módulo al cuadrado 2 l k, Y y de la componente de ruido D k,l, que consiste en descomponer el módulo al cuadrado 2 l k, Y y la componente de ruido D k,l en respectivamente varios módulos al cuadrado de sub-banda 2 i l, k, Y y varias componentes de ruido de sub-banda D k,l,i propios de cada una de las sub-bandas SBi; d) estimación, para cada una de las sub-bandas SBi, del módulo al cuadrado X k,l,i2 25 de una componente con ruido eliminado de sub-banda X k,l,i, propia de cada sub-banda SBi de una señal con ruido eliminado X k,l, mediante un algoritmo de sustracción espectral multi-banda denominado "SSMB" a partir de los módulos al cuadrado de sub-banda 2 i l, k, Y y de las componentes de ruido de sub-banda D k,l,i; e) determinación de una señal de salida con ruido eliminado SDk,l a partir de los módulos al cuadrado X k,l,i2 procedentes de la etapa d), y eventualmente de las fasesθk,l extraídas durante la etapa a); f) conversión de la señal de salida con ruido eliminado SDk,l en una señal vocal de salida con ruido eliminado sd(t) en el dominio temporal, mediante una etapa f.1) de cálculo de una señal muestreada de salida Sdl propia de cada trama temporal l mediante la aplicación de una transformada de Fourier inversa de la señal de salida con ruido eliminado SDk,l, seguida por una etapa f.2) de reconstrucción temporal de la señal vocal de salida con ruido eliminado sd(t) a partir de las señales muestreadas de salida Sdl; y en el que la etapa e) consiste en: - determinar, para cada una de las sub-bandas SBi, el módulo al cuadrado k,l,i2 de una componente con ruido eliminado combinada de sub-banda X k,l,i propia de cada sub-banda SBi de una señal con ruido eliminado combinada X k,l, que responde a la ecuación correspondiente:**Fórmula** en la que γ es un coeficiente de amplificación predeterminado, comprendido preferentemente entre 0,01 y 0,1; - determinar una señal con ruido eliminado combinada X k,l a partir de los módulos al cuadrado X k,l,i2 de las componentes con ruido eliminado combinadas de sub-banda X k,l,i , y eventualmente de las fases θk,l extraídas durante la etapa a), de manera que la señal con ruido eliminado de salida SDk,l corresponda a la señal con ruido eliminado combinada X k,l , es decir SDk,l>=X k,l.

Description

5
15
25
35
45
55
65 E12163679
13-08-2014
DESCRIPCIÓN
Procedimiento y sistema de reducción del ruido.
La presente invención se refiere a un procedimiento de reducción del ruido y a un sistema de reducción del ruido asociado.
Se refiere más en particular a un procedimiento y a un sistema de reducción del ruido en una señal acústica con ruido y(t) procedente de un micrófono que está funcionando en un medio ruidoso.
La presente invención encuentra una aplicación particular en los sistemas de comunicación de audio dúplex completo, inalámbricos y de un solo sensor, dicho de otra manera de un solo micrófono, que permiten establecer una comunicación de audio entre varios usuarios, de manera autónoma (es decir, sin conexión con una base de transmisión o con una red) y que sea sencillo de utilizar (es decir, sin que necesite ninguna intervención de un técnico para establecer la comunicación).
Dichos sistemas de comunicación se utilizan en general en un entorno ruidoso, como, por ejemplo, un medio marino
o una sala de espectáculos, e incluso extremadamente ruidoso, como, por ejemplo, un emplazamiento de obras públicas o una sala o estadio que acoja un acontecimiento deportivo.
Así, es necesario, e incluso imprescindible, prever un procedimiento y/o sistema de reducción del ruido (o de realce de palabra) en la cadena de tratamiento de la señal con el fin de mejorar la calidad de audio para que la conversación resulte audible entre los usuarios de los sistemas de comunicación, dicho de otra manera, para que la comunicación resulte comprensible.
Se conoce la estimación de la componente de ruido contenida en la señal con ruido por medio de un algoritmo de estimación de la densidad espectral de potencia de la componente de ruido según un método de promediado recursivo de los mínimos controlados, denominado "MCRA" de "Minima Controlled Recursive Averaging".
Este método de estimación del ruido denominado "MCRA" se conoce a partir de la bibliografía científica, especialmente a partir de los siguientes artículos:
-"Speech enhancement for non-stationary noise environments", de I. Cohen y B. Berdugo, Signal Processing, 2001, vol. 81, págs. 2.403 a 2.418;
-"Noise Estimation by Minima Controlled Recursive Averaging for Robust Speech Enhancement", de I. Cohen y B. Berdugo, IEEE Signal Processing Letters, Janvier 2002, vol. 9, n.º 1, págs. 12 a 15;
-"A Modified Spectral Subtraction Method for Speech Enhancement Based on Masking Property of Human Auditory System", de X. Bing-Yin et al., Wireless Communications & Signals Processing, International Conference on IEEE, 13 de noviembre de 2009, págs. 1 a 5, XP031594664.
Así, el método de estimación del ruido denominado "MCRA" está en particular bien adaptado en los entornos en los que la señal de ruido es considerablemente no estacionaria y evoluciona de forma relativamente rápida en el tiempo.
El estado de la técnica también se puede ilustrar según las enseñanzas del artículo "Multi-band Spectral Subraction for Enhancing Speech Corrupted by Colored Noise", 2002 IEEE International Conference on Acoustics, Speech and Signal Processing. Proceedings (Cat. N.º02CH37334), vol. 4, 2002. Este artículo da a conocer un método de sustracción espectral multi-banda.
Otro estado de la técnica publicado en "A Multi-Band Spectral Subtraction Method for Enhancing Speech Corrupted by Colored Noise", de S.D. Kamath y P.C. Loizou, Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing, 2002, vol. 4, describe un método de sustracción espectral con descomposición multibanda que tiene en cuenta efectos de ruido coloreado a frecuencias diferentes.
La presente invención tiene como objetivo proponer un procedimiento según la reivindicación 1 y un sistema según la reivindicación 10, de reducción de ruido, adaptado a entornos fuertemente ruidosos y en los que la componente de ruido es considerablemente no estacionaria y evoluciona de forma relativamente rápida en el tiempo.
A título de ejemplo, un procedimiento de reducción del ruido en una señal acústica con ruido y(t) procedente de un micrófono, preferentemente único, que está funcionando en un medio ruidoso, comprende las siguientes etapas sucesivas:
a) conversión de la señal acústica con ruido y(t) dentro del dominio temporal en una señal con ruido Yk,l dentro del dominio de la frecuencia, mediante segmentación temporal de la señal acústica con ruido y(t) en señales muestreadas yl dentro de tramas temporales I sucesivas, enventanado de las señales muestreadas yl por
E12163679
13-08-2014
aplicación de una ventana de ponderación, y aplicación de una transformada de Fourier discreta, con
extracción del módulo al cuadrado Yk,l 2 , y eventualmente de la fase θk,l, de la señal con ruido Yk,l;
b) estimación de una componente de ruido Dk,l contenida dentro de la señal con ruido Yk,l a partir del módulo al
5 cuadrado Yk,l 2 , mediante un algoritmo de estimación de la densidad espectral de potencia de la
componente de ruido según un método de promediado recursivo de los mínimos controlados denominado "MCRA";
caracterizado por que comprende además, después de la etapa b), las siguientes etapas sucesivas: 10 c) segmentación de la banda frecuencial en varias sub-bandas frecuenciales SBi=[ei, bi], seguido por una
descomposición multi-banda del módulo al cuadrado Yk,l 2 y de la componente de ruido Dk,l, que consiste en
descomponer el módulo al cuadrado Yk,l 2 y la componente de ruido Dk,l en respectivamente varios módulos
al cuadrado de sub-banda Yk,l,i 2 y varias componentes de ruido de sub-banda Dk,l,i propios de cada una de
15 las sub-bandas SBi;
2
d) estimación, para cada una de las sub-bandas SBi, del módulo al cuadrado Xk,l,i de una componente con ruido eliminado de sub-banda Xk,l,i propia de cada sub-banda SBi de una señal con ruido eliminado Xk,l, mediante un algoritmo de sustracción espectral multi-banda denominado "SSMB" a partir de los módulos al
20 cuadrado de sub-banda Yk,l,i 2 y de las componentes de ruido de sub-banda Dk,l,i;
2
e) determinación de una señal con ruido eliminado, de salida SDk,l a partir de los módulos al cuadrado Xk,l,i procedentes de la etapa d), y eventualmente de las fases θk,l extraídas durante la etapa a);
25 f) conversión de la señal de salida con ruido eliminado SDk,l en una señal vocal con ruido eliminado, de salida, sd(t) en el dominio temporal, mediante una etapa f.1) de cálculo de una señal muestreada de salida Sdl propia de cada trama temporal l mediante aplicación de una transformada de Fourier inversa de la señal de salida con ruido eliminado SDk,l, seguido por una etapa f.2) de reconstrucción temporal de la señal vocal con ruido eliminado, de salida, sd(t) a partir de las señales muestreadas de salida Sdl.
30 Así, este ejemplo propone utilizar un algoritmo de sustracción espectral multi-banda "SSMB" que consiste en repartir la banda espectral completa en sub-bandas y en adaptar, dentro de cada sub-banda, el cálculo de sustracción entre la señal con ruido Yk,l y la componente de ruido Dk,l para extraer una señal de salida con ruido eliminado SDk,l; aplicar la operación de sustracción espectral dentro de cada sub-banda lo cual permite mejorar la sensibilidad del
35 procedimiento de reducción del ruido.
Las simulaciones con este procedimiento que combina los algoritmos "MCRA" y "SSMB" demuestran una clara mejora de la calidad de audio de la señal con ruido tratada. Para una gama amplia de ruidos, el resultado se revela ampliamente superior con respecto a los procedimientos clásicos.
40 Durante la etapa a), la extracción de la fase θk,l, de la señal con ruido Yk,l es opcional. En efecto, es posible, durante
2
la etapa e), determinar la señal con ruido, de salida, SDk,l a partir de los módulos al cuadrado Xk,l,i y de la señal con ruido Yk,l sin tener que calcular como condición previa su fase.
45 Según una característica, el algoritmo de estimación de la densidad espectral de potencia de la componente de ruido según el método de promediado recursivo de los mínimos controlados denominado "MCRA" durante la etapa b) utiliza las siguientes fases de cálculo:
b.1) cálculo de una componente con ruido, filtrada, Sk,l que responde a la ecuación: 50
S = α S +(1− α ) Yk,l 2
k,l s k,l −1 s
donde αs es una constante predeterminada característica de un filtro paso-bajo;
~
55 b.2) cálculo de una densidad de probabilidad de presencia de palabra mediante la utilización del cálculo
pk,l progresivo siguiente:
E12163679
13-08-2014
(i) cálculo de una componente mínima espectral Smink,l con: -si rem(k,l) = 0 5 entonces Smink,l = min (Smink,l-1; Sk,l) y Stmpk,l = Sk,l -si rem(k,l) ≠ 0 10 entonces Smink,l = min (Stmpk,l-1; Sk,l) y Stmpk,l = min (Stmpk,l-1; Sk,l) donde rem(k,l) es el resto de la división entera de k por l, a continuación
15 (ii) cálculo de una relación espectral Srk,l que responde a la ecuación: S
k,l
Sr =
k,l
Smin
k,l
(iii) cálculo de una variable indicadora Ik,l con:
20 -si Srk,l > δTH entonces Ik,l = 1 -si Srk,l ≤δTH entonces Ik,l =0
donde δTH es un parámetro predeterminado de umbral fijo de detección de palabra; 25
~
(iv) cálculo de la densidad de la probabilidad de presencia de palabra con:
pk,l
~ ~
pk,l = αppk,l−1 +(1− αp )Ik,l
30 donde αp es una constante predeterminada;
~
b.3) cálculo de un coeficiente que responde a la siguiente ecuación:
αk,l
~~
α = α +(1− α) p
k,l k,l
, 35 donde α es una constante predeterminada;
b.4) cálculo de la componente de ruido Dk,l que responde a la siguiente ecuación:
240 Dk,l =αk,lDk,l-1+ 1-αk,l Yk,l .
El método denominado "MCRA" utiliza el siguiente principio: en una ventana de horizonte finito y para una frecuencia dada, el mínimo de la densidad espectral de potencia (DSP) de la señal con ruido Yk,l corresponde al valor de la densidad espectral de potencia (DSP) de la componente de ruido Dk,l. Así, una estimación de los diferentes valores
45 mínimos del espectro sobre una ventana deslizante permite obtener una estimación de la densidad espectral de potencia (DSP) de la componente de ruido Dk,l.
Según otra característica, el algoritmo de sustracción espectral multi-banda denominado "SSMB" de la etapa d) utiliza las fases de cálculo siguientes, para cada una de las sub-bandas SBi: 50 d.1) cálculo de una relación de señal/ruido SNRk,l,i propia de cada sub-banda SBi que responde a la ecuación:
∑bi 2Yk,l,i SNRk,l,i=10.log10 k=ei
∑bi Dk,l,i
k=ei
2
d.2) cálculo del módulo al cuadrado Xk,l.i de la componente con ruido eliminado de sub-banda Xk,l.i propio de 55 cada sub-banda SBi, según la ecuación:
E12163679
13-08-2014
22 2
Yk,l,i -αi δi Dk,l,i si Yk,l,i >αi δi Dk,l,i Xk,l,i
=
22 β Yk,l,i si Yk,l,i ≤αi δi Dk,l,i
donde
-δi es un parámetro variable en función de la sub-banda SBi correspondiente, que adopta valores 5 distintos de una sub-banda a otra;
-αi es un parámetro variable que depende del valor de la relación de señal/ruido SNRk,l,i calculado dentro de la sub-banda SBi correspondiente; y
10 -β es una constante.
Un algoritmo de este tipo es en particular ventajoso puesto que tiene en cuenta el valor de la relación de señal/ruido SNRk,l,i propio de cada sub-banda SBi para llevar a cabo la sustracción espectral dentro de cada sub-banda.
15 Como la componente de ruido no está distribuida de manera uniforme a lo largo de las frecuencias, la utilización de este algoritmo de sustracción espectral multi-banda "SSMB" permite realizar tratamientos con parámetros diferentes según la sub-banda en la que se encuentre. Por ello, la componente de ruido se podrá reducir de manera más significativa dentro de una sub-banda si la misma es más preponderante en esta última, a diferencia de un algoritmo de sustracción de banda completa que reducirá el ruido de manera igual sobre todas las sub-bandas del espectro y,
20 por tanto, será menos preciso y así menos eficaz.
En una forma de realización particular, los parámetros αi responden a las ecuaciones siguientes:
 α si SNR < SNR
c1 k,l,i 1
α = ⎨α + α SNR si SNR ≤ SNR ≤ SNR
i c2 c3 k,l,i 1 k,l,i 2
α si SNR > SNR
 c4 k,l,i 2
25 donde αc1, αc2, αc3 y αc4 son unas constantes predeterminadas, y SNR1 y SNR2 son unos umbrales predeterminados.
Los valores αc1, αc2, αc3 y αc4, y SNR1 y SNR2 se escogen de manera experimental, especialmente por simulación digital. A título de ejemplo no limitativo, los siguientes valores han ofrecido buenos resultados en la simulación
30 digital:
SNR1 = -5 dB, SNR2= 20 dB;y
αc1 = 5, αc2 = 4, αc3 = -0,15, αc4 = 1
35 Según el procedimiento ejemplificativo, la etapa e) consiste en determinar la señal con ruido eliminado Xk,l a partir de
2
los módulos al cuadrado Xk,l,i de las componentes con ruido eliminado, de sub-banda, Xk,l,i, y eventualmente de las fases θk,l extraídas durante la etapa a), de manera que la señal de salida con ruido eliminado SDk,l corresponda a la señal con ruido eliminado Xk,l, es decir, SDk,l=Xk,l.
40 Así, se considera que la señal de salida con ruido eliminado SDk,l corresponde a la señal con ruido eliminado Xk,l
2
cuyos módulos al cuadrado Xk,l,i proceden directamente desde la etapa d) que utiliza el algoritmo de sustracción espectral multi-banda "SSMB".
Según la invención, en una variante del ejemplo, la etapa e) consiste en: 45
2
-determinar, para cada una de las sub-bandas SBi, el módulo al cuadrado k,l,i de una componente con ruido eliminado combinada de sub-banda Xk,l,i propia de cada sub-banda SBi de una señal con ruido eliminado combinada Xk,l, que responde a la ecuación correspondiente:
Xk,l,i 2= Xk,l,i 2+γ Yk,l,i 2
50 donde γ es un coeficiente de amplificación predeterminado, preferentemente comprendido entre 0,01 y 0,1;
2
-determinar una señal con ruido eliminado combinada Xk,l a partir de los módulos al cuadrado Xk,l,i de las componentes con ruido eliminado combinadas de sub-banda Xk,l,i , y eventualmente de las fases θk,l extraídas 55 durante la etapa a), de manera que la señal con ruido eliminado de salida SDk,l corresponda a la señal con
E12163679
13-08-2014
ruido eliminado combinada Xk,l , es decir SDk,l=Xk,l.
La señal tratada, es decir la señal con ruido eliminado Xk,l, puede sufrir a nivel de la calidad y de la inteligibilidad de un problema de distorsión. Esta distorsión, cuyo origen es en general el tratamiento de reducción del ruido, depende 5 de los parámetros de los algoritmos de reducción del ruido (algoritmos "MCRA" y "SSMB") aunque también del nivel y del tipo de componente de ruido a reducir.
Así, en el marco de la invención, después de la etapa d) que utiliza el algoritmo de sustracción espectral multi-banda "SSMB", se prosigue hacia una etapa de realimentación de la señal con ruido Yk,l procedente del micrófono en la 10 señal con ruido eliminado Xk,l; esta realimentación es controlada por el coeficiente de amplificación (denominado, con otras palabras, parámetro de atenuación) que se escoge de manera que es muy débil, del orden de algunos
2
puntos porcentuales. La señal realimentada corresponde a la señal γ Yk,l,i y no presenta distorsión, ya que no ha sido objeto de un tratamiento por los algoritmos "MCRA" y "SSMB".
15 Este principio de realimentación de una parte muy débil de la señal con ruido Yk,l procedente del micrófono permite remediar, por lo menos en parte, este problema de distorsión.
En una primera forma de realización, la etapa f.2) consiste en reconstruir la señal vocal con ruido eliminado de salida sd(t) únicamente a partir de las señales de salida Sdl procedentes de la etapa f.1), correspondiendo estas señales de 20 salida Sdl a las transformadas de Fourier inversas de la señal con ruido eliminado de salida SDk,l propias de cada trama temporal l.
Así, en esta primera forma de realización, la señal vocal con ruido eliminado de salida sd(t) se reconstruye a partir de las señales de salida Sdl únicas procedentes de la etapa f.1).
25 En una segunda forma de realización, en una variante de la primera forma de realización, la etapa f.2) consiste en, para cada trama temporal l:
g) calcular una relación media de señal/ruido rl propia de la trama temporal l a partir del módulo al cuadrado
30 Yk,l 2 y de la componente de ruido Dk,l;
h) comparar la relación media de señal/ruido rl con un umbral ψTH predeterminado;
i) reconstruir la señal vocal con ruido eliminado de salida sd(t) teniendo en cuenta que: 35
-si la relación media de señal/ruido rl es inferior a dicho umbral ψTH para la trama temporal l, entonces la señal considerada antes de la reconstrucción temporal para esta trama temporal l corresponde a la señal de salida Sdl procedente de la etapa f.1);
40 -si la relación media de señal/ruido rl es superior a dicho umbral ψTH para la trama temporal l, entonces la señal considerada antes de la reconstrucción temporal para esta trama temporal l corresponde a la señal muestreada yl procedente de la etapa de segmentación de la etapa a).
Así, en esta segunda forma de realización, se utiliza: 45 -durante la etapa g), una detección de ruido mediante cálculo de una relación media de señal/ruido rl;
-durante la etapa h), una comparación de esta relación media de señal/ruido rl con un umbral ψTH para establecer si el ruido está presente (rl < ψTH) o si el ruido está ausente o al menos es extremadamente débil 50 (rl> ψTH); y
-durante la etapa i), se actúa de manera que, para cada trama l:
-si el ruido está presente (rl < ψTH), entonces se tiene en cuenta la señal tratada digitalmente, es decir la 55 señal de salida Sdl para la reconstrucción temporal;
-si el ruido está ausente o es extremadamente débil (rl > ψTH), entonces no se tiene en cuenta la señal de salida Sdl si no que se tiene en cuenta directamente la señal muestreada yl para la reconstrucción temporal, lo cual equivale a ignorar los tratamientos de reducción del ruido ("MCRA", "SSMB") para esta
60 trama l, con la ventaja de evitar distorsiones inútiles cuando el nivel de ruido es tal que un tratamiento de reducción del mismo no es necesario.
Esta segunda forma de realización permite, en cierta manera, la desactivación de las etapas b), c) y d) de reducción del ruido cuando el ruido está presente. Por ello, las distorsiones que pueden ser aportadas por el tratamiento de E12163679
13-08-2014
reducción del ruido, en esta situación de ausencia o de casi ausencia del ruido, serán eliminadas.
Para hacer que el procedimiento sea más robusto, resultará ventajoso que se tome la misma decisión (presencia o no de ruido) sobre una sucesión de tramas temporales l. 5 En un modo de realización particular, la etapa g) utiliza el siguiente algoritmo de cálculo, para cada trama temporal l:
g.1) cálculo de una componente de ruido media Dl a partir de la componente de ruido Dk,l estimada durante la
etapa b) y que responde a la ecuación: 10 1
M-1
Dl= Dk,l
M k=0
donde M es una constante predeterminada, preferentemente igual a N o a [1+N/2], siendo N el número de puntos de la transformada de Fourier;
2
15 g.2) cálculo de un módulo al cuadrado medio Yk,l de la señal con ruido Yk,l que responde a la ecuación:
2 1M −12Y
= ∑ Y
k,l k,l
Mk = 0
2
g.3) cálculo de una componente filtrada Pl del módulo al cuadrado, medio, Yk,l que responde a la ecuación:
imagen12 P = λP +(1− λ) Y
ll−1 k,l
20 donde -λ es una constante predeterminada característica de un filtro paso-bajo, preferentemente comprendido entre 0,80 y 0,99;
1 ∑M-1
25 -P0=D0= Dk,0 para inicializar el algoritmo.
M
k=0
g.4) cálculo de la relación media de señal/ruido rl que responde a la ecuación:
P
-si Dl > 0 entonces rl = l ,D
l
30 -si Dl ≤ 0 entonces rl = 0.
Ventajosamente, las etapas a) y f) de conversión utilizan un método de solapamiento y suma denominado "OLA", con:
35 -para la etapa a), una segmentación de la señal acústica con ruido y(t) en tramas temporales con un solapamiento entre las tramas temporales sucesivas;
-para la etapa f.2), la reconstrucción de la señal vocal con ruido eliminado de salida sd(t) se relaiza mediante la sumas sucesivas de las partes en solapamiento de las señales de dos tramas temporales sucesivas.
40 Este método de solapamiento y suma denominado "OLA" de "OverLap and Add method" es un método clásico de reconstrucción temporal que utiliza ventanas de ponderación yuxtapuestas (es decir, ventanas que se superponen o que se solapan parcialmente), y que a continuación suma las señales de salida teniendo en cuenta el solapamiento de las tramas temporales.
45 Otro ejemplo se refiere también a un sistema de reducción del ruido en una señal acústica con ruido y(t) procedente de un micrófono que funciona en un medio ruidoso, que comprende:
-una unidad de conversión de la señal acústica con ruido y(t) dentro del dominio temporal en una señal con 50 ruido Yk,l dentro del dominio de la frecuencia, que comprende:
-un módulo de segmentación de la señal acústica con ruido y(t) en señales muestreadas yl dentro de tramas temporales l sucesivas;
55 -a la salida del módulo de segmentación, un módulo de enventanado de las señales muestreadas yl
E12163679
13-08-2014
mediante aplicación de una ventana de ponderación;
-a la salida del módulo de enventanado, un módulo de cálculo de una transformada de Fourier discreta que suministra a la salida la señal con ruido Yk,l; 5 -una unidad de tratamiento digital dentro del dominio de la frecuencia, que comprende, a la salida de la unidad de conversión:
-un primer módulo de extracción del módulo al cuadrado Yk,l 2 de la señal con ruido Yk,l; y eventualmente
10 un segundo módulo de extracción de la fase θk,l de la señal con ruido Yk,l;
-a la salida del primer módulo de extracción, un módulo de estimación, denominado "MCRA", de una
componente de ruido Dk,l contenida dentro de la señal con ruido Yk,l a partir del módulo al cuadrado Yk,l 2
procedente del primer módulo de extracción, mediante un algoritmo de estimación de la densidad 15 espectral de potencia de la componente de ruido según un método de promediado recursivo de los mínimos controlados denominado "MCRA";
-a la salida del primer módulo de extracción, un módulo de segmentación de la banda frecuencial en varias sub-bandas frecuenciales SBi=[ei, bi]; 20 -a la salida del módulo de estimación "MCRA" y del módulo de segmentación de la banda frecuencial, un
2
módulo de estimación, denominado "SSMB", del módulo al cuadrado Xk,l,i de una componente con ruido eliminado de sub-banda Xk,l,i propia de cada sub-banda SBi de una señal con ruido eliminado Xk,l, mediante un algoritmo de sustracción espectral multi-banda a partir de módulos al cuadrado de sub-banda
25 Yk,l,i 2 y de componentes de ruido de sub-banda Dk,l,i;
-a la salida del módulo de estimación "SSMB", y eventualmente del segundo módulo de extracción, un módulo de determinación de una señal con ruido eliminado de salida SDk,l a partir de los módulos al
2cuadrado Xk,l,i y eventualmente de las fases θk,l; 30 -una unidad de conversión dentro del dominio temporal, que comprende, a la salida de la unidad de tratamiento digital:
-un módulo de cálculo de una señal de salida Sdl propia de cada trama temporal l mediante aplicación de 35 una transformada de Fourier inversa de la señal con ruido eliminado de salida SDk,l; y
-un módulo de reconstrucción de una señal vocal con ruido eliminado de salida sd(t) dentro del dominio temporal a partir de dichas señales de salida Sdl.
40 Según este ejemplo, el módulo de determinación de la señal con ruido eliminado de salida SDk,l comprende:
-un sub-módulo de raíz cuadrada para calcular el módulo Xk,l,i de las componentes con ruido eliminado de sub-banda Xk,l,i, y
45 -un sub-módulo de recombinación de las componentes con ruido eliminado de sub-banda Xk,l,i para obtener la señal con ruido eliminado Xk,l a partir de los módulos Xk,l,i y eventualmente de las fases θk,l, de manera que la señal con ruido eliminado de salida SDk,l corresponda a la señal con ruido eliminado Xk,l, es decir,
SDk,l=Xk,l
50 Según la invención, en una variante de este ejemplo, el módulo de determinación de una señal con ruido eliminado de salida SDk,l comprende:
-a la salida del primer módulo de extracción, un sub-módulo de amplificación según un coeficiente de amplificación γ, preferentemente comprendido entre 0,01 y 0,1, con el fin de suministrar una señal amplificada
55 γ Yk,l 2;
-a la salida del módulo de estimación "SSMB", un sub-módulo sumador apropiado para sumar la señal
amplificada γ Yk,l 2 y los módulos al cuadrado Xk,l,i 2, con el fin de suministrar a la salida los módulos al
E12163679
13-08-2014
2
cuadrado Xk,l,i de componentes con ruido eliminado combinadas de sub-banda Xk,l,i propias de cada subbanda SBi de una señal con ruido eliminado combinada Xk,l, que responde a la ecuación correspondiente:
Xk,l,i 2= Xk,l,i 2+γ Yk,l,i 2; 5 -un sub-módulo de raíz cuadrada para calcular el módulo Xk,l,i de las componentes con ruido eliminado combinadas de sub-banda Xk,l,i; y
-un sub-módulo de recombinación de las componentes combinadas de sub-banda Xk,l,i para obtener la señal
10 con ruido eliminado combinada Xk,l, a partir de los módulos Xk,l,i , y eventualmente de las fases θk,l, de manera que la señal con ruido eliminado de salida SDk,l corresponda a la señal con ruido eliminado combinada Xk,l, es decir, SDk,l=Xk,l.
En esta segunda posibilidad, el sistema utiliza una etapa de realimentación de una parte muy débil de la señal con 15 ruido Yk,l procedente del micrófono en la señal con ruido eliminado Xk,l para remediar por lo menos en parte los problemas de distorsión inducidos por los módulos de estimación "MCRA" y "SSMB".
En una forma de realización ventajosa, la unidad de tratamiento digital comprende además, a la salida del módulo de estimación "MCRA", un módulo de detección del ruido que comprende 20 -un módulo de cálculo de una relación media de señal/ruido rl propia de cada trama temporal l a partir del
módulo al cuadrado Yk,l 2 y de la componente de ruido Dk,l;
-un módulo de comparación de la relación media de señal/ruido rl propia de cada trama temporal l con un 25 umbral ψTH predeterminado;
-un módulo de control del módulo de reconstrucción de la señal vocal con ruido eliminado de salida sd(t) que está concebido para que:
30 -si la relación media de señal/ruido rl es inferior a dicho umbral ψTH para la trama temporal l, entonces la señal considerada antes de la reconstrucción para esta trama temporal l corresponde a la señal de salida Sdl procedente del módulo de cálculo de dicha señal de salida Sdl;
-si la relación media de señal/ruido rl es superior a dicho umbral ψTH para la trama temporal l, entonces la 35 señal considerada antes de la reconstrucción para esta trama temporal l corresponde a la señal muestreada yl procedente del módulo de segmentación de la señal acústica con ruido y(t).
Otras características y ventajas de la presente invención se pondrán de manifiesto al leer la descripción detallada siguiente, de un ejemplo de realización no limitativo, realizada en referencia a las figuras adjuntas, en las cuales:
40 -la figura 1 es una vista esquemática de un primer sistema de reducción del ruido ejemplificativo; -la figura 2 es una vista esquemática de un sistema de reducción del ruido de acuerdo con la invención; -la figura 3 es una vista esquemática de una variante del segundo sistema de la figura 2.
45 La descripción de un sistema 1 de reducción del ruido en una señal acústica con ruido y(t) procedente de un micrófono único que funciona en un medio ruidoso, y de procedimiento de reducción del ruido asociado, se realiza en referencia a las figuras 1 a 3.
En los tres modos de realización, el sistema 1 comprende una unidad de conversión 2 de la señal acústica con ruido 50 y(t) dentro del dominio temporal en una señal con ruido Yk,l dentro del dominio de la frecuencia.
Esta unidad de conversión 2 comprende un módulo de segmentación 21 de la señal acústica con ruido y(t) en señales muestreadas yl dentro de tramas temporales l sucesivas.
55 En este módulo de segmentación 21, la señal acústica con ruido y(t) se segmenta en tramas de 240 muestras, lo cual, a una frecuencia de muestreo de 8 kHz, corresponde a unas tramas temporales de 30 milisegundos.
Es también concebible disponer de una segmentación en tramas de 256 muestras, lo cual, a una frecuencia de muestreo de 8 kHz, corresponde a unas tramas temporales de 32 milisegundos.
60 En este módulo de segmentación 21, las tramas temporales sucesivas se solapan o superponen. Por ejemplo, las tramas temporales sucesivas se superponen sobre 120 muestras, lo cual corresponde a un cincuenta por ciento (50
E12163679
13-08-2014
%) de solapamiento.
Este solapamiento de las tramas temporales está destinado a permitir la utilización de un método de solapamiento y suma denominado "OLA", que permite la segmentación temporal inicial de la señal acústica con ruido y(t) y a 5 continuación la restitución final a la salida del sistema 1 dentro del dominio temporal.
Esta unidad de conversión 2 consta, a la salida del módulo de segmentación 21, de un módulo de enventanado 22 de las señales muestreadas yl mediante aplicación de una ventana de ponderación, especialmente del tipo ventana de Hanning o ventana de Hamming, con el fin de suministrar a la salida señales muestreadas ponderadas {yl}.
10 Así, las tramas temporales se apodizan entonces con una ventana de ponderación, antes de aplicar una transformada de Fourier, con el fin de minimizar los efectos de bordes debidos a la segmentación-solapamiento efectuado por el módulo de segmentación 21.
15 Esta unidad de conversión 2 consta, a la salida del módulo de enventanado 22, de un módulo de cálculo 23 de una transformada de Fourier discreta que suministra a la salida la señal con ruido Yk,l.
Desde un punto de vista matemático, se observa:
20 y(t) = x(t) + d(t),
siendo x(t) la señal de palabra útil y d(t) la componente de ruido.
El módulo de segmentación 21 recibe en la entrada la señal acústica con ruido y(t) y suministra en la salida la señal 25 muestreada yl, donde l el índice temporal (o índice de la trama temporal).
El módulo de segmentación 21 recibe en la entrada la señal muestreada yl y suministra a la salida la señal muestreada ponderada {yl}, con:
30 {yl}= ωl · yl
siendo ωl la señal representativa de la ventana de ponderación.
El módulo de cálculo 23 recibe a la entrada la señal muestreada ponderada {yl} y suministra a la salida la señal con 35 ruido Yk,l que corresponde a la transformada de Fourier Discreta de {y(l)}, donde k representa el índice de frecuencia, es decir:
Yk,l = DFT ({yl}) = rk,l + j ik,l
40 El cálculo de la transformada de Fourier Discreta (DFT de "Discrete Fourier Transform") se realiza por ejemplo mediante un cálculo de transformada de Fourier rápida (FFT de "Fast Fourier Transform") con un tamaño N que puede ser igual a 256 (N corresponde al número de puntos de la transformada de Fourier).
El sistema 1 comprende, a la salida de la unidad de conversión 2, una unidad de tratamiento digital 3 en el dominio 45 de la frecuencia, que lleva a cabo el tratamiento de eliminación de ruido o de realce de la palabra sobre la señal con ruido Yk,l.
2
Esta unidad de tratamiento digital 3 comprende un primer módulo de extracción 31 del módulo al cuadrado Yk,l de
la señal con ruido Yk,l. 50 Desde un punto de vista matemático, el primer módulo de extracción 31 realiza el siguiente cálculo:
2 22
Y
= r + i.
k,l k,l k,l
55 En los modos de realización de las figuras 1 y 2, esta unidad de tratamiento digital 3 comprende un segundo módulo de extracción 32 de la fase θk,l de la señal con ruido Yk,l. Tal como se detallará posteriormente, es previsible también obviar este segundo módulo de extracción 32.
Desde un punto de vista matemático, el segundo módulo de extracción 32 realiza el siguiente cálculo: 60 ri
k,l k,l
cosθ = , y senθ =
k,l k,l
Y Y
k,l k,l
E12163679
13-08-2014
2 2
= imagen2+ i
siendo Y
k,l k,l k,l
La unidad de tratamiento digital 3 comprende, a la salida del primer módulo de extracción 31, un módulo de estimación 33, denominado "MCRA", de una componente de ruido Dk,l contenida dentro de la señal con ruido Yk,l a
2
5 partir del módulo al cuadrado Yk,l procedente del primer módulo de extracción 31, mediante un algoritmo de
estimación de la densidad espectral de potencia de la componente de ruido según un método de promediado recursivo de los mínimos controlados denominado "MCRA".
Desde un punto de vista matemático, el algoritmo de estimación de la densidad espectral de potencia de la 10 componente de ruido según el método de promediado recursivo de los mínimos controlados denominado "MCRA" utiliza las siguientes fases de cálculo:
b.1) cálculo de una componente con ruido filtrada Sk,l que responde a la ecuación:
S = α S +(1− α ) Yk,l 2
k,l s k,l−1s
15 donde αs es una constante predeterminada característica de un filtro paso-bajo;
~
b.2) cálculo de una densidad de probabilidad de presencia de palabra mediante la utilización del siguiente
pk,l 20 cálculo progresivo:
(i) cálculo de una componente mínima espectral Smink,l con: -si rem(k,l) = 0 25 entonces Smink,l = min (Smink,l-1; Sk,l) y Stmpk,l = Sk,l -si rem(k,l) ≠ 0 30 entonces Smink,l = min (Stmpk,l-1; Sk,l) y Stmpk,l = min (Stmpk,l-1; Sk,l) donde rem(k,l) es el resto de la división entera de k por l, a continuación
35 (ii) cálculo de una relación espectral Srk,l que responde a la ecuación: S
k,l
Sr =
k,l
Smin
k,l
(iii) cálculo de una variable indicadora Ik,l con:
40 -si Srk,l > δTH entonces Ik,l = 1 -si Srk,l ≤δTH entonces Ik,l =0
donde δTH es un parámetro predeterminado de umbral fijo de detección de palabra; 45
~
(iv) cálculo de la densidad de probabilidad de presencia de palabra con:
pk,l
~~
pk,l = αppk,l−1 +(1− αp )Ik,l
50 donde αp es una constante predeterminada;
~
b.3) cálculo de un coeficiente que responde a la siguiente ecuación:
αk,l
~~
α = α +(1− α) p,
k,l k,l 55 donde α es una constante predeterminada;
E12163679
13-08-2014
b.4) cálculo de la componente de ruido Dk,l que responde a la siguiente ecuación:
2Dk,l =αk,lDk,l-1+ 1-αk,l Yk,l
.
5 Así, el módulo de estimación "MCRA" 33 suministra a la salida la componente de ruido Dk,l.
La unidad de tratamiento digital 3 comprende, a la salida del primer módulo de extracción 31, un módulo de segmentación 34 de la banda frecuencial en varias sub-bandas frecuenciales SBi=[ei, bi].
10 La banda frecuencial se puede dividir, por ejemplo, en tres sub-bandas frecuenciales, a saber SB1 para fi < 1.000 Hz, SB2 para 1.000 Hz ≤ fi ≤ 2.000 Hz y finalmente SB3 para fi > 2.000 Hz, donde fi es la frecuencia de sub-banda.
La unidad de tratamiento digital 3 comprende, a la salida del módulo de estimación "MCRA" 33 y del módulo de segmentación 34 de la banda frecuencial, un módulo de estimación 35, denominado "SSMB", del módulo al
2
15 cuadrado Xk,l,i de una componente con ruido eliminado de sub-banda Xk,l,i propia de cada sub-banda SBi de una señal con ruido eliminado Xk,l, mediante un algoritmo de sustracción espectral multi-banda a partir de módulos al
cuadrado de sub-banda Yk,l,i 2 y de componentes de ruido de sub-banda Dk,l,i.
El principio del algoritmo de sustracción espectral multi-banda (SSMB) procede de una generalización del algoritmo
20 de sustracción espectral que consiste en sustraer de la densidad espectral de potencia de la señal con ruido Yk,l procedente del micrófono una porción de la densidad espectral de potencia de la componente de ruido estimada mediante el método "MCRA". El algoritmo de sustracción espectral multi-banda aplica el mismo principio segmentando el espacio espectral en varias sub-bandas SBi frecuenciales y, a continuación, en cada sub-banda SBi, se aplica la operación de sustracción espectral, de la manera siguiente:
25
22 2Xk,l,i = Yk,l,i -µi Dk,l,i
siendo µi un coeficiente predeterminado.
Este algoritmo de sustracción espectral multi-banda se combina con el método de solapamiento y suma denominado 30 "OLA".
Evidentemente es posible perfeccionar la relación de sustracción espectral multi-banda ofrecida más arriba, según se describe a continuación.
35 Desde un punto de vista matemático, el algoritmo de sustracción espectral multi-banda "SSMB" utilizado por medio del módulo de estimación "SSMB" 35, lleva a cabo las siguientes fases de cálculo, para cada una de las sub-bandas SBi:
d.1) cálculo de una relación de señal/ruido SNRk,l,i propia de cada sub-banda SBi, que responde a la ecuación: 40 ∑bi 2Yk,l,i SNRk,l,i=10.log10 k=ei
∑bi Dk,l,i
k=ei
2
d.2) cálculo del módulo al cuadrado Xk,l,i de la componente con ruido eliminado de sub-banda Xk,l,i propia de cada sub-banda SBi, según la ecuación:
22 2 Yk,l,i -αi δi Dk,l,i si Yk,l,i >αi δi Dk,l,i Xk,l,i
=
22 β Yk,l,i si Yk,l,i ≤αi δi Dk,l,i 45 donde
-δi es un parámetro variable en función de la sub-banda SBi correspondiente, que adopta valores distintos de una sub-banda a otra; 50 -αi es un parámetro variable que depende del valor de la relación de señal/ruido SNRk,l,i calculado dentro de la sub-banda SBi correspondiente; y
-β es una constante.
E12163679
13-08-2014
Es posible comparar el valor de la relación de señal/ruido SNRk,l,i con dos umbrales SNR1 y SNR2 para establecer el valor de los parámetros αi. Así, los parámetros αi responden a las siguientes ecuaciones:
α si SNR < SNR
c1 k,l,i 1
 ⎪⎨⎪⎩
≤≤
SNR siSNR SNR SNR
2
+
α
i
=
α α si SNR > SNR
c4 k,l,i 2
α
c2 c3 k,l,i 1 k,l,i
donde αc1, αc2, αc3 y αc4 son unas constantes predeterminadas, y SNR1 y SNR2 son los umbrales predeterminados. Por ejemplo, es posible disponer de las siguientes relaciones para los parámetros αi:
5 si SNR <−5
k,l,i
α =
i
imagen3⎨⎪⎪⎩
3
4 − SNR si − 5 ≤ SNR ≤ 20
k,l,i k,l,i
20 1 si SNR > 20
k,l,i
En relación con los parámetros variables δi, es posible disponer de las siguientes relaciones, en el caso de la división en tres sub-bandas frecuenciales que se ha descrito más arriba:
δ =
i
 ⎪⎨⎪⎩
1si f < 1.000 (primera sub − banda SB )
i 1
2,75 si 1.000 ≤ f ≤ 2.000 (segunda sub − banda SB )
i 2
1,75 si f > 2.000 (tercera sub − banda SB )
i 3
En relación con la constante β, es posible disponer de valores del orden de 0,002 ó 0,0015, es decir, por ejemplo β = 0,002 ó β = 0,0015.
20 La unidad de tratamiento digital 3 comprende también, a la salida del módulo de estimación "SSMB" 35 y del segundo módulo de extracción 32, un módulo de determinación 36 de una señal con ruido eliminado de salida SDk,l
2
a partir de los módulos al cuadrado Xk,l,i y de las fases θk,l.
25 En el primer modo de realización ilustrado en la figura 1, el módulo de determinación 36 de la señal con ruido eliminado de salida SDk,l comprende
-un sub-módulo de raíz cuadrada 361 para calcular el módulo Xk,l,i de las componentes con ruido eliminado de sub-banda Xk,l,i, y 30
-un sub-módulo de recombinación 362 de las componentes con ruido eliminado de sub-banda Xk,l,i para obtener la señal con ruido eliminado Xk,l a partir de los módulos Xk,l,i y de las fases θk,l, de manera que la señal con ruido eliminado de salida SDk,l corresponda a la señal con ruido eliminado Xk,l, es decir, SDk,l=Xk,l.
35 Desde un punto de vista matemático, se tiene que:
2
-el sub-módulo de raíz cuadrada 361 realiza el cálculo: Xk,l = Xk,l ; y
-el sub-módulo de recombinación 362 efectúa la realimentación de la fase, de la manera siguiente: 40 SDk,l=Xk,l= Xk,l cosθk,l+j Xk,l senθk,l.
En el segundo modo de realización ilustrado en la figura 2, el módulo de determinación 36 de la señal con ruido eliminado de salida SDk,l comprende:
45 -a la salida del primer módulo de extracción 31, un sub-módulo de amplificación 363 según un coeficiente de amplificación γ, preferentemente comprendido entre 0,01 y 0,1, con el fin de suministrar una señal amplificada
γ Yk,l 2;
-a la salida del módulo de estimación "SSMB" 35, un sub-módulo sumador 364 apropiado para sumar la señal
50 amplificada γ Yk,l 2 y los módulos al cuadrado Xk,l,i 2, con el fin de suministrar a la salida los módulos al E12163679
13-08-2014
2
cuadrado Xk,l,i de componentes con ruido eliminado combinadas de sub-banda Xk,l,i propias de cada subbanda SBi de una señal con ruido eliminado combinada Xk,l, que responde a la ecuación correspondiente:
Xk,l,i 2= Xk,l,i 2+γ Yk,l,i 2;
5 -un sub-módulo de raíz cuadrada 361 para calcular el módulo Xk,l,i de las componentes con ruido eliminado combinadas de sub-banda Xk,l,i; y
-un sub-módulo de recombinación 362 de las componentes combinadas de sub-banda Xk,l,i para obtener la señal con ruido eliminado combinada Xk,l, a partir de los módulos Xk,l,i , y de las fases θk,l, de manera que la 10 señal con ruido eliminado de salida SDk,l corresponda a la señal con ruido eliminado combinada Xk,l, es decir,
.
SDk,l=Xk,l
Desde un punto de vista matemático, se tiene que:
15 -el sub-módulo de amplificación 363 suministra a la salida la señal amplificada γ Yk,l 2;
-el sub-módulo sumador 364 realiza el cálculo:
Xk,l,i 2= Xk,l,i 2+γ Yk,l,i 2
2
20 -el sub-módulo de raíz cuadrada 361 realiza el cálculo: Xk,l,i = Xk,l,i ; y
-el sub-módulo de recombinación 362 efectúa la realimentación de la fase, de la manera siguiente: SDk,l=Xk,l= Xk,l cosθk,l+j Xk,l senθk,l
25 Así, en este segundo modo de realización, el sistema 1 utiliza una etapa de realimentación de una parte muy débil de la señal con ruido Yk,l, procedente del micrófono, en la señal con ruido eliminado Xk,l; la señal realimentada
corresponde a la señal amplificada γ Yk,l 2 . De esta manera, se remedian por lo menos en parte los problemas de
distorsión introducidos por los módulos de estimación "MCRA" 33 y "SSMB" 35.
30 El sistema 1 comprende, a la salida de la unidad de tratamiento digital 3, una unidad de conversión 4 en el dominio temporal.
Esta unidad de conversión 4 comprende un módulo de cálculo 41 de una señal de salida Sdl propia de cada trama temporal l mediante aplicación de una transformada de Fourier inversa de la señal con ruido eliminado de salida 35 SDk,l.
Desde un punto de vista matemático, este módulo de cálculo 41 utiliza el cálculo de la transformada de Fourier rápida inversa (IFFT de "Inverse Fast Fourier Transform") con un tamaño N igual a 256 (recordando que N corresponde al número de puntos de la transformada de Fourier), con la siguiente relación:
40 Sdl =IDFT(SDk,l)
donde IDFT corresponde a la función de transformada de Fourier discreta inversa, que puede ser del tipo transformada de Fourier rápida inversa (IFFT).
45 Además, debido a la simetría de la amplitud de la transformada de Fourier (DFT o FFT) de las señales reales, el tratamiento de reducción del ruido y de reconstrucción según el método "OLA" se realizará únicamente sobre los primeros [N/2 + 1] puntos de muestreo, es decir, sobre los 129 primeros puntos de muestreo para N igual a 256, sabiendo que se dispone de la siguiente relación de simetría hermítica:
50 *
SD = SD
−k,l k,l
En el caso del primer modo de realización ilustrado en la figura 1, se tiene la siguiente relación: Sdl=xl=IFFT Xk,l .
55 En el caso del segundo modo de realización ilustrado en la figura 2, se tiene la siguiente relación: Sdl=x =IFFT Xk,l .
Esta unidad de conversión 4 consta, a la salida del módulo de cálculo 41, de un módulo de reconstrucción 42 de una E12163679
13-08-2014
señal vocal con ruido eliminado, de salida sd(t) en el dominio temporal a partir de las señales de salida Sdl.
La señal temporal se restituye según el método de solapamiento y suma "OLA", realizándose la reconstrucción de la señal vocal con ruido eliminado de salida sd(t) mediante las sumas sucesivas de las partes en solapamiento de las 5 señales de dos tramas temporales sucesivas, según el principio:
sdl = Sdl-1 + Sdl
que se traduce en el primer modo de realización por: sdl = + xl , y
xl-1
10 que se traduce en el segundo modo de realización por: sdl = + xl .
xl-1
Cada vez que se suministra una trama temporal de la señal con ruido eliminado de salida SDk,l en el dominio de la frecuencia y que se calcula su transformada de Fourier inversa Sdl, los primeros N/2 puntos de muestreo se sumarán con los últimos N/2 puntos de muestreo de la trama tratada precedente. En cuanto a los últimos N/2 puntos
15 de muestreo de la trama tratada en curso, los mismos se almacenarán en memoria para ser usados, a su vez, durante el tratamiento de la siguiente trama.
Dicho de otra manera, después del tratamiento en el dominio espectral, la trama temporal de la señal con ruido eliminado de salida SDk,l pasa por el módulo de cálculo 41 de la transformada de Fourier inversa, y a continuación su
20 primera mitad (primeros N/2 puntos de muestreo) se suma con la segunda mitad (últimos N/2 puntos de muestreo) guardada de la trama precedente, mientras que su segunda mitad (primeros N/2 puntos de muestreo) se guarda para el próximo bloque.
Con N igual a 256, se tiene N/2 que es igual a 128, recordando que la tasa de solapamiento de dos tramas 25 sucesivas es del cincuenta por ciento (50%).
De manera opcional y ventajosa, la unidad de tratamiento digital 3 comprende además, a la salida del módulo de estimación "MCRA" 33, un módulo de detección del ruido 37 que controla el módulo de reconstrucción 42 según el siguiente principio:
30 -utilización de un cálculo de una relación media de señal/ruido rl para efectuar una detección de ruido;
-comparación de esta relación media de señal/ruido rl con un umbral ψTH para establecer si el ruido está presente (rl < ψTH) o si el ruido está ausente o al menos es extremadamente débil (rl > ψTH); y 35 -control del módulo de reconstrucción 42 según las siguientes reglas:
-si el ruido está presente (rl < ψTH), entonces se tiene en cuenta la señal tratada digitalmente, es decir la señal de salida Sdl para la reconstrucción temporal; 40
-si el ruido está ausente o es extremadamente débil (rl > ψTH), entonces no se tiene en cuenta la señal de salida Sdl si no que se tiene en cuenta directamente la señal muestreada yl para la reconstrucción temporal, lo cual equivale a ignorar los tratamientos de reducción del ruido (MCRA, SSMB) para esta trama l, con la ventaja de evitar distorsiones inútiles cuando el nivel de ruido es tal que un tratamiento de
45 reducción del mismo no es necesario.
Por tanto, en una situación de ausencia o casi ausencia de ruido, las distorsiones que pueden ser ocasionadas por el tratamiento de reducción del ruido se eliminarán.
50 Desde un punto de vista estructural, el módulo de detección del ruido 37 comprende:
-un módulo de cálculo de una relación media de señal/ruido rl propia de cada trama temporal l a partir del
módulo al cuadrado Yk,l 2 y de la componente de ruido Dk,l;
55 -un módulo de comparación de la relación media de señal/ruido rl propia de cada trama temporal l con un umbral ψTH predeterminado;
-un módulo de control del módulo de reconstrucción 42 de la señal vocal con ruido eliminado de salida sd(t) que está concebido para que: 60 -si la relación media de señal/ruido rl es inferior a dicho umbral ψTH para la trama temporal l, entonces la señal considerada antes de la reconstrucción para esta trama temporal l corresponde a la señal de salida
E12163679
13-08-2014
Sdl procedente del módulo de cálculo de dicha señal de salida Sdl;
-si la relación media de señal/ruido rl es superior a dicho umbral ψTH para la trama temporal l, entonces la señal considerada antes de la reconstrucción para esta trama temporal l corresponde a la señal 5 muestreada yl procedente del módulo de segmentación de la señal acústica con ruido y(t).
Desde un punto de vista matemático, el módulo de detección del ruido 37 utiliza el siguiente algoritmo de cálculo, para cada trama temporal l:
10 g.1) cálculo de una componente de ruido media Dl a partir de la componente de ruido Dk,l estimada por el
módulo de estimación "MCRA" 33 y que responde a la ecuación:
1 M-1
Dl= Dk,l
M k=0
donde M es una constante predeterminada igual a N/2, siendo N, a título recordatorio, el número de puntos 15 de la transformada de Fourier;
2
g.2) cálculo de un módulo al cuadrado, medio Yk,l de la señal con ruido Yk,l que responde a la ecuación:
2 1M −12Y
= ∑ Y
k,l k,l
Mk = 0 20
2
g.3) cálculo de una componente filtrada Pl del módulo al cuadrado, medio, Yk,l que responde a la ecuación:
2
Pl = λP− +(1− λ) Y
l1 k,l
donde 25 -λ es una constante predeterminada característica de un filtro paso-bajo, preferentemente comprendido entre 0,80 y 0,99;
1 ∑M-1
-P0=D0= Dk,0 para inicializar el algoritmo.
M
k=0 30 g.4) cálculo de la relación media de señal/ruido rl que responde a la ecuación:
P
-si Dl > 0 entonces rl = l ,D
l
-si Dl ≤ 0 entonces rl = 0.
35 Evidentemente, el ejemplo de realización citado en la presente memoria anteriormente no presenta ningún carácter limitativo y se pueden aportar al sistema de reducción según la invención otras mejoras y detalles, sin apartarse por ello del ámbito de la invención.
40 Así, es viable prescindir de la extracción de fase de la fase θk,l, de la señal con ruido Yk,l tal como se ilustra en la figura 3 donde el sistema 1 no comprendel segundo módulo de extracción 32 de la fase θk,l de la señal con ruido Yk,l. En este caso, el sub-módulo de recombinación 362 de las componentes con ruido eliminado de sub-banda Xk,l,i lleva
a cabo el cálculo de la señal con ruido eliminado Xk,l a partir de los módulos Xk,l,i y de la señal con ruido Yk,l. En efecto, la realimentación de la fase se puede efectuar directamente a partir de la señal con ruido Yk,l que incorpora 45 intrínsecamente esta fase.
Con este fin, el sub-módulo de recombinación 362 lleva a cabo el siguiente cálculo:
rk,l ik,l
Xk,l= Xk,l +j Xk,l =Gk,lrk,l+jGk,lik,l,
Yk,l Yk,l
50 es decir Xk,l = Gk,lYk,l.
Siendo Gk,l la ganancia del algoritmo de reducción de ruido. Con este cálculo, ya no es por tanto necesario calcular, E12163679
13-08-2014
almacenar y realimentar la fase.
El sistema 1 de la figura 3 es una variante del sistema 1 de la figura 2 sin el segundo módulo de extracción 32, aunque evidentemente también es viable prever la supresión del segundo módulo de extracción 32 en el sistema 1 de la figura 1.

Claims (11)

  1. E12163679
    13-08-2014
    REIVINDICACIONES
    1. Procedimiento de reducción del ruido en una señal acústica con ruido y(t) procedente de un micrófono que está funcionando en un medio ruidoso, que comprende las etapas sucesivas siguientes: 5
    a) conversión de la señal acústica con ruido y(t) dentro del dominio temporal en una señal con ruido Yk,l dentro del dominio de la frecuencia, mediante segmentación temporal de la señal acústica con ruido y(t) en señales muestreadas yl dentro de tramas temporales I sucesivas, enventanado de las señales muestreadas yl por aplicación de una ventana de ponderación, y aplicación de una transformada de Fourier discreta, con
    10 extracción del módulo al cuadrado Yk,l 2 , y eventualmente de la fase θk,l, de la señal con ruido Yk,l;
    b) estimación de una componente de ruido Dk,l contenida dentro de la señal con ruido Yk,l a partir del módulo al
    cuadrado Yk,l 2 , mediante un algoritmo de estimación de la densidad espectral de potencia de la
    componente de ruido según un método de promediado recursivo de los mínimos controlados denominado 15 "MCRA";
    caracterizado por que comprende además, después de la etapa b), las etapas sucesivas siguientes:
    c) segmentación de la banda frecuencial en varias sub-bandas frecuenciales SBi=[ei, bi], seguida por una
    20 descomposición multi-banda del módulo al cuadrado Yk,l 2 y de la componente de ruido Dk,l, que consiste en
    descomponer el módulo al cuadrado Yk,l 2 y la componente de ruido Dk,l en respectivamente varios módulos
    al cuadrado de sub-banda Yk,l,i 2 y varias componentes de ruido de sub-banda Dk,l,i propios de cada una de
    las sub-bandas SBi;
    2
    25 d) estimación, para cada una de las sub-bandas SBi, del módulo al cuadrado Xk,l,i de una componente con ruido eliminado de sub-banda Xk,l,i, propia de cada sub-banda SBi de una señal con ruido eliminado Xk,l, mediante un algoritmo de sustracción espectral multi-banda denominado "SSMB" a partir de los módulos al
    cuadrado de sub-banda Yk,l,i 2 y de las componentes de ruido de sub-banda Dk,l,i;
    2
    30 e) determinación de una señal de salida con ruido eliminado SDk,l a partir de los módulos al cuadrado Xk,l,i procedentes de la etapa d), y eventualmente de las fases θk,l extraídas durante la etapa a);
    f) conversión de la señal de salida con ruido eliminado SDk,l en una señal vocal de salida con ruido eliminado sd(t) en el dominio temporal, mediante una etapa f.1) de cálculo de una señal muestreada de salida Sdl
    35 propia de cada trama temporal l mediante la aplicación de una transformada de Fourier inversa de la señal de salida con ruido eliminado SDk,l, seguida por una etapa f.2) de reconstrucción temporal de la señal vocal de salida con ruido eliminado sd(t) a partir de las señales muestreadas de salida Sdl;
    y en el que la etapa e) consiste en: 40
    2
    -determinar, para cada una de las sub-bandas SBi, el módulo al cuadrado k,l,i de una componente con ruido eliminado combinada de sub-banda Xk,l,i propia de cada sub-banda SBi de una señal con ruido eliminado combinada Xk,l, que responde a la ecuación correspondiente:
    Xk,l,i 2= Xk,l,i 2+γ Yk,l,i 2
    45 en la que γ es un coeficiente de amplificación predeterminado, comprendido preferentemente entre 0,01 y 0,1;
    2
    - determinar una señal con ruido eliminado combinada Xk,l a partir de los módulos al cuadrado Xk,l,i de las
    50 componentes con ruido eliminado combinadas de sub-banda Xk,l,i , y eventualmente de las fases θk,l extraídas durante la etapa a), de manera que la señal con ruido eliminado de salida SDk,l corresponda a la señal con ruido eliminado combinada Xk,l , es decir SDk,l=Xk,l.
  2. 2. Procedimiento según la reivindicación 1, en el que el algoritmo de estimación de la densidad espectral de potencia 55 de la componente de ruido según el método de promediado recursivo de los mínimos controlados denominado
    E12163679
    13-08-2014
    "MCRA" durante la etapa b) utiliza las siguientes fases de cálculo: b.1) cálculo de una componente con ruido filtrada Sk,l que responde a la ecuación:
    2
    5S = α S +(1− α ) Y
    k,l s k,l−1 s k,l
    en la que αs es una constante predeterminada característica de un filtro paso-bajo;
    ~
    b.2) cálculo de una densidad de probabilidad de presencia de palabra mediante la utilización del cálculo
    pk,l 10 progresivo siguiente:
    (i) cálculo de una componente mínima espectral Smink,l con:
    -si rem(k,l) = 0 15 entonces Smink,l = min (Smink,l-1; Sk,l) y Stmpk,l = Sk,l
    -si rem(k,l) ≠ 0 entonces Smink,l = min (Stmpk,l-1; Sk,l) y Stmpk,l = min (Stmpk,l-1; Sk,l)
    20 donde rem(k,l) es el resto de la división entera de k por l, y después
    (ii) cálculo de una relación espectral Srk,l que responde a la ecuación: S
    k,l
    25 Sr =
    k,l
    Smin
    k,l
    (iii) cálculo de una variable indicadora Ik,l con: -si Srk,l > δTH entonces Ik,l = 1
    30 -si Srk,l ≤δTH entonces Ik,l =0 donde δTH es un parámetro predeterminado de umbral fijo de detección de palabra;
    ~
    (iv) cálculo de la densidad de probabilidad de presencia de palabra con:
    pk,l 35
    ~~
    pk,l = αppk,l−1 +(1− αp )Ik,l
    donde αp es una constante predeterminada;
    ~
    40 b.3) cálculo de un coeficiente que responde a la siguiente ecuación:
    αk,l
    ~~
    α = α +(1− α) p
    k,l k,l
    ,
    en la que α es una constante predeterminada; 45 b.4) cálculo de la componente de ruido Dk,l que responde a la siguiente ecuación:
    2Dk,l =αk,lDk,l-1+ 1-αk,l Yk,l
    .
    50 3. Procedimiento según cualquiera de las reivindicaciones 1 y 2, en el que el algoritmo de sustracción espectral multi-banda denominado "SSMB" de la etapa d) utiliza las fases de cálculo siguientes, para cada una de las subbandas SBi:
    d.1) cálculo de una relación de señal/ruido SNRk,l,i propia de cada sub-banda SBi que responde a la ecuación: 55 ∑bi 2Yk,l,i SNRk,l,i=10.log10 k=ei
    ∑bi Dk,l,i
    k=ei
    E12163679
    13-08-2014
    2
    d.2) cálculo del módulo al cuadrado Xk,l,i de la componente con ruido eliminado de sub-banda Xk,l,i propio de cada sub-banda SBi, según la ecuación:
    22 2 Yk,l,i -αi δi Dk,l,i si Yk,l,i >αi δi Dk,l,i Xk,l,i
    =
    22 β Yk,l,i si Yk,l,i ≤αi δi Dk,l,i 5 en la que
    -δi es un parámetro variable en función de la sub-banda SBi correspondiente, que adopta valores distintos de una sub-banda a otra; 10 -αi es un parámetro variable que depende del valor de la relación de señal/ruido SNRk,l,i calculado dentro de la sub-banda SBi correspondiente; y
    -β es una constante. 15
  3. 4. Procedimiento según la reivindicación 3, en el que los parámetros αi responden a las ecuaciones siguientes:
     α si SNR < SNR
    c1 k,l,i 1
    α = ⎨ αc2 + αc3 SNR k,l,i si SNR 1 ≤ SNR k,l,i ≤ SNR 2
    i
    α si SNR > SNR
     c4 k,l,i 2
    20 en las que αc1, αc2, αc3 y αc4 son unas constantes predeterminadas, y SNR1 y SNR2 son unos umbrales predeterminados.
  4. 5. Procedimiento según cualquiera de las reivindicaciones 1 a 4, en el que la etapa e) consiste en determinar la
    2
    señal con ruido eliminado Xk,l a partir de los módulos al cuadrado Xk,l,i de las componentes con ruido eliminado de 25 sub-banda Xk,l,i, y eventualmente de las fases θk,l extraídas durante la etapa a), de manera que la señal de salida con ruido eliminado SDk,l corresponda a la señal con ruido eliminado Xk,l, es decir, SDk,l=Xk,l.
  5. 6. Procedimiento según cualquiera de las reivindicaciones 1 a 5, en el que la etapa f.2) consiste en reconstruir la señal vocal con ruido eliminado de salida sd(t) únicamente a partir de las señales de salida Sdl procedentes de la
    30 etapa f.1), correspondiendo dichas señales de salida Sdl a las transformadas de Fourier inversas de la señal con ruido eliminado de salida SDk,l propias de cada trama temporal l.
  6. 7. Procedimiento según cualquiera de las reivindicaciones 1 a 5, en el que la etapa f.2) consiste en, para cada trama temporal l:
    35 g) calcular una relación media de señal/ruido rl propia de la trama temporal l a partir del módulo al cuadrado
    Yk,l 2 y de la componente de ruido Dk,l;
    h) comparar la relación media de señal/ruido rl con un umbral ψTH predeterminado; 40 i) reconstruir la señal vocal con ruido eliminado de salida sd(t) teniendo en cuenta que:
    -si la relación media de señal/ruido rl es inferior a dicho umbral ψTH para la trama temporal l, entonces la señal considerada antes de la reconstrucción temporal para esta trama temporal l corresponde a la señal 45 de salida Sdl procedente de la etapa f.1);
    -si la relación media de señal/ruido rl es superior a dicho umbral ψTH para la trama temporal l, entonces la señal considerada antes de la reconstrucción temporal para esta trama temporal l corresponde a la señal muestreada yl procedente de la etapa de segmentación de la etapa a).
    50
  7. 8. Procedimiento según la reivindicación 7, en el que la etapa g) utiliza el siguiente algoritmo de cálculo, para cada trama temporal l:
    g.1) cálculo de una componente de ruido media Dl a partir de la componente de ruido Dk,l estimada durante la
    55 etapa b) y que responde a la ecuación: E12163679
    13-08-2014
    1 M-1
    Dl= Dk,l
    M k=0
    en la que M es una constante predeterminada, preferentemente igual a N o a N/2, siendo N el número de puntos de muestreo de la transformada de Fourier;
    2
    5 g.2) cálculo de un módulo al cuadrado medio Yk,l de la señal con ruido Yk,l que responde a la ecuación:
    M − 12Yk,l
    =
    Yk,l 2 M1 ∑k = 0
    2
    g.3) cálculo de una componente filtrada Pl del módulo al cuadrado medio Yk,l que responde a la ecuación:
    imagen12 P = λP +(1− λ) Y
    ll−1 k,l
    10 en la que -λ es una constante predeterminada característica de un filtro paso-bajo, comprendido preferentemente 15 entre 0,80 y 0,99; 1 ∑M-1
    -P0=D0= Dk,0 para inicializar el algoritmo.
    M
    k=0
    g.4) cálculo de la relación media de señal/ruido rl que responde a la ecuación: 20 P
    -si Dl > 0 entonces rl = l ,D
    l -si Dl ≤ 0 entonces rl = 0.
  8. 9. Procedimiento según cualquiera de las reivindicaciones anteriores, en el que las etapas a) y f) de conversión 25 utilizan un método de solapamiento y suma denominado "OLA", con:
    -para la etapa a), una segmentación de la señal acústica con ruido y(t) en tramas temporales con un solapamiento entre las tramas temporales sucesivas;
    30 -para la etapa f.2), la reconstrucción de la señal vocal con ruido eliminado de salida sd(t) se realiza mediante la sumas sucesivas de las partes en solapamiento de las señales de dos tramas temporales sucesivas.
  9. 10. Sistema (1) de reducción del ruido en una señal acústica con ruido y(t) procedente de un micrófono que funciona en un medio ruidoso, que comprende: 35
    -una unidad de conversión (2) de la señal acústica con ruido y(t) dentro del dominio temporal en una señal con ruido Yk,l dentro del dominio de la frecuencia, que comprende:
    -un módulo de segmentación (21) de la señal acústica con ruido y(t) en señales muestreadas yl dentro de 40 tramas temporales l sucesivas;
    -a la salida del módulo de segmentación (21), un módulo de enventanado (22) de las señales muestreadas yl mediante aplicación de una ventana de ponderación;
    45 -a la salida del módulo de enventanado (22), un módulo de cálculo (23) de una transformada de Fourier discreta que suministra a la salida la señal con ruido Yk,l;
    -una unidad de tratamiento digital (3) dentro del dominio de la frecuencia, que comprende, a la salida de la unidad de conversión: 50
    -un primer módulo de extracción (31) del módulo al cuadrado Yk,l 2 de la señal con ruido Yk,l; y
    eventualmente un segundo módulo de extracción (32) de la fase θk,l de la señal con ruido Yk,l;
    -a la salida del primer módulo de extracción (31), un módulo de estimación (33), denominado "MCRA", de
    E12163679
    13-08-2014
    una componente de ruido Dk,l contenida dentro de la señal con ruido Yk,l a partir del módulo al cuadrado
    Yk,l 2 procedente del primer módulo de extracción (31), mediante un algoritmo de estimación de la
    densidad espectral de potencia de la componente de ruido según un método de promediado recursivo de los mínimos controlados denominado "MCRA"; 5 -a la salida del primer módulo de extracción (31), un módulo de segmentación (34) de la banda frecuencial en varias sub-bandas frecuenciales SBi=[ei, bi], en particular del tipo banco de filtros;
    -a la salida del módulo de estimación "MCRA" (33) y del módulo de segmentación (34) de la banda
    2
    10 frecuencial, un módulo de estimación (35), denominado "SSMB", del módulo al cuadrado Xk,l,i de una componente con ruido eliminado de sub-banda Xk,l,i propia de cada sub-banda SBi de una señal con ruido eliminado Xk,l, mediante un algoritmo de sustracción espectral multi-banda a partir de módulos al
    cuadrado de sub-banda Yk,l,i 2 y de componentes de ruido de sub-banda Dk,l,i;
    15 -a la salida del módulo de estimación "SSMB" (35), y eventualmente del segundo módulo de extracción (32), un módulo de determinación (36) de una señal con ruido eliminado de salida SDk,l a partir de los
    2
    módulos al cuadrado Xk,l,i , y eventualmente de las fases θk,l;
    -una unidad de conversión (4) dentro del dominio temporal que comprende, a la salida de la unidad de 20 tratamiento digital (3):
    -un módulo de cálculo (41) de una señal de salida Sdl propia de cada trama temporal l mediante la aplicación de una transformada de Fourier inversa de la señal con ruido eliminado de salida SDk,l; y
    25 -un módulo de reconstrucción (42) de una señal vocal con ruido eliminado de salida sd(t) dentro del dominio temporal a partir de dichas señales de salida Sdl;
    en el que el módulo de determinación (36) de una señal con ruido eliminado de salida SDk,l comprende:
    30 -a la salida del primer módulo de extracción (31), un sub-módulo de amplificación (363) según un coeficiente de amplificación γ, comprendido preferentemente entre 0,01 y 0,1, con el fin de suministrar una señal
    amplificada γ Yk,l 2;
    -a la salida del módulo de estimación "SSMB" (35), un sub-módulo sumador (364) apropiado para sumar la
    35 señal amplificada γ Yk,l 2 y los módulos al cuadrado Xk,l,i 2, con el fin de suministrar a la salida los módulos
    2
    al cuadrado Xk,l,i de componentes con ruido eliminado combinadas de sub-banda Xk,l,i propias de cada subbanda SBi de una señal con ruido eliminado combinada Xk,l, que responden a la ecuación correspondiente:
    Xk,l,i 2= Xk,l,i 2+γ Yk,l,i 2; 40 -un sub-módulo de raíz cuadrada (361) para calcular el módulo Xk,l,i de las componentes con ruido eliminado combinadas de sub-banda Xk,l,i; y
    -un sub-módulo de recombinación (362) de las componentes combinadas de sub-banda Xk,l,i para obtener la
    45 señal con ruido eliminado combinada Xk,l, a partir de los módulos Xk,l,i , y eventualmente de las fases θk,l, de manera que la señal con ruido eliminado de salida SDk,l corresponda a la señal con ruido eliminado combinada Xk,l, es decir, SDk,l=Xk,l.
  10. 11. Sistema (1) según la reivindicación 10, en el que el módulo de determinación (36) de la señal con ruido eliminado 50 de salida SDk,l comprende:
    -un sub-módulo de raíz cuadrada (361) para calcular el módulo Xk,l,i de las componentes con ruido eliminado de sub-banda Xk,l,i, y
    55 -un sub-módulo de recombinación (362) de las componentes con ruido eliminado de sub-banda Xk,l,i para obtener la señal con ruido eliminado Xk,l a partir de los módulos Xk,l,i , y eventualmente de las fases θk,l, de manera que la señal con ruido eliminado de salida SDk,l corresponda a la señal con ruido eliminado Xk,l, es
    E12163679
    13-08-2014
    decir, SDk,l=Xk,l.
  11. 12. Sistema (1) según cualquiera de las reivindicaciones 10 y 11, en el que la unidad de tratamiento digital (3)
    comprende además, a la salida del módulo de estimación "MCRA" (33), un módulo de detección del ruido (37) que 5 comprende
    -un módulo de cálculo de una relación media de señal/ruido rl propia de cada trama temporal l a partir del
    módulo al cuadrado Yk,l 2 y de la componente de ruido Dk,l;
    10 -un módulo de comparación de la relación media de señal/ruido rl propia de cada trama temporal l con un umbral ψTH predeterminado;
    -un módulo de control del módulo de reconstrucción (42) de la señal vocal con ruido eliminado de salida sd(t) que está concebido para que: 15
    -si la relación media de señal/ruido rl es inferior a dicho umbral ψTH para la trama temporal l, entonces la señal considerada antes de la reconstrucción para esta trama temporal l corresponde a la señal de salida Sdl procedente del módulo de cálculo de dicha señal de salida Sdl;
    20 -si la relación media de señal/ruido rl es superior a dicho umbral ψTH para la trama temporal l, entonces la señal considerada antes de la reconstrucción para esta trama temporal l corresponde a la señal muestreada yl procedente del módulo de segmentación de la señal acústica con ruido y(t).
ES12163679.9T 2011-04-22 2012-04-11 Procedimiento y sistema de reducción del ruido Active ES2492698T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1153507A FR2974443B1 (fr) 2011-04-22 2011-04-22 Procede et systeme de reduction du bruit
FR1153507 2011-04-22

Publications (1)

Publication Number Publication Date
ES2492698T3 true ES2492698T3 (es) 2014-09-10

Family

ID=44243603

Family Applications (1)

Application Number Title Priority Date Filing Date
ES12163679.9T Active ES2492698T3 (es) 2011-04-22 2012-04-11 Procedimiento y sistema de reducción del ruido

Country Status (4)

Country Link
EP (1) EP2515300B1 (es)
ES (1) ES2492698T3 (es)
FR (1) FR2974443B1 (es)
PT (1) PT2515300E (es)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111854920A (zh) * 2020-07-24 2020-10-30 贵州电网有限责任公司 一种基于dvs振动监测信号的预处理方法及系统
CN113367676B (zh) * 2021-06-07 2022-06-21 广东电网有限责任公司 一种用于可穿戴式设备的ppg运动噪声滤波方法及装置
CN116495946B (zh) * 2023-06-27 2023-10-13 珠江水利委员会珠江水利科学研究院 一种用于城市雨污水截污调蓄和清淤综合处理方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1326479B2 (en) * 1997-04-16 2018-05-23 Emma Mixed Signal C.V. Method and apparatus for noise reduction, particularly in hearing aids

Also Published As

Publication number Publication date
EP2515300B1 (fr) 2014-05-14
FR2974443B1 (fr) 2013-04-26
EP2515300A1 (fr) 2012-10-24
PT2515300E (pt) 2014-08-27
FR2974443A1 (fr) 2012-10-26

Similar Documents

Publication Publication Date Title
CN103730125B (zh) 一种回声抵消方法和设备
US9438992B2 (en) Multi-microphone robust noise suppression
US8977545B2 (en) System and method for multi-channel noise suppression
US8781137B1 (en) Wind noise detection and suppression
US6523003B1 (en) Spectrally interdependent gain adjustment techniques
CN109727604A (zh) 用于语音识别前端的频域回声消除方法及计算机储存介质
CN101916567B (zh) 应用于双麦克风系统的语音增强方法
US8010355B2 (en) Low complexity noise reduction method
CN102074246B (zh) 基于双麦克风语音增强装置及方法
KR102431896B1 (ko) 주 및 기준 채널들 사이의 잡음 및 사운드 파워 레벨 차들의 결정
US20120263317A1 (en) Systems, methods, apparatus, and computer readable media for equalization
BRPI0116844B1 (pt) Processo e dispositivo de redução de ruído
US9343073B1 (en) Robust noise suppression system in adverse echo conditions
CN103380456A (zh) 噪声抑制方法和应用噪声抑制方法的噪声抑制器
CA2549744A1 (en) System for adaptive enhancement of speech signals
WO2014181330A1 (en) A method and apparatus for suppression of unwanted audio signals
ES2492698T3 (es) Procedimiento y sistema de reducción del ruido
WO2016010624A1 (en) Wind noise reduction for audio reception
CN110310656A (zh) 一种语音增强方法
CN105390142A (zh) 一种数字助听器语音噪声消除方法
US20110082692A1 (en) Method and apparatus for removing signal noise
CN103578466B (zh) 基于分数阶傅里叶变换的语音非语音检测方法
US20130051570A1 (en) Method, System and Computer Program Product for Estimating a Level of Noise
Jayakumar et al. An integrated acoustic echo and noise cancellation system using cross-band adaptive filters and wavelet thresholding of multitaper spectrum
May et al. Generalization of supervised learning for binary mask estimation