ES2548010T3

ES2548010T3 - Procedimiento y dispositivo para suavizar ruido de fondo estacionario

Info

Publication number: ES2548010T3
Application number: ES08712799.9T
Authority: ES
Inventors: Stefan Bruhn
Original assignee: Telefonaktiebolaget LM Ericsson AB
Current assignee: Telefonaktiebolaget LM Ericsson AB
Priority date: 2007-03-05
Filing date: 2008-02-13
Publication date: 2015-10-13
Anticipated expiration: 2028-02-13
Also published as: AU2008221657A1; JP5340965B2; PL2132731T3; PL2945158T3; US20100114567A1; PT2945158T; JP2010520512A; EP2132731B1; KR101462293B1; EP2132731A1; KR20090129450A; WO2008108719A1; EP2945158B1; EP3629328A1; CN101632119B; EP2132731A4; US8457953B2; AU2008221657B2; CN101632119A; ES2778076T3

Abstract

Un procedimiento para suavizar ruido de fondo en una sesión de voz de telecomunicaciones, que comprende recibir y descodificar (S10) una señal representativa de una sesión de voz, comprendiendo dicha señal tanto un componente de voz como un componente de ruido de fondo; determinar (S20) parámetros LPC para dicha señal recibida; determinar (S30) una señal de excitación para dicha señal recibida; modificar (S35) dicha señal de excitación determinada reduciendo las fluctuaciones de potencia y espectrales de la señal de excitación; sintetizar y emitir (S40) una señal de salida en base a dichos parámetros LPC y a dicha señal de excitación, caracterizado por: modificar (S25) dicho conjunto determinado de parámetros LPC proporcionando un conjunto filtrado en paso bajo de parámetros LPC, y determinar una combinación ponderada de dicho conjunto filtrado en paso bajo y dicho conjunto determinado de parámetros LPC, y llevar a cabo dicha etapa de síntesis y emisión en base a dicho conjunto modificado de parámetros LPC, para proporcionar una señal de salida suavizada.

Description

imagen1

imagen2

imagen3

imagen4

imagen5

imagen6

5

10

15

20

25

30

35

40

45

E08712799

22-09-2015

que la señal e' tiene una potencia menor que la señal de excitación e. Este efecto, a su vez, puede provocar discontinuidades no deseables en la señal de salida sintetizada en las transiciones entre inactividad y voz activa. Para resolver este problema se ha considerado que e y r sean generalmente secuencias aleatorias estadísticamente independientes. Por consiguiente, la potencia de la señal de excitación modificada depende del factor α y de las potencias de la señal de excitación e y de la señal de ruido r, como sigue:

imagen7

Por lo tanto, para asegurar que la señal de excitación modificada tiene una potencia adecuada, ésta tiene que ser escalada adicionalmente mediante un factor γ:

imagen8

Con la hipótesis simplificada (ignorando el suavizado de potencia de la señal de ruido que se ha descrito anteriormente) de que la potencia de la señal de ruido y la potencia deseada de la señal de excitación modificada son idénticas a la potencia de la señal de excitación P{e}, se encuentra que el factor γ se tiene que escoger como sigue:

imagen9

Una aproximación adecuada es escalar solamente la señal de excitación con un factor γ pero no la señal de ruido:

imagen10

La operación de mezcla de ruido descrita se realiza preferentemente una vez para cada trama, pero podría asimismo realizarse una vez para cada subtrama.

En el curso de minuciosas investigaciones, se ha encontrado que es preferible que la compensación de inclinación (blanqueado) descrita y la modificación del ruido descrita de la señal de excitación se realicen en combinación. En ese caso, la mejor calidad de la señal de ruido de fondo sintetizada se puede conseguir cuando la modificación del ruido trabaja con la señal de excitación compensada en inclinación en lugar de con la señal de excitación original del descodificador de voz.

Para hacer el trabajo del procedimiento de manera aún más óptima puede ser necesario garantizar que ni el suavizado de los parámetros LPC ni las modificaciones de la excitación afecten a la señal de voz activa. De acuerdo con una realización básica y haciendo referencia a la figura 4, esto es posible si la operación de suavizado se activa en respuesta a una VAD que indica inactividad de voz S50.

Otra realización preferida de la invención es su aplicación en un códec de voz escalable. Se puede conseguir un rendimiento global mejorado adicionalmente mediante las etapas de adaptar la operación de suavizado descrita del ruido de fondo estacionario a la tasa de bits a la que se descodifica la señal. Preferentemente, el suavizado se realiza solamente en la descodificación de las capas inferiores de tasa reducida mientras que se desconecta (o se reduce) cuando se descodifica a tasas de bits superiores. La razón es que las capas superiores no acusan normalmente tanta turbulencia y una operación de suavizado podría incluso afectar a la fidelidad con la que el descodificador resintetiza la señal de voz a una tasa de bits superior.

Haciendo referencia a la figura 5, se describirá un dispositivo 1 en un descodificador que habilita el procedimiento según la presente invención.

El dispositivo 1 comprende una unidad general de entrada/salida E/S 10 para recibir señales de entrada y transmitir señales de salida desde el dispositivo. La unidad comprende preferentemente cualquier funcionalidad necesaria para recibir y descodificar señales para el dispositivo. Además, el dispositivo 1 comprende una unidad 20 de parámetros LPC para descodificar y determinar parámetros LPC para la señal recibida y descodificada, y una unidad de excitación 30 para descodificar y determinar una señal de excitación para la señal de entrada recibida. Además, el dispositivo 1 comprende una unidad de modificación 35 para modificar la señal de excitación determinada reduciendo las fluctuaciones de potencia y espectrales de la señal de excitación. Finalmente, el dispositivo 1 comprende un filtro o unidad de síntesis LPC 40 para proporcionar una señal de salida de voz sintetizada suavizada en base, por lo menos, a los parámetros LPC determinados y a la señal de excitación determinada modificada.

De acuerdo con otra realización, también haciendo referencia a la figura 5, el dispositivo comprende una unidad de suavizado 25 para suavizar los parámetros LPC determinados procedentes de la unidad 20 de parámetros LPC. Además, la unidad 40 de síntesis de LPC está adaptada para determinar la señal de voz sintetizada en base, por lo menos, a los parámetros LPC suavizados y a la señal de excitación modificada.

8

imagen11

Claims

imagen1

imagen2