ES2286017T3

ES2286017T3 - Procedimiento y aparato para ajustar de manera automatica las ganancias del altavoz y del microfono en un telefono movil.

Info

Publication number: ES2286017T3
Application number: ES00921542T
Authority: ES
Inventors: Samir Gupta; Anthony P. Mauro; Andrew P. Dejaco
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 1999-03-30
Filing date: 2000-03-29
Publication date: 2007-12-01
Anticipated expiration: 2020-03-29
Also published as: EP1210767A2; AU4184200A; CN1390383A; WO2000059110A2; EP1210767B1; HK1049927A1; CN1168207C; WO2000059110A3; DE60035512D1; DE60035512T2; CN100514989C; CN1533134A; ATE367011T1; HK1049927B

Abstract

Un dispositivo para procesar una señal de entrada proveniente de un micrófono (202) de un dispositivo de comunicaciones, comprendiendo: un medio (204) para aplicar una ganancia analógica a la señal de entrada para formar una señal ajustada de ganancia analógica; y un medio (216) para convertir la señal ajustada de ganancia analógica en una señal digital; caracterizado por: un medio (210) para aplicar una ganancia digital a la señal digital para formar una señal ajustada de ganancia digital; y un medio limitador (214) para procesar la señal ajustada de ganancia digital para generar una señal de salida que tenga un valor que sea menor o igual a un valor umbral limitador, el medio limitador (214) estando configurado para realizar la detección de pico sobre la señal ajustada de ganancia digital.

Description

Procedimiento y aparato para ajustar de manera automática las ganancias del altavoz y del micrófono en un teléfono móvil.

Antecedentes de la invención I. Campo de la invención

La presente invención se refiere por lo general a teléfonos móviles y en particular al micrófono de audio de un teléfono móvil.

II. Antecedentes

Los teléfonos celulares y otros teléfonos móviles son normalmente empleados dentro de una amplia gama de diferentes ambientes de ruido. Por ejemplo, un teléfono celular puede emplearse dentro del ambiente de una oficina o dentro del ambiente de casa relativamente silenciosos o dentro de un ambiente de una fábrica o del ambiente con tráfico relativamente ruidosos.

En un ambiente ruidoso, un usuario tiende a hablar con un volumen más alto en el micrófono del teléfono celular en comparación con los ambientes relativamente silenciosos. Esta es una tendencia natural que surge de la suposición por parte del usuario que él o ella deben hablar con un volumen alto para ser oídas por encima del ruido. Aún así, esto no es a menudo necesario y, de hecho, puede ser contraproducente. El micrófono del teléfono celular puede ser altamente directivo y por lo tanto no detectará ni amplificará todo el ruido que el usuario oye. De esta forma, es innecesario que el usuario hable más alto. Además, el teléfono celular puede ser capaz de procesar sólo un intervalo dinámico limitado de niveles de sonido de forma que la voz del usuario se vea recortada si el usuario habla demasiado alto en el micrófono. Dicho recorte puede dar como resultado una disminución en la relación señal a ruido (SNR) entre la voz transmitida y el nivel del ruido de fondo transmitido. De esta forma, el hablar alto en el micrófono puede hacer realmente más difícil para el oyente el distinguir la voz del usuario.

El fenómeno de recorte anteriormente descrito se ilustra en las figuras 1 y 2. De manera específica, la figura 1 ilustra una señal de voz 10 y una señal de ruido de fondo 12 que entran a un teléfono celular. El nivel de ruido de fondo aumenta comenzando en el instante de tiempo 14. En respuesta a esto, el usuario habla más alto, dando como resultado un aumento en el nivel de la señal de voz de entrada. A medida que el nivel de ruido continúa subiendo, el usuario habla aún más alto hasta alcanzar un punto 16 en el que comienza el recorte. Después de esto, la voz se recorta, produciendo una SNR más baja así como una señal de voz posiblemente desviada. La figura 2 ilustra los cambios resultantes en la SNR. Como puede verse, la SNR disminuye después del instante de tiempo 16.

De esta forma, en circunstancias en las que se produce el recorte, un usuario que intente hablar más alto, realmente puede reducir la inteligibilidad. Incluso cuando no ocurra el recorte, el usuario al hablar más alto puede causar molestias al oyente, dando como resultado quizá una necesidad para el oyente de disminuir el volumen del altavoz de su teléfono. Para muchos teléfonos, en particular para los teléfonos que no son teléfonos móviles, el volumen del altavoz no se puede ajustar y de esta forma, el oyente puede no ser capaz de conseguir un nivel de volumen cómodo. Además, la privacidad puede verse expuesta en el extremo del oyente si la voz del usuario es demasiado alta y el oyente no puede disminuir el nivel de volumen del altavoz.

Otro problema que surge de los altos niveles de ruido es que puede ser difícil para el usuario en el ambiente ruidoso oír la voz de la otra parte. Para muchos teléfonos celulares, el volumen o la ganancia del altavoz del teléfono se pueden aumentar a mano para compensar, pero dicha acción manual por parte del usuario es inconveniente. Además, la acción manual puede ser peligrosa, en particular si el usuario está conduciendo en el tráfico mientras intenta disminuir manualmente la ganancia del altavoz.

De manera adicional, algunos usuarios hablan relativamente de manera suave, mientras otros usuarios hablan relativamente alto. Es inherentemente difícil el diseñar la ganancia del micrófono para proporcionar una ganancia adecuada para las personas que hablan suave sin saturar a las personas que hablan alto.

De acuerdo con esto, existe una necesidad de remediar los problemas anteriormente mencionados, y es para este fin que la invención está principalmente dirigida.

El documento GB 2 179 810 trata un controlador de rango dinámico que consiste en un multiplicador controlado por una cadena lateral que comprende un detector de nivel, un circuito logarítmico, un restador de umbral, un circuito no lineal, un multiplicador de pendiente y un circuito antilogarítmico.

El documento de los Estados Unidos 4.829.565 trata un sistema para la regulación del volumen de audio que supervisa el ruido de fondo en el área de escucha y ajusta de manera automática el nivel de sonido del sistema de acuerdo con esto.

\newpage

El documento GB 2277840 trata un circuito para su uso en los teléfonos móviles digitales para evitar el recorte de una señal de voz. La amplificación de un amplificador ajustable se atenúa con la ayuda de la realimentación de un procesador de señal digital siempre que una muestra digital sobrepase un nivel de recorte más de una vez.

En un aspecto de la invención, un dispositivo para ajustar la ganancia en un micrófono de un dispositivo de comunicaciones incluye de manera ventajosa un medio para aplicar una ganancia digital a una señal de entrada proveniente del micrófono para formar una señal ajustada y un medio limitador para procesar las señales ajustadas para generar una señal de salida que tiene un valor que es menor o igual a un valor umbral limitador, estando el medio limitador configurado para realizar la detección del pico de la señal ajustada.

En otro aspecto de la invención, un dispositivo para ajustar la ganancia en un micrófono de un dispositivo de comunicaciones incluye de manera ventajosa los pasos de aplicar una ganancia digital a una señal de entrada proveniente del micrófono para formar una señal ajustada y procesar la señal ajustada para generar una señal de salida que tenga un valor que sea menor o igual a un valor umbral limitador, el procesado comprendiendo un paso para realizar la detección de pico en la señal ajustada.

De esta forma, la invención anterior, describe problemas que ocurren cuando se usan teléfonos celulares u otros teléfonos móviles en ambientes que tienen altos niveles de ruido de fondo y que se ven solucionados. Una ventaja de la presente invención es que se elimina la necesidad de un botón de control del volumen en un teléfono. Otras ventajas de la invención, así como otras características y objetos de la misma, serán aparentes a partir de la descripción detallada que sigue y de los dibujos que la acompañan.

Breve descripción de los dibujos

Las características, objetos, y ventajas de la presente invención serán más aparentes a partir de la descripción detallada declara a continuación cuando se tome junto con los dibujos en los que idénticos caracteres de referencia identifican de manera correspondiente en todo el documento y en los que:

La figura 1 es un gráfico que ilustra los niveles del ruido de fondo y los niveles de voz de entrada correspondientes para un teléfono celular que funcione en un entorno ruidoso cambiante;

La figura 2 es un gráfico que el nivel de señal a ruido para las señales de entrada de voz y de ruido de la figura 1;

La figura 3 es un diagrama de bloques de un teléfono celular configurado de acuerdo con una realización de la invención;

La figura 4 es un diagrama de bloques de una tabla de consulta de la ganancia del micrófono del teléfono celular de la figura 3; y

La figura 5 es un diagrama de bloques de una tabla de consulta de la ganancia del altavoz del teléfono celular de la figura 3.

La figura 6 es un diagrama de bloques de la circuitería de enlace inverso para un teléfono.

La figura 7 es un diagrama de bloques de un limitador que puede usarse en la circuitería del enlace inverso de la figura 6.

La figura 8 es un diagrama de bloques de la circuitería del enlace directo para un teléfono.

La figura 9 es un diagrama de bloques de un compresor que puede usarse en la circuitería del enlace directo de la figura 8.

La figura 10 es un diagrama de flujo que ilustra los pasos realizados por un algoritmo de control automático del volumen (AVC).

Descripción detallada de las realizaciones preferidas

Con referencia a las figuras restantes, se describirán ahora realizaciones ejemplares de la invención. Las realizaciones ejemplares se describirán principalmente con referencia a diagramas de bloques que ilustran los elementos del aparato. Dependiendo en la implementación, cada elemento del aparato, o parte del mismo, puede configurarse en hardware, software, firmware o combinaciones de los mismos. Debería apreciarse que no todos los componentes necesarios para una implementación completa de un sistema práctico se ilustran o se describen en detalle. En lugar de esto, sólo se ilustran y se describen aquellos componentes necesarios para una comprensión completa de la invención.

La figura 3 ilustra un teléfono celular 100 que tiene un micrófono 102, un altavoz 104 y una antena 106. Los componentes internos pertinentes del teléfono ilustrados en la figura 3 incluyen una unidad de control 108, un Procesador Digital de Señal (DSP) 110, y una unidad de receptor/transmisor 112. También, se incluye una unidad de control de la ganancia del micrófono 113 y una unidad de control de la ganancia del altavoz 115.

Durante su uso, un usuario del teléfono celular 100 habla en el micrófono 102 y su voz y cualquier ruido de fondo detectado es encaminado por la unidad de control 108 dentro del DSP 110 para su procesado en el interior del mismo. En el presente ejemplo, las señales de voz procesadas se codifican, por medio de las unidades mostradas de manera no separada, usando el protocolo de transmisión celular de Acceso Múltiple por División de Código (CDMA), como se describe en detalle en el documento de la Asociación de la Industria de las Telecomunicaciones TIA/EIA/IS 95 - Una Norma de Compatibilidad de Estación Móvil - Estación Base para el Sistema Celular de Espectro Expandido de Banda Ancha de Modo Dual. Las señales codificadas se encaminan al receptor/transmisor 112, después se transmiten a través de la antena 106 a una estación base local (que no se muestra). Las señales se pueden reenviar desde allí a un teléfono remoto que puede ser otro teléfono celular, otro teléfono móvil o a una línea terrestre conectada a una red telefónica pública con conmutación (RTPC) (que no se muestra). Las señales de voz transmitidas al teléfono celular 100 son recibidas a través de la antena 106 y el receptor/transmisor 112, procesadas por el DSP 110 y sacadas a través del altavoz, todos bajo el control de la unidad de control 108.

El DSP' 110 puede, dependiendo de la implementación, puede realizar cualquier variedad de funciones de procesado digital convencionales sobre las señales de voz. De manera adicional, el DSP 110 determina el nivel de ruido de fondo del entorno local a partir de las señales detectadas por el micrófono 102 y fija la ganancia del micrófono 102 a un nivel seleccionado para compensar la tendencia natural del usuario del teléfono celular 100 a hablar más alto en ambientes ruidosos. En el presente ejemplo, la ganancia del micrófono se fija a un nivel que es generalmente inversamente proporcional al nivel del ruido de fondo. En el ejemplo presente, la ganancia del micrófono se disminuye en la mitad del aumento en el ruido de fondo medido en decibelios.

Para este fin, el DSP 110 incluye una unidad de detección del nivel de ruido de fondo 114, una tabla de consulta de la ganancia del micrófono 116 y una tabla de consulta de la ganancia del altavoz 118. El detector de nivel de ruido de fondo 114 determina, de acuerdo con técnicas convencionales, el nivel del ruido de fondo a partir de las señales recibidas desde el micrófono 102, produciendo un valor digital que es representativo del nivel del ruido de fondo. El valor digital puede por ejemplo, representar la energía del ruido de fondo en decibelios. El DSP 110 aplica el valor digital a la tabla de consulta de la ganancia del micrófono 116 para leer un valor de ganancia de micrófono para aplicarlo al micrófono 102 a través de la unidad de control de la ganancia del micrófono 113.

En el presente ejemplo, el nivel de ruido de fondo B' se determina en la estructura actual en base al nivel de ruido de fondo de la estructura anterior B y a la energía de la estructura actual E_{f}. En la determinación del nuevo nivel de ruido de fondo B' para su uso durante la siguiente estructura (como la estimación B del ruido de fondo de la estructura anterior), se calculan dos valores. El primer valor V_{1} simplemente es la energía de la estructura actual E_{f}. El segundo valor V_{2} es el valor más grande de B+1 y K\cdotB, dónde K= 1,00547. El menor de los dos valores, V_{1} o V_{2} es elegido como el nuevo nivel de ruido de fondo B'. En forma matemática,

(1)V_{1} = R(0)

(2)V_{2} = \text{mín} \ (160000, \ máx \ (K \cdot B, \ B+1))

y el nuevo nivel de ruido de fondo B' es:

(3)B' = \text{mín} \ (V_{1}, \ V_{2})

donde mín (x, y) es el mínimo de x e y, y máx (x, y) es el máximo de x e y.

La figura 4 ilustra una tabla de consulta de la ganancia del micrófono ejemplar 116 que tiene entradas 120 para varios niveles de ruido de fondo y entradas 122 para los correspondientes valores de ganancia de micrófono. Los valores de ganancia del micrófono, por ejemplo, pueden ser representaciones digitales de niveles de tensión o de corriente para su aplicación a un amplificador de micrófono 102 (que no se muestra). Las entradas 120 pueden especificar niveles de ruido individuales o intervalos de niveles del ruido. Cada nivel de ruido de entrada cuantificado esperado está representado dentro de la tabla de consulta 116. Si se detecta que un nivel de ruido no tiene una entrada correspondiente en la tabla 116, se emplea un valor por defecto. De acuerdo con técnicas convencionales, la tabla de consulta 116 se puede implementar como una parte de memoria de sólo lectura (ROM). En otras implementaciones, la tabla de consulta 116 puede implementarse usando otras técnicas apropiadas, tales como algoritmos software.

Como se ha hecho notar, el valor del nivel de ruido de fondo leído de la tabla de consulta de la ganancia del micrófono 116 se aplica al micrófono 102 para ajustar su ganancia. Mediante el almacenamiento de los valores en la tabla de consulta 116 que proporcionen una ganancia del micrófono que sea disminuida con los niveles del ruido crecientes, la tendencia natural de un usuario del teléfono a hablar más alto en un ambiente ruidoso se compensa de manera automática. También, mediante la disminución de la ganancia del micrófono, se evita una pérdida en la SNR provocada por el recorte de la señal, en el propio micrófono 102 o en el DSP 110.

Se pueden calcular los niveles del ruido de fondo y se pueden leer y aplicar los correspondientes niveles de ganancia al micrófono 102 ya sea de manera continua o de manera periódica. En el presente ejemplo, la ganancia del micrófono se reajusta cada dos o tres segundos, acomodándose por lo tanto al retardo típico entre un aumento en el nivel del ruido de fondo y un aumento correspondiente en el volumen de la voz del usuario. En otro ejemplo, se detecta el nivel del ruido y la ganancia se fija sólo una vez por llamada o quizás sólo al encender el teléfono celular.

En el ejemplo presente, la ganancia del altavoz 104 se ajusta de manera automática de una manera similar a la ganancia del micrófono. El valor del nivel de ruido de fondo calculado por medio de la unidad de detección del nivel de ruido de fondo 114 se aplica a la tabla de consulta de la ganancia del altavoz 118 para leer un valor de ganancia de altavoz apropiado para el nivel del ruido de fondo. En la figura 5 se ilustra una tabla de consulta de la ganancia del altavoz de ejemplo 118. La tabla de consulta de la ganancia del altavoz 118 tiene entradas 130 para los niveles del ruido de fondo y entradas 132 para los correspondientes valores de ganancia del altavoz. Los valores de ganancia del altavoz pueden representar niveles de tensión o de corriente para controlar la ganancia de un amplificador (no mostrado de manera independiente) del altavoz. Se puede emplear un valor por defecto para cualquier nivel del ruido que no tenga una entrada en la tabla de consulta de la ganancia del altavoz 118. También, como con la tabla de consulta de la ganancia del micrófono 116, se puede acceder a la tabla de consulta de la ganancia del altavoz 118 de manera continua o de manera periódica, o quizás sólo una vez por llamada o sólo al encender.

Sin embargo, a diferencia de la tabla de consulta de la ganancia del micrófono 116 que está programada de manera ventajosa con valores seleccionados para disminuir la ganancia con los niveles de ruido crecientes, la tabla de consulta de la ganancia del altavoz 118 está programada de manera ventajosa con los valores seleccionados para aumentar la ganancia con los niveles de ruido crecientes. Los valores de ganancia del altavoz, por ejemplo, se pueden fijar para aumentar la ganancia en una cantidad sustancialmente proporcional a un incremento en los niveles del ruido de fondo. Como tal, el usuario no necesita ajustar la ganancia del altavoz por medio de una unidad de control manual (que no se muestra). En lugar de esto, se realiza el ajuste automático.

Lo que se han descrito son ejemplos de un teléfono celular configurado para disminuir de manera automática la ganancia del micrófono y para aumentar la ganancia del altavoz de manera automática en respuesta a un incremento en los niveles del ruido de fondo del entorno del teléfono celular. En los ejemplos, la disminución en la ganancia del micrófono y el aumento en la ganancia del altavoz son ambos proporcionales a un aumento en los niveles del ruido de fondo. En otros ejemplos, se prevén otras relaciones entre las ganancias del micrófono y del altavoz y los niveles del ruido de fondo. En general, se puede emplear cualquier relación deseada solamente preprogramando las tablas de consulta con los valores apropiados. Los valores, por ejemplo, calcularse de manera inicial en base a una relación matemática tal como la simple proporcionalidad. En otros casos, se pueden determinar valores apropiados de manera empírica midiendo hasta que grado un usuario del teléfono real aumenta su volumen de habla en respuesta a los cambios en los niveles del ruido de fondo. Como se puede apreciar, se puede emplear una amplia gama de posibles técnicas para determinar los valores apropiados para almacenar en las tablas de consulta coherentes con los principios generales de la invención. Además, las tablas de consulta no son necesarias. Se puede emplear cualquier medio adecuado para ajustar la ganancia del micrófono y del altavoz. Por ejemplo, el nivel digital del ruido detectado puede convertirse en una tensión analógica, procesado por medio de la circuitería para su dimensionamiento y su inversión en caso necesario, y aplicado después directamente a los amplificadores respectivos del micrófono y del altavoz para ajustar la ganancia.

De acuerdo con una realización, se puede añadir un limitador a la circuitería del enlace inverso convencional para un teléfono. Como se muestra en la figura 6, la circuitería del enlace inverso 200 para un teléfono (que no se muestra) incluye un micrófono 202, la lógica de ganancia analógica 204 (típicamente un amplificador operacional convencional), un sumador/restador 206, un filtro cancelador de eco 208, una lógica de ganancia estática 210, un supresor de ruido 212, un limitador 214, y un conversor analógico a digital (A/D) 216.

Un usuario habla en el micrófono 202, que traduce la señal de habla sonora en una señal de voz eléctrica. La señal de habla se entrega a la lógica de ganancia analógica 204 que aplica una ganancia analógica a la señal de voz. La señal de voz se entrega entonces al A/D 216 que muestrea y cuantifica la señal de voz analógica, convirtiendo la señal en un formato digital de acuerdo con cualquiera de un número de técnicas conocidas, incluyendo, por ejemplo, la modulación de impulsos codificados (MIC), la ley \mu, o la ley A. Una señal generada por el filtro cancelador de eco 208 se resta de la señal de voz digitalizada por medio del sumador/restador 206, eliminando por tanto los componentes de eco de la señal de voz. El sumador/restador 206, el A/D 216, y el filtro cancelador de eco 208 son componentes ventajosamente convencionales que son bien conocidos en la técnica pertinente.

La señal de voz filtrada se entrega a la lógica de ganancia estática 210 que aplica una ganancia de entrada digital estática para sintonizar de manera precisa la amplificación de la señal de voz. Los dispositivos para implementar la lógica de la ganancia estática 210 son bien conocidos en la técnica. La ganancia estática se elige de manera ventajosa junto con un umbral limitador para compensar la reducción en la ganancia analógica. El limitador 214 que está configurado de manera ventajosa para funcionar sobre cada palabra hablada, sirve para evitar el recorte de las señales de voz que estén maximizadas, tal como, por ejemplo, las palabras habladas por usuarios que hablan en alto.

La señal de voz amplificada se entrega al supresor de ruidos 212 que suprime los componentes del ruido de fondo de la señal de voz que fueron recibidos en el micrófono 202 cuando habló el usuario. Los dispositivos para implementar el supresor de ruido 212 son bien conocidos en la técnica. En una realización, el supresor de ruido 212 no se usa. En otra realización, el A/D 216, el filtro cancelador de eco 208, el sumador/restador 206, la lógica de ganancia estática 210, el supresor de ruido 212, y el limitador 214 son todos implementados en un procesador digital de la señal (DSP). En la realización ilustrada en la figura 6, la señal se entrega al limitador 214 por el supresor de ruido 212. El limitador 214 sirve para evitar el recorte en la señal de voz si la señal de voz se maximiza, como se describe con posterioridad. El limitador 214 genera una señal de salida que se entrega a un codificador (que no se muestra) antes de ser modulada y transmitida sobre un canal de comunicaciones digital.

En la figura 7 se ilustra un limitador 214 que está configurado de acuerdo con una realización. El limitador 214 incluye la lógica de la medida de pico 300, la lógica logarítmica en base dos 302, un sumador/restador 304, lógica del limitador 306, un primer multiplicador 308, lógica logarítmica inversa en base dos 310, lógica de suavizado 312, un elemento de retardo 314, y un segundo multiplicador 316.

Las muestras de voz digitalizadas x[n] son multiplicadas por una ganancia de entrada estática G por medio de la lógica de ganancia estática 210 que es de manera ventajosa un multiplicador convencional 210. La ganancia digital G sirve para sintonizar de manera precisa, o para ajustar, los niveles de amplificación de las muestras de voz x[n]. Las muestras de voz x[n] son entregadas después al limitador 214 que se implementa de manera ventajosa en un DSP. En el limitador 214, las muestras de voz de entrada x[n] se entregan a la lógica de medida de pico 300 y al elemento de retardo 314.

La lógica de la medida de pico 300 implementa la siguiente ecuación para medir el pico de las muestras de voz x[n]:

X_{pico} \ [n] = (1 - RT) \ x_{pico} \ [n - 1] + AT \ x_{dif} \ [n].

En la ecuación anterior, el valor de pico de la muestra de voz x[n] se fija igual a la cantidad de uno menos el tiempo de liberación RT multiplicado por el valor de pico de la muestra anterior x [n-1], sumado al producto del tiempo de ataque y un valor de diferencia x_{dif} [n]. El valor de diferencia x_{dif} [n] se fija igual a la diferencia entre el valor absoluto de la muestra de voz actual y el valor de pico de la muestra de voz anterior, si y sólo si esta diferencia es mayor que cero. En caso contrario, el valor diferencia x_{dif}[n] se fija igual a cero.

El valor de pico calculado x_{pico} [n] se entrega a la lógica logarítmica en base dos 302 que calcula el logaritmo en base dos del valor de pico de x_{pico} [n], generando una señal de salida en unidades de decibelios (dB). La señal en dB se entrega al sumador/restador 304 que resta un valor umbral limitador L_{umbral} de la señal en dB. Se entrega una señal en dB resultante a la lógica del limitador 306 que realiza una función de limitación en la señal. La señal se entrega después al primer multiplicador 308 que multiplica la señal por un valor de pendiente de atenuación (negativo) L_{pendiente}. El sumador/restador 304, la lógica del limitador 306 y el primer multiplicador 308 sirven para generar un valor en dB de salida que es igual al valor en dB de entrada, con tal de que el valor en dB de la entrada (y el valor en dB de la salida) sean menores o iguales al valor umbral limitador L_{umbral}. Cuando el valor en dB de entrada sobrepase el valor umbral limitador L_{umbral}, la pendiente de la señal de salida se atenúa, o se dimensiona, de acuerdo con el valor de la pendiente -L_{pendiente}, tal que, por ejemplo, el valor en dB de salida aumenta en un dB si el valor en dB de la entrada sube en veinte dB. El valor umbral limitador L_{umbral} puede ser elegido de manera ventajosa para que esté muy próximo al punto de saturación original del amplificador de lógica de la ganancia estática 210 antes de la sintonía precisa digital para la reducción de la saturación. El punto de saturación original se define por medio de la ganancia de transmisión deseada del sistema de micrófono como se implementa en el dominio analógico.

El primer multiplicador 308 entrega la señal de salida en dB a la lógica logarítmica inversa en base dos 310 que calcula el logaritmo inverso en base 2 de la señal en dB subiendo el valor dos a la potencia del exponente del valor de la señal en dB (G, en dB). La lógica logarítmica inversa en base dos 310 genera una señal de salida f [n]. La señal f[n] es entregada a la lógica de suavizado 312 que genera una señal de salida suavizada g [n] de acuerdo con la siguiente ecuación:

g [n] = (1 - k) \ g \ [n - 1] + k \ f \ [n],

donde el valor k es un coeficiente de suavizado que está elegido de manera ventajosa para la calidad óptima de audio.

La señal suavizada g [n] se entrega al segundo multiplicador 316. El elemento de retardo 314 que las muestras de voz de entrada x [n], está configurado para retrasar cada muestra de voz x [n] un tiempo D, generando muestras de voz de salida retrasadas x [n-D]. Las muestras de voz retrasadas x [n-D] se entregan al segundo multiplicador 316. El segundo multiplicador 316 multiplica las muestras de voz retrasadas x [n-D] por la función de suavizado g [n], generando una señal de salida limitada para su entrega a un codificador (que no se muestra) antes de que sean moduladas y transmitidas sobre un canal de comunicaciones digital.

El limitador 214 limita de esta forma los límites de señal a un valor de aproximadamente L_{umbral} de magnitud. Para proporcionar la ganancia adecuada para personas que hablan de manera suave sin saturar a las personas hablantes con voz alta, la ganancia analógica de la etapa de entrada se reduce en una cantidad en dB fija y se compensa con la ganancia digital G donde se encuentre disponible altura libre adicional. El limitador 214 reduce entonces los niveles altos al intervalo completo del A/D 216 (figura 6) en el otro lado del canal de comunicaciones digital, mientras que se da a las personas que hablan de manera suave adecuados niveles de ruido de señal a cuantificación. Los varios cálculos matemáticos se pueden realizar de acuerdo con técnicas DSP conocidas. De esta forma, el limitador 214 proporciona de manera ventajosa la capacidad de ensanchar el margen dinámico de entrada percibido a la vez que evita la saturación para las señales altas. Otras variaciones en los niveles de la señal de entrada que se pueden compensar para estar de acuerdo con la realización anteriormente descrita incluyen, por ejemplo, el equipo de coche manos libres frente al teléfono y el micrófono de solapa frente al micrófono de boca.

Debería entenderse los que sean expertos en la técnica que las realizaciones anteriormente descritas dirigidas a la circuitería de enlace inverso pueden residir en cualquier dispositivo de comunicaciones por el que hable un usuario. De manera similar, los que sean expertos apreciarán que las realizaciones descritas a continuación dirigidas a la circuitería de enlace directo pueden residir en cualquier dispositivo de comunicaciones que emita sonidos.

De acuerdo con una realización, la circuitería convencional de enlace directo 400 para un teléfono se puede modificar para ajustar el volumen del altavoz de un teléfono en base a la altura libre disponible y a la estimación de ruido de fondo. Como se muestra en la figura 8, circuitería de enlace directo para un teléfono (que no se muestra) incluye filtros de salida 402, lógica de ganancia fija 404, un compresor 406, la lógica del control automático del volumen (AVC) 408, la lógica de configuración del volumen de usuario 410, un conversor digital a analógico (D/A) 412, y un altavoz 414.

Para propósitos de ilustración, también se describen los componentes acompañantes de la circuitería de enlace inverso de la figura 6 para el teléfono, incluyendo el micrófono 202, la lógica de ganancia analógica 204, el A/D 216, el filtro cancelador de eco 208, el sumador/restador 206, y el supresor de ruido 212. Los varios elementos del enlace inverso pueden funcionar y se pueden implementar como se ha descrito anteriormente con referencia a la figura 6. En una realización, la circuitería del enlace directo digital y la circuitería del enlace inverso digital están implementadas en un DSP.

En la figura 8, las muestras de voz digitalizadas x [n] son recibidas sobre un canal de comunicación desde otro teléfono y son descodificadas por medio de un descodificador (que no se muestra). Las muestras de voz x [n] son sacadas desde el descodificador y son entregadas a los filtros de salida 402 para su filtrado apropiado como entenderán los que sean expertos en la técnica. Los filtros de salida 402 entregan las muestras de voz filtradas a la lógica de ganancia fija 404, que multiplica las muestras de voz por una ganancia fija G, generando muestras de voz amplificadas. Las muestras de voz amplificadas son entregadas al compresor 406, que o comprime o expande las muestras de voz como se describe a continuación con referencia a la figura 9.

Las muestras de voz comprimidas son entregadas a la lógica AVC 408. La lógica AVC 408 también está acoplada a la salida del sumador/restador 206. La lógica AVC 408 recibe una señal de estimación del ruido de fondo actualizada de manera periódica (BNE) proveniente del sumador/restador 206. La lógica AVC 408 proporciona AVC en base a la altura libre disponible (según se obtuvo del compresor 406) y el BNE (según se obtuvo de la circuitería de enlace inverso antes de la supresión de ruido). A continuación se describe con referencia a la figura 10, un algoritmo AVC ejemplar que puede ser realizado por la lógica AVC 408.

Si la lógica AVC 408 está en el modo Desactivado (OFF), el control del volumen es especificado por el usuario a través de un botón de control de volumen (que no se muestra) en el teléfono y la lógica de configuración de volumen del usuario 410. Si la lógica AVC 408 está en modo Activado (ON), la lógica AVC 408 proporciona de manera automática el control de volumen en respuesta a los niveles de ruido de fondo cambiantes y a la altura libre disponible. El usuario puede activar o desactivar el modo AVC. Por ejemplo, el usuario puede configurar el nivel de volumen del altavoz de manera manual una primera vez, y después activar la lógica AVC 408 para proporcionar el control de volumen del altavoz después de esto.

La lógica AVC 408 genera una señal de control del volumen que se aplica a la lógica de configuración del volumen de usuario 410. La lógica de configuración del volumen del usuario 410 proporciona las muestras de voz digitalizadas de salida al nivel de volumen apropiado, al D/A 412. El D/A 412 convierte las muestras de voz digitalizadas de salida a una señal analógica y proporciona la señal analógica al altavoz 414, que traduce la señal en una señal de salida de altavoz audible por el usuario.

Se puede implementar un compresor 406 para proporcionar la compresión y la expansión, como se muestra en la figura 9. Como se ilustra en la figura 9, la circuitería de enlace directo de un teléfono (que no se muestra) incluye la lógica de ganancia fija 404 que es de manera ventajosa un multiplicador convencional 404 y un compresor 406 que se puede usar como un compresor o como un expansor, según se desee.

El compresor 406 incluye un elemento de retardo 500, un filtro 502, un calculador del valor cuadrático medio (RMS) 504, lógica de cálculo logarítmico 506, un sumador/restador 508, lógica de compresor 510, un primer multiplicador 512, la lógica de cálculo logarítmico inverso 514, lógica de aplicación de tiempo de ataque/liberación 516, y un segundo multiplicador 518. El filtro 502 puede no usarse.

Las muestras de voz digitalizadas x [n] se entregan al multiplicador 404 que multiplica las muestras de voz x [n] por una ganancia digital G. La ganancia digital G se elige de manera ventajosa, junto con un umbral de compresión definido a continuación, para asegurar que se trae a la persona que habla de manera más suave al nivel de señal deseado, controlando el compresor 406 durante los picos. Las muestras de voz x [n] se entregan entonces al compresor 406 que se implementa de manera ventajosa en un DSP. En el compresor 406, las muestras de voz de entrada x [n] se entregan al filtro 502 y al elemento de retardo 500. El elemento de retardo 500 que puede por ejemplo, ser implementado con una muestra de salida FIFO, sirve para controlar de manera predictiva el nivel de la señal de salida, por tanto atacando los picos en la parte delantera de la transmisión. El filtro 502 puede estar configurado para filtrar las muestras de voz de acuerdo con cualquiera de varias técnicas de filtrado conocidas. Por ejemplo, el filtro 502 puede estar configurado como un filtro paso banda con el fin de elegir de manera selectiva qué frecuencias sobre las que hacer decisiones de compresión. En un ejemplo en el que reside la circuitería de enlace directo 400 en un equipo de coche manos libres, el filtro 502 sirve para reforzar las frecuencias con distorsión pesada que entran en el compresor 406. Cualquier frecuencia de la señal que tenga niveles de distorsión que sobrepasen un umbral predefinido es reforzada por el filtro 502. Las muestras de voz filtradas se entregan al calculador de RMS 504.

El calculador de RMS 504 implementa la siguiente ecuación para calcular el RMS de las muestras de voz:

X_{rms} \ [n] = (1 - TAV) \ x_{rms} \ [n - 1] + TAV \ x^{2} \ [n].

En la ecuación anterior, el valor RMS de la muestra de voz x[n] se fija igual a la cantidad de uno menos un coeficiente promediado en el tiempo TAV multiplicado por el valor RMS de la muestra anterior x [n-1], sumado al producto del coeficiente promediado en el tiempo TAV y el cuadrado de la muestra de voz actual x [n]. El coeficiente promediado en el tiempo TAV sirve para determinar la tasa de promediado RMS. El nivel RMS de las muestras de voz se calcula de manera ventajosa usando un filtro paso bajo de primer orden aplicado a la señal en el dominio de la energía. La constante de tiempo para este filtro de suavizado se elige de manera ventajosa para que la componente de frecuencia más pequeña de interés pueda conseguir una salida RMS constante para el filtro de suavizado dado. A modo de ejemplo, para una sinusoide de 100 Hz, la constante de tiempo debería ser aproximadamente 10 ms.

El valor RMS calculado x_{rms}[n] se entrega a la lógica de cálculo logarítmico 506 que calcula el logaritmo en base 2 del valor RMS x_{rms}[n] y multiplica el valor logarítmico en base 2 calculado por 0,5, generando una señal de salida en unidades de decibelios (dB). La señal en dB se entrega al sumador/restador 508 que resta un valor umbral de compresión C_{umbral} de la señal en dB. Se proporciona una señal en dB resultante a la lógica del compresor 510 que realiza una función de compresión en la señal. La señal se entrega entonces al primer multiplicador 512 que multiplica la señal por un valor de pendiente de compresión de atenuación (negativa) -C_{pendiente}. Si el nivel RMS de la señal sube por encima del valor C_{umbral}, se aplica compresión a la señal (con los tiempos apropiados de ataque y de liberación) en base al valor C_{pendiente} que especifica una relación del compresor R como una relación de dB de acuerdo con la siguiente ecuación: C_{pendiente} = 1 - 1/R. La relación de compresión R se puede definir como el nivel RMS por encima del cual ocurre realmente toda la compresión. El valor umbral de compresión C_{umbral} y el valor de la pendiente de compresión C_{pendiente} para un trayecto particular de la señal deben elegirse de acuerdo con el nivel promedio del hablante dBm0 deseado para la normalización.

El primer multiplicador 512 entrega la señal en dB de salida a la lógica de cálculo logarítmico inverso 514, que calcula el logaritmo inverso en base 2 de la señal en dB subiendo el valor dos a la potencia del exponente del valor de la señal en dB (G, en dB). La lógica de cálculo logarítmico inverso 514 genera una señal de salida f [n]. La señal f [n] se entrega a la lógica de aplicación del tiempo de ataque/liberación 516 que genera una señal de salida g[n] de acuerdo con la siguiente ecuación:

g \ [n] = (1 - k) \ g \ [n - 1] + k \ f \ [n]

donde el valor de k es un coeficiente de suavizado que es elegido de manera ventajosa para la calidad de audio óptima. La lógica de aplicación del tiempo de ataque/liberación 516 da servicio de manera ventajosa a una función de suavizado. El ataque y la liberación son aplicados usando una función de suavizado de primer orden para proporcionar una curva de ganancia de suavizado para su aplicación a la señal de salida (el valor de k es cambiado de manera ventajosa dependiendo de si se está aplicando el ataque o la liberación. El tiempo de ataque se puede fijar de manera ventajosa en un milisegundo (ms) para atacar los picos de las muestras de entrada de manera rápida y precisa. El tiempo de liberación se puede fijar de manera ventajosa entre 100 y 200 ms para impedir que las fluctuaciones rápidas de ganancia puedan afectar a la calidad del compresor 406. Se puede usar un retardo predictivo de 1 ms para relajar el tiempo de ataque. Se pueden implementar el ataque y la liberación con una histéresis para evitar que las oscilaciones en la señal de entrada puedan afectar a la curva de ganancia de salida.

La señal suavizada g[n] se entrega al segundo multiplicador 518. El elemento de retardo 500 que recibe las muestras de voz de entrada x[n], está configurado para retardar cada muestra de voz x[n] en un tiempo D, generando muestras de voz de salida retardadas x [n-D]. Las muestras de voz retrasadas x [n-D] se entregan al segundo multiplicador 518. El segundo multiplicador 518 multiplica las muestras de voz retrasadas x [n-D] por la función de suavizado g[n], generando una señal de salida comprimida para su entrega a la lógica AVC 408 (figura 8).

La lógica del compresor 510 también puede usarse como lógica del expansor por medio de la configuración del sumador/restador 508 para restar la señal en dB de un valor de umbral de expansión E_{umbral}, y configurando el primer multiplicador 512 para multiplicar la señal por un valor positivo de pendiente de expansión E_{pendiente}. El sumador/restador 508 y el primer multiplicador 512 pueden ser reconfigurados de manera ventajosa por medio de programación de forma que la lógica del compresor 510 puede dar servicio tanto a las funciones de compresión como a las funciones de expansión. Si el nivel RMS de la señal cae por debajo del valor E_{umbral}, se aplica la expansión a la señal en base al valor E_{pendiente} que especifica una relación de expansor como una relación de dB.

Un algoritmo de AVC puede realizar los pasos mostrados en el diagrama de flujo de la figura 10 con el fin de hacer un seguimiento de las condiciones ambientales del enlace inverso y ajustar de manera automática el volumen para dar al usuario un nivel de volumen apropiado. De manera ventajosa, el usuario puede fijar un punto fijo de nivel de volumen deseado y después, si se desea, se puede uno olvidar del control de volumen que por lo tanto es manejado de manera automática. El algoritmo AVC de la figura 10 funciona junto con el compresor 406 (véase la figura 9) que limita los niveles de señal a un pequeño intervalo por encima del valor umbral de compresión programable C_{umbral}. La altura libre sin distorsión disponible depende del valor umbral de compresión C_{umbral}.

De acuerdo con el diagrama de flujo de la figura 10, el algoritmo AVC obtiene una estimación del ruido de fondo (BNE) (un valor en dB) en el paso 600. El algoritmo AVC procede después con el paso 602. En el paso 602, el algoritmo AVC compara el BNE con un primer valor umbral sintonizable T3 (en dB). Si el BNE es mayor que el primer valor umbral sintonizable T3, el algoritmo AVC procede con el paso 604. Si, por otra parte, el BNE no es mayor que el primer valor umbral sintonizable T3, el algoritmo AVC procede con el paso 606.

En el paso 604 un valor objetivo del volumen para la muestra actual, objetivo [n], se fija igual a un primer valor de ganancia predefinido G3. El algoritmo AVC procede entonces con el paso 608. El primer valor de ganancia predefinido G3 puede fijarse a 18 dB para proporcionar un volumen adecuado para un ambiente con ruido alto.

En el paso 606 el algoritmo AVC resta un valor de histéresis H (en dB) del primer valor umbral sintonizable T3, y compara la diferencia resultante con el BNE. Si el BNE es mayor que la diferencia entre el primer valor umbral sintonizable T3 y el valor de la histéresis H, el algoritmo AVC procede con el paso 610. Si, por otra parte, el BNE no es mayor que la diferencia entre el primer valor umbral sintonizable T3 y el valor de la histéresis H, el algoritmo AVC procede con el paso 612. El valor de histéresis H sirve para evitar que la ganancia fluctúe con cambios instantáneos en el BNE.

En el paso 610 el algoritmo AVC compara un valor de volumen objetivo para la muestra anterior, objetivo [n-1], con el primer valor de ganancia predefinido G3. Si el valor objetivo del volumen para la muestra anterior, objetivo [n-1], es igual al primer valor de ganancia predefinido G3, el algoritmo AVC procede con el paso 604. Si, por otra parte, el valor objetivo del volumen para la muestra anterior, objetivo [n-1], no es igual al primer valor de ganancia predefinido G3, el algoritmo AVC procede con el paso 614.

En el paso 612 el algoritmo AVC compara el BNE con un segundo valor umbral sintonizable T2 (en dB). Si el BNE es mayor que el segundo valor umbral sintonizable T2, el algoritmo AVC procede con el paso 614. Si, por otra parte, el BNE no es mayor que el segundo valor umbral sintonizable T2, el algoritmo AVC procede con el paso 616.

En el paso 614 el valor objetivo del volumen para la muestra actual, objetivo [n], es fijado igual a un segundo valor de ganancia predefinido G2. El algoritmo AVC procede entonces con el paso 608. El segundo valor de ganancia predefinido G2 puede fijarse a 12 dB para proporcionar un volumen adecuado un ambiente con un ruido medio.

En el paso 616 el algoritmo AVC resta el valor de histéresis H del segundo valor umbral sintonizable T2, y compara la diferencia resultante con el BNE. Si el BNE es mayor que la diferencia entre el segundo valor umbral sintonizable T2 y el valor de histéresis H, el algoritmo AVC procede con el paso 618. Si, por otra parte, el BNE no es mayor que la diferencia entre el segundo valor umbral sintonizable T2 y el valor de histéresis H, el algoritmo AVC procede con el paso 620.

En el paso 618, el algoritmo AVC compara el valor objetivo de volumen para la muestra anterior, objetivo [n-1], con el segundo valor de ganancia predefinido G2. Si el valor objetivo de volumen para la muestra anterior, objetivo [n1], es igual al segundo valor de ganancia predefinido G2, el algoritmo AVC procede con el paso 614. Si, por otra parte, el valor objetivo de volumen para la muestra anterior, objetivo [n-1], no es igual al segundo valor de ganancia predefinido G2, el algoritmo AVC procede con el paso 622.

En el paso 620, el algoritmo AVC compara el BNE con un tercer valor umbral sintonizable T1 (en dB). Si el BNE es mayor que el tercer valor umbral sintonizable T1, el algoritmo AVC procede con el paso 622. Si, por otra parte, el BNE no es mayor que el tercer valor umbral sintonizable T1, el algoritmo AVC procede con el paso 624.

En el paso 622 el valor objetivo del volumen para la muestra actual, objetivo [n], es fijado igual a un tercer valor de ganancia predefinido G1. El algoritmo AVC procede entonces con el paso 608. El tercer valor de ganancia predefinido G1 se puede fijar a 6 dB para proporcionar un volumen adecuado para un entorno de ruido bajo.

En el paso 624, el algoritmo AVC resta el valor de histéresis H del tercer valor umbral sintonizable T1, y compara la diferencia resultante con el BNE. Si el BNE es mayor que la diferencia entre el tercer valor umbral sintonizable T1 y el valor de histéresis H, el algoritmo AVC procede con el paso 626. Si, por otra parte, el BNE no es mayor que la diferencia entre el tercer valor umbral sintonizable T1 y el valor de histéresis H, el algoritmo AVC procede con el paso 628.

En el paso 626 el algoritmo AVC compara el valor objetivo del volumen para la muestra anterior, objetivo [n-1], con el tercer valor de ganancia predefinido G1. Si el valor objetivo del volumen para la muestra anterior, objetivo [n-1], es igual al tercer valor de ganancia predefinido G1, el algoritmo AVC procede con el paso 622. Si, por otra parte, el valor objetivo del volumen para la muestra anterior, objetivo [n-1], no es igual al tercer valor de ganancia predefinido G1, el algoritmo AVC procede con el paso 628. En el paso 628 el valor objetivo del volumen para la muestra actual, objetivo [n], se fija igual a 0 dB, es decir, no se aplica ninguna ganancia a la señal. El algoritmo AVC procede entonces con el paso 608.

En el paso 608, se suma un valor umbral de compresión C_{umbral} a un parámetro de control digital de la altura libre, AVC_ Altura_libre, para producir una primera suma. El valor objetivo del volumen para la muestra actual, objetivo [n], se suma al nivel del volumen actual para producir una segunda suma. La primera y la segunda sumas se comparan entre sí. Si la primera suma es mayor que la segunda suma, el algoritmo AVC procede con el paso 630. Si, por otra parte, la primera suma no es mayor que la segunda suma, el algoritmo AVC procede con el paso 632.

En el paso 630, el algoritmo AVC suma el valor umbral de compresión C_{umbral} al parámetro de control digital de altura libre, AVC_Altura_libre, para producir una primera suma, y después resta el nivel de volumen actual de la primera suma para producir un valor de diferencia. El valor objetivo del volumen para la muestra actual, objetivo [n], se fija igual al valor objetivo del volumen para el valor de la diferencia. El algoritmo AVC procede entonces con el paso 632. Debería señalarse que la ganancia global está limitada por la altura libre digital disponible (como el proporcionado por un compresor (que no se muestra)) y por el parámetro de control, AVC_Altura_libre. El parámetro de control de la altura libre, AVC_Altura_libre, se resta de la altura libre disponible para limitar la ganancia total disponible. La ausencia de recorte digital se asegura porque la suma del valor umbral de compresión C_{umbral}, el parámetro de control de la altura libre, AVC_Altura_libre, y el nivel de volumen actual está restringida a un valor que es menor de 0 dBm0.

En el paso 632, el producto de un coeficiente de promediado en el tiempo TAV y el valor objetivo del volumen para la muestra actual, objetivo [n], se suma al producto de la cantidad uno menos el coeficiente de promediado en el tiempo TAV y un valor de control automático de la ganancia (AGC) para la muestra anterior, GananciaVolAGC [n-1]. La suma resultante se fija igual a un valor AGC para la muestra actual, GananciaVolAGC [n]. El algoritmo AVC procede entonces con el paso 634. En el paso 634, el algoritmo AVC aplica el control de volumen para la muestra actual.

En el ejemplo descrito con referencia a la figura 10, se emplearon tres valores umbrales sintonizables y tres valores de ganancia predefinidos. Debería ser rápidamente aparente para los que sean expertos en la técnica que se podrían usar cualquier número razonable de valores umbrales sintonizables y valores de ganancia predefinidos. De manera alternativa, por ejemplo, se usan siete valores umbrales sintonizables y siete valores de ganancia predefinidos.

Cuando se activa el AVC, se le puede proporcionar al usuario puntos fijos que están definidos como los niveles de volumen preferidos del usuario con independencia de las condiciones ambientales del entorno. A continuación, en la tabla 1, se muestran configuraciones de ejemplo.

\vskip1.000000\baselineskip

TABLA 1

1

\newpage

En la tabla 1, el valor umbral de compresión C_{umbral} se fija a -9 dBm0, y los niveles de volumen para las configuraciones de alto, medio, y bajo se fijan a 6, 4, y 2, respectivamente. Se supone que las configuraciones del volumen están en pasos de 3 dB comenzando en 0 dB, es decir, la configuración 7 es 0 dB, la configuración 6 es -3 dB, la configuración 5 es -6 dB, etc. En cualquier configuración, cuando el usuario está en un entorno de un ambiente de alto ruido, el algoritmo AVC proporciona 12 dB adicionales de ganancia al nivel de la señal. De manera similar, en un entorno de ambiente de ruido medio, el algoritmo AVC proporciona 6 dB adicionales de ganancia al nivel de la señal. La columna que describe el entorno de ambiente silencioso es equivalente a un modo AVC DESACTIVADO (OFF). Debería entenderse que podría usarse cualquier número de puntos fijos que sea distinto de tres (alto, medio, y bajo).

La lógica AVC, tal como la lógica AVC descrita anteriormente con referencia a la figura 8, se usa junto con un codificador de voz de tasa variable, tal como el codificador CELP de tasa variable descrito en la Patente de los Estados Unidos número 5.414.796 transferida al cesionario de la presente invención.

Como se ha descrito con anterioridad, cuando la ganancia digital fija G se multiplica por las muestras de voz de entrada, la amplitud de las muestras sube. El umbral de compresión C_{umbral} sirve como un techo de suavizado sobre el nivel de las muestras. Sin embargo, para muestras que no sean de voz (silencio), la ganancia aumentada produce un ruido de fondo relativamente más alto al usuario. De esta forma, el usuario percibe una relación señal a ruido (SNR) más baja. Pero se puede usar el conocimiento del codificador de voz que está retenido, para determinar qué tramas de muestras se codificaron/descodificaron hasta la tasa octava (es decir, qué tramas eran tramas que no eran de voz). De acuerdo con esto, para compensar para el aumento relativo en el ruido de fondo durante los períodos de silencio, cada trama que fue codificada/descodificada hasta la tasa octava no se multiplica por la ganancia digital fija G.

De esta manera, se ha descrito un procedimiento y un aparato novedosos y mejorados para ajustar de manera automática las ganancias de micrófono y de altavoz dentro de un teléfono móvil. Los que sean expertos en la técnica comprenderán que los varios bloques lógicos ilustrativos y los pasos del algoritmo descritos junto con las realizaciones descritas en este documento se pueden llevar a cabo o realizar con un procesador digital de la señal (DSP), un circuito integrado específico de la aplicación (ASIC), lógica de puertas o de transistores discretos, componentes hardware discretos tales como, por ejemplo, registros y FIFO, un procesador que ejecute un conjunto de instrucciones firmware, o cualquier módulo o procesador software programable convencional. El procesador puede ser de manera ventajosa un microprocesador, pero en la alternativa, el procesador puede ser cualquier procesador convencional, controlador, microcontrolador, o máquina de estados. El módulo software podría residir en la memoria RAM, en memoria instantánea; en los registros, o en cualquier otra forma de medio de almacenamiento en el que se pueda escribir conocido en la técnica. Los que sean expertos en la técnica apreciarán de manera adicional que los datos, instrucciones, órdenes, información, señales, bits, símbolos, y circuitos integrados a los que se puede haber hecho referencia en toda la descripción anterior están de manera ventajosa representados por medio de tensiones, corrientes, ondas electromagnéticas, campos o partículas magnéticos, campos o partículas ópticos, o cualquier combinación de los mismos.

La descripción anterior de las realizaciones preferidas se proporciona para permitir a cualquier persona experta en la técnica hacer o usar la presente invención. Las distintas modificaciones a estas realizaciones serán rápidamente aparentes para los expertos en la técnica, y los principios genéricos definidos en este documento se pueden aplicar a otras realizaciones sin el uso de la facultad inventiva. De esta manera, no se pretende que la presente invención esté limitada a las realizaciones mostradas en este documento sino que esté de acuerdo con el alcance más amplio coherente con los principios y las características novedosas descritas en este documento.

Claims

1. Un dispositivo para procesar una señal de entrada proveniente de un micrófono (202) de un dispositivo de comunicaciones, comprendiendo: un medio (204) para aplicar una ganancia analógica a la señal de entrada para formar una señal ajustada de ganancia analógica; y

un medio (216) para convertir la señal ajustada de ganancia analógica en una señal digital; caracterizado por:

un medio (210) para aplicar una ganancia digital a la señal digital para formar una señal ajustada de ganancia digital; y

un medio limitador (214) para procesar la señal ajustada de ganancia digital para generar una señal de salida que tenga un valor que sea menor o igual a un valor umbral limitador, el medio limitador (214) estando configurado para realizar la detección de pico sobre la señal ajustada de ganancia digital.

2. El dispositivo de la reivindicación 1, en el que la ganancia digital y el valor umbral limitador se eligen para compensar la reducción en la ganancia analógica.

3. El dispositivo de la reivindicación 1, en el que el medio limitador (214) está dispuesto para atenuar o para ponderar la pendiente de la señal de salida de acuerdo con un valor de pendiente cuando el valor de la señal ajustada sobrepase el valor umbral limitador.

4. El dispositivo de la reivindicación 1, que comprende además un medio (206,208) para eliminar las componentes de eco de la señal digital.

5. El dispositivo de la reivindicación 1, comprendiendo además un medio (212) para suprimir el ruido en la señal ajustada.

6. El dispositivo de la reivindicación 1, en el que el medio limitador (214) está configurado para realizar la detección de pico de acuerdo con la siguiente ecuación:

X_{pico} \ [n] = (1 - RT) \ x_{pico} \ [n - 1] + AT \ x_{dif} \ [n].

en la que x_{pico} [n] es un valor de pico de una muestra digitalizada x[n], RT es un valor de tiempo de liberación, AT es un valor de tiempo de ataque, x_{pico} [n-1] es un valor de pico de una muestra digitalizada anterior x [n-1], y x_{dif} [n] es un valor de diferencia,

en el que el valor de diferencia x_{dif} [n] es igual a la diferencia entre el valor absoluto de la muestra digitalizada x [n] y el valor de pico x_{pico} [n-1] de la muestra digitalizada anterior x [n-1] si la diferencia entre el valor absoluto de la muestra digitalizada x [n] y el valor de pico x_{pico} [n-1] de la muestra digitalizada anterior x [n-1] es mayor que cero,
y

en el que el valor de diferencia x_{dif} [n] es igual a cero si la diferencia entre el valor absoluto de la muestra digitalizada x [n] y el valor de pico x_{pico} [n-1] de la muestra digitalizada anterior x [n-1] no es mayor que cero.

7. Un procedimiento para procesar una señal de entrada proveniente de un micrófono (202) de un dispositivo de comunicaciones, comprendiendo los pasos de:

aplicar una ganancia analógica a la señal de entrada para formar una señal ajustada de ganancia analógica; y

convertir la señal ajustada en ganancia de la señal analógica en una señal digital;

caracterizado por:

aplicar una ganancia digital a la señal digital para formar una señal ajustada en ganancia digital; y

procesar la señal ajustada de ganancia digital para generar una señal de salida que tenga un valor que sea menor o igual a un valor umbral limitador, comprendiendo el procedimiento un paso para realizar la detección de pico en la señal ajustada de ganancia digital.

8. El procedimiento de la reivindicación 7, en el que la ganancia digital y el valor umbral limitador se eligen para compensar la reducción en la ganancia analógica.

9. El procedimiento de la reivindicación 7, en el que el paso de procesado comprende además los sub-pasos de:

determinar si el valor del valor de la señal ajustada sobrepasa el valor umbral limitador; y

atenuar o ponderar la pendiente de la señal de salida de acuerdo con un valor de pendiente cuando se determina que el valor del valor de señal ajustada sobrepasa el valor umbral limitador.

10. El procedimiento de la reivindicación 7, que comprende además un paso de eliminación de las componentes de eco de la señal digital.

11. El procedimiento de la reivindicación 7, que comprende además un paso de supresión del ruido en la señal ajustada.

12. El procedimiento de la reivindicación 7, en el que el paso de procesado comprende el paso de realizar la detección de pico de acuerdo con la siguiente ecuación:

X_{pico} \ [n] = (1 - RT) \ x_{pico} \ [n - 1] + AT \ x_{dif} \ [n].