ES2286017T3 - Procedimiento y aparato para ajustar de manera automatica las ganancias del altavoz y del microfono en un telefono movil. - Google Patents
Procedimiento y aparato para ajustar de manera automatica las ganancias del altavoz y del microfono en un telefono movil. Download PDFInfo
- Publication number
- ES2286017T3 ES2286017T3 ES00921542T ES00921542T ES2286017T3 ES 2286017 T3 ES2286017 T3 ES 2286017T3 ES 00921542 T ES00921542 T ES 00921542T ES 00921542 T ES00921542 T ES 00921542T ES 2286017 T3 ES2286017 T3 ES 2286017T3
- Authority
- ES
- Spain
- Prior art keywords
- value
- signal
- gain
- peak
- digital
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers without distortion of the input signal
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/32—Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
- H04M1/6008—Substation equipment, e.g. for use by subscribers including speech amplifiers in the transmitter circuit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
- H04M1/6016—Substation equipment, e.g. for use by subscribers including speech amplifiers in the receiver circuit
Abstract
Un dispositivo para procesar una señal de entrada proveniente de un micrófono (202) de un dispositivo de comunicaciones, comprendiendo: un medio (204) para aplicar una ganancia analógica a la señal de entrada para formar una señal ajustada de ganancia analógica; y un medio (216) para convertir la señal ajustada de ganancia analógica en una señal digital; caracterizado por: un medio (210) para aplicar una ganancia digital a la señal digital para formar una señal ajustada de ganancia digital; y un medio limitador (214) para procesar la señal ajustada de ganancia digital para generar una señal de salida que tenga un valor que sea menor o igual a un valor umbral limitador, el medio limitador (214) estando configurado para realizar la detección de pico sobre la señal ajustada de ganancia digital.
Description
Procedimiento y aparato para ajustar de manera
automática las ganancias del altavoz y del micrófono en un teléfono
móvil.
La presente invención se refiere por lo general
a teléfonos móviles y en particular al micrófono de audio de un
teléfono móvil.
Los teléfonos celulares y otros teléfonos
móviles son normalmente empleados dentro de una amplia gama de
diferentes ambientes de ruido. Por ejemplo, un teléfono celular
puede emplearse dentro del ambiente de una oficina o dentro del
ambiente de casa relativamente silenciosos o dentro de un ambiente
de una fábrica o del ambiente con tráfico relativamente
ruidosos.
En un ambiente ruidoso, un usuario tiende a
hablar con un volumen más alto en el micrófono del teléfono celular
en comparación con los ambientes relativamente silenciosos. Esta es
una tendencia natural que surge de la suposición por parte del
usuario que él o ella deben hablar con un volumen alto para ser
oídas por encima del ruido. Aún así, esto no es a menudo necesario
y, de hecho, puede ser contraproducente. El micrófono del teléfono
celular puede ser altamente directivo y por lo tanto no detectará ni
amplificará todo el ruido que el usuario oye. De esta forma, es
innecesario que el usuario hable más alto. Además, el teléfono
celular puede ser capaz de procesar sólo un intervalo dinámico
limitado de niveles de sonido de forma que la voz del usuario se
vea recortada si el usuario habla demasiado alto en el micrófono.
Dicho recorte puede dar como resultado una disminución en la
relación señal a ruido (SNR) entre la voz transmitida y el nivel del
ruido de fondo transmitido. De esta forma, el hablar alto en el
micrófono puede hacer realmente más difícil para el oyente el
distinguir la voz del usuario.
El fenómeno de recorte anteriormente descrito se
ilustra en las figuras 1 y 2. De manera específica, la figura 1
ilustra una señal de voz 10 y una señal de ruido de fondo 12 que
entran a un teléfono celular. El nivel de ruido de fondo aumenta
comenzando en el instante de tiempo 14. En respuesta a esto, el
usuario habla más alto, dando como resultado un aumento en el nivel
de la señal de voz de entrada. A medida que el nivel de ruido
continúa subiendo, el usuario habla aún más alto hasta alcanzar un
punto 16 en el que comienza el recorte. Después de esto, la voz se
recorta, produciendo una SNR más baja así como una señal de voz
posiblemente desviada. La figura 2 ilustra los cambios resultantes
en la SNR. Como puede verse, la SNR disminuye después del instante
de tiempo 16.
De esta forma, en circunstancias en las que se
produce el recorte, un usuario que intente hablar más alto,
realmente puede reducir la inteligibilidad. Incluso cuando no ocurra
el recorte, el usuario al hablar más alto puede causar molestias al
oyente, dando como resultado quizá una necesidad para el oyente de
disminuir el volumen del altavoz de su teléfono. Para muchos
teléfonos, en particular para los teléfonos que no son teléfonos
móviles, el volumen del altavoz no se puede ajustar y de esta forma,
el oyente puede no ser capaz de conseguir un nivel de volumen
cómodo. Además, la privacidad puede verse expuesta en el extremo del
oyente si la voz del usuario es demasiado alta y el oyente no puede
disminuir el nivel de volumen del altavoz.
Otro problema que surge de los altos niveles de
ruido es que puede ser difícil para el usuario en el ambiente
ruidoso oír la voz de la otra parte. Para muchos teléfonos
celulares, el volumen o la ganancia del altavoz del teléfono se
pueden aumentar a mano para compensar, pero dicha acción manual por
parte del usuario es inconveniente. Además, la acción manual puede
ser peligrosa, en particular si el usuario está conduciendo en el
tráfico mientras intenta disminuir manualmente la ganancia del
altavoz.
De manera adicional, algunos usuarios hablan
relativamente de manera suave, mientras otros usuarios hablan
relativamente alto. Es inherentemente difícil el diseñar la ganancia
del micrófono para proporcionar una ganancia adecuada para las
personas que hablan suave sin saturar a las personas que hablan
alto.
De acuerdo con esto, existe una necesidad de
remediar los problemas anteriormente mencionados, y es para este
fin que la invención está principalmente dirigida.
El documento GB 2 179 810 trata un controlador
de rango dinámico que consiste en un multiplicador controlado por
una cadena lateral que comprende un detector de nivel, un circuito
logarítmico, un restador de umbral, un circuito no lineal, un
multiplicador de pendiente y un circuito antilogarítmico.
El documento de los Estados Unidos 4.829.565
trata un sistema para la regulación del volumen de audio que
supervisa el ruido de fondo en el área de escucha y ajusta de manera
automática el nivel de sonido del sistema de acuerdo con esto.
\newpage
El documento GB 2277840 trata un circuito para
su uso en los teléfonos móviles digitales para evitar el recorte de
una señal de voz. La amplificación de un amplificador ajustable se
atenúa con la ayuda de la realimentación de un procesador de señal
digital siempre que una muestra digital sobrepase un nivel de
recorte más de una vez.
En un aspecto de la invención, un dispositivo
para ajustar la ganancia en un micrófono de un dispositivo de
comunicaciones incluye de manera ventajosa un medio para aplicar una
ganancia digital a una señal de entrada proveniente del micrófono
para formar una señal ajustada y un medio limitador para procesar
las señales ajustadas para generar una señal de salida que tiene un
valor que es menor o igual a un valor umbral limitador, estando el
medio limitador configurado para realizar la detección del pico de
la señal ajustada.
En otro aspecto de la invención, un dispositivo
para ajustar la ganancia en un micrófono de un dispositivo de
comunicaciones incluye de manera ventajosa los pasos de aplicar una
ganancia digital a una señal de entrada proveniente del micrófono
para formar una señal ajustada y procesar la señal ajustada para
generar una señal de salida que tenga un valor que sea menor o
igual a un valor umbral limitador, el procesado comprendiendo un
paso para realizar la detección de pico en la señal ajustada.
De esta forma, la invención anterior, describe
problemas que ocurren cuando se usan teléfonos celulares u otros
teléfonos móviles en ambientes que tienen altos niveles de ruido de
fondo y que se ven solucionados. Una ventaja de la presente
invención es que se elimina la necesidad de un botón de control del
volumen en un teléfono. Otras ventajas de la invención, así como
otras características y objetos de la misma, serán aparentes a
partir de la descripción detallada que sigue y de los dibujos que la
acompañan.
Las características, objetos, y ventajas de la
presente invención serán más aparentes a partir de la descripción
detallada declara a continuación cuando se tome junto con los
dibujos en los que idénticos caracteres de referencia identifican
de manera correspondiente en todo el documento y en los que:
La figura 1 es un gráfico que ilustra los
niveles del ruido de fondo y los niveles de voz de entrada
correspondientes para un teléfono celular que funcione en un
entorno ruidoso cambiante;
La figura 2 es un gráfico que el nivel de señal
a ruido para las señales de entrada de voz y de ruido de la figura
1;
La figura 3 es un diagrama de bloques de un
teléfono celular configurado de acuerdo con una realización de la
invención;
La figura 4 es un diagrama de bloques de una
tabla de consulta de la ganancia del micrófono del teléfono celular
de la figura 3; y
La figura 5 es un diagrama de bloques de una
tabla de consulta de la ganancia del altavoz del teléfono celular
de la figura 3.
La figura 6 es un diagrama de bloques de la
circuitería de enlace inverso para un teléfono.
La figura 7 es un diagrama de bloques de un
limitador que puede usarse en la circuitería del enlace inverso de
la figura 6.
La figura 8 es un diagrama de bloques de la
circuitería del enlace directo para un teléfono.
La figura 9 es un diagrama de bloques de un
compresor que puede usarse en la circuitería del enlace directo de
la figura 8.
La figura 10 es un diagrama de flujo que ilustra
los pasos realizados por un algoritmo de control automático del
volumen (AVC).
Con referencia a las figuras restantes, se
describirán ahora realizaciones ejemplares de la invención. Las
realizaciones ejemplares se describirán principalmente con
referencia a diagramas de bloques que ilustran los elementos del
aparato. Dependiendo en la implementación, cada elemento del
aparato, o parte del mismo, puede configurarse en hardware,
software, firmware o combinaciones de los mismos. Debería apreciarse
que no todos los componentes necesarios para una implementación
completa de un sistema práctico se ilustran o se describen en
detalle. En lugar de esto, sólo se ilustran y se describen aquellos
componentes necesarios para una comprensión completa de la
invención.
La figura 3 ilustra un teléfono celular 100 que
tiene un micrófono 102, un altavoz 104 y una antena 106. Los
componentes internos pertinentes del teléfono ilustrados en la
figura 3 incluyen una unidad de control 108, un Procesador Digital
de Señal (DSP) 110, y una unidad de receptor/transmisor 112.
También, se incluye una unidad de control de la ganancia del
micrófono 113 y una unidad de control de la ganancia del altavoz
115.
Durante su uso, un usuario del teléfono celular
100 habla en el micrófono 102 y su voz y cualquier ruido de fondo
detectado es encaminado por la unidad de control 108 dentro del DSP
110 para su procesado en el interior del mismo. En el presente
ejemplo, las señales de voz procesadas se codifican, por medio de
las unidades mostradas de manera no separada, usando el protocolo
de transmisión celular de Acceso Múltiple por División de Código
(CDMA), como se describe en detalle en el documento de la Asociación
de la Industria de las Telecomunicaciones TIA/EIA/IS 95 - Una
Norma de Compatibilidad de Estación Móvil - Estación Base para el
Sistema Celular de Espectro Expandido de Banda Ancha de Modo
Dual. Las señales codificadas se encaminan al
receptor/transmisor 112, después se transmiten a través de la
antena 106 a una estación base local (que no se muestra). Las
señales se pueden reenviar desde allí a un teléfono remoto que
puede ser otro teléfono celular, otro teléfono móvil o a una línea
terrestre conectada a una red telefónica pública con conmutación
(RTPC) (que no se muestra). Las señales de voz transmitidas al
teléfono celular 100 son recibidas a través de la antena 106 y el
receptor/transmisor 112, procesadas por el DSP 110 y sacadas a
través del altavoz, todos bajo el control de la unidad de control
108.
El DSP' 110 puede, dependiendo de la
implementación, puede realizar cualquier variedad de funciones de
procesado digital convencionales sobre las señales de voz. De
manera adicional, el DSP 110 determina el nivel de ruido de fondo
del entorno local a partir de las señales detectadas por el
micrófono 102 y fija la ganancia del micrófono 102 a un nivel
seleccionado para compensar la tendencia natural del usuario del
teléfono celular 100 a hablar más alto en ambientes ruidosos. En el
presente ejemplo, la ganancia del micrófono se fija a un nivel que
es generalmente inversamente proporcional al nivel del ruido de
fondo. En el ejemplo presente, la ganancia del micrófono se
disminuye en la mitad del aumento en el ruido de fondo medido en
decibelios.
Para este fin, el DSP 110 incluye una unidad de
detección del nivel de ruido de fondo 114, una tabla de consulta de
la ganancia del micrófono 116 y una tabla de consulta de la ganancia
del altavoz 118. El detector de nivel de ruido de fondo 114
determina, de acuerdo con técnicas convencionales, el nivel del
ruido de fondo a partir de las señales recibidas desde el micrófono
102, produciendo un valor digital que es representativo del nivel
del ruido de fondo. El valor digital puede por ejemplo, representar
la energía del ruido de fondo en decibelios. El DSP 110 aplica el
valor digital a la tabla de consulta de la ganancia del micrófono
116 para leer un valor de ganancia de micrófono para aplicarlo al
micrófono 102 a través de la unidad de control de la ganancia del
micrófono 113.
En el presente ejemplo, el nivel de ruido de
fondo B' se determina en la estructura actual en base al nivel de
ruido de fondo de la estructura anterior B y a la energía de la
estructura actual E_{f}. En la determinación del nuevo nivel de
ruido de fondo B' para su uso durante la siguiente estructura (como
la estimación B del ruido de fondo de la estructura anterior), se
calculan dos valores. El primer valor V_{1} simplemente es la
energía de la estructura actual E_{f}. El segundo valor V_{2} es
el valor más grande de B+1 y K\cdotB, dónde K= 1,00547. El menor
de los dos valores, V_{1} o V_{2} es elegido como el nuevo nivel
de ruido de fondo B'. En forma matemática,
(1)V_{1} =
R(0)
(2)V_{2} =
\text{mín} \ (160000, \ máx \ (K \cdot B, \
B+1))
y el nuevo nivel de ruido de fondo
B'
es:
(3)B' =
\text{mín} \ (V_{1}, \
V_{2})
donde mín (x, y) es el mínimo de x
e y, y máx (x, y) es el máximo de x e
y.
La figura 4 ilustra una tabla de consulta de la
ganancia del micrófono ejemplar 116 que tiene entradas 120 para
varios niveles de ruido de fondo y entradas 122 para los
correspondientes valores de ganancia de micrófono. Los valores de
ganancia del micrófono, por ejemplo, pueden ser representaciones
digitales de niveles de tensión o de corriente para su aplicación a
un amplificador de micrófono 102 (que no se muestra). Las entradas
120 pueden especificar niveles de ruido individuales o intervalos
de niveles del ruido. Cada nivel de ruido de entrada cuantificado
esperado está representado dentro de la tabla de consulta 116. Si se
detecta que un nivel de ruido no tiene una entrada correspondiente
en la tabla 116, se emplea un valor por defecto. De acuerdo con
técnicas convencionales, la tabla de consulta 116 se puede
implementar como una parte de memoria de sólo lectura (ROM). En
otras implementaciones, la tabla de consulta 116 puede implementarse
usando otras técnicas apropiadas, tales como algoritmos
software.
Como se ha hecho notar, el valor del nivel de
ruido de fondo leído de la tabla de consulta de la ganancia del
micrófono 116 se aplica al micrófono 102 para ajustar su ganancia.
Mediante el almacenamiento de los valores en la tabla de consulta
116 que proporcionen una ganancia del micrófono que sea disminuida
con los niveles del ruido crecientes, la tendencia natural de un
usuario del teléfono a hablar más alto en un ambiente ruidoso se
compensa de manera automática. También, mediante la disminución de
la ganancia del micrófono, se evita una pérdida en la SNR provocada
por el recorte de la señal, en el propio micrófono 102 o en el DSP
110.
Se pueden calcular los niveles del ruido de
fondo y se pueden leer y aplicar los correspondientes niveles de
ganancia al micrófono 102 ya sea de manera continua o de manera
periódica. En el presente ejemplo, la ganancia del micrófono se
reajusta cada dos o tres segundos, acomodándose por lo tanto al
retardo típico entre un aumento en el nivel del ruido de fondo y un
aumento correspondiente en el volumen de la voz del usuario. En otro
ejemplo, se detecta el nivel del ruido y la ganancia se fija sólo
una vez por llamada o quizás sólo al encender el teléfono
celular.
En el ejemplo presente, la ganancia del altavoz
104 se ajusta de manera automática de una manera similar a la
ganancia del micrófono. El valor del nivel de ruido de fondo
calculado por medio de la unidad de detección del nivel de ruido de
fondo 114 se aplica a la tabla de consulta de la ganancia del
altavoz 118 para leer un valor de ganancia de altavoz apropiado
para el nivel del ruido de fondo. En la figura 5 se ilustra una
tabla de consulta de la ganancia del altavoz de ejemplo 118. La
tabla de consulta de la ganancia del altavoz 118 tiene entradas 130
para los niveles del ruido de fondo y entradas 132 para los
correspondientes valores de ganancia del altavoz. Los valores de
ganancia del altavoz pueden representar niveles de tensión o de
corriente para controlar la ganancia de un amplificador (no
mostrado de manera independiente) del altavoz. Se puede emplear un
valor por defecto para cualquier nivel del ruido que no tenga una
entrada en la tabla de consulta de la ganancia del altavoz 118.
También, como con la tabla de consulta de la ganancia del micrófono
116, se puede acceder a la tabla de consulta de la ganancia del
altavoz 118 de manera continua o de manera periódica, o quizás sólo
una vez por llamada o sólo al encender.
Sin embargo, a diferencia de la tabla de
consulta de la ganancia del micrófono 116 que está programada de
manera ventajosa con valores seleccionados para disminuir la
ganancia con los niveles de ruido crecientes, la tabla de consulta
de la ganancia del altavoz 118 está programada de manera ventajosa
con los valores seleccionados para aumentar la ganancia con los
niveles de ruido crecientes. Los valores de ganancia del altavoz,
por ejemplo, se pueden fijar para aumentar la ganancia en una
cantidad sustancialmente proporcional a un incremento en los
niveles del ruido de fondo. Como tal, el usuario no necesita ajustar
la ganancia del altavoz por medio de una unidad de control manual
(que no se muestra). En lugar de esto, se realiza el ajuste
automático.
Lo que se han descrito son ejemplos de un
teléfono celular configurado para disminuir de manera automática la
ganancia del micrófono y para aumentar la ganancia del altavoz de
manera automática en respuesta a un incremento en los niveles del
ruido de fondo del entorno del teléfono celular. En los ejemplos, la
disminución en la ganancia del micrófono y el aumento en la
ganancia del altavoz son ambos proporcionales a un aumento en los
niveles del ruido de fondo. En otros ejemplos, se prevén otras
relaciones entre las ganancias del micrófono y del altavoz y los
niveles del ruido de fondo. En general, se puede emplear cualquier
relación deseada solamente preprogramando las tablas de consulta
con los valores apropiados. Los valores, por ejemplo, calcularse de
manera inicial en base a una relación matemática tal como la simple
proporcionalidad. En otros casos, se pueden determinar valores
apropiados de manera empírica midiendo hasta que grado un usuario
del teléfono real aumenta su volumen de habla en respuesta a los
cambios en los niveles del ruido de fondo. Como se puede apreciar,
se puede emplear una amplia gama de posibles técnicas para
determinar los valores apropiados para almacenar en las tablas de
consulta coherentes con los principios generales de la invención.
Además, las tablas de consulta no son necesarias. Se puede emplear
cualquier medio adecuado para ajustar la ganancia del micrófono y
del altavoz. Por ejemplo, el nivel digital del ruido detectado
puede convertirse en una tensión analógica, procesado por medio de
la circuitería para su dimensionamiento y su inversión en caso
necesario, y aplicado después directamente a los amplificadores
respectivos del micrófono y del altavoz para ajustar la
ganancia.
De acuerdo con una realización, se puede añadir
un limitador a la circuitería del enlace inverso convencional para
un teléfono. Como se muestra en la figura 6, la circuitería del
enlace inverso 200 para un teléfono (que no se muestra) incluye un
micrófono 202, la lógica de ganancia analógica 204 (típicamente un
amplificador operacional convencional), un sumador/restador 206, un
filtro cancelador de eco 208, una lógica de ganancia estática 210,
un supresor de ruido 212, un limitador 214, y un conversor analógico
a digital (A/D) 216.
Un usuario habla en el micrófono 202, que
traduce la señal de habla sonora en una señal de voz eléctrica. La
señal de habla se entrega a la lógica de ganancia analógica 204 que
aplica una ganancia analógica a la señal de voz. La señal de voz se
entrega entonces al A/D 216 que muestrea y cuantifica la señal de
voz analógica, convirtiendo la señal en un formato digital de
acuerdo con cualquiera de un número de técnicas conocidas,
incluyendo, por ejemplo, la modulación de impulsos codificados
(MIC), la ley \mu, o la ley A. Una señal generada por el filtro
cancelador de eco 208 se resta de la señal de voz digitalizada por
medio del sumador/restador 206, eliminando por tanto los componentes
de eco de la señal de voz. El sumador/restador 206, el A/D 216, y
el filtro cancelador de eco 208 son componentes ventajosamente
convencionales que son bien conocidos en la técnica pertinente.
La señal de voz filtrada se entrega a la lógica
de ganancia estática 210 que aplica una ganancia de entrada digital
estática para sintonizar de manera precisa la amplificación de la
señal de voz. Los dispositivos para implementar la lógica de la
ganancia estática 210 son bien conocidos en la técnica. La ganancia
estática se elige de manera ventajosa junto con un umbral limitador
para compensar la reducción en la ganancia analógica. El limitador
214 que está configurado de manera ventajosa para funcionar sobre
cada palabra hablada, sirve para evitar el recorte de las señales
de voz que estén maximizadas, tal como, por ejemplo, las palabras
habladas por usuarios que hablan en alto.
La señal de voz amplificada se entrega al
supresor de ruidos 212 que suprime los componentes del ruido de
fondo de la señal de voz que fueron recibidos en el micrófono 202
cuando habló el usuario. Los dispositivos para implementar el
supresor de ruido 212 son bien conocidos en la técnica. En una
realización, el supresor de ruido 212 no se usa. En otra
realización, el A/D 216, el filtro cancelador de eco 208, el
sumador/restador 206, la lógica de ganancia estática 210, el
supresor de ruido 212, y el limitador 214 son todos implementados
en un procesador digital de la señal (DSP). En la realización
ilustrada en la figura 6, la señal se entrega al limitador 214 por
el supresor de ruido 212. El limitador 214 sirve para evitar el
recorte en la señal de voz si la señal de voz se maximiza, como se
describe con posterioridad. El limitador 214 genera una señal de
salida que se entrega a un codificador (que no se muestra) antes de
ser modulada y transmitida sobre un canal de comunicaciones
digital.
En la figura 7 se ilustra un limitador 214 que
está configurado de acuerdo con una realización. El limitador 214
incluye la lógica de la medida de pico 300, la lógica logarítmica en
base dos 302, un sumador/restador 304, lógica del limitador 306, un
primer multiplicador 308, lógica logarítmica inversa en base dos
310, lógica de suavizado 312, un elemento de retardo 314, y un
segundo multiplicador 316.
Las muestras de voz digitalizadas x[n]
son multiplicadas por una ganancia de entrada estática G por medio
de la lógica de ganancia estática 210 que es de manera ventajosa un
multiplicador convencional 210. La ganancia digital G sirve para
sintonizar de manera precisa, o para ajustar, los niveles de
amplificación de las muestras de voz x[n]. Las muestras de
voz x[n] son entregadas después al limitador 214 que se
implementa de manera ventajosa en un DSP. En el limitador 214, las
muestras de voz de entrada x[n] se entregan a la lógica de
medida de pico 300 y al elemento de retardo 314.
La lógica de la medida de pico 300 implementa la
siguiente ecuación para medir el pico de las muestras de voz
x[n]:
X_{pico} \ [n]
= (1 - RT) \ x_{pico} \ [n - 1] + AT \ x_{dif} \
[n].
En la ecuación anterior, el valor de pico de la
muestra de voz x[n] se fija igual a la cantidad de uno menos
el tiempo de liberación RT multiplicado por el valor de pico de la
muestra anterior x [n-1], sumado al producto del
tiempo de ataque y un valor de diferencia x_{dif} [n]. El valor de
diferencia x_{dif} [n] se fija igual a la diferencia entre el
valor absoluto de la muestra de voz actual y el valor de pico de la
muestra de voz anterior, si y sólo si esta diferencia es mayor que
cero. En caso contrario, el valor diferencia x_{dif}[n] se
fija igual a cero.
El valor de pico calculado x_{pico} [n] se
entrega a la lógica logarítmica en base dos 302 que calcula el
logaritmo en base dos del valor de pico de x_{pico} [n], generando
una señal de salida en unidades de decibelios (dB). La señal en dB
se entrega al sumador/restador 304 que resta un valor umbral
limitador L_{umbral} de la señal en dB. Se entrega una señal en
dB resultante a la lógica del limitador 306 que realiza una función
de limitación en la señal. La señal se entrega después al primer
multiplicador 308 que multiplica la señal por un valor de pendiente
de atenuación (negativo) L_{pendiente}. El sumador/restador 304,
la lógica del limitador 306 y el primer multiplicador 308 sirven
para generar un valor en dB de salida que es igual al valor en dB
de entrada, con tal de que el valor en dB de la entrada (y el valor
en dB de la salida) sean menores o iguales al valor umbral
limitador L_{umbral}. Cuando el valor en dB de entrada sobrepase
el valor umbral limitador L_{umbral}, la pendiente de la señal de
salida se atenúa, o se dimensiona, de acuerdo con el valor de la
pendiente -L_{pendiente}, tal que, por ejemplo, el valor en dB de
salida aumenta en un dB si el valor en dB de la entrada sube en
veinte dB. El valor umbral limitador L_{umbral} puede ser elegido
de manera ventajosa para que esté muy próximo al punto de
saturación original del amplificador de lógica de la ganancia
estática 210 antes de la sintonía precisa digital para la reducción
de la saturación. El punto de saturación original se define por
medio de la ganancia de transmisión deseada del sistema de micrófono
como se implementa en el dominio analógico.
El primer multiplicador 308 entrega la señal de
salida en dB a la lógica logarítmica inversa en base dos 310 que
calcula el logaritmo inverso en base 2 de la señal en dB subiendo el
valor dos a la potencia del exponente del valor de la señal en dB
(G, en dB). La lógica logarítmica inversa en base dos 310 genera una
señal de salida f [n]. La señal f[n] es entregada a la
lógica de suavizado 312 que genera una señal de salida suavizada g
[n] de acuerdo con la siguiente ecuación:
g [n] = (1 -
k) \ g \ [n - 1] + k \ f \
[n],
donde el valor k es un coeficiente
de suavizado que está elegido de manera ventajosa para la calidad
óptima de
audio.
La señal suavizada g [n] se entrega al segundo
multiplicador 316. El elemento de retardo 314 que las muestras de
voz de entrada x [n], está configurado para retrasar cada muestra
de voz x [n] un tiempo D, generando muestras de voz de salida
retrasadas x [n-D]. Las muestras de voz retrasadas x
[n-D] se entregan al segundo multiplicador 316. El
segundo multiplicador 316 multiplica las muestras de voz retrasadas
x [n-D] por la función de suavizado g [n],
generando una señal de salida limitada para su entrega a un
codificador (que no se muestra) antes de que sean moduladas y
transmitidas sobre un canal de comunicaciones digital.
El limitador 214 limita de esta forma los
límites de señal a un valor de aproximadamente L_{umbral} de
magnitud. Para proporcionar la ganancia adecuada para personas que
hablan de manera suave sin saturar a las personas hablantes con voz
alta, la ganancia analógica de la etapa de entrada se reduce en una
cantidad en dB fija y se compensa con la ganancia digital G donde
se encuentre disponible altura libre adicional. El limitador 214
reduce entonces los niveles altos al intervalo completo del A/D 216
(figura 6) en el otro lado del canal de comunicaciones digital,
mientras que se da a las personas que hablan de manera suave
adecuados niveles de ruido de señal a cuantificación. Los varios
cálculos matemáticos se pueden realizar de acuerdo con técnicas DSP
conocidas. De esta forma, el limitador 214 proporciona de manera
ventajosa la capacidad de ensanchar el margen dinámico de entrada
percibido a la vez que evita la saturación para las señales altas.
Otras variaciones en los niveles de la señal de entrada que se
pueden compensar para estar de acuerdo con la realización
anteriormente descrita incluyen, por ejemplo, el equipo de coche
manos libres frente al teléfono y el micrófono de solapa frente al
micrófono de boca.
Debería entenderse los que sean expertos en la
técnica que las realizaciones anteriormente descritas dirigidas a
la circuitería de enlace inverso pueden residir en cualquier
dispositivo de comunicaciones por el que hable un usuario. De
manera similar, los que sean expertos apreciarán que las
realizaciones descritas a continuación dirigidas a la circuitería
de enlace directo pueden residir en cualquier dispositivo de
comunicaciones que emita sonidos.
De acuerdo con una realización, la circuitería
convencional de enlace directo 400 para un teléfono se puede
modificar para ajustar el volumen del altavoz de un teléfono en base
a la altura libre disponible y a la estimación de ruido de fondo.
Como se muestra en la figura 8, circuitería de enlace directo para
un teléfono (que no se muestra) incluye filtros de salida 402,
lógica de ganancia fija 404, un compresor 406, la lógica del control
automático del volumen (AVC) 408, la lógica de configuración del
volumen de usuario 410, un conversor digital a analógico (D/A) 412,
y un altavoz 414.
Para propósitos de ilustración, también se
describen los componentes acompañantes de la circuitería de enlace
inverso de la figura 6 para el teléfono, incluyendo el micrófono
202, la lógica de ganancia analógica 204, el A/D 216, el filtro
cancelador de eco 208, el sumador/restador 206, y el supresor de
ruido 212. Los varios elementos del enlace inverso pueden funcionar
y se pueden implementar como se ha descrito anteriormente con
referencia a la figura 6. En una realización, la circuitería del
enlace directo digital y la circuitería del enlace inverso digital
están implementadas en un DSP.
En la figura 8, las muestras de voz
digitalizadas x [n] son recibidas sobre un canal de comunicación
desde otro teléfono y son descodificadas por medio de un
descodificador (que no se muestra). Las muestras de voz x [n] son
sacadas desde el descodificador y son entregadas a los filtros de
salida 402 para su filtrado apropiado como entenderán los que sean
expertos en la técnica. Los filtros de salida 402 entregan las
muestras de voz filtradas a la lógica de ganancia fija 404, que
multiplica las muestras de voz por una ganancia fija G, generando
muestras de voz amplificadas. Las muestras de voz amplificadas son
entregadas al compresor 406, que o comprime o expande las muestras
de voz como se describe a continuación con referencia a la figura
9.
Las muestras de voz comprimidas son entregadas a
la lógica AVC 408. La lógica AVC 408 también está acoplada a la
salida del sumador/restador 206. La lógica AVC 408 recibe una señal
de estimación del ruido de fondo actualizada de manera periódica
(BNE) proveniente del sumador/restador 206. La lógica AVC 408
proporciona AVC en base a la altura libre disponible (según se
obtuvo del compresor 406) y el BNE (según se obtuvo de la
circuitería de enlace inverso antes de la supresión de ruido). A
continuación se describe con referencia a la figura 10, un
algoritmo AVC ejemplar que puede ser realizado por la lógica AVC
408.
Si la lógica AVC 408 está en el modo Desactivado
(OFF), el control del volumen es especificado por el usuario a
través de un botón de control de volumen (que no se muestra) en el
teléfono y la lógica de configuración de volumen del usuario 410.
Si la lógica AVC 408 está en modo Activado (ON), la lógica AVC 408
proporciona de manera automática el control de volumen en respuesta
a los niveles de ruido de fondo cambiantes y a la altura libre
disponible. El usuario puede activar o desactivar el modo AVC. Por
ejemplo, el usuario puede configurar el nivel de volumen del
altavoz de manera manual una primera vez, y después activar la
lógica AVC 408 para proporcionar el control de volumen del altavoz
después de esto.
La lógica AVC 408 genera una señal de control
del volumen que se aplica a la lógica de configuración del volumen
de usuario 410. La lógica de configuración del volumen del usuario
410 proporciona las muestras de voz digitalizadas de salida al
nivel de volumen apropiado, al D/A 412. El D/A 412 convierte las
muestras de voz digitalizadas de salida a una señal analógica y
proporciona la señal analógica al altavoz 414, que traduce la señal
en una señal de salida de altavoz audible por el usuario.
Se puede implementar un compresor 406 para
proporcionar la compresión y la expansión, como se muestra en la
figura 9. Como se ilustra en la figura 9, la circuitería de enlace
directo de un teléfono (que no se muestra) incluye la lógica de
ganancia fija 404 que es de manera ventajosa un multiplicador
convencional 404 y un compresor 406 que se puede usar como un
compresor o como un expansor, según se desee.
El compresor 406 incluye un elemento de retardo
500, un filtro 502, un calculador del valor cuadrático medio (RMS)
504, lógica de cálculo logarítmico 506, un sumador/restador 508,
lógica de compresor 510, un primer multiplicador 512, la lógica de
cálculo logarítmico inverso 514, lógica de aplicación de tiempo de
ataque/liberación 516, y un segundo multiplicador 518. El filtro 502
puede no usarse.
Las muestras de voz digitalizadas x [n] se
entregan al multiplicador 404 que multiplica las muestras de voz x
[n] por una ganancia digital G. La ganancia digital G se elige de
manera ventajosa, junto con un umbral de compresión definido a
continuación, para asegurar que se trae a la persona que habla de
manera más suave al nivel de señal deseado, controlando el
compresor 406 durante los picos. Las muestras de voz x [n] se
entregan entonces al compresor 406 que se implementa de manera
ventajosa en un DSP. En el compresor 406, las muestras de voz de
entrada x [n] se entregan al filtro 502 y al elemento de retardo
500. El elemento de retardo 500 que puede por ejemplo, ser
implementado con una muestra de salida FIFO, sirve para controlar de
manera predictiva el nivel de la señal de salida, por tanto
atacando los picos en la parte delantera de la transmisión. El
filtro 502 puede estar configurado para filtrar las muestras de voz
de acuerdo con cualquiera de varias técnicas de filtrado conocidas.
Por ejemplo, el filtro 502 puede estar configurado como un filtro
paso banda con el fin de elegir de manera selectiva qué frecuencias
sobre las que hacer decisiones de compresión. En un ejemplo en el
que reside la circuitería de enlace directo 400 en un equipo de
coche manos libres, el filtro 502 sirve para reforzar las
frecuencias con distorsión pesada que entran en el compresor 406.
Cualquier frecuencia de la señal que tenga niveles de distorsión
que sobrepasen un umbral predefinido es reforzada por el filtro 502.
Las muestras de voz filtradas se entregan al calculador de RMS
504.
El calculador de RMS 504 implementa la siguiente
ecuación para calcular el RMS de las muestras de voz:
X_{rms} \ [n]
= (1 - TAV) \ x_{rms} \ [n - 1] + TAV \ x^{2} \
[n].
En la ecuación anterior, el valor RMS de la
muestra de voz x[n] se fija igual a la cantidad de uno menos
un coeficiente promediado en el tiempo TAV multiplicado por el
valor RMS de la muestra anterior x [n-1], sumado al
producto del coeficiente promediado en el tiempo TAV y el cuadrado
de la muestra de voz actual x [n]. El coeficiente promediado en el
tiempo TAV sirve para determinar la tasa de promediado RMS. El nivel
RMS de las muestras de voz se calcula de manera ventajosa usando un
filtro paso bajo de primer orden aplicado a la señal en el dominio
de la energía. La constante de tiempo para este filtro de suavizado
se elige de manera ventajosa para que la componente de frecuencia
más pequeña de interés pueda conseguir una salida RMS constante para
el filtro de suavizado dado. A modo de ejemplo, para una sinusoide
de 100 Hz, la constante de tiempo debería ser aproximadamente 10
ms.
El valor RMS calculado x_{rms}[n] se
entrega a la lógica de cálculo logarítmico 506 que calcula el
logaritmo en base 2 del valor RMS x_{rms}[n] y multiplica
el valor logarítmico en base 2 calculado por 0,5, generando una
señal de salida en unidades de decibelios (dB). La señal en dB se
entrega al sumador/restador 508 que resta un valor umbral de
compresión C_{umbral} de la señal en dB. Se proporciona una señal
en dB resultante a la lógica del compresor 510 que realiza una
función de compresión en la señal. La señal se entrega entonces al
primer multiplicador 512 que multiplica la señal por un valor de
pendiente de compresión de atenuación (negativa) -C_{pendiente}.
Si el nivel RMS de la señal sube por encima del valor C_{umbral},
se aplica compresión a la señal (con los tiempos apropiados de
ataque y de liberación) en base al valor C_{pendiente} que
especifica una relación del compresor R como una relación de dB de
acuerdo con la siguiente ecuación: C_{pendiente} = 1 - 1/R. La
relación de compresión R se puede definir como el nivel RMS por
encima del cual ocurre realmente toda la compresión. El valor
umbral de compresión C_{umbral} y el valor de la pendiente de
compresión C_{pendiente} para un trayecto particular de la señal
deben elegirse de acuerdo con el nivel promedio del hablante dBm0
deseado para la normalización.
El primer multiplicador 512 entrega la señal en
dB de salida a la lógica de cálculo logarítmico inverso 514, que
calcula el logaritmo inverso en base 2 de la señal en dB subiendo el
valor dos a la potencia del exponente del valor de la señal en dB
(G, en dB). La lógica de cálculo logarítmico inverso 514 genera una
señal de salida f [n]. La señal f [n] se entrega a la lógica de
aplicación del tiempo de ataque/liberación 516 que genera una señal
de salida g[n] de acuerdo con la siguiente ecuación:
g \ [n] = (1 -
k) \ g \ [n - 1] + k \ f \
[n]
donde el valor de k es un
coeficiente de suavizado que es elegido de manera ventajosa para la
calidad de audio óptima. La lógica de aplicación del tiempo de
ataque/liberación 516 da servicio de manera ventajosa a una función
de suavizado. El ataque y la liberación son aplicados usando una
función de suavizado de primer orden para proporcionar una curva de
ganancia de suavizado para su aplicación a la señal de salida (el
valor de k es cambiado de manera ventajosa dependiendo de si se
está aplicando el ataque o la liberación. El tiempo de ataque se
puede fijar de manera ventajosa en un milisegundo (ms) para atacar
los picos de las muestras de entrada de manera rápida y precisa. El
tiempo de liberación se puede fijar de manera ventajosa entre 100 y
200 ms para impedir que las fluctuaciones rápidas de ganancia puedan
afectar a la calidad del compresor 406. Se puede usar un retardo
predictivo de 1 ms para relajar el tiempo de ataque. Se pueden
implementar el ataque y la liberación con una histéresis para
evitar que las oscilaciones en la señal de entrada puedan afectar a
la curva de ganancia de
salida.
La señal suavizada g[n] se entrega al
segundo multiplicador 518. El elemento de retardo 500 que recibe las
muestras de voz de entrada x[n], está configurado para
retardar cada muestra de voz x[n] en un tiempo D, generando
muestras de voz de salida retardadas x [n-D]. Las
muestras de voz retrasadas x [n-D] se entregan al
segundo multiplicador 518. El segundo multiplicador 518 multiplica
las muestras de voz retrasadas x [n-D] por la
función de suavizado g[n], generando una señal de salida
comprimida para su entrega a la lógica AVC 408 (figura 8).
La lógica del compresor 510 también puede usarse
como lógica del expansor por medio de la configuración del
sumador/restador 508 para restar la señal en dB de un valor de
umbral de expansión E_{umbral}, y configurando el primer
multiplicador 512 para multiplicar la señal por un valor positivo de
pendiente de expansión E_{pendiente}. El sumador/restador 508 y
el primer multiplicador 512 pueden ser reconfigurados de manera
ventajosa por medio de programación de forma que la lógica del
compresor 510 puede dar servicio tanto a las funciones de
compresión como a las funciones de expansión. Si el nivel RMS de la
señal cae por debajo del valor E_{umbral}, se aplica la expansión
a la señal en base al valor E_{pendiente} que especifica una
relación de expansor como una relación de dB.
Un algoritmo de AVC puede realizar los pasos
mostrados en el diagrama de flujo de la figura 10 con el fin de
hacer un seguimiento de las condiciones ambientales del enlace
inverso y ajustar de manera automática el volumen para dar al
usuario un nivel de volumen apropiado. De manera ventajosa, el
usuario puede fijar un punto fijo de nivel de volumen deseado y
después, si se desea, se puede uno olvidar del control de volumen
que por lo tanto es manejado de manera automática. El algoritmo AVC
de la figura 10 funciona junto con el compresor 406 (véase la
figura 9) que limita los niveles de señal a un pequeño intervalo por
encima del valor umbral de compresión programable C_{umbral}. La
altura libre sin distorsión disponible depende del valor umbral de
compresión C_{umbral}.
De acuerdo con el diagrama de flujo de la figura
10, el algoritmo AVC obtiene una estimación del ruido de fondo
(BNE) (un valor en dB) en el paso 600. El algoritmo AVC procede
después con el paso 602. En el paso 602, el algoritmo AVC compara
el BNE con un primer valor umbral sintonizable T3 (en dB). Si el BNE
es mayor que el primer valor umbral sintonizable T3, el algoritmo
AVC procede con el paso 604. Si, por otra parte, el BNE no es mayor
que el primer valor umbral sintonizable T3, el algoritmo AVC procede
con el paso 606.
En el paso 604 un valor objetivo del volumen
para la muestra actual, objetivo [n], se fija igual a un primer
valor de ganancia predefinido G3. El algoritmo AVC procede entonces
con el paso 608. El primer valor de ganancia predefinido G3 puede
fijarse a 18 dB para proporcionar un volumen adecuado para un
ambiente con ruido alto.
En el paso 606 el algoritmo AVC resta un valor
de histéresis H (en dB) del primer valor umbral sintonizable T3, y
compara la diferencia resultante con el BNE. Si el BNE es mayor que
la diferencia entre el primer valor umbral sintonizable T3 y el
valor de la histéresis H, el algoritmo AVC procede con el paso 610.
Si, por otra parte, el BNE no es mayor que la diferencia entre el
primer valor umbral sintonizable T3 y el valor de la histéresis H,
el algoritmo AVC procede con el paso 612. El valor de histéresis H
sirve para evitar que la ganancia fluctúe con cambios instantáneos
en el BNE.
En el paso 610 el algoritmo AVC compara un valor
de volumen objetivo para la muestra anterior, objetivo
[n-1], con el primer valor de ganancia predefinido
G3. Si el valor objetivo del volumen para la muestra anterior,
objetivo [n-1], es igual al primer valor de ganancia
predefinido G3, el algoritmo AVC procede con el paso 604. Si, por
otra parte, el valor objetivo del volumen para la muestra anterior,
objetivo [n-1], no es igual al primer valor de
ganancia predefinido G3, el algoritmo AVC procede con el paso
614.
En el paso 612 el algoritmo AVC compara el BNE
con un segundo valor umbral sintonizable T2 (en dB). Si el BNE es
mayor que el segundo valor umbral sintonizable T2, el algoritmo AVC
procede con el paso 614. Si, por otra parte, el BNE no es mayor que
el segundo valor umbral sintonizable T2, el algoritmo AVC procede
con el paso 616.
En el paso 614 el valor objetivo del volumen
para la muestra actual, objetivo [n], es fijado igual a un segundo
valor de ganancia predefinido G2. El algoritmo AVC procede entonces
con el paso 608. El segundo valor de ganancia predefinido G2 puede
fijarse a 12 dB para proporcionar un volumen adecuado un ambiente
con un ruido medio.
En el paso 616 el algoritmo AVC resta el valor
de histéresis H del segundo valor umbral sintonizable T2, y compara
la diferencia resultante con el BNE. Si el BNE es mayor que la
diferencia entre el segundo valor umbral sintonizable T2 y el valor
de histéresis H, el algoritmo AVC procede con el paso 618. Si, por
otra parte, el BNE no es mayor que la diferencia entre el segundo
valor umbral sintonizable T2 y el valor de histéresis H, el
algoritmo AVC procede con el paso 620.
En el paso 618, el algoritmo AVC compara el
valor objetivo de volumen para la muestra anterior, objetivo
[n-1], con el segundo valor de ganancia predefinido
G2. Si el valor objetivo de volumen para la muestra anterior,
objetivo [n1], es igual al segundo valor de ganancia predefinido G2,
el algoritmo AVC procede con el paso 614. Si, por otra parte, el
valor objetivo de volumen para la muestra anterior, objetivo
[n-1], no es igual al segundo valor de ganancia
predefinido G2, el algoritmo AVC procede con el paso 622.
En el paso 620, el algoritmo AVC compara el BNE
con un tercer valor umbral sintonizable T1 (en dB). Si el BNE es
mayor que el tercer valor umbral sintonizable T1, el algoritmo AVC
procede con el paso 622. Si, por otra parte, el BNE no es mayor que
el tercer valor umbral sintonizable T1, el algoritmo AVC procede con
el paso 624.
En el paso 622 el valor objetivo del volumen
para la muestra actual, objetivo [n], es fijado igual a un tercer
valor de ganancia predefinido G1. El algoritmo AVC procede entonces
con el paso 608. El tercer valor de ganancia predefinido G1 se
puede fijar a 6 dB para proporcionar un volumen adecuado para un
entorno de ruido bajo.
En el paso 624, el algoritmo AVC resta el valor
de histéresis H del tercer valor umbral sintonizable T1, y compara
la diferencia resultante con el BNE. Si el BNE es mayor que la
diferencia entre el tercer valor umbral sintonizable T1 y el valor
de histéresis H, el algoritmo AVC procede con el paso 626. Si, por
otra parte, el BNE no es mayor que la diferencia entre el tercer
valor umbral sintonizable T1 y el valor de histéresis H, el
algoritmo AVC procede con el paso 628.
En el paso 626 el algoritmo AVC compara el valor
objetivo del volumen para la muestra anterior, objetivo
[n-1], con el tercer valor de ganancia predefinido
G1. Si el valor objetivo del volumen para la muestra anterior,
objetivo [n-1], es igual al tercer valor de ganancia
predefinido G1, el algoritmo AVC procede con el paso 622. Si, por
otra parte, el valor objetivo del volumen para la muestra anterior,
objetivo [n-1], no es igual al tercer valor de
ganancia predefinido G1, el algoritmo AVC procede con el paso 628.
En el paso 628 el valor objetivo del volumen para la muestra
actual, objetivo [n], se fija igual a 0 dB, es decir, no se aplica
ninguna ganancia a la señal. El algoritmo AVC procede entonces con
el paso 608.
En el paso 608, se suma un valor umbral de
compresión C_{umbral} a un parámetro de control digital de la
altura libre, AVC_ Altura_libre, para producir una primera suma. El
valor objetivo del volumen para la muestra actual, objetivo [n], se
suma al nivel del volumen actual para producir una segunda suma. La
primera y la segunda sumas se comparan entre sí. Si la primera suma
es mayor que la segunda suma, el algoritmo AVC procede con el paso
630. Si, por otra parte, la primera suma no es mayor que la segunda
suma, el algoritmo AVC procede con el paso 632.
En el paso 630, el algoritmo AVC suma el valor
umbral de compresión C_{umbral} al parámetro de control digital
de altura libre, AVC_Altura_libre, para producir una primera suma, y
después resta el nivel de volumen actual de la primera suma para
producir un valor de diferencia. El valor objetivo del volumen para
la muestra actual, objetivo [n], se fija igual al valor objetivo
del volumen para el valor de la diferencia. El algoritmo AVC
procede entonces con el paso 632. Debería señalarse que la ganancia
global está limitada por la altura libre digital disponible (como
el proporcionado por un compresor (que no se muestra)) y por el
parámetro de control, AVC_Altura_libre. El parámetro de control de
la altura libre, AVC_Altura_libre, se resta de la altura libre
disponible para limitar la ganancia total disponible. La ausencia de
recorte digital se asegura porque la suma del valor umbral de
compresión C_{umbral}, el parámetro de control de la altura libre,
AVC_Altura_libre, y el nivel de volumen actual está restringida a
un valor que es menor de 0 dBm0.
En el paso 632, el producto de un coeficiente de
promediado en el tiempo TAV y el valor objetivo del volumen para la
muestra actual, objetivo [n], se suma al producto de la cantidad uno
menos el coeficiente de promediado en el tiempo TAV y un valor de
control automático de la ganancia (AGC) para la muestra anterior,
GananciaVolAGC [n-1]. La suma resultante se fija
igual a un valor AGC para la muestra actual, GananciaVolAGC [n]. El
algoritmo AVC procede entonces con el paso 634. En el paso 634, el
algoritmo AVC aplica el control de volumen para la muestra
actual.
En el ejemplo descrito con referencia a la
figura 10, se emplearon tres valores umbrales sintonizables y tres
valores de ganancia predefinidos. Debería ser rápidamente aparente
para los que sean expertos en la técnica que se podrían usar
cualquier número razonable de valores umbrales sintonizables y
valores de ganancia predefinidos. De manera alternativa, por
ejemplo, se usan siete valores umbrales sintonizables y siete
valores de ganancia predefinidos.
Cuando se activa el AVC, se le puede
proporcionar al usuario puntos fijos que están definidos como los
niveles de volumen preferidos del usuario con independencia de las
condiciones ambientales del entorno. A continuación, en la tabla 1,
se muestran configuraciones de ejemplo.
\vskip1.000000\baselineskip
\newpage
En la tabla 1, el valor umbral de compresión
C_{umbral} se fija a -9 dBm0, y los niveles de volumen para las
configuraciones de alto, medio, y bajo se fijan a 6, 4, y 2,
respectivamente. Se supone que las configuraciones del volumen
están en pasos de 3 dB comenzando en 0 dB, es decir, la
configuración 7 es 0 dB, la configuración 6 es -3 dB, la
configuración 5 es -6 dB, etc. En cualquier configuración, cuando el
usuario está en un entorno de un ambiente de alto ruido, el
algoritmo AVC proporciona 12 dB adicionales de ganancia al nivel de
la señal. De manera similar, en un entorno de ambiente de ruido
medio, el algoritmo AVC proporciona 6 dB adicionales de ganancia al
nivel de la señal. La columna que describe el entorno de ambiente
silencioso es equivalente a un modo AVC DESACTIVADO (OFF). Debería
entenderse que podría usarse cualquier número de puntos fijos que
sea distinto de tres (alto, medio, y bajo).
La lógica AVC, tal como la lógica AVC descrita
anteriormente con referencia a la figura 8, se usa junto con un
codificador de voz de tasa variable, tal como el codificador CELP de
tasa variable descrito en la Patente de los Estados Unidos número
5.414.796 transferida al cesionario de la presente invención.
Como se ha descrito con anterioridad, cuando la
ganancia digital fija G se multiplica por las muestras de voz de
entrada, la amplitud de las muestras sube. El umbral de compresión
C_{umbral} sirve como un techo de suavizado sobre el nivel de las
muestras. Sin embargo, para muestras que no sean de voz (silencio),
la ganancia aumentada produce un ruido de fondo relativamente más
alto al usuario. De esta forma, el usuario percibe una relación
señal a ruido (SNR) más baja. Pero se puede usar el conocimiento del
codificador de voz que está retenido, para determinar qué tramas de
muestras se codificaron/descodificaron hasta la tasa octava (es
decir, qué tramas eran tramas que no eran de voz). De acuerdo con
esto, para compensar para el aumento relativo en el ruido de fondo
durante los períodos de silencio, cada trama que fue
codificada/descodificada hasta la tasa octava no se multiplica por
la ganancia digital fija G.
De esta manera, se ha descrito un procedimiento
y un aparato novedosos y mejorados para ajustar de manera
automática las ganancias de micrófono y de altavoz dentro de un
teléfono móvil. Los que sean expertos en la técnica comprenderán
que los varios bloques lógicos ilustrativos y los pasos del
algoritmo descritos junto con las realizaciones descritas en este
documento se pueden llevar a cabo o realizar con un procesador
digital de la señal (DSP), un circuito integrado específico de la
aplicación (ASIC), lógica de puertas o de transistores discretos,
componentes hardware discretos tales como, por ejemplo, registros y
FIFO, un procesador que ejecute un conjunto de instrucciones
firmware, o cualquier módulo o procesador software programable
convencional. El procesador puede ser de manera ventajosa un
microprocesador, pero en la alternativa, el procesador puede ser
cualquier procesador convencional, controlador, microcontrolador, o
máquina de estados. El módulo software podría residir en la memoria
RAM, en memoria instantánea; en los registros, o en cualquier otra
forma de medio de almacenamiento en el que se pueda escribir
conocido en la técnica. Los que sean expertos en la técnica
apreciarán de manera adicional que los datos, instrucciones,
órdenes, información, señales, bits, símbolos, y circuitos
integrados a los que se puede haber hecho referencia en toda la
descripción anterior están de manera ventajosa representados por
medio de tensiones, corrientes, ondas electromagnéticas, campos o
partículas magnéticos, campos o partículas ópticos, o cualquier
combinación de los mismos.
La descripción anterior de las realizaciones
preferidas se proporciona para permitir a cualquier persona experta
en la técnica hacer o usar la presente invención. Las distintas
modificaciones a estas realizaciones serán rápidamente aparentes
para los expertos en la técnica, y los principios genéricos
definidos en este documento se pueden aplicar a otras realizaciones
sin el uso de la facultad inventiva. De esta manera, no se pretende
que la presente invención esté limitada a las realizaciones
mostradas en este documento sino que esté de acuerdo con el alcance
más amplio coherente con los principios y las características
novedosas descritas en este documento.
Claims (12)
1. Un dispositivo para procesar una señal de
entrada proveniente de un micrófono (202) de un dispositivo de
comunicaciones, comprendiendo: un medio (204) para aplicar una
ganancia analógica a la señal de entrada para formar una señal
ajustada de ganancia analógica; y
un medio (216) para convertir la señal ajustada
de ganancia analógica en una señal digital; caracterizado
por:
un medio (210) para aplicar una ganancia digital
a la señal digital para formar una señal ajustada de ganancia
digital; y
un medio limitador (214) para procesar la señal
ajustada de ganancia digital para generar una señal de salida que
tenga un valor que sea menor o igual a un valor umbral limitador, el
medio limitador (214) estando configurado para realizar la
detección de pico sobre la señal ajustada de ganancia digital.
2. El dispositivo de la reivindicación 1, en el
que la ganancia digital y el valor umbral limitador se eligen para
compensar la reducción en la ganancia analógica.
3. El dispositivo de la reivindicación 1, en el
que el medio limitador (214) está dispuesto para atenuar o para
ponderar la pendiente de la señal de salida de acuerdo con un valor
de pendiente cuando el valor de la señal ajustada sobrepase el
valor umbral limitador.
4. El dispositivo de la reivindicación 1, que
comprende además un medio (206,208) para eliminar las componentes
de eco de la señal digital.
5. El dispositivo de la reivindicación 1,
comprendiendo además un medio (212) para suprimir el ruido en la
señal ajustada.
6. El dispositivo de la reivindicación 1, en el
que el medio limitador (214) está configurado para realizar la
detección de pico de acuerdo con la siguiente ecuación:
X_{pico} \ [n]
= (1 - RT) \ x_{pico} \ [n - 1] + AT \ x_{dif} \
[n].
en la que x_{pico} [n] es un
valor de pico de una muestra digitalizada x[n], RT es un
valor de tiempo de liberación, AT es un valor de tiempo de ataque,
x_{pico} [n-1] es un valor de pico de una muestra
digitalizada anterior x [n-1], y x_{dif} [n] es
un valor de
diferencia,
en el que el valor de diferencia x_{dif} [n]
es igual a la diferencia entre el valor absoluto de la muestra
digitalizada x [n] y el valor de pico x_{pico}
[n-1] de la muestra digitalizada anterior x
[n-1] si la diferencia entre el valor absoluto de
la muestra digitalizada x [n] y el valor de pico x_{pico}
[n-1] de la muestra digitalizada anterior x
[n-1] es mayor que cero,
y
y
en el que el valor de diferencia x_{dif} [n]
es igual a cero si la diferencia entre el valor absoluto de la
muestra digitalizada x [n] y el valor de pico x_{pico}
[n-1] de la muestra digitalizada anterior x
[n-1] no es mayor que cero.
7. Un procedimiento para procesar una señal de
entrada proveniente de un micrófono (202) de un dispositivo de
comunicaciones, comprendiendo los pasos de:
aplicar una ganancia analógica a la señal de
entrada para formar una señal ajustada de ganancia analógica; y
convertir la señal ajustada en ganancia de la
señal analógica en una señal digital;
caracterizado por:
aplicar una ganancia digital a la señal digital
para formar una señal ajustada en ganancia digital; y
procesar la señal ajustada de ganancia digital
para generar una señal de salida que tenga un valor que sea menor o
igual a un valor umbral limitador, comprendiendo el procedimiento un
paso para realizar la detección de pico en la señal ajustada de
ganancia digital.
8. El procedimiento de la reivindicación 7, en
el que la ganancia digital y el valor umbral limitador se eligen
para compensar la reducción en la ganancia analógica.
9. El procedimiento de la reivindicación 7, en
el que el paso de procesado comprende además los
sub-pasos de:
determinar si el valor del valor de la señal
ajustada sobrepasa el valor umbral limitador; y
atenuar o ponderar la pendiente de la señal de
salida de acuerdo con un valor de pendiente cuando se determina que
el valor del valor de señal ajustada sobrepasa el valor umbral
limitador.
10. El procedimiento de la reivindicación 7, que
comprende además un paso de eliminación de las componentes de eco
de la señal digital.
11. El procedimiento de la reivindicación 7, que
comprende además un paso de supresión del ruido en la señal
ajustada.
12. El procedimiento de la reivindicación 7, en
el que el paso de procesado comprende el paso de realizar la
detección de pico de acuerdo con la siguiente ecuación:
X_{pico} \ [n]
= (1 - RT) \ x_{pico} \ [n - 1] + AT \ x_{dif} \
[n].
en la que x_{pico} [n] es un
valor de pico de una muestra digitalizada x[n], RT es un
valor de tiempo de liberación, AT es un valor de tiempo de ataque,
x_{pico} [n-1] es un valor de pico de una muestra
digitalizada anterior x [n-1], y x_{dif} [n] es
un valor de
diferencia,
en el que el valor de diferencia x_{dif} [n]
es igual a la diferencia entre el valor absoluto de la muestra
digitalizada x [n] y el valor de pico x_{pico}
[n-1] de la muestra digitalizada anterior x
[n-1] si la diferencia entre el valor absoluto de
la muestra digitalizada x [n] y el valor de pico x_{pico}
[n-1] de la muestra digitalizada anterior x
[n-1] es mayor que cero, y
en el que el valor de diferencia x_{dif} [n]
es igual a cero si la diferencia entre el valor absoluto de la
muestra digitalizada x [n] y el valor de pico x_{pico}
[n-1] de la muestra digitalizada anterior x
[n-1] no es mayor que cero.
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US281568 | 1988-12-08 | ||
US28156799A | 1999-03-30 | 1999-03-30 | |
US281564 | 1999-03-30 | ||
US281567 | 1999-03-30 | ||
US09/281,568 US6766176B1 (en) | 1996-07-23 | 1999-03-30 | Method and apparatus for automatically adjusting speaker and microphone gains within a mobile telephone |
US09/281,564 US6744882B1 (en) | 1996-07-23 | 1999-03-30 | Method and apparatus for automatically adjusting speaker and microphone gains within a mobile telephone |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2286017T3 true ES2286017T3 (es) | 2007-12-01 |
Family
ID=27403237
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES00921542T Expired - Lifetime ES2286017T3 (es) | 1999-03-30 | 2000-03-29 | Procedimiento y aparato para ajustar de manera automatica las ganancias del altavoz y del microfono en un telefono movil. |
Country Status (8)
Country | Link |
---|---|
EP (1) | EP1210767B1 (es) |
CN (2) | CN1168207C (es) |
AT (1) | ATE367011T1 (es) |
AU (1) | AU4184200A (es) |
DE (1) | DE60035512T2 (es) |
ES (1) | ES2286017T3 (es) |
HK (1) | HK1049927B (es) |
WO (1) | WO2000059110A2 (es) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2823385B1 (fr) * | 2001-04-10 | 2003-05-30 | Thomson Csf | Dispositif de conditionnement analogique d'un signal vocal dans une chaine de traitement numerique de la parole en milieu bruite |
EP1410500A1 (en) * | 2001-06-28 | 2004-04-21 | Danacom A/S | Volume control in a communication device interface unit |
DE10208096A1 (de) * | 2001-08-27 | 2003-04-10 | Siemens Ag | Mobiles Kommunikationsendgerät |
US6988068B2 (en) * | 2003-03-25 | 2006-01-17 | International Business Machines Corporation | Compensating for ambient noise levels in text-to-speech applications |
US7187764B2 (en) * | 2003-04-23 | 2007-03-06 | Siemens Communications, Inc. | Automatic speak-up indication for conference call attendees |
KR20050090283A (ko) * | 2004-03-08 | 2005-09-13 | 엘지전자 주식회사 | 다운로드 받은 음악파일의 이득조정방법 |
US7392066B2 (en) * | 2004-06-17 | 2008-06-24 | Ixi Mobile (R&D), Ltd. | Volume control system and method for a mobile communication device |
CN1855704B (zh) * | 2005-04-26 | 2011-07-20 | 佛山市顺德区顺达电脑厂有限公司 | 自动调整电子装置音量的方法 |
CN1964187B (zh) * | 2005-11-11 | 2011-09-28 | 鸿富锦精密工业(深圳)有限公司 | 音量管理系统、方法及装置 |
US7742746B2 (en) | 2007-04-30 | 2010-06-22 | Qualcomm Incorporated | Automatic volume and dynamic range adjustment for mobile audio devices |
EP2007167A3 (en) * | 2007-06-21 | 2013-01-23 | Funai Electric Advanced Applied Technology Research Institute Inc. | Voice input-output device and communication device |
JP4926005B2 (ja) | 2007-11-13 | 2012-05-09 | ソニー・エリクソン・モバイルコミュニケーションズ株式会社 | 音声信号処理装置及び音声信号処理方法、通信端末 |
CN101409744B (zh) * | 2008-11-27 | 2011-11-16 | 华为终端有限公司 | 移动终端及其提高通话质量的方法 |
JP5551254B2 (ja) * | 2009-09-14 | 2014-07-16 | ディーティーエス・エルエルシー | 適応音声了解度処理のためのシステム |
CN101924828A (zh) | 2010-07-21 | 2010-12-22 | 惠州Tcl移动通信有限公司 | 一种移动终端及其音量调节方法和装置 |
CN102469187A (zh) * | 2010-11-01 | 2012-05-23 | 吴昌德 | 传递手机来电信号的方法 |
CN102469196A (zh) * | 2010-11-01 | 2012-05-23 | 吴昌德 | 传递手机来电信号的方法 |
CN102006349B (zh) * | 2010-11-25 | 2014-04-09 | 惠州Tcl移动通信有限公司 | 会议模式下增强手机通话质量的方法及其实现装置 |
DE102011006566A1 (de) * | 2011-03-31 | 2012-10-04 | Rohde & Schwarz Gmbh & Co. Kg | Vorrichtungen zum automatischen Einstellen eines Verstärkungs- bzw. Dämpfungsfaktors |
US9654609B2 (en) | 2011-12-16 | 2017-05-16 | Qualcomm Incorporated | Optimizing audio processing functions by dynamically compensating for variable distances between speaker(s) and microphone(s) in an accessory device |
CN103188585B (zh) * | 2011-12-31 | 2016-01-27 | 冠捷投资有限公司 | 音频调整装置及其调整方法 |
EP2693636A1 (en) * | 2012-08-01 | 2014-02-05 | Harman Becker Automotive Systems GmbH | Automatic loudness control |
US9735746B2 (en) | 2012-08-01 | 2017-08-15 | Harman Becker Automotive Systems Gmbh | Automatic loudness control |
CN103024198B (zh) * | 2012-12-27 | 2015-05-13 | 东莞宇龙通信科技有限公司 | 移动终端和提醒方法 |
CN104244139A (zh) * | 2013-06-07 | 2014-12-24 | 深圳富泰宏精密工业有限公司 | 受话器控制电路及便携式电子装置 |
CN104639719A (zh) * | 2013-11-11 | 2015-05-20 | 中兴通讯股份有限公司 | 一种通话方法和通信终端 |
CN103945062B (zh) | 2014-04-16 | 2017-01-18 | 华为技术有限公司 | 一种用户终端的音量调节方法、装置及终端 |
CN203840537U (zh) | 2014-05-13 | 2014-09-17 | 歌尔声学股份有限公司 | 扬声器模组 |
CN104219365A (zh) * | 2014-08-15 | 2014-12-17 | 青岛蓝图文化传播有限公司市南分公司 | 一种车载语音设备 |
CN104243695A (zh) * | 2014-08-27 | 2014-12-24 | 青岛蓝图文化传播有限公司市南分公司 | 一种基于数字控制的音量智能调节电路 |
CN105162939A (zh) * | 2015-09-24 | 2015-12-16 | 广东欧珀移动通信有限公司 | 一种增大终端通话音量的方法和装置 |
CN105262452A (zh) * | 2015-10-29 | 2016-01-20 | 小米科技有限责任公司 | 音量调整方法、装置及终端 |
US9906859B1 (en) * | 2016-09-30 | 2018-02-27 | Bose Corporation | Noise estimation for dynamic sound adjustment |
SG10202106125YA (en) | 2016-12-13 | 2021-07-29 | QSIC Pty Ltd | Sound management method and system |
KR102356625B1 (ko) * | 2017-06-19 | 2022-01-28 | 삼성전자주식회사 | 아날로그 출력의 특성을 향상시키기 위해 이득 제어 및 이득 압축을 수행하는 전자 회로 및 그것을 포함하는 전자 장치 |
CN110120226B (zh) * | 2018-02-06 | 2021-09-03 | 成都鼎桥通信技术有限公司 | 一种专网集群终端语音尾噪消除方法和设备 |
US11876497B2 (en) | 2019-09-06 | 2024-01-16 | Google Llc | Automatic progressive transition of volume adaptation to environmental noise |
WO2021226628A2 (en) | 2020-05-04 | 2021-11-11 | Shure Acquisition Holdings, Inc. | Intelligent audio system using multiple sensor modalities |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58221510A (ja) * | 1982-06-18 | 1983-12-23 | Sony Corp | デイジタルオ−デイオ信号処理装置 |
GB2179810B (en) * | 1983-09-21 | 1987-10-21 | British Broadcasting Corp | Dynamic range control of a signal |
EP0290952B1 (de) * | 1987-05-15 | 1992-11-04 | Alcatel SEL Aktiengesellschaft | Schaltungsanordnung zur Sprachsteuerung für ein Endgerät der Nachrichtentechnik |
US4829565A (en) * | 1987-10-20 | 1989-05-09 | Goldberg Robert M | Telephone with background volume control |
FI97001C (fi) * | 1993-05-05 | 1996-09-25 | Nokia Mobile Phones Ltd | Kytkentä puhesignaalin käsittelemiseksi |
DE4336609A1 (de) * | 1993-10-27 | 1995-05-04 | Klippel Wolfgang | Prädikative Schutzschaltung für elektroakustische Schallsender |
US5566201A (en) * | 1994-09-27 | 1996-10-15 | Nokia Mobile Phones Ltd. | Digital AGC for a CDMA radiotelephone |
JPH08125475A (ja) * | 1994-10-25 | 1996-05-17 | Fujitsu Ltd | リニア・クリッパ方法および装置 |
WO1999005840A1 (en) * | 1997-07-24 | 1999-02-04 | Qualcomm Incorporated | Method and apparatus for automatically adjusting speaker and microphone gains within a mobile telephone |
-
2000
- 2000-03-29 ES ES00921542T patent/ES2286017T3/es not_active Expired - Lifetime
- 2000-03-29 AT AT00921542T patent/ATE367011T1/de not_active IP Right Cessation
- 2000-03-29 AU AU41842/00A patent/AU4184200A/en not_active Abandoned
- 2000-03-29 EP EP00921542A patent/EP1210767B1/en not_active Expired - Lifetime
- 2000-03-29 CN CNB008058024A patent/CN1168207C/zh not_active Expired - Fee Related
- 2000-03-29 WO PCT/US2000/008527 patent/WO2000059110A2/en active IP Right Grant
- 2000-03-29 CN CNB200410032363XA patent/CN100514989C/zh not_active Expired - Fee Related
- 2000-03-29 DE DE60035512T patent/DE60035512T2/de not_active Expired - Lifetime
-
2003
- 2003-03-24 HK HK03102104.6A patent/HK1049927B/zh not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
EP1210767A2 (en) | 2002-06-05 |
AU4184200A (en) | 2000-10-16 |
CN1390383A (zh) | 2003-01-08 |
WO2000059110A2 (en) | 2000-10-05 |
EP1210767B1 (en) | 2007-07-11 |
HK1049927A1 (en) | 2003-05-30 |
CN1168207C (zh) | 2004-09-22 |
WO2000059110A3 (en) | 2002-04-04 |
DE60035512D1 (de) | 2007-08-23 |
DE60035512T2 (de) | 2008-03-13 |
CN100514989C (zh) | 2009-07-15 |
CN1533134A (zh) | 2004-09-29 |
ATE367011T1 (de) | 2007-08-15 |
HK1049927B (zh) | 2005-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2286017T3 (es) | Procedimiento y aparato para ajustar de manera automatica las ganancias del altavoz y del microfono en un telefono movil. | |
US6766176B1 (en) | Method and apparatus for automatically adjusting speaker and microphone gains within a mobile telephone | |
EP1889258B1 (en) | Adapted audio response | |
RU2347282C2 (ru) | Система и способ обработки звукового сигнала | |
US8964997B2 (en) | Adapted audio masking | |
JP5102273B2 (ja) | 移動電話内のスピーカ利得およびマイクロフォン利得を自動的に調整するための方法および装置 | |
US9197181B2 (en) | Loudness enhancement system and method | |
KR101311028B1 (ko) | 주변 잡음 검출을 이용한 요해도 제어 | |
US7577263B2 (en) | System for audio signal processing | |
US7835773B2 (en) | Systems and methods for adjustable audio operation in a mobile communication device | |
GB2432750A (en) | Polyphonic ringtone annunciator with spectrum modification | |
US20110125491A1 (en) | Speech Intelligibility | |
JP2008522511A (ja) | 適応可能な音声処理パラメータ用の方法及び装置 | |
NL1038762C2 (en) | Voice immersion smartphone application or headset for reduction of mobile annoyance. | |
JP2586847B2 (ja) | 電子電話機 | |
KR101760122B1 (ko) | 휴대단말기의 평균 음압 향상 장치 및 방법 | |
JP2002218045A (ja) | 携帯型無線機器の補聴処理装置および携帯型無線機器 | |
CN114446315A (zh) | 通讯装置及其调整输出侧音的方法 |