MXPA96005354A - Metodo y aparato para reducir el eco residual del extremo lejano en redes de comunicacion de voz - Google Patents

Metodo y aparato para reducir el eco residual del extremo lejano en redes de comunicacion de voz

Info

Publication number
MXPA96005354A
MXPA96005354A MXPA/A/1996/005354A MX9605354A MXPA96005354A MX PA96005354 A MXPA96005354 A MX PA96005354A MX 9605354 A MX9605354 A MX 9605354A MX PA96005354 A MXPA96005354 A MX PA96005354A
Authority
MX
Mexico
Prior art keywords
signals
far
signal
network
referred
Prior art date
Application number
MXPA/A/1996/005354A
Other languages
English (en)
Other versions
MX9605354A (es
Inventor
Dale Wynn Woodson
Michael Velardo Patrick Jr
Original Assignee
At&T
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/398,272 external-priority patent/US5587998A/en
Application filed by At&T filed Critical At&T
Publication of MX9605354A publication Critical patent/MX9605354A/es
Publication of MXPA96005354A publication Critical patent/MXPA96005354A/es

Links

Abstract

La presente invención se refiere a un método y una aparato para reducir, en las señales de comunicación recibidas por una red local a partir de una red lejana (señales lejanas), el contenido de energía que se puede atribuir a los ecos de las señales transmitidas en la red local (señales cercanas). Esto se logra, en parte, al generar una señal de plantilla variable con el tiempo que representa el contenido de energía suavizado de las señales cercanas retrasadas de acuerdo con la ruta del eco y atenuadas con una pérdida de transmisión de eco, estimada. Un procesador no lineal pasa la señal lejana sustancialmente sin atenuación si excede la plantilla, pero atenúa la señal lejana si estásituada dentro de un intervalo definido por abajo de plantilla.

Description

MÉTODO Y APARATO PARA REDUCIR EL ECO RESIDUAL DEL EXTREMO LEJANO EN REDES DE COMUNICACIÓN DE VOZ Campo de la invención Esta invención se refiere a técnicas para procesar señales vocales en redes de comunicación, y en forma más particular, se refiere al procesamiento para la supresión de los ecos del extremo .lejano.
Antecedentes de la invención Se ha reconocido por mucho tiempo que en muchas redes de comunicación de voz, el extremo lejano tiene una tendencia molesta a regresar hacia la persona que habla del extremo cercano una réplica retrasada de sus transmisiones de voz. Este eco del extremo lejano es especialmente incómodo cuando ocurre en un retraso de aproximadamente 40 ms o más, puesto que en estos retrasos, el eco tiende a ser percibido claramente por la persona que habla del extremo cercano como un ruido perturbador. De esta manera, el eco del extremo lejano posee especialmente grandes problemas para aquellos tipos de redes cuya operación ocasiona estos retrasos REF: 23515 relativamente grandes. Estas incluyen redes via satélite, y al menos algunas redes que realizan la codificación y compresión de voz. En realidad, están disponibles dispositivos que permitirían que la persona que habla del extremo lejano suprima o cancele el componente vocal cercano que se regresa de manera no intencional al extremo cercano. Sin embargo, habrá casos cuando la persona que habla del extremo lejano no esté usando este dispositivo. Además, aún si se está usando en el extremo lejano este dispositivo de supresión del eco o cancelación del eco, puede no ser completamente efectivo para remover el eco. De esta manera, en muchos casos habrá al menos un eco residual regresado al extremo cercano. Como consecuencia, será deseable frecuentemente para la persona que habla del extremo lejano operar un dispositivo que pueda reducir aquellos componentes de la voz cercana que se regresan a la persona que habla del extremo lejano después de recorrer un recorrido redondo a través de la red de comunicación lejana. Se describió un procesador no lineal, anterior, para la reducción de eco en O.M. Mracek Mitchell y D.A. Berkley, "A Full-Duplex Echo Supressor Using Center-Clipping", Bell System Technical Journal 50 (1971), páginas 1619-1630. Cuando se publicó este articulo, no estaban en uso aún los canceladores del eco. En el articulo, los autores describieron un circuito limitador central de sub-bandas para el uso como un dispositivo independiente para reemplazar un supresor de eco convencional (en el momento de la publicación) del extremo lejano (es decir, el receptor). Este circuito limitador central no tiene adaptaciones para situaciones donde hay un retraso sustancial del eco . La Patente Norteamericana No. 5,274,705, emitida a Younce y colaboradores, describe un esfuerzo más reciente para suprimir el eco residual usando un dispositivo en el extremo lejano (receptor) . El eco que no se ha removido completamente por un cancelador convencional del eco se remueve adicionalmente por un procesador no lineal. En este procesador no lineal, se usa una estimación del nivel del ruido de fondo para establecer un umbral de transparencia del ruido, de banda completa. Las transmisiones que caen por abajo de este umbral se transmiten a fin de enmascarar el eco residual y para evitar las interrupciones sonoras, no naturales del ruido de fondo. Esta técnica también usa la energia en una réplica de eco, en base a una ganancia estimada para la ruta de eco, para establecer un umbral variable con el tiempo para la limitación central de banda completa . La técnica de Younce, puede fallar, en algunos casos, para lograr un grado satisfactorio de control del eco. Por ejemplo, el eco residual que sobrevive al proceso de limitación central se extenderá sobre la banda de frecuencia completa, y de esta manera puede ser reconocible como voz (y por lo tanto, ser perturbador) aún a relaciones muy bajas de señal a ruido. Además, la transparencia del ruido de banda completa es desventajosa debido a que el ruido de banda estrecha, tal como el zumbido en la linea de energia, tenderá a aumentar el umbral de transparencia del ruido a través de la banda de frecuencia completa. Esto puede dar por resultado la transmisión no deseada de ecos que se enmascaran por el ruido solo en un intervalo de frecuencia limitado . Los profesionales en este campo han reconocido que se puede usar un dispositivo colocado en el extremo cercano (transmisor) para reducir el eco del extremo lejano, si se compensa el retraso incurrido por la transmisión del eco sobre un recorrido redondo a través de las redes locales y lejanas. Por ejemplo, la Solicitud de Patente Internacional PC/AU93/00626 (Publicación Internacional W094/14248), por J. Portelli, describe el uso de un cancelador de eco convencional en el extremo cercano (transmisor). Debido a que puede haber un retraso sustancial entre la transmisión de la voz cercana y el arribo del eco que se va a cancelar, este cancelador de eco se opera en unión con un dispositivo de retraso que está programado, antes de la instalación, para proporcionar un retraso compensatorio, fijo. En el cancelador de eco, un filtro transversal adaptable de banda completa genera un réplica substractiva del eco. Sin embargo, ciertos factores pueden prevenir que este sistema proporcione un remedio completamente satisfactorio. Por ejemplo, la exactitud de la réplica del eco se limita por el ruido en la linea (ruido del circuito). Esto puede reducir la efectividad del cancelador del eco. Además, el equipo de multiplicación o compresión del circuito entre las redes locales y lejanas puede distorsionar las porciones de la señal de eco, conduciendo a la supresión incompleta. Este sistema también puede sufrir el desempeño degradado debido al movimiento de fases (por ejemplo, a partir de medios de transmisión analógicos), o debido al ruido de cuantificación y a las no linealidades introducidas por los codificadores vocales en los sistemas de transmisión digitales. De esta manera, los profesionales en el campo del control del eco han fallado hasta la fecha para proporcionar un método completamente satisfactorio que se puede emplear en la red local para reducir los ecos residuales del extremo lejano.
Breve descripción de la invención Se ha inventado un aparato y método mejorados de procesamiento no lineal que se puede realizar dentro de una red de comunicación local -. El presente método es altamente efectivo para reducir el eco residual de la red de comunicación lejana, aún cuando el eco regrese con un retraso significante en la transmisión. El presente método es fuerte para el ruido en la linea y para distorsiones que se pueden introducir dentro de la red lejana por el procesamiento no lineal, lejano.
El presente método también se puede hacer relativamente insensible al movimiento de fases y a varios problemas encontrados frecuentemente que tienden a degradar la convergencia de los canceladores convencionales de eco. En un sentido amplio, la presente invención comprende la reducción del eco en las comunicaciones vocales que se transmiten en una red desde una ubicación lejana, y se reciben desde la red en una ubicación cercana. (Las palabras "lejano" y "cercana" no se proponen para que se limiten, diferentes para denotar los extremos opuestos de una ruta para la comunicación bidireccisnal . En varios sitios en la presente, la palabra "local" se puede sustituir por "cercana" y la palabra "remota" sustituir por "lejana"). De acuerdo con la práctica de la invención, como se define ampliamente, las señales transmitidas en la red en la ubicación cercana se reciben, mediante un dispositivo apropiado de procesamiento de señales, como una "entrada cercana". Las señales transmitidas en la red desde la ubicación lejana se reciben por el mismo dispositivo de procesamiento como una "entrada lejana". La entrada cercana y la entrada lejana se comparan, para producir de este modo un valor EPD para una cantidad referida como el "retraso en la ruta del eco". Este EPD es una medida del retraso de tiempo relativo entre aquellas porciones de la entrada cercana y lejana que contienen información similar. La entrada cercana se somete a un retraso igual a EPD, para alinear temporalmente de este modo las señales de entrada cercana y lejana. Luego, la entrada cercana y la entrada lejana se descomponen cada una separadamente en componentes de sub-banda, plurales . Una señal de módulo luego se deriva de cada componente de sub-banda de la entrada cercana. Esto es, el valor absoluto de cada una de estas señales de sub-banda se suaviza, dando por resultado una forma de onda que es proporcional a la envoltura de energia de rms de la señal de sub-banda. Cada una de estas formas de onda luego se atenúa de acuerdo a una estimación de pérdida de eco. La forma de onda resultante, referida posteriormente en la presente como una "plantilla", representa la envoltura de la forma de onda del eco, esperada. Cada componente de sub-banda de la entrada lejana luego se somete a una operación de limitación central que se propone para remover las señales débiles en la suposición que son ecos. La plantilla es el umbral (referido en la presente como un umbral "superior" por las razones que se explican posteriormente) para discriminar estas señales débiles. Esto es, cada una de las señales de sub-banda, de entrada lejana se transmitirán al menos parcialmente si se excede el valor corriente de su plantilla respectiva. Después de la limitación central, los componentes de sub-banda, de entrada lejana se combinan, para producir de este modo una señal de salida, de banda completa, sintetizada. Las modalidades preferidas de la invención incluyen un segundo umbral, referido en la presente como un umbral "inferior". Un umbral inferior es útil para suprimir un efecto de fondo molesto referido algunas veces como un "bombeo de ruido". Esto ocurre cuando el ruido en la linea u otro ruido de fondo del extremo lejano se modula por la voz del extremo cercano, produciendo sonidos intermitentes que pueden asemejar a aquellos de una bomba reciprocante. Es bien conocido enmascarar este efecto al inyectar una cantidad controlada de energía de ruido después de la operación de limitación. Sin embargo, el ruido inyectado es en general una unión pobre a la distribución de frecuencia del ruido de fondo real y de esta manera es raramente una máscara completamente efectiva. En contraste, en el planteamiento de la presente invención se arregla el limitador central para transmitir componentes de sub-banda que se sitúan por debajo del umbral inferior, el cual representa un fondo de ruido. Debido a que el umbral inferior se determina de una forma separada para cada componente de sub-banda, se puede lograr una unión buena al espectro de ruido real aún en la presencia de ruido en la línea de banda estrecha. Cada umbral inferior se deriva a partir de un componente de sub-banda, respectivo de la entrada lejana. El valor absoluto de la señal de entrada lejana se suaviza usando un suavizador de lento ascenso, de rápida disminución. Este procedimiento produce una estimación del fondo de ruido de sub-banda, y se establece igual al umbral inferior. Aquellas señales de sub-banda de la entrada lejana correspondientes que caen por abajo de este umbral inferior se transmiten por el limitador central y se combinan en la señal de salida de banda completa.
Breve descripción de los dibujos La Figura 1 representa las características arquitectónicas generales de una red de comunicación, que incluyen el uso convencional de dispositivos para el control del eco.
La Figura 2 ilustra, de una manera amplia, el uso, en una red de comunicación, de un sistema para el control del eco residual, del extremo lejano (RFEC, por sus siglas en inglés).
La Figura 3 es una representación esquemática de un sistema para el control del eco de acuerdo con la invención, en una modalidad.
La Figura 4 es una representación esquemática de las funciones realizadas por el bloque de procesamiento de señales de sub-banda de la Figura 3.
La Figura 5 es una representación de una función de transferencia para un limitador central de acuerdo con la invención, en una modalidad.
La Figura 6 es una representación esquemática del procedimiento para medir el retraso en la ruta del eco, de acuerdo con la invención en una modalidad.
DESCRIPCIÓN DETALLADA DE UNA MODALIDAD PREFERIDA La red de comunicación de la Figura 1 incluye una red local 10, una red 20 lejana o remota, y conexiones de línea 30 entre redes. Cada red 10, 20 incluirá típicamente un acoplador diferencial 32 telefónico, y uno o más conmutadores o intercambiadores 34. Las conexiones de línea entre redes pueden incluir enlaces de comunicación entre redes nacionales e internacionales, y pueden incluir enlaces hacia y desde satélites de comunicación. Una red de comunicación para comunicaciones de larga distancia incluirá también típicamente sistemas 40 de multiplicación del circuito para reducir la transmisión del ancho de banda mediante la codificación vocal u otros procesos de compresión vocal. Las redes locales o lejanas también pueden incluir sistemas 50, 55 de control de eco, convencionales. Por ejemplo, en la red lejana, se usa un sistema 55 para reducir el habla del extremo cercano (que se origina en el sistema local) que se recicla a través de la red lejana y regresa a la persona que habla del extremo cercano como un eco de su propia voz. Sin embargo, en al menos algunos casos, este sistema 55 estará ausente, o fallará para hacer un trabajo adecuado de reducción del eco. En aquellos casos, puede ser ventajoso para la persona que habla del extremo cercano emplear un sistema para el control del eco residual del extremo lejano (RFEC, por sus siglas en inglés) que se instala en la red local. Este sistema 60 de RFEC, como se muestra en la Figura 2, es útil para la reducción adicional del eco que se regresa a la persona que habla del extremo cercano desde el extremo lejano. Representado en la Figura 3 está un sistema de RFEC que opera en una señal vocal y[n] del extremo cercano, de banda completa, y una señal vocal x[n] del extremo lejano, de banda completa. (La variable "n" denota una medida discretizada de tiempo). Este sistema es ventajosamente implementado en el procesador de señales digitales. En el bloque 100 de la figura, el sistema evalúa una medida EPDfn], que es una estimación del retraso en la ruta del eco entre las señales del extremo cercano transmitidas y regresadas. Como se explica posteriormente, un paso intermedio en la derivación de EPD[n] comprende el cálculo de las energías espectrales, promedio, de banda completa de las señales del extremo cercano y del extremo lejano. Una medición opcional de la pérdida entre las señales transmitidas y regresadas se deriva fácilmente a partir de la relación de la energía espectral del extremo lejano a la energía espectral del extremo cercano. En esta relación, la energía espectral del extremo cercano se retrasa por el retraso en la ruta del eco, estimado. Esta medición opcional de la pérdida se ilustra mejor en el bloque 425 de la Figura 6. La medición de la pérdida también puede ser útil para ajustar la cantidad de atenuación que se aplicará a la plantilla (ver posteriormente) , y también se puede usar como una señal de control para determinar cuando permitir el procesamiento de las señales de sub-banda en el bloque 130 de la Figura 3. En el bloque 110, las porciones derivadas del habla cercana saliente se someten a un retraso de EPDfnJ, para producir una señal vocal, cercana, de banda completa, retrasada y[n]-EPD], Esta señal retrasada se usa para crear la plantilla, que, como se señala, representa la envoltura del eco esperada después de la atenuación. En el bloque 120, la señal vocal cercana, retrasada se descompone en una pluralidad de sub-bandas de frecuencia, numeradas desde 1 a M. Cada señal de sub-banda, de manera ejemplar la señal de sub-banda k-ésima yah[n], se somete de manera separada al procesamiento de la señal de sub-banda. Como se representa en la Figura, cada señal de subbanda se procesa en un bloque 130 de procesamiento respectivo. En las modalidades corrientemente preferidas, el procesador representado por el bloque 120 de análisis de frecuencia es un banco de filtro de análisis polifásico con reducción de la proporción de la muestra, que produce señales de sub-banda, diezmadas. El uso de los bancos de filtro polifásicos es particularmente atractivo debido a que ofrece una eficiencia de cálculo relativamente alta. Estos bancos de filtro son bien conocidos en la técnica y no se necesitan describir en más detalle en la presente. Una referencia útil a este respecto es P. P. Vaidyanathan, "Multirate Systems and Filterbanks, " Capítulo 8, Prentice Hall, 1993.
El presente planteamiento corrientemente preferido emplea bancos de filtro modulados con coseno que se implementan en estructuras polifásicas, eficientes en el cómputo. Este planteamiento conduce al diseño directo, a requerimientos computacionales relativamente bajos, y a características de respuesta de frecuencia, excelentes que conducen a la mínima distorsión en la reconstrucción de la señal de banda completa. Una referencia útil en este respecto es K. Nayebi y colaboradores, "On the Desing of FIR Analysis-Synthesis Filterbanks con High Co putational Efficiency." IEEE Trans. Signal Processing 42 (Abril de 1994) . Como una materia general, se cree que la regulación selectiva de las sub-bandas de frecuencia, individuales conduce a una estabilidad operacional más alta y mejor calidad de voz de lo que se logra usando procesadores no lineales, de banda completa, convencionales para la reducción del eco. Además, el planteamiento de sub-banda tiene una mayor tendencia para dar la impresión de una conexión dúplex, completa, debido a que la mayoría de las bandas de frecuencia activas para la persona que habla del extremo lejano pueden diferir de aquellas para el eco de la persona que habla, local. Aún además, el bombeo de ruido tiende a ser menos perceptible con el procesamiento de sub-banda que con el procesamiento de banda completa, aún sin la característica descrita anteriormente, de transparencia al ruido de sub-umbral. También se procesan en los bloques 130 respectivos las señales de sub-banda M obtenidas al descomponer la señal de entrada lejana x[n] en el bloque 140. En las modalidades corrientemente preferidas, el procesador representado por el bloque 140 también es un banco de filtro de análisis polifásico con reducción de la proporción de la muestra, que produce señales de sub-banda diezmadas. Para cada valor de k (k asume valores de números enteros desde 1 a M, la señal del extremo lejano de sub-banda, k-ésima xa n] se somete, en el bloque 130, a la operación de limitación central que depende de una comparación entre la ' señal del extremo lejano de sub-banda y el valor contemporáneo de la plantilla. La salida de cada bloque 130 de procesamiento de sub-banda es una señal de sub-banda, procesada, respectiva, xek[nj. Las señales de sub-banda, procesadas, M se recombinan en el bloque 150 de síntesis de frecuencia para producir una señal de salida de banda completa xpo[n]. En las modalidades corrientemente preferidas, el procesador de bloque 150 es un banco de filtro de síntesis polifásico. Los bancos de filtros de esta clase se describen, por ejemplo, en Vaidyanathan, como se describe anteriormente y en Nayebi y colaboradores, descrito anteriormente. En el bloque 135, se usa opcionalmente un detector de voz de banda completa para inhabilitar el procesamiento de sub-banda del bloque 130 cuando se detecta la voz lejana, y para habilitar el procesamiento de sub-banda en otros momentos. Estas funciones de habilitación e inhabilitación se realizan de manera ejemplar a través de ajustes apropiados de un indicador que tiene un estado de PERMITIR y un estado de NEGAR. Una estimación de banda completa de la pérdida del eco puede ser útil, en este respecto, para determinar cuando la energía en la entrada x[nj es la voz lejana real, antes que un eco de la voz cercana. Esto es, x[n] se puede clasificar como la voz lejana, antes de como eco, si su envoltura de energía representa una fracción mayor de la envoltura de energía retrasada de y[n] que se pronosticaría en base a la pérdida sola del eco. En la figura, el bloque 135 se muestra que tiene una entrada para una señal que representa esta estimación de pérdida del eco. Se puede proporcionar una estimación apropiada por el bloque 425 de la Figura 6. Un detector de voz, corrientemente preferido para este propósito se puede obtener a partir de la Norma GSM 06.32 VAD discutida en "The Voice Activity Detector for the PAN-EUROPEAN Digital Celular Mobile Telephone Service," por D.K. Freeman y colaboradores, en IEEE Conf. ICASSP, 1989, Sección S7.6, páginas 369-372. Este detector de voz se prefiere debido a que se conoce que opera confiablemente en la presencia de ruido. Sin embargo, otros detectores de voz, bien conocidos en la técnica, también se usan fácilmente para este propósito . De acuerdo con las modalidades corrientemente preferidas de la invención, ahora se describen con referencia a la Figura 4, los detalles adicionales del procesamiento en el bloque 130 de las señales de sub-banda k-ésimas, diezmadas ya^fn] y xak[n], En el bloque 200, la magnitud de la forma de onda de la señal del extremo cercano, yak[n] se determina y pasa al bloque 210. De manera similar, en el bloque 220, la magnitud de la forma de onda de la señal del extremo lejano, xak[n] se determina y pasa al bloque 230. Cada uno de los bloques 210 y 230 representa una operación de suavizacíón, que conserva el valor máximo, que tiene un tiempo de ascenso relativamente rápido y una disminución más lenta. Al menos en el bloque 210, es deseable que la disminución se aproxime a la final esperada de reverberación del eco. De manera ejemplar, la salida suavizada ybk[n] del bloque 210 se expresa por el promedio repetitivo si !yai[n]| = ybk[n] (condición de ascenso) ybk[n} = A2 A yak[n] | + (1-A2) ybk[n - 1); si |yak[n]| < ybk[n] (condición de caída) : ybk[n] - A3Ayak[n]| + (1-A3) ybk[n - 1], donde A2 se selecciona para ser la unidad cercana, para asegurar un tiempo de ascenso rápido y A3 se selecciona para tener una disminución en el orden de 40-50 ms. Se ha encontrado que el presente sistema se puede hacer menos sensible a errores en la estimación del retraso en la ruta del eco al adicionar a la fórmula para ybk[n] una provisión para mantenerse sobre los valores máximos en yak[n] durante un periodo de continuación, predeterminado. Este periodo de continuación se ajusta preferentemente al retraso esperado a través de la red lejana, que es típicamente 20-40 ms . En la presente modalidad corrientemente preferida, la provisión de continuación se aplica de acuerdo con las siguientes instrucciones: (i) si la condición de ascenso se satisface, actualizar ybk[n] e iniciar un periodo de continuación; (ii) si la condición de caída se satisface, actualizar ybk[n] solo si ha expirado el último periodo de continuación. Se hacen ajustes opcionales a la pérdida en la ruta del eco, esperada EPLk[n] en el bloque 240. Se debe señalar a este respecto que en los circuitos limitadores centrales, convencionales, se predetermina un valor fijo de la pérdida esperada, mínima. Típicamente, este valor es aproximadamente 18 dB para los propósitos del control del eco residual en las redes de telecomunicaciones. Sin embargo, puede ser ventajoso hacer ajustes en esta cifra de pérdida esperada, si por ejemplo, el nivel de la energia de la plantilla muestra una tendencia a exceder los niveles reales de energía de las señales de eco recibidas. La presente práctica corriente es para determinar una pérdida esperada, mínima, fija a través de todas las sub-bandas, típicamente en el intervalo de 10-12 dB, y para ajustar EPL igual a este valor. Este valor de pérdida, se puede determinar fácilmente, por ejemplo, a partir de mediciones en la red tomadas al inspeccionar las conexiones de líneas entre redes durante una duración apropiada de tiempo. Sin embargo, puede ser deseable en al menos algunos casos usar un valor fijo, diferente de EPLk para cada banda de frecuencia k. Esto permite la formación del valor de pérdida de acuerdo con por ejemplo, criterios porcentuales o los resultados de las mediciones en la red. Otra alternativa es determinar EPLfn] de manera adaptativa, ya sea a través de todas las sub-bandas de frecuencia, o individualmente dentro de las sub-bandas respectivas. De acuerdo con esta alternativa, la pérdida esperada, mínima, predeterminada puede servir como una unión menor para EPL, con los ajustes en EPL guiados por los resultados de un cálculo de la pérdida. Se discute posteriormente un cálculo de la pérdida, de banda completa, apropiado. En aún otra alternativa, la pérdida se puede determinar al probar activamente la red lejana con una señal conocida, y al analizar el eco regresado . En el bloque 250, la envoltura del extremo cercano del bloque 210 se multiplica por la estimación de la pérdida para producir un umbral siguiente a la forma de onda CLlk[n]: CLlk[n] = EPL[n] x ybk[n] En el bloque 230, la entrada lejana se suaviza de una manera similar al suavizamiento de la entrada cercana en el bloque 210. La señal de la entrada lejana, suavizada es útil para realizar los ajustes opcionales de la pérdida del bloque 240, y para realizar la estimación del fondo de ruido de los bloques 260 y 265, que se describen posteriormente . La salida suavizada xbk[n] del bloque 230 se expresa de manera ejemplar por el promedio repetitivo : si xak{n] | = xbk[n]: xbk[n] = A4 xak[n] | + 1-A4) xbk[n - 1J; si xak{nj | < xbk[nj: xbk[nj = A5 xak[n] I + (1-A5) xbk[n - 1], en donde A4 se selecciona para ser la unidad cercana, para asegurar un tiempo de ascenso rápido, y A5 se selecciona par tener una disminución en el orden de 40-50 ms . La salida xbk[n] del bloque 230, que representa una envoltura del extremo lejano, suavizada, se procesa en el bloque 260 para producir una estimación xc[nj del nivel de ruido de la red lejana. A manera de ejemplo, la salida xbk[nj del bloque 230 se somete al promedio repetitivo definido por : s i | xbk[n] | > xck[n] : xck{n] - A6 « | xbkfn] | + ( 1 - A6 ) xck[n - 1]; s i | xbk[n] | < xck[n] : xck[n] = A7 - | xbk[n] I + ( 1 - A7 ) xck[n - 1] . en donde A6 se selecciona para ser relativamente pequeña para as egurar un t iempo de ascenso l ento , y A7 se selecciona para tener una disminución corta, en el orden de 1 - 5 ms . A partir de la estimación del ruido del extremo lejano, xck[n], se deriva un umbral inferior siguiente a la forma de onda (es decir, un fondo de ruido) CL2k[n], como se muestra en el bloque 265 de la Figura 4. A manera de ejemplo, este umbral se deriva al multiplicar la estimación del ruido por un factor de escala, opcional, NFACk[n] que asume típicamente valores entre 0.5 y 1.5. Además, el umbral CL2k[n] se restringe ventajosamente para nunca exceder el nivel del eco esperado. De esta manera, se define un umbral inferior, ejemplar por la fórmula : CL2k[n] = min (NFACk[n] x xck[n], CLlk[n]) Se ha encontrado que la estimación del fondo de ruido se puede mejorar aún adicionalmente, si el suavizamiento de xak[n] y xbk[n] se realiza solo cuando la entrada lejana contiene solo ruido, y no voz. El detector de voz del extremo lejano del bloque 135 de la Figura 3 se usa fácilmente para distinguir entre la situación donde la voz (o eco) está presente, y la situación donde solo hay ruido.
Por consiguiente, la estimación del fondo de ruido se inhabilita en el primer caso, y se habilita en el segundo caso. En el bloque 270, la señal de entrada, de sub-banda, del extremo lejano xak[n] se somete a la limitación central. De acuerdo con una modalidad corrientemente preferida de la invención, la señal de entrada se atenúa tan pronto como su valor absoluto cae entre los umbrales CL2k[n] y CLlk[n] + CL2k[nJ, pero pasa sin atenuación si cualquiera de: (1) cae por arriba de CLl?.[nJ + CL2k[n]; o (2) cae por abajo de CL2 [n]. La función de transferencia del circuito limitador corrientemente preferido se ilustra en la Figura 5. Como es evidente a partir de la figura, este circuito limitador pasa la señal de entrada sustancialmente sin atenuación si el valor absoluto de la señal es menor del umbral inferior CL2 ó mayor que el umbral superior CL1 + CL . En la figura, el subíndice k y la dependencia explícita en el tiempo cuantificado n se han omitido por propósitos de brevedad) . Sin embargo, en la región intermedia entre estos umbrales, la señal de entrada se limita a un nivel de salida plano de CL2.
Se ha observado que cuando el ruido es relativamente alto, dentro de una sub-banda k dada, se puede transmitir algo del eco reducido y distorsionado por el circuito limitador central en esa sub-banda. A fin de enmascarar este componente de eco, se ha encontrado que es útil mezclar la señal de sub-banda, transmitida con un componente de ruido blanco (es decir, un componente de ruido que tiene un espectro plano dentro de la sub-banda dada k) . De acuerdo con el procedimiento corrientemente preferido, se mezcla un nivel de la señal de sub-banda (1 - FFAC) x xak con un nivel de ruido blanco FFACC x CL2k[n]. Se selecciona típicamente un valor de FFAC en el intervalo de 25 % - 50 %. Debido a que el espectro de ruido adicionado es plano solo dentro de cada sub-banda, la salida de banda completa, sintetizada, resultante se aproximará al espectro de ruido de banda completa. En el bloque 275, una función de post-suavización, opcional remueve los picos transitorios falsos de la salida del circuito limitador 270. De acuerdo con un procedimiento de post-suavización, que es similar a un filtro medio, se hace una determinación de si la muestra corriente de la señal xdk[n] está ocurriendo durante el habla del extremo lejano. Esta determinación se basa en la salida del detector 320 de voz, en unión con una medición de pérdida, como se describe anteriormente. Si el habla del extremo lejano está ausente y el bloque de la señal corriente contiene valores máximos aislados unidos por muestras limitadas de la señal, entonces el bloque completo se limita. Por otra parte, si se detecta el habla del extremo lejano, los valores limitados se restauran en el bloque completo. Para este propósito, se prefieren corrientemente los tamaños de bloque de aproximadamente 10-20 ms . Adicionalmente, el bloque 275 puede proporcionar atenuación adicional de aquellos segmentos de la señal de extremo lejano, limitada que contiene solo ruido. Como se señala, se calcula en el bloque 100 de la Figura 3 una estimación de banda completa EPD[n] del retraso en la ruta del eco. Un método corrientemente preferido para calcular este retraso ahora se discute con referencia en la Figura 6. Este método se basa en el cálculo de una medida coherente en el dominio de frecuencia. Esa medida se evalúa a partir de estimaciones periodogra áticas de los autoespectros de las señales del extremo cercano y del extremo lejano, respectivamente, y una estimación periodogra ática de su espectro cruzado. Se describen métodos de esta clase, en general, en G. Cliffar, Cárter, ed. Coherence and Time Delay Estimation, IEEE Press, 1993. Sin embargo, diferente de los métodos convencionales, el presente método evalúa la medida coherente, y termina con una medida de energía normalizada antes de realizar una FFT invertida para transformarse desde el dominio de frecuencia de regreso al dominio de tiempo. Esta modificación produce una estimación de tiempo menos exacta que el método de estimación completa descrito en Cárter, pero reduce los presentes requerimientos computacionales y el uso de memoria, y es suficiente para los presentes propósitos. La entrada del extremo cercano y[n] y la entrada del extremo lejano x[n] se reciben cada una en tiempo real, y en los bloques 300 y 310 de la figura, respectivamente, estas señales de entrada se segmentan en bloques sobrepuestos. Una ventana de tiempo, tal como una ventana Hanning, asigna valor a las muestras en cada bloque. Se prefiere corrientemente usar un tamaño de bloque de 240 muestras, con un traslape de 33 %, es decir, de 80 muestras .
El cálculo del retraso se propone para operar solo en la voz del extremo cercano, y en aquella porción de la señal del extremo lejano, que regresa, que se supone que contiene ecos de la voz del extremo cercano. De esta manera, el cálculo del retraso se inicia solo cuando se detectan señales vocales del extremo cercano. Para este propósito, un detector vocal 320 da una señal de "adelante" cuando determina que la parte del extremo cercano está hablando. Se usa corrientemente un detector de voz que emplea una medición de energía simple para identificar la actividad de la voz a partir del extremo cercano. Los detectores de voz de este tipo son bien conocidos en la técnica, y no necesitan ser descritos en detalle en la presente. Es deseable evitar el cálculo innecesario durante los intervalos cuando no se espera el eco. Todos los ecos que siguen a la iniciación de un estañido dado de la voz cercana se esperarán que ocurran dentro de algún periodo de tiempo. Se selecciona una duracción T2, típicamente alrededor de 1000 ms, para representar este periodo de tiempo. Además, se espera que ocurra el primer eco después de algún retraso mínimo en la transmisión. Se selecciona una duración Ti para representar este retraso. Aunque Ti se puede ajustar opcionalmente a 0, se prefiere usar un valor diferente de 0 (finito), típicamente alrededor de 150 ms . Las duraciones i y T2 se almacenan en el temporizador 330. Este temporizador limita el procesamiento de la señal a aquellos bloques del extremo lejano que arriban en un retraso entre i y T2 con relación al bloque del extremo cercano, corriente del proceso. Cuando el detector de voz 320 determina que la energía vocal del bloque de señal del extremo cercano k-ésimo excede un umbral preestablecido, el detector de voz emite la señal de adelante. En respuesta, el bloque de la señal cercana se rellena con ceros y se transforma a una señal de dominio de frecuencia Y(f) usando una Transformada de Fourier Rápida (FFT, por sus siglas en inglés), como se indica en el bloque 340 de la figura. A manera de ejemplo, se prefiere usar una FFT que tenga una longitud de 256 puntos y requiera un relleno de 16 ceros. El autoespectro de la señal del extremo cercano se obtiene al tomar el módulo elevado al cuadrado de Y(f), es decir, al formar |Y(f) i2, como se indica en el bloque 350 de la figura.
De manera similar, aquellos bloques de señal del extremo lejano que se reciben entre Ti y T2 milisegundos después de la detección de la voz del extremo cercano se rellenan con ceros y se someten a la FFT 360, que es del mismo tamaño como la FFT 340. Sin embargo, esta señal del dominio de frecuencia, del extremo lejano, se calcula en cada uno de una pluralidad de valores discretos de un retraso de tiempo variable, t, que se sitúa dentro del intervalo de Ti a T?. Los valores t sucesivos se separan, por ejemplo, 160 muestras (2/3 la longitud de un bloque) . La señal del dominio de frecuencia, resultante se denota X(t,f). El autoespectro del extremo lejano (para cada uno de los retrasos discretos t) se forma al tomar el módulo elevado al cuadrado |X(t,f) \ 2 , como se indica en el bloque 370 de la figura. Se forma un espectro cruzado para cada bloque retrasado entre Ti y T2, como se indica en el bloque 380 de la figura. Este espectro cruzado es el producto de la señal de dominio de frecuencia, del extremo cercano, a veces el conjugado complejo de la señal de dominio de frecuencia del extremo lejano. Igual que el autoespectro del extremo lejano, este espectro cruzado YX*(t,f) es dependiente del retraso t. Se actualiza continuamente el conjunto completo de espectros Y(f), X(t,f), y YX*(t,f). De acuerdo con el presente procedimiento corrientemente preferido, se produce una estimación periodogramática, suavizada una vez que cada bloque detectado J de la voz del extremo cercano, con J establecido igual a 25. Cada uno de los periodogramas aperiódicos, resultantes es un promedio, de manera ejemplar un promedio correcto, de los autoespectros y los espectros cruzados sobre los bloques detectados J. Los espectros promedio resultantes se denotan, posteriormente, por SY(f), SX(t,f) y YX* (t, f ) , respectivamente. El promedio de los autoespectros del extremo cercano se muestra en la figura como que toma lugar en el bloque 390, el promedio de los autoespectros del extremo lejano se muestra como que toma lugar en el bloque 400, y el promedio de los espectros cruzados se muestra como que toma lugar en el bloque 410. A fin de incrementar la voz y reducir los requerimientos de memoria de este procedimiento, es ventajoso diezmar los piquetes de frecuencia de los autoespectros y los espectros cruzados. El grado de pérdida que se puede tolerar dependerá de la suavidad espectral esperada de la voz del extremo cercano. En los presentes ensayos corrientes, se usa un factor de pérdida espectral de 2, y una extensión de la banda vocal de 187 - 3187 Hz, pero se cree que puede ser adecuada una banda vocal de 187 - 2000 Hz. En el término de cada secuencia de los bloques de voz del extremo cercano J, se forma una medida de coherencia elevada al cuadrado en cada valor del retraso t, como se indica en el bloque 420 de la figura. Esta medida se expresa por la fórmula : / SYX(t.O C(t,f) - SY(f) x SX(t,f) ' Esta medida de coherencia elevada al cuadrado, normalizada se suma sobre la banda espectrada diezmada de interés, que es corrientemente 187 - 3187 Hz para aplicaciones que se refieren al habla telefónica, para producir una función de energía de coherencia C(t) que depende del retraso de tiempo discreto t. El procedimiento de sumar las frecuencias se indica el bloque 430 de la figura. Como se indica en el bloque 440 de la figura, C(t) luego se somete a un procedimiento para encontrar los valores máximos de la función. Este procedimiento identifica los retrasos en la ruta del eco, EPD, como aquel valor t discreto donde C(t) tiene un valor máximo local. Conforme se reciben los bloques de señales adicionales, se revuelve a calcular la medida de coherencia elevada al cuadrado. Esto permite que el retraso en la ruta del eco, estimado se recorra a través del intervalo de tiempo de conversación. Más de un EPD puede estar presente, y cada un se detecta y recorre a partir de umbrales locales de C(t) que están situados por arriba de un umbral de detección preestablecido. Si se necesita una exactitud más grande en la estimación del retraso o estimaciones de EPD, la función C(t) puede ser calculada por una transformada de Fourier inversa y la estimación por autocorrelación, resultante buscada para las posiciones de tiempo máximo dentro de cada sub-intervalo t discreto. Para los tamaños de bloque y los traslpaes que se han usado, no parece ser necesario llevar a cabo los cálculos del retraso a través de este último paso de transformación a fin de obtener la exactitud suficiente del retraso en EPD. La suma de C (t) es una medida suficiente para probar o detectar el EPD. De manera significante, la determinación que hay al menos un valor máximo local de C(t) es por sí misma una indicación de que el eco está presente. De esta manera, esta técnica de medición del retraso del eco puede por sí misma ser una base para un detector de eco en un sistema de comunicación . La presente invención será útil en varias clases de sistemas de comunicación que sufren del arribo de ecos después de algún retraso. Este retraso incluirá en general un componente debido al tiempo de propagación sobre la ruta del eco. Sin embargo, en ciertas aplicaciones puede haber un componente adicional, y a un dominante, debido al procesamiento de las señales. Los retrasos de este tipo incluyen retrasos de codificación en sistemas de comunicación celulares y en sistemas de teleconferencia. Se cree que la presente invención será útil en estas aplicaciones.
En particular, se cree que la presente invención será útil en unión con aparatos de comunicación de conferencia del extremo lejano, tal como un teléfono del parlante o un sistema e teleconferencia. En este contexto, la presente invención será útil para remover el eco residual debido a la cancelación incompleta del eco en el aparato de comunicación de conferencia. Cuando se usa la presente invención para reducir el eco en las llamadas telefónicas internacionales, un sitio preferido para que tome lugar el procesamiento de señales descrito anteriormente está dentro del centro de conmutación internacional, y en forma preferente en la línea internacional de conexiones en un punto justo más allá (es decir, en el lado internacional de) el intercambio de la vía de entrada. Esto coloca al aparato de procesamiento en un punto de transmisión único para todas las llamadas telefónicas que pasen hacia y desde esa línea de conexión. Cuando se usa la presente invención para reducir el eco en llamadas telefónicas celulares, nacionales, una manera deseable de colocar el aparato de procesamiento es conectarlo a las conexiones de línea que se enlazan a la oficina celular . Cuando la presente invención se usa para reducir el eco en enlaces vía satélite, nacionales, es ventajoso conectar el aparato de procesamiento al canal receptor del satélite. A manera de ilustración, está corriendo un prototipo de trabajo de la invención en un procesador de señales digitales de Analog Devices ADSP-21020. Se debe señalar, sin embargo, que aún los procesadores de señales de una potencia computacional sustancialmente menor, se emplean de una manera útil como máquinas huéspedes para los métodos descritos en la presente.
Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica, la presente invención, es el que resulta claro a partir de la presente descripción de la invención. Habiéndose descrito la invención como antecede se reclama como propiedad lo contenido en las siguientes:

Claims (32)

REIVINDICACIONES
1. Un método para reducir, en las señales de comunicación recibidas por una primera red desde una segunda red (estas señales recibidas se refieren como las señales lejanas), el contenido de energía que se puede atribuir a los ecos, a partir de la segunda red, de las señales transmitidas en la primera red (estas señales transmitidas se refieren como las señales cercanas), el método está caracterizado porque comprende: a) medir un retraso entre las señales cercanas y el arribo de los ecos correspondientes en las señales lejanas; b) procesar una copia de las señales cercanas para crear una señal variable con el tiempo que representa el contenido de energía suavizado de las señales cercanas retrasadas por el retraso medido y atenuadas por una pérdida de transmisión estimada para los ecos, la señal variable con el tiempo se refiere como una plantilla; c) en un procesador no lineal, pasar las señales lejanas sustancialmente sin atenuación si exceden la plantilla; y d) en el procesador no lineal, atenuar las señales lejanas si están situadas dentro de un intervalo definido por abajo de la plantilla.
2. El método de conformidad con la reivindicación 1, caracterizado porque el paso de medición del retraso comprende: evaluar una medida de coherencia en el dominio de frecuencia C(t;f) de las señales cercanas y lejanas, la medida, una función de la frecuencia f y el retraso relativo t entre las señales; sumar la medida C(t;f) sobre una banda de frecuencia de interés, con lo cual se obtiene una función de la energía de coherencia C(t); e identificar un valor máximo local de esta función C (t) .
3. El método de conformidad con la reivindicación 2, caracterizado porque la medida C(t;f) se expresa por: SYX(t;?|2 C(t;f) = SY(0 x SX(t;f) en donde F representa la frecuencia, SY(f) es un autoespectro promediado de la señal cercana, SX(f) es un autoespectro promediado de la señal lejana, y SXY(t;f) es un promedio del espectro cruzado de las señales cercanas y lejanas.
4. Un método para reducir, en las señales de comunicación recibidas por una red local desde una red lejana (estas señales recibidas se refieren como señales lejanas), el contenido de energía que se puede atribuir a los ecos de las señales transmitidas en la red local (estas señales transmitidas se refieren como señales cercanas) , el método está caracterizado porque comprende: a) medir un retraso entre las señales cercanas y el arribo los ecos correspondientes en las señales lejanas; b) analizar las señales lejanas en una pluralidad de componentes de sub-banda de frecuencia que se refieren como señales de sub-banda, lejanas, y analizar las señales cercanas en una pluralidad de componentes de sub-banda de frecuencia, que se refieren como las señales de sub-banda cercanas; c) procesar una copia de cada señal de sub-banda cercana para crear una señal variable con el tiempo que representa el contenido de energía suavizado de la señal de sub-banda cercana retrasada por el retraso medido y atenuada por una pérdida de transmisión estimada para los ecos, la señal variable con el tiempo se refiere como una plantilla; d) en un procesador no lineal, pasar cada señal de sub-banda lejana sustanciamente sin atenuación si excede la plantilla correspondiente; e) en el procesador no lineal, atenuar cada señal de sub-banda lejana si se sitúa dentro de un intervalo definido por abajo de la plantilla correspondiente; y f) sintetizar las señales de sub-bandas lejanas, procesadas no linealmente para formar una señal lejana de banda completa, de eco reducido.
5. El método de conformidad con la reivindicación 4, caracterizado porque el paso de medición del retraso comprende: evaluar una medida de coherencia en el dominio de frecuencia C(t;f) de las señales cercanas y lejanas, la medida una función de la frecuencia f y el retraso relativo t entre las señales; sumar la medida C(t;f) sobre una banda de frecuencia de interés, con lo cual se obtiene una función de la energía de coherencia C(t); e identificar un valor máximo local de la función C (t) .
6. El método de conformidad con la reivindicación 5, caracterizado porque la medida C(t;f) se expresa por: SYX(t; 2 C(t;f) " SY(f)?SX(x;f)' en donde f representa la frecuencia, SY(f) es un autoespectro promediado de la señal cercana, SX(f) es un autoespectro promediado de la señal lejana, y SXY(t;f) es un promedio del espectro cruzado de las señales cercanas y lejanas.
7. El método de conformidad con la reivindicación 4, caracterizado porque: el método comprende además el paso de ajustar, para cada señal de sub-banda lejana, un nivel de ruido que en cada momento de interés es menor o igual a la señal de la plantilla correspondiente; y para cada señla de sub-banda, lejana, se llevan a cabo los pasos (d) y (e) , tal que la señal no se atenúe si cae por abajo del nivel de ruido.
8. El método de conformidad con la reivindicación 1 , caracterizado porque para cada señal de sub-banda, lejana, el paso de ajustar el nivel de ruido correspondiente, comprende: adquirir una envoltura de energía de la señal de sub-banda, lejana; y suavizar la envoltura en un procedimiento de promediado que da valor a los valles más pesadamente que a los picos.
9. El método de conformidad con la reivindicación 8, caracterizado porque además comprende el paso de probar la presencia de la energía de la señal lejana, y en donde el paso de adquirir una envoltura de energía de cada señal de sub-banda lejana se lleva a cabo solo cuando no se detecta una energía significante de la señal lejana.
10. El método de conformidad con la reivindicación 7, caracterizado porque el paso de atenuación comprende la limitación de la señal de sub-banda, lejana, a un nivel predeterminado.
11. El método de conformidad con la reivindicación 10, caracterizado porque el nivel predeterminado es sustancialmente igual al nivel de ruido .
12. El método de conformidad con la reivindicación 10, caracterizado porque: el paso de atenuación comprende además mezclar la señal de sub-banda lejana, limitada con un componente de ruido; el componente de ruido tiene un espectro de frecuencia sustancialmente plano dentro de la sub-banda pertinente; y el paso de mezclado se lleva a cabo tal que el nivel de la señal mezclada resultante es sustancialmente igual al nivel de ruido.
13. En un sistema de comunicación en el cual las transmisiones, que se refieren como la voz lejana, a partir de un enviador en una ubicación lejana se insertan por el enviador en una red lejana y luego se reciben como señales lejanas de la red lejana por una red local, un método para reducir el contenido de energía de las señales lejanas que se puede atribuir a los ecos de las señales transmitidas en la red locales (estas señales transmitidas se refieren como señales cercanas), el método está caracterizado porque comprende: a) medir un retraso entre las señales cercanas y el arribo de los ecos correspondientes en las señales lejanas; b) probar la energía en las señales lejanas que se puede atribuir a la voz lejana, ajustando un indicador a un estado de NEGAR cuando se detecta la energía, y ajustar el indicador a un estado de PERMITIR cuando no se detecta la energía; c) analizar las señales lejanas en una pluralidad de componentes de sub-banda de frecuencia que se refieren como señales de sub-banda lejanas, y analizar las señales cercanas en una pluralidad de componentes de sub-banda de frecuencia, que se refieren como las señales de sub-banda cercanas; d) procesar una copia de cada señal de sub-banda cercana para crear una señal variable con el tiempo que representa el contenido de energía suavizado de la señal de sub-banda cercana retrasada por el retraso medido y atenuada por una pérdida de transmisión estimada para los ecos, la señal variable con el tiempo se refiere como una plantilla; e) pasar cada señal de sub-banda lejana a través de un procesador no lineal sustancialmente sin atenuación si la señal excede la plantilla correspondiente; f) pasar cada señal de sub-banda lejana a través del procesador no lineal con atenuación si la señal está situada dentro de un intervalo definido por abajo de la plantilla correspondiente; y g) sintetizar las señales de sub-banda, lejanas, pasadas, para formar una señal lejana, de banda completa, de eco reducido; en donde h) los pasos (c) - (g) se llevan a cabo solo cuando el indicador se ajusta al estado de PERMITIR.
14. El método de conformidad con la reivindicación 13, caracterizado porque cada señal de sub-banda lejana, después de pasar a través del procesador no lineal, se subdivide en bloques plurales, cada bloque que tiene una duración en el intervalo de 10-20 ms, y cada bloque que comprende una pluralidad de muestras de señal, un método que comprende además, después de los pasos establecidos, los pasos de: si se detecta la voz lejana durante un intervalo de tiempo que correponde a cualquier bloque, restaurar todas las muestras en ese bloque a sus amplitudes antes de los pasos establecidos; y si no se detecta la voz lejana durante un intervalo de tiempo que corresponde a cualquier bloque, atenuar todas las muestras en ese bloque que representan los picos aislados de la amplitud de la señal .
15. Un método para reducir, en las señales recibidas por un usuario de teléfono local a partir de un dispositivo de comunicación de conferencia en una ubicación lejana (estas señales recibidas que se refieren como las señales lejanas), el contenido de la energía que se puede atribuir a los ecos de la voz del usuario local que se regresan al usuario local debido a la cancelación incompleta del eco en el dispositivo de comunicación de conferencia, el método está caracterizado porque comprende: a) medir un retraso entre las señales transmitidas en la red telefónica por el usuario local (estas señales transmitidas se refieren como señales cercanas) y el arribo de los ecos correspondientes en las señales lejanas; b) procesar una copia de las señales cercanas para crear una señal variable con el tiempo que representa el contenido de energía suavizado de las señales cercanas retrasadas por el retraso medido y atenuadas por una pérdida de transmisión estimada para los ecos, la señal variable con el tiempo se refiere como una plantilla; c) en un procesador no lineal, pasar las señales lejanas sustancialmente sin atenuación si exceden la plantilla; y d) en el procesador no lineal, atenuar las señales lejanas si están situadas dentro de un intervalo definido por abajo de la plantilla.
16. Un aparato para reducir, en las señales de comunicación recibidas por una primera red desde una segunda red (estas señales recibidas se refieren como señales lejanas), el contenido de energía que se puede atribuir a los ecos, a partir de la segunda red, de las señales transmitidas en la primera red (estas señales transmitidas que se refieren como señales cercanas), caracterizado porque comprende: a) un medio para medir un retraso entre las señales cercanas y el arribo de los ecos correspondientes en las señales lejanas; b) un medio para recibir una copia de las señales cercanas y para procesar la copia para crear una señal de salida variable con el tiempo, que se refiere como una plantilla, que representa el contenido de energía suavizado de las señales cercanas retrasadas por el retraso medido y atenuadas por una pérdida de atenuación estimada para los ecos; y c) un procesador no lineal adaptado para pasar señales lejanas sustancialmente sin atenuación si exceden la plantilla y para atenuar las señales lejanas si están situadas dentro de un intervalo definido por abajo de la plantilla.
17. El aparato de conformidad con la reivindicación 16, caracterizado porque el medio de medición del retraso comprende: un medio para evaluar una medida de coherencia en el dominio de frecuencia C(t;f) de las señales cercanas y lejanas, la medida una función de frecuencia f y el retraso relativo t entre las señales; un medio para sumar la medida C(t;f) sobre una banda de frecuencia de interés, con lo cual se obtiene una función de la energía de coherencia C(t); y un medio para identificar un valor máximo local de la función C(t).
18. Un aparato para reducir, en señales de comunicación recibidas por una red local desde una red lejana (estas señales recibidas que se refieren como señales lejanas), el contenido de energía que se puede atribuir a los ecos de las señales transmitidas en la red local (estas señales transmitidas que se refieren como señales cercanas), caracterizado porque comprende: a) un medio para medir un retraso entre las señales cercanas y el arribo de los ecos correspondientes en las señales lejanas; b) un medio para analizar las señales lejanas en una pluralidad de componentes de sub-banda de frecuencia que se refieren como las señales de sub-banda lejanas, y analizar las señales cercanas en una pluralidad de componentes de sub-banda, de frecuencia que se refieren como señales de sub-banda cercanas; c) un medio para recibir una copia de cada señal de sub-banda cercana y para procesar cada copia para crear una señal de salida variable con el tiempo, que se refiere como una plantilla, que representa el contenido de energía suavizado de la señal de sub-banda cercana retrasada por el retraso medido y atenuada por una pérdida de transmisión, estimada para los ecos; d) un procesador no lineal, adaptado para pasar cada señal de sub-banda lejana sustancialmente sin atenuación si excede la plantilla correspondiente y para atenuar cada sub-señal de sub-banda lejana si se sitúa dentro de un intervalo definido por abajo de la plantilla correspondiente; y e) un medio para sintetizar las señales de sub-banda lejanas procesadas de manera no lineal para formar una señal lejana de banda completa con eco reducido.
19. El aparato de conformidad con la reivindicación 18, caracterizado porque: el aparato comprende además un medio para ajustar, para cada señal de sub-banda lejana, un nivel de ruido que en cada momento de interés es menos o igual a la señal de plantilla correspondiente; y el procesador no lineal se adapta para pasar cada señal de sub-banda lejana sustancialmente sin atenuación si cae por abajo del nivel de ruido.
20. El aparato de conformidad con la reivindicación 19, caracterizado porque el procesador no lineal se adapta para atenuar las señales de subbanda lejanas al limitar las señales a un nivel predeterminado .
21. El aparato de conformidad con la reivindicación 20, caracterizado porque el nivel predeterminado es sustancialmente igual al nivel de ruido.
22. El aparato de conformidad con la reivindicación 20, caracterizado porque además comprende un medio para mezclar cada señal de sub-banda lejana, limitada con un componente de ruido que tiene un espectro de frecuencia sustancialmente plano dentro de la sub-banda pertinente, tal que el nivel de la señal mezclada, resultante es sustancialmente igual al nivel de ruido.
23. Un aparato para reducir, en las señales recibidas por un usuario telefónico local a partir de un dispositivo de comunicación de conferencia en una ubicación lejana (estas señales recibidas se refieren como señales lejanas) el contenido de energía que se puede atribuir a los ecos de la voz del usuario local que se regresan al usuario local debido a la cancelación incompleta del eco en el dispositivo de comunicación de transferencia caracterizado porque comprende: a) un medio para medir un retraso entre las señales transmitidas en la red telefónica por el usuario local (estas señales trnasmitidas se refieren como señales cercanas) y el arribo de los ecos correspondientes en las señales lejanas; b) un medio para recibir una copia de las señales cercanas y para procesar la copia para crear una señal de salida variable con el tiempo, que se refiere como una plantilla, que representa el contenido de energía suavizado de las señales cercanas retrasadas por el retraso medido y atenuadas por la pérdidad de transmisión estimada para los ecos; y c) un procesador no lineal, adaptado para pasar las señales lejanas substancialmente sin atenuación si excenden la plantilla y atenuar las eñales lejanas si están situadas dentro de un intervalo definido por abajo de la pl anti lia.
24. Un sistema de comunicación, caracterizado Dorque comprende: una primera red y una segunda red conectadas a través de un medio de comunicación, en donde las señales de comunicación, que se refieren como las señales lejanas, se reciben por la primera red de comunicación a partir de la segunda red de comunicación, las señales de comunicación, que se ref ieren como señales cercanas, se transmiten en la pi era red; y porque comprende además un aparato para reducir el contenido de energía de las señales lejanas que se puede atribuir a los ecos, de la segunda red, de las señales cercanas, en donde el aparato comprende a) un medio para medir un retraso entre las señales cercanas y el arribo de los ecos correspondientes en las señales lejanas; b) un medio para recibir una copia de las señales cercanas y para procesar la copia para crear una señal de salida variable con el tiempo, que se refiere como una plantilla, que representa el contenido de enrgía suavizado de las señales cercanas retrasadas por el retraso medido y atenuadas por la pérdida de transmisión estimada para los ecos; y c) un procesador no lineal adaptado para pasar las señales lejanas substancialmente sin atenuación si exceden la plantilla y para atenuar las señales lejanas si están situadas dentro de un intervalo definido por abajo de 1 a planti lia.
25. El sistema de comunicación de conformidad con la reivindicación 24, caracterizado porque las señales de comunicación son señales telefónicas, y la primera y la segunda red son redes telefónicas.
26. El sistema de comunicación de conformidad con la reivindicación 25, caracterizado porque al menos la primera red telefónica es una red telefónica celular.
27. El sistema de comunicación de conformidad con la reivindicación 25, caracterizado porque al menos la segunnda red telefónica es una red telefónica celular.
28. El sistema de comunicación de conformidad con la reivindicación 25, caracterizado porque la primera y la segunda red están interconecatadas por un enlace vía satél ite.
29. El sistema de comuni a ión a conformidad con la reivindicación 25, caracterizado porque la primera y la segunda red están interconectadas por una línea de conexión internacional.
30. En un sistema de comunicación que comprende una primera y una segunda red conectadas por un medio de transmisión, en donde las señales, que se refieren como loas señales cercanas, se transmiten en la primera red, y las señales, que se refieren como las señales lejanas, se reciben por la primera red a partir de la segunda red, un método para detectar los ecos de las señales cercanas que se regresan a la primera red por la segunda red, el método está caracterizado porque comprende: evaluar una medida de coherencia en el dominio de frecuencias C(t;f) de las señales cercanas y lejanas, la medida una función de la frecuencia f y de un retraso t relativo entre las señales; sumar la medida C(**;f) sobre una banda de frecuencia de interés, con lo cual se obtiene una función de energía de coherencia C(t); y identificar un valor máximo local de la función C(t) .
31. El método de conformidad con la reivindicación 30, caracterizado porque la medida C (HT; f ) se expresa por: SYX(t;Q c<t;f) ~ SY(0 * SX(t;f)' en donde f representa la frecuencia, SY(f) es un auto-espectro promediado de las señales cercanas, SX(f) es un autoespectro promediado de la señal lejana, y SXY( ;f) es un promedio del espectro cruzado de las señales cercanas y lejanas.
32. Aparato para detectar ecos en un sis-tema de comunicación que comprende una primera y una segunda red conectadas por un medio de transmisión, en donde: las señales, que se refieren como señales cercanas, se transmiten en la primera red, las señales, que se refieren como las señales lejanas, se reciben por la primera red desde la segunda red; y los ecos de las señales cercanas que se regresan a la primera red por la segunda red, el aparato esta caracterizado porque comprende: un medio para evaluar una medida de coherencia en el dominio de frecuencia C(t;f) de las señales cer-canas y lejanas, la medida una función de la frecuencia f y un retraso relativo t entre las señales: un medio para sumar la medida C(t;f) sobre una banda de frecuencia de interés, con lo cual se obtiene una función de energía de coherencia C ( r) ; y un medio para identificar un valor máximo local de la función C(r).
MXPA/A/1996/005354A 1995-03-03 1996-11-04 Metodo y aparato para reducir el eco residual del extremo lejano en redes de comunicacion de voz MXPA96005354A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US398272 1995-03-03
US08/398,272 US5587998A (en) 1995-03-03 1995-03-03 Method and apparatus for reducing residual far-end echo in voice communication networks
PCT/US1996/000391 WO1996027951A1 (en) 1995-03-03 1996-01-11 Method and apparatus for reducing residual far-end echo in voice communication networks

Publications (2)

Publication Number Publication Date
MX9605354A MX9605354A (es) 1998-05-31
MXPA96005354A true MXPA96005354A (es) 1998-10-23

Family

ID=

Similar Documents

Publication Publication Date Title
US5587998A (en) Method and apparatus for reducing residual far-end echo in voice communication networks
EP1298815B1 (en) Echo processor generating pseudo background noise with high naturalness
US6574336B1 (en) Echo suppressor and non-linear processor of echo canceller
US8335319B2 (en) Double talk detection method based on spectral acoustic properties
EP1927192B1 (en) Method for measuring speech intelligibility
AU680981B2 (en) Method for determining the location of echo in an echo cancellar
BG98780A (bg) Устройство за елиминиране на ехо
JP2000502520A (ja) エコー消去のためのスペクトルノイズ補償方法
JPH06338829A (ja) 通信システム内の反響除去方法と装置
US6785382B2 (en) System and method for controlling a filter to enhance speakerphone performance
Yasukawa et al. An acoustic echo canceller using subband sampling and decorrelation methods
US8369511B2 (en) Robust method of echo suppressor
US7787597B1 (en) Automated tools for testing echo cancellers using natural speech excitations
US7711107B1 (en) Perceptual masking of residual echo
JP2002503910A (ja) 雑音環境におけるフィルタ適応化の制御方法および装置
MXPA96005354A (es) Metodo y aparato para reducir el eco residual del extremo lejano en redes de comunicacion de voz
US7023986B2 (en) Echo canceller in a communication system at a terminal
Jia et al. Subband doubletalk detector for acoustic echo cancellation systems
JPH11150491A (ja) 回線レベル制御装置及びこれを有するエコーキャンセル装置
CN101286763A (zh) 一种有效的回波抑制器