ES2965954T3 - Método y aparato de cancelación de eco basados en estimación de retardo de tiempo - Google Patents

Método y aparato de cancelación de eco basados en estimación de retardo de tiempo Download PDF

Info

Publication number
ES2965954T3
ES2965954T3 ES18869573T ES18869573T ES2965954T3 ES 2965954 T3 ES2965954 T3 ES 2965954T3 ES 18869573 T ES18869573 T ES 18869573T ES 18869573 T ES18869573 T ES 18869573T ES 2965954 T3 ES2965954 T3 ES 2965954T3
Authority
ES
Spain
Prior art keywords
reference signal
delay
value
signal
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18869573T
Other languages
English (en)
Inventor
Mingzi Li
Feng Ma
Haikun Wang
Zhiguo Wang
Guoping Hu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Application granted granted Critical
Publication of ES2965954T3 publication Critical patent/ES2965954T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/004Monitoring arrangements; Testing arrangements for microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02163Only one microphone

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

Un método y aparato de cancelación de eco basado en la estimación del retardo de tiempo. El método comprende: adquirir señales de micrófono y señales de referencia y preprocesar las mismas (101); determinar señales de puntos de frecuencia con una condición no lineal en las señales de micrófono preprocesadas y señales de referencia en un escenario de cancelación de eco actual (102); según señales puntuales de frecuencia sin una condición no lineal en las señales de micrófono y las señales de referencia, obteniendo, mediante cálculo, un valor de estimación del retardo de tiempo actual (103); mover las señales de referencia basándose en el valor de estimación del retardo de tiempo actual (104); y según las señales de micrófono preprocesadas y las señales de referencia movidas, actualizar un filtro autoadaptativo para realizar la cancelación de eco (105). La presente invención puede mejorar la precisión de la estimación del retardo de tiempo y mejorar el efecto de cancelación de eco. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Método y aparato de cancelación de eco basados en estimación de retardo de tiempo
Campo
La presente divulgación se refiere al campo del procesamiento de señales, y en particular a un método de cancelación de eco basado en estimación de retardo y un aparato de cancelación de eco basado en estimación de retardo.
Antecedentes
Con el desarrollo continuo de la tecnología de la información, diversos tipos de hardware inteligente distribuido se utilizan cada vez más en diversos campos. La cancelación de eco es necesaria en la interacción entre dispositivos inteligentes, que es un punto crítico de investigación en la técnica.
La cancelación de eco es un procesamiento de cancelación o eliminación de una señal de sonido de extremo lejano captada por un micrófono local para evitar el retorno del sonido de extremo lejano. Un esquema de cancelación de eco típico existente se basa en la estimación de retardo. Se calcula la correlación lineal entre una señal de referencia y una señal de micrófono. Un retardo que corresponde a una correlación cruzada máxima se selecciona como un retardo de dispositivo. La señal de referencia se desplaza basándose en el retardo del dispositivo. Un filtro adaptativo se actualiza basándose en la señal de referencia desplazada y la señal de micrófono, para generar una señal que se aproxima a un eco real. La señal que se aproxima al eco real se resta de la señal del micrófono, para lograr la cancelación de eco. Por ejemplo, un aparato de hardware inteligente distribuido con autorización de autooperación no puede volver a muestrear sincrónicamente la señal de referencia y la señal de micrófono. Por ejemplo, en una casa normal, se usa una caja de televisión para controlar un televisor. La caja de televisión y el televisor normalmente los proporcionan diferentes fabricantes. Por ejemplo, un fabricante de la caja de televisión diseña la función de control de sonido de la caja de televisión para realizar la cancelación de eco de un sonido reproducido por la televisión, pero sin embargo solo tiene autorización de operación de la caja de televisión. Es decir, la caja de televisión solo puede adquirir una señal de origen transmitida por la caja de televisión a la televisión y una señal recopilada por un micrófono de la caja de televisión. En este caso, la señal de origen transmitida por la caja de televisión al televisor sirve como la señal de referencia. La señal recogida por el micrófono de la caja de televisión sirve como señal de micrófono. La caja de televisión no puede volver a muestrear sincrónicamente la señal de altavoz y la señal de micrófono. Por lo tanto, se requiere estimar un retardo entre la señal de referencia y la señal del micrófono, para lograr la cancelación de eco basándose en el retardo.
Puede observarse que la precisión de la estimación de retardo afecta directamente al efecto de la cancelación de eco. Debido al entorno complejo y cambiante de las aplicaciones prácticas, se produce un gran error en un valor de estimación de retardo adquirido con la tecnología de cancelación de eco convencional basada en la estimación de retardo. Por lo tanto, se desea mejorar el efecto de cancelación de eco.
La publicación de solicitud de patente de Estados Unidos US20160127527A1 proporciona un controlador para un cancelador de eco acústico. El controlador incluye un estimador de ruido configurado para estimar un nivel de ruido que está comprendido en una señal de micrófono en relación con un componente de eco, estimado por el cancelador de eco acústico, comprendida en la señal del micrófono. El controlador incluye adicionalmente un módulo de control configurado para controlar el cancelador de eco acústico dependiendo de esa estimación.
La patente estadounidense US 7792281 B1 proporciona un método de identificación de señales, que comprende recibir una señal entrante que tiene tramas entrantes, recibir una señal saliente que tiene tramas salientes, extraer características salientes de una trama actual de las tramas salientes, extraer características entrantes de una primera trama previa de las tramas entrantes, calcular las primeras distancias de características basándose en las características salientes y entrantes correspondientes, derivar una primera puntuación basándose en las primeras distancias de características, extraer características entrantes de una segunda trama anterior de las tramas entrantes, calcular segundas distancias de características basándose en características salientes correspondientes y características entrantes desde la segunda trama anterior; derivar una segunda puntuación basándose en las segundas distancias de características, y determinar si la señal saliente incluye la señal entrante basándose en la primera puntuación y la segunda puntuación.
La publicación de solicitud de patente CN CN105872156A proporciona un método de seguimiento de retardo de tiempo de eco. El método comprende: adquirir una señal de referencia de trama actual y una señal de adquisición de trama actual; reconocer información sobre un punto de frecuencia de relación señal a ruido objetivo en la señal de adquisición de trama actual, en donde el punto de frecuencia de relación señal a ruido objetivo es un punto de frecuencia de relación señal a ruido mayor que un primer umbral preestablecido; cuando se determina que la señal de adquisición de trama actual es una señal de trama efectiva que se ajusta a una condición preestablecida de acuerdo con la información sobre el punto de frecuencia de relación señal a ruido objetivo, realizar cálculo de correlación mutua en la señal de referencia de trama actual y la señal de adquisición de trama actual para la parte de señal que corresponde al punto de frecuencia de relación señal a ruido objetivo; y adquirir un valor de retardo de tiempo de eco de acuerdo con el resultado de cálculo de correlación mutua.
Sumario
Se proporciona un método de cancelación de eco basado en estimación de retardo y un aparato de cancelación de eco basado en estimación de retardo de acuerdo con realizaciones de la presente divulgación, para reducir un error de estimación de retardo y mejorar un efecto de cancelación de eco.
Por lo tanto, se proporcionan las siguientes soluciones técnicas de acuerdo con la presente divulgación.
Un método de cancelación de eco basado en estimación de retardo incluye: recibir una señal de micrófono y una señal de referencia, y preprocesar la señal de micrófono y la señal de referencia para transformar la señal de referencia y la señal de micrófono de un dominio de tiempo en un dominio de frecuencia; determinar, en la señal de micrófono preprocesada y la señal de referencia preprocesada, señales de punto de frecuencia con no linealidad en un escenario de cancelación de eco actual; calcular un valor de estimación de retardo actual basándose en señales de punto de frecuencia sin no linealidad en la señal de micrófono y la señal de referencia; desplazar la señal de referencia basándose en el valor de estimación de retardo actual; y actualizar un filtro adaptativo basándose en la señal de micrófono preprocesada y la señal de referencia desplazada, para realizar la cancelación de eco.
En una realización, la determinación, en la señal de micrófono preprocesada y la señal de referencia preprocesada, las señales de punto de frecuencia con no linealidad en un escenario de cancelación de eco actual incluyen una o más de una detección de señal de extremo lejano, una detección de señal de extremo dual y una detección de no linealidad provocada por el hardware del dispositivo. En la detección de señal de extremo lejano, las señales de punto de frecuencia con no linealidad se determinan basándose en una o más de energía, una tasa de cruce por cero y una amplitud a corto plazo de la señal de referencia preprocesada. En la detección de señal de extremo dual, las señales de punto de frecuencia con no linealidad se determinan basándose en una relación de energía de la señal de micrófono preprocesada a la energía de la señal de referencia preprocesada. En la detección de la no linealidad provocada por el hardware del dispositivo, en primer lugar, se calcula un valor medio de correlación entre la señal de referencia y la señal de micrófono en un rango de baja frecuencia. Entonces, se calculan los valores medios de correlación entre la señal de referencia y la señal de micrófono en otros intervalos de frecuencia en un intervalo de frecuencia predeterminado. Finalmente, las señales de punto de frecuencia con no linealidad se determinan basándose en los valores medios de correlación en los otros rangos de frecuencia y el valor medio de correlación en el rango de baja frecuencia.
En una realización, el cálculo de un valor de estimación de retardo actual basándose en señales de punto de frecuencia sin no linealidad en la señal de micrófono y la señal de referencia incluye: para cada uno de las tramas de la señal de micrófono en un rango de análisis de retardo, seleccionar señales de punto de frecuencia sin no linealidad en la señal de referencia y la trama de la señal de micrófono, y calcular un valor de correlación cruzada entre la señal de referencia y la trama de la señal de micrófono; y determinar el valor de estimación de retardo basándose en valores de correlación cruzada calculados entre la señal de referencia y las tramas de la señal de micrófono.
En una realización, la determinación del valor de estimación de retardo basándose en valores de correlación cruzada calculados entre la señal de referencia y las tramas de la señal de micrófono incluye: seleccionar una posición correspondiente a una trama de la señal de micrófono con un valor de correlación cruzada máximo entre la correlación cruzada calculada valores entre la señal de referencia y las tramas de la señal de micrófono como una posición de retardo actual; y determinar el valor de estimación de retardo actual basándose en la posición de retardo actual y una posición de la señal de referencia.
En una realización, la determinación del valor de estimación de retardo actual basándose en valores de correlación cruzada calculados entre la señal de referencia y las tramas de la señal de micrófono incluye: seleccionar, en cada estimación de retardo, una posición que corresponde a una trama de la señal de micrófono con un valor de correlación cruzada máximo entre los valores de correlación cruzada calculados entre la señal de referencia y las tramas de la señal de micrófono en el rango de análisis de retardo como una posición de retardo candidata; y asignar posiciones de retardo candidatas en una matriz L-dimensional Sa, en donde L es igual a un número total de tramas de la señal de micrófono en el rango de análisis de retardo, y contar el número de veces que una posición de retardo candidata se repite continuamente; aumentar un valor para una posición de retardo candidata actual en un primer valor preestablecido t1, disminuir un valor para una posición de retardo candidata anterior en un segundo valor preestablecido t2, y disminuir los valores para otras posiciones en un tercer valor preestablecido t3, si se cambia la posición de retardo candidata actual; aumentar el valor para la posición de retardo candidata actual en el primer valor preestablecido t1, y disminuir los valores para otras posiciones en el tercer valor preestablecido t3, si la posición de retardo candidata actual no se cambia, donde el segundo valor preestablecido t2 es menor o igual que el tercer valor preestablecido t3; y determinar el valor de estimación de retardo actual basándose en la posición de retardo candidata actual y una posición de la señal de referencia, si el valor para la posición de retardo candidata actual es mayor que un primer umbral y el número de veces que la posición de retardo candidata actual se repite continuamente es mayor que un segundo umbral.
En una realización, el desplazamiento de la señal de referencia basándose en el valor de estimación de retardo actual incluye: no desplazar los datos de la señal de referencia en un caso en el que el valor de estimación de retardo actual D-i(t) es menor o igual que un tercer umbral T3; desplazar los datos de la señal de referencia en D-i(t)/2 en caso de que el valor de estimación de retardo actual Di(t) es mayor que el tercer umbral T3 y menor que un cuarto umbral T4; y desplazar los datos de la señal de referencia en Di(t) en caso de que el valor de estimación de retardo actual Di(t) es mayor o igual que el cuarto umbral T4.
En una realización, la determinación del valor de estimación de retardo basándose en valores de correlación cruzada calculados entre la señal de referencia y las tramas de la señal de micrófono incluye determinar que se cumplen una o más de las siguientes condiciones: (1) un valor de correlación cruzada C(t) correspondiente a una posición de retardo actual es mayor que un valor de correlación cruzada C(t-1) correspondiente a una posición de retardo anterior; (2) para cada trama en un rango de análisis de retardo actual, una diferencia entre una posición correspondiente a un valor máximo de correlación cruzada Cmáx(t) y una posición correspondiente a una correlación cruzada mínima Cmin(t) es mayor que una primera diferencia preestablecida; (3) una diferencia entre un valor medio Cmedia(t) de los valores de correlación cruzada entre la señal de referencia y las tramas de la señal de micrófono en el rango de análisis de retardo y el valor de correlación cruzada C(t) correspondiente a la posición de retardo actual es mayor que una segunda diferencia preestablecida; y (4) la posición de retardo actual p(t) es menor que una posición de retardo anterior p(t-1).
En una realización, el método incluye adicionalmente: almacenar en caché datos de una señal de referencia histórica; y desplazar los datos almacenados en caché de la señal de referencia histórica conjuntamente cuando se desplaza la señal de referencia.
En una realización, el método incluye además: si el valor de estimación de retardo actual es menor que una longitud del filtro adaptativo, la actualización del filtro adaptativo incluye: desplazar un coeficiente de filtro adaptativo basándose en el valor de estimación de retardo y actualizar el filtro adaptativo basándose en el coeficiente de filtro adaptativo desplazado, donde se restablece un coeficiente en una posición que no tiene valor después del desplazamiento, y el filtro adaptativo se actualiza basándose en un coeficiente de filtro adaptativo restablecido.
Un dispositivo de cancelación de eco basado en la estimación de retardo incluye un procesador, una memoria y un bus de sistema. El procesador está conectado a la memoria a través del bus de sistema. La memoria almacena uno o más programas que incluyen instrucciones que, cuando es ejecutado por el procesador, controlar el procesador para realizar cualquiera de los métodos de cancelación de eco anteriores basándose en la estimación de retardo.
Un medio de almacenamiento legible por ordenador almacena instrucciones que, cuando se ejecutan por un dispositivo terminal, controla el dispositivo terminal para realizar cualquiera de los métodos de cancelación de eco anteriores basándose en la estimación de retardo.
Un producto de programa de ordenador, cuando se ejecutan por un dispositivo terminal, controla el dispositivo terminal para realizar cualquiera de los métodos de cancelación de eco anteriores basándose en la estimación de retardo.
Con el método de cancelación de eco y el aparato de cancelación de eco de acuerdo con las realizaciones de la presente divulgación, se detectan puntos de frecuencia con no linealidad en la señal de micrófono y la señal de referencia. Se calcula un valor de estimación de retardo actual basándose en señales de punto de frecuencia sin no linealidad en la señal de micrófono y la señal de referencia. Es decir, se estima un retardo entre la señal de referencia y la señal de micrófono sin no linealidad, de modo que el valor de estimación de retardo sea más preciso. Entonces, la señal de referencia se desplaza basándose en el valor de estimación de retardo actual. El filtro adaptativo se actualiza basándose en la señal de micrófono y la señal de referencia desplazada, para realizar la cancelación de eco, mejorando así eficazmente el efecto de la cancelación de eco.
Adicionalmente, en la estimación de retardo, el valor de estimación de retardo se corrige basándose en diversas condiciones robustas, de modo que el retardo estimado sea más robusto.
Adicionalmente, en el proceso de actualización del filtro adaptativo, almacenando en caché y desplazando los datos de la señal de referencia histórica, y restableciendo un coeficiente de filtro que no tiene magnificencia de referencia, se puede reducir un período de tiempo para la reconvergencia del filtro provocada por un cambio del retardo, reduciendo así una influencia de la reconvergencia en el rendimiento de la cancelación de eco.
Breve descripción de los dibujos
Con el fin de ilustrar de manera más clara las soluciones técnicas de las realizaciones de la presente divulgación o de la tecnología convencional, los dibujos que se utilizarán en las realizaciones se describen brevemente a continuación. Aparentemente, los dibujos en la siguiente descripción muestran únicamente algunas realizaciones de la presente divulgación y que los expertos en la materia pueden obtener otros dibujos a partir de los dibujos.
La figura 1 es un diagrama de flujo de un método de cancelación de eco basado en estimación de retardo de acuerdo con una realización de la presente divulgación;
La figura 2 es un diagrama esquemático que muestra una comparación entre una realización de la presente divulgación en la que una señal de referencia histórica se desplaza conjuntamente y la tecnología convencional en la que solo se desplaza la señal de referencia actual;
La figura 3 es un diagrama esquemático que muestra una comparación entre la tecnología convencional y una realización de la presente divulgación en la que se restablece un coeficiente de filtro de error cuando se actualiza el filtro;
La figura 4 es un diagrama de bloques esquemático de un aparato de cancelación de eco basado en estimación de retardo de acuerdo con una realización de la presente divulgación; y
La figura 5 es un diagrama de bloques esquemático de un aparato de cancelación de eco basado en estimación de retardo de acuerdo con otra realización de la presente divulgación.
Descripción detallada de las realizaciones
Las realizaciones de la presente divulgación se describen adicionalmente en detalle a continuación con referencia a los dibujos e implementaciones adjuntos, de modo que los expertos en la materia puedan comprender mejor las soluciones técnicas de acuerdo con las realizaciones de la presente divulgación.
En aplicaciones prácticas, la no linealidad a menudo se produce en un proceso de cancelación de eco. Muchos casos, como alto volumen, potencia de batería insuficiente, ausencia de señal de extremo lejano, es decir, ausencia de señal de referencia y habla dual, es decir, se incluyen tanto el sonido humano como el sonido del altavoz, puede dar como resultado la no linealidad de una señal de sonido, lo que puede provocar un error de correlación cruzada calculado para la estimación de retardo y, finalmente, dar como resultado un efecto deficiente de cancelación de eco. En vista de esto, se proporciona un método de cancelación de eco basado en estimación de retardo y un aparato de cancelación de eco basado en estimación de retardo de acuerdo con las realizaciones de la presente divulgación. Al determinar un retardo, se eliminan los puntos de frecuencia con no linealidad. Se determina un valor de estimación de retardo basándose en señales de punto de frecuencia sin no linealidad en la señal de micrófono y la señal de referencia, para obtener un valor de estimación de retardo preciso. Por lo tanto, la cancelación de eco realizada basándose en este valor de estimación de retardo puede tener un mejor efecto.
Haciendo referencia a la figura 1, que es un diagrama de flujo de un método de cancelación de eco basado en la estimación de retardo de acuerdo con una realización de la presente divulgación. El método incluye las siguientes etapas 101 a 105.
En la etapa 101, se reciben y preprocesan una señal de micrófono y una señal de referencia.
La señal de micrófono es una señal digital adquirida por un micrófono para recoger una señal de voz y sometida a conversión A/D. La señal de referencia es una señal de origen a cancelar por la cancelación de eco, que también es una señal digital. Tomando un caso en el que la cancelación de eco se realiza en una caja de televisión como ejemplo, para un fabricante de la caja de televisión, la señal de referencia es una señal de origen transmitida por la caja de televisión al televisor o una señal de altavoz de televisión generalmente utilizada en la tecnología convencional, que no están limitados en el presente documento.
El preprocesamiento incluye principalmente encuadre, la creación de ventanas y la transformada rápida de Fourier y similares, y se realiza para transformar la señal de referencia y la señal de micrófono en un dominio de tiempo en señales respectivas en un dominio de frecuencia.
En la etapa 102, se determinan las señales de punto de frecuencia con no linealidad en la señal de micrófono preprocesada y la señal de referencia preprocesada en un escenario de cancelación de eco actual.
En vista de la diversidad de entornos de aplicación reales y hardware de dispositivo, se pueden usar los siguientes métodos de detección diferentes para determinar las señales de punto de frecuencia con no linealidad.
(1) Detección de señal de extremo lejano
Las señales de punto de frecuencia con no linealidad se determinan basándose en una o más de energía, una tasa de cruce por cero y una amplitud a corto plazo de la señal de referencia preprocesada. Por ejemplo, si la energía Px de una señal de referencia x en un punto de frecuencia es mayor que un umbral de energía preestablecido, se determina que se produce no linealidad en una señal de punto de frecuencia en este punto de frecuencia.
(2) Detección de señal de extremo dual
Las señales de punto de frecuencia con no linealidad se determinan basándose en una relación de energía de la señal de micrófono preprocesada a la energía de la señal de referencia preprocesada.
Específicamente, se calculan energía de suavizado Px de la señal de referencia x en un punto de frecuencia y la energía de suavizado Py de la señal del micrófono en este punto de frecuencia. La determinación se realiza basándose en una relación de energía Py/Px. Si la relación de energía es mayor que un umbral de relación de energía preestablecido, se determina que se produce no linealidad en una señal de punto de frecuencia en este punto de frecuencia. La energía de suavizado Px y Py se calculan a partir de las siguientes ecuaciones:
Px(n) = a*Px(n - 1) (1 - a) * |x(n)|2 (1.1)
Py(n) = a* Py(n - 1) (1 - a) * |y(n)|2 (1.2)
donde x(n) e y(n) representan respectivamente la señal de referencia y la señal de micrófono a una frecuencia n, y a es un coeficiente de suavizado y puede determinarse basándose en un gran número de resultados experimentales y/o experiencias.
De manera alternativa, la energía de la señal de referencia x en un punto de frecuencia y la energía de la señal de micrófono en el punto de frecuencia pueden calcularse directamente. La determinación se realiza basándose en una relación de energía de la energía de la señal de referencia x a la energía de la señal de micrófono. Si la relación de energía es mayor que el umbral de relación de energía preestablecido, se determina que se produce no linealidad en una señal de punto de frecuencia en este punto de frecuencia.
(3) Detección de no linealidad provocada por hardware de dispositivo.
En aplicaciones prácticas, para reducir el coste del dispositivo de hardware tanto como sea posible, a menudo se usa hardware barato, lo que puede dar como resultado una no linealidad en algunos estados de operación, como un volumen de altavoz demasiado alto y una carga de batería insuficiente. La no linealidad puede detectarse como sigue. En primer lugar, un valor medio de correlación cruzada entre la señal de referencia y la señal de micrófono en un rango de baja frecuencia N (por ejemplo, que van desde 300 HZ a 800 HZ, que puede determinarse basándose en experiencias y/o un gran número de resultados experimentales) se calcula.
A la frecuencia n, el valor de correlación cruzada entre la señal de referencia y la señal de micrófono se calcula a partir de la siguiente ecuación 1.3:
donde Pxy(n) = p * Pxy(n - 1) (1 - P) * |x(n)y(n)|2, p es un coeficiente de suavizado y puede determinarse basándose en un gran número de experimentos y/o experiencias.
Por lo tanto, en el rango de baja frecuencia N, el valor medio de correlación cruzada entre la señal de referencia y la señal de micrófono puede calcularse como sigue:
qH) = In C (n )^ (1.4)
Entonces, se calculan valores medios de correlación cruzada entre la señal de referencia y la señal de micrófono en otros rangos de frecuencia en un cierto intervalo de frecuencia d (1<d<20), por el mismo método de cálculo que el del valor medio de correlación cruzada en el rango de baja frecuencia anterior.
Finalmente, las señales de punto de frecuencia con no linealidad se determinan basándose en los valores medios de correlación cruzada en los otros rangos de frecuencia y la correlación cruzada de valor medio en el rango de baja frecuencia. Por ejemplo, se determina si uno de los valores medios de correlación en los otros rangos de frecuencia es significativamente menor que el valor medio de correlación en el rango de baja frecuencia (por ejemplo, si una relación del valor medio de correlación en otro rango de frecuencia al valor medio de correlación en el rango de baja frecuencia es menor que 0,1). Si un valor medio de correlación en otro rango de frecuencia es significativamente menor que el valor medio de correlación en el rango de baja frecuencia, las señales en el otro rango de frecuencia no tienen linealidad.
Cabe señalar que en aplicaciones prácticas, la determinación puede hacerse usando uno cualquiera de los métodos de detección anteriores, o combinando dos cualesquiera o los tres de los métodos de detección anteriores. Adicionalmente, en caso de que se utilicen múltiples métodos de detección para una determinación exhaustiva, los valores obtenidos por los múltiples métodos de detección pueden ponderarse. De manera alternativa, se determina que las señales de punto de frecuencia no tienen linealidad solo cuando un resultado de cada uno de los múltiples métodos de detección indica que las señales de punto de frecuencia tienen no linealidad, que no están limitados en el presente documento.
En la etapa 103, se calcula un valor de estimación de retardo actual basándose en señales de punto de frecuencia sin no linealidad en la señal de micrófono y la señal de referencia.
En primer lugar, se determinan tramas de la señal de micrófono incluidas en un rango de análisis de retardo. Por ejemplo, en el caso de una tasa de muestreo de 16 KHZ y un retardo máximo de 1 s, el rango de análisis de retardo es de 30 tramas. Es decir, se calcula un valor de correlación cruzada entre la señal de referencia y cada uno de las 30 tramas de la señal de micrófono en cada análisis de retardo.
Entonces, para cada una de las tramas de la señal de micrófono, se seleccionan señales de punto de frecuencia sin no linealidad en la señal de referencia y el marco de la señal de micrófono, para calcular un valor de correlación cruzada entre la señal de referencia y la trama de la señal de micrófono.
Específicamente, para una trama actual, se seleccionan señales de punto de frecuencia sin no linealidad. En un caso de 512 puntos de frecuencia (donde una longitud de intervalo de FFT es 1024), se calcula un valor de correlación cruzada entre la señal de referencia y la señal de micrófono en cada uno de los 512 puntos de frecuencia, haciendo referencia a la ecuación 1.3 anterior para obtener detalles.
Después de adquirir un valor de correlación cruzada en cada uno de los 512 puntos de frecuencia, se calcula un valor medio de correlación cruzada en los 512 puntos de frecuencia en la trama actual. El valor medio de correlación cruzada sirve como un valor de correlación cruzada entre la trama actual de la señal de referencia y la trama actual de la señal de micrófono.
Cabe señalar que para hacer que la estimación de retardo basada en correlación cruzada sea más precisa, puntos de frecuencia en un rango de frecuencia de audio general (en un caso de la tasa de muestreo de 16 KHZ, la frecuencia de audio general varía de 1500 Hz a 4625 Hz) para calcular el valor de correlación cruzada entre la señal de referencia y la señal de micrófono. Adicionalmente, con el fin de reducir la cantidad de cálculo y mejorar la eficiencia, pueden seleccionarse M (por ejemplo, M=100) puntos de frecuencia en el rango de frecuencia general para calcular el valor de correlación cruzada entre la señal de referencia y la señal de micrófono.
Finalmente, el valor de estimación de retardo se determina basándose en los valores de correlación cruzada calculados entre la señal de referencia y las tramas de la señal de micrófono.
En aplicaciones prácticas, el valor de estimación de retardo puede determinarse de diversas maneras, que se describen por separado a continuación.
En un primer ejemplo, una posición correspondiente a una trama de la señal de micrófono con un valor de correlación cruzada máximo entre los valores de correlación cruzada calculados entre la señal de referencia y las tramas de la señal de micrófono se selecciona como una posición de retardo actual. El valor de estimación de retardo actual se determina basándose en la posición de retardo actual y una posición de la señal de referencia.
Por ejemplo, la trama actual de la señal de referencia se toma como referencia, que se supone que es la 50a trama, y hay 30 tramas de la señal del micrófono en el rango de análisis de retardo, en concreto, la 20a a 50a tramas del micrófono. Cada una de las 30 tramas de la señal del micrófono se compara con la 50a trama de la señal de referencia. Si un valor de correlación cruzada entre las actuales 50a tramas de la señal de referencia y una 25a trama de la señal del micrófono es máximo, el valor de estimación del retardo actual se calcula como 50-25=25. Aparentemente, si un número de cuadro de la señal de referencia es inferior a 30 (por ejemplo, 18), tramas de la señal del micrófono que se van a comparar son todas las tramas anteriores a la trama actual. Es decir, la 18a trama de la señal de referencia se compara con cada una de 1a a 18a tramas de las señales de micrófono.
En un segundo ejemplo, para hacer que el valor de estimación de retardo actual sea más robusto, se puede satisfacer una o más de las siguientes condiciones robustas. Es decir, después de obtener la trama con el valor de correlación cruzada más grande, se requiere además determinar si se satisfacen una o más de las siguientes condiciones robustas. Si se cumplen una o más de las siguientes condiciones robustas, el valor de estimación de retardo actual se determina basándose en la posición de retardo actual y la posición de la señal de referencia, de lo contrario, se realiza una siguiente estimación de retardo.
Las condiciones robustas incluyen: (1) un valor de correlación cruzada C(t) correspondiente a una posición de retardo actual es mayor que un valor de correlación cruzada C(t-1) correspondiente a una posición de retardo anterior; (2) para cada trama en un rango de análisis de retardo actual, una diferencia entre una posición correspondiente a un valor máximo de correlación cruzada Cmáx(t) y una posición correspondiente a una correlación cruzada mínima Cmin(t) es mayor que una primera diferencia preestablecida; (3) una diferencia entre un valor medio Cmedia(t) de los valores de correlación cruzada entre la señal de referencia y las tramas de la señal de micrófono en el rango de análisis de retardo y el valor de correlación cruzada C(t) correspondiente a la posición de retardo actual es mayor que una segunda diferencia preestablecida; y (4) la posición de retardo actual p(t) es menor que una posición de retardo anterior p(t-1).
En un tercer ejemplo, al desplazar la señal de referencia y actualizar el filtro basándose en el retardo, se requiere que el valor de estimación de retardo sea altamente preciso debido a la convergencia del filtro. Para adquirir el retardo con mayor precisión, una posición correspondiente a la trama con un valor de correlación cruzada máximo puede servir como una posición de retardo candidata en una realización. Basándose en datos históricos, la posición de retardo candidata se castiga y/o recompensa de acuerdo con un cambio de la posición de retardo candidata, para adquirir finalmente un valor de estimación de retardo preciso.
El valor de estimación de retardo se determina como sigue.
En primer lugar, una posición correspondiente a una trama de la señal de micrófono con un valor de correlación cruzada máximo entre los valores de correlación cruzada entre la señal de referencia y las tramas de la señal de micrófono en el rango de análisis de retardo que se calculan en cada estimación de retardo sirve como candidato posición de retardo. Las posiciones de retardo candidatas se asignan en una matriz L-dimensional Sa, donde L es igual a un número total de tramas de la señal de micrófono en el rango de análisis de retardo. Se "cuenta" el número de veces que una posición de retardo candidata se repite continuamente. Una vez que se interrumpe la repetición continua, la "cuenta" se establece en 0.
Si se cambia la posición de retardo candidata actual, un valor para la posición de retardo candidata actual se incrementa en un primer valor preestablecido t1, un valor para una posición de retardo candidata anterior se reduce en un segundo valor preestablecido t2, y los valores para las otras posiciones se reducen en un tercer valor preestablecido t3.
Si la posición de retardo candidata actual no se cambia, la credibilidad de la posición de retardo candidata actual aumenta, y la credibilidad de la posición de retardo candidata previamente estimada y otras posiciones es baja. El valor para la posición de retardo candidata actual aumenta en el primer valor preestablecido t1, y los valores para las otras posiciones disminuyen en el tercer valor preestablecido t3. Dado que la posición de retardo candidata anterior es más creíble que las otras posiciones, la posición de retardo candidata anterior se reduce en un valor relativamente pequeño. Valores de t1, t2 y t3 pueden determinarse basándose en experiencias o en un gran número de experimentos, y generalmente t3 es mayor o igual que t2. Por ejemplo, t1, t2 y t3 pueden establecerse en 2, 1 y 2, respectivamente.
Si el valor de la posición de retardo candidata actual es mayor que un primer umbral T1 (por ejemplo, T1=10), y el número de veces que la posición de retardo candidata actual se repite continuamente es mayor que un segundo umbral T2 (por ejemplo, T2=4), indica que la posición de retardo candidata actual estimada es muy precisa y puede usarse como un retardo preciso D-i(t).
En un cuarto ejemplo 4, para hacer que el valor de estimación de retardo actual sea más robusto, al determinar el valor de estimación de retardo por el método en el tercer ejemplo, se determina adicionalmente si se satisfacen una o más de las condiciones robustas anteriores. Si se cumplen una o más de las condiciones robustas anteriores, el valor de estimación de retardo actual se determina basándose en la posición de retardo actual y la posición de la señal de referencia, de lo contrario, se realiza una siguiente estimación de retardo.
En la etapa 104, la señal de referencia se desplaza basándose en el valor de estimación de retardo actual.
En aplicaciones prácticas, los datos de la señal de referencia pueden desplazarse por un valor de estimación de retardo determinado por cualquiera de los diferentes métodos en el primer a cuarto ejemplos anteriores.
Además, en caso de que el valor de estimación de retardo actual D-i(t) se determina por el método en el tercer ejemplo o el cuarto ejemplo, considerando que la precisión de una posición de retardo candidata estimada varía con los intervalos, la señal de referencia puede desplazarse de la siguiente manera.
En caso de que el valor de estimación de retardo actual D-i(t) es menor o igual que un tercer umbral T3 (por ejemplo, T3=10), los datos de la señal de referencia no se desplazan.
En caso de que el valor de estimación de retardo actual D-i(t) es mayor que el tercer umbral T3 y menor que un cuarto umbral T4 (por ejemplo, T4=20), los datos de la señal de referencia se desplazan en D-i(t)/2.
En caso de que el valor de estimación de retardo actual D-i(t) es mayor o igual que el cuarto umbral T4, los datos de la señal de referencia se desplazan en D-i(t).
Además, en vista de un problema existente de pérdida de contenido de la señal de referencia histórica cuando se desplaza la señal de referencia basándose en el retardo, los datos de la señal de referencia histórica se desplazan conjuntamente con el desplazamiento de la señal de referencia basándose en el valor de estimación de retardo actual en otra realización de la presente divulgación. Específicamente, los datos de la señal de referencia histórica se almacenan en caché. Los datos almacenados en caché de la señal de referencia histórica se desplazan conjuntamente cuando se desplaza la señal de referencia.
Haciendo referencia a la figura 2, que es un diagrama esquemático que muestra una comparación entre la tecnología convencional y una realización de la presente divulgación en la que los datos de la señal de referencia histórica se desplazan conjuntamente.
Se puede ver en la figura 2 que en la tecnología convencional, suponiendo que un valor de estimación de retardo es igual a 3, los datos de la señal de referencia en un punto de tiempo n se reemplazan directamente con datos de los datos de la señal de referencia en un punto de tiempo (n-3) al desplazar la señal de referencia. Sin embargo, datos de la señal de referencia histórica, por ejemplo, datos de la señal de referencia en los puntos de tiempo (n-1) a (n-4) en la figura 2, que se mantienen sin cambios, lo que puede dar lugar a discontinuidades en la señal. En la realización de la presente divulgación, al desplazar la señal de referencia, no solo los datos de la señal de referencia en el punto de tiempo n se reemplazan con los datos de los datos de la señal de referencia en el punto de tiempo (n-3), sino que también los datos de la señal de referencia histórica se desplazan conjuntamente, como se muestra en la figura 2, evitando así la influencia sobre el efecto de la cancelación de eco causada por la señal discontinua, es decir, la pérdida del contenido de la señal de referencia histórica.
En la etapa S105, se actualiza un filtro adaptativo basándose en la señal de micrófono preprocesada y la señal de referencia desplazada, para realizar la cancelación de eco.
Específicamente, después de que se realiza la cancelación de eco basándose en una señal de micrófono y(t, n) y una señal de referencia desplazada x';(t, n), una señal de salida es la siguiente:
donde h(t, n) representa un coeficiente de filtro.
El coeficiente de filtro h(t, n) se actualiza como sigue:
h(t, n) = h(t - 1, n) y * e(t, n) * x'(t, n)/(x'(t, n)2 0) (1.6)
donde<y>es un tamaño de etapa para actualizar el filtro, que se determina basándose en un gran número de experimentos y/o experiencias, y 0 es un factor de regularización, que también se determina generalmente basándose en un gran número de experimentos y/o experiencias.
Dado que se requiere que el coeficiente de filtro se actualice cuando cambia el retardo, para acelerar la actualización del coeficiente de filtro y reducir la degradación en el rendimiento de la cancelación de eco provocada por la actualización del coeficiente de filtro, en otra realización de la presente divulgación, si el valor de estimación de retardo actual es menor que una longitud del filtro, al actualizar el coeficiente de filtro adaptativo, el coeficiente de filtro se desplaza basándose en el valor de estimación de retardo y el filtro se actualiza basándose en el coeficiente de filtro adaptativo desplazado, donde se restablece un coeficiente en una posición que no tiene valor después del desplazamiento, por ejemplo, a 0. La actualización del filtro se basa en el coeficiente de filtro adaptativo de restablecimiento, para acortar un período de tiempo para actualizar el coeficiente de filtro.
Haciendo referencia a la figura 3, que es un diagrama esquemático que muestra una comparación entre la tecnología convencional y una realización de la presente divulgación en la que un coeficiente de filtro de error se restablece a 0 cuando se actualiza el filtro.
Se supone que el valor de estimación de retardo es igual a 3. En la parte izquierda se muestra un diagrama esquemático de actualización del coeficiente de filtro en la tecnología convencional. Se puede ver que en la tecnología convencional, todos los coeficientes se actualizan basándose en un valor actual cuando se actualiza el coeficiente de filtro. En la parte derecha se muestra un diagrama esquemático de actualización del coeficiente de filtro en la realización de la presente divulgación. Se puede ver que un nésimo y (n-1)ésimo coeficientes de filtro se actualizan, y los otros coeficientes de filtro se actualizan restableciendo a 0.
Con el método de cancelación de eco de acuerdo con las realizaciones de la presente divulgación, se detectan puntos de frecuencia con no linealidad en la señal de micrófono y la señal de referencia. Se calcula un valor de estimación de retardo actual basándose en señales de punto de frecuencia sin no linealidad en la señal de micrófono y la señal de referencia. Es decir, se estima un retardo entre la señal de referencia y la señal de micrófono sin no linealidad, de modo que el valor de estimación de retardo sea más preciso. Entonces, la señal de referencia se desplaza basándose en el valor de estimación de retardo actual. El filtro adaptativo se actualiza basándose en la señal de micrófono y la señal de referencia desplazada, para realizar la cancelación de eco, mejorando así eficazmente el efecto de la cancelación de eco.
Adicionalmente, en la estimación de retardo, el valor de estimación de retardo se corrige basándose en diversas condiciones robustas, de modo que el retardo estimado sea más robusto.
Adicionalmente, en el proceso de actualización del filtro adaptativo, almacenando en caché y desplazando conjuntamente los datos de la señal de referencia histórica, y restableciendo un coeficiente de filtro que no tiene importancia de referencia, se puede reducir un período de tiempo para la reconvergencia del filtro provocada por un cambio del retardo, reduciendo así una influencia de la reconvergencia en el rendimiento de la cancelación de eco.
Por consiguiente, se proporciona adicionalmente un aparato de cancelación de eco basado en estimación de retardo de acuerdo con una realización de la presente divulgación. Haciendo referencia a la figura 4, que es un diagrama de bloques esquemático del aparato.
La figura 4 muestra un ejemplo en el que se realiza cancelación de eco en una caja de televisión. La señal de referencia es una señal de origen transmitida por la caja de televisión a un televisor o una señal de altavoz de televisión generalmente usada en la tecnología convencional. Una señal recogida por un micrófono de la caja de televisión sirve como señal de micrófono. Un usuario A controla la caja de televisión por voz.
Una señal de entrada en la figura 4 incluye una señal de eco de un altavoz. La señal de entrada se somete a conversión A/D, y la señal digital convertida se transmite al aparato de cancelación de eco 400 basándose en la estimación de retardo de acuerdo con la realización de la presente divulgación. El aparato de cancelación de eco 400 cancela la señal de eco en la señal de entrada para obtener una señal de salida, es decir, una señal de sonido del usuario A. La caja de televisión analiza la señal de salida para obtener una instrucción de control del usuario A.
El aparato de cancelación de eco 400 basado en la estimación de retardo de acuerdo con esta realización incluye módulos de procesamiento de señal 401 y 401', los módulos de detección de puntos de frecuencia 402 y 402', un módulo de estimación de retardo 403, un módulo de desplazamiento de señal 404 y un filtro adaptativo 405.
Los módulos de procesamiento de señales 401 y 401' están configurados respectivamente para recibir una señal de micrófono y una señal de referencia, preprocesar la señal de micrófono y la señal de referencia, y emitir la señal de micrófono preprocesada y la señal de referencia preprocesada. El preprocesamiento incluye principalmente encuadre, la creación de ventanas y la transformada rápida de Fourier y similares, y se realiza para transformar la señal de referencia y la señal de micrófono en un dominio de tiempo en señales respectivas en un dominio de frecuencia.
Los módulos de detección de puntos de frecuencia 402 y 402' están configurados respectivamente para determinar, en la señal de micrófono preprocesada y la señal de referencia preprocesada que emiten los módulos de procesamiento de señales, señales de punto de frecuencia con no linealidad en un escenario de cancelación de eco actual.
El módulo de estimación de retardo 403 está configurado para calcular un valor de estimación de retardo actual basándose en señales de punto de frecuencia sin no linealidad que se determinan por los módulos de detección de punto de frecuencia en la señal de micrófono preprocesada y la señal de referencia preprocesada, y emite el valor de estimación de retardo actual.
El módulo de desplazamiento de señal 404 está configurado para desplazar la señal de referencia basándose en el valor de estimación de retardo actual emitido por el módulo de estimación de retardo, y emitir la señal de referencia desplazada.
El filtro adaptativo 405 está configurado para actualizar el filtro adaptativo basándose en la señal de micrófono preprocesada emitida por el módulo de procesamiento de señal y la señal de referencia desplazada emitida por el módulo de desplazamiento de señal 404, para realizar la cancelación de eco.
Cabe señalar que en la figura 4, el módulo de procesamiento de señales 401 y el módulo de procesamiento de señales 401', así como el módulo de detección de puntos de frecuencia 402 y el módulo de detección de puntos de frecuencia 402' se describen simplemente por conveniencia de comprensión del principio del aparato de acuerdo con la presente divulgación. En aplicaciones prácticas, el módulo de procesamiento de señales 401 y el módulo de procesamiento de señales 401' pueden integrarse en una misma entidad física. De manera similar, el módulo de detección de puntos de frecuencia 402 y el módulo de detección de puntos de frecuencia 402' pueden integrarse en una misma entidad física. Adicionalmente, los módulos de procesamiento de señales y los módulos de detección de puntos de frecuencia pueden integrarse en una misma entidad física, que no están limitados en el presente documento.
La figura 4 muestra únicamente un ejemplo de aplicación del aparato de acuerdo con la presente divulgación. Debería observarse que el aparato de acuerdo con la realización de la presente divulgación puede ser aplicable a diversos escenarios. Por ejemplo, en un escenario en el que una caja de televisión controla un televisor, el aparato de acuerdo con la presente divulgación está integrado en la caja de televisión, para cancelar eficazmente un sonido reproducido por la televisión desde un sonido de control para la televisión. Otros escenarios no se enumeran en el presente documento.
En vista de la diversidad de entornos de aplicación reales y hardware de dispositivo, se pueden usar diferentes métodos de detección cuando se determinan señales de punto de frecuencia con no linealidad. Por consiguiente, el módulo de detección de punto de frecuencia anterior puede incluir una o más de las siguientes unidades de detección de una unidad de detección de señal de extremo lejano, una unidad de detección de señal de extremo dual y una unidad de detección de hardware de dispositivo, para detectar señales de punto de frecuencia con no linealidad en diferentes condiciones.
La unidad de detección de señal de extremo lejano está configurada para determinar las señales de punto de frecuencia con no linealidad basándose en uno o más de energía, una tasa de cruce por cero y una amplitud a corto plazo de la señal de referencia preprocesada. Por ejemplo, si la energía Px de una señal de referencia x en un punto de frecuencia es mayor que un umbral de energía preestablecido, se determina que se produce no linealidad en una señal de punto de frecuencia en este punto de frecuencia.
La unidad de detección de señal de extremo dual está configurada para determinar las señales de punto de frecuencia con no linealidad basándose en una relación de energía de la señal de micrófono preprocesada a la energía de la señal de referencia preprocesada. Se puede hacer referencia a la descripción de las realizaciones de método anteriores para obtener detalles, que no se repetirá en el presente documento.
La unidad de detección de hardware de dispositivo está configurada para: en primer lugar, determinar un valor medio de correlación entre la señal de referencia y la señal de micrófono en un rango de baja frecuencia, a continuación, calcular los valores medios de correlación entre la señal de referencia y la señal de micrófono en otros intervalos de frecuencia en un intervalo de frecuencia predeterminado y, finalmente, determinar las señales de punto de frecuencia con no linealidad basándose en los valores medios de correlación en los otros rangos de frecuencia y la media valor de correlación en el rango de baja frecuencia. Por ejemplo, si un valor medio de correlación en otro rango de frecuencia es significativamente menor que el valor medio de correlación en el rango de baja frecuencia, las señales en el otro rango de frecuencia no tienen linealidad.
El módulo de estimación de retardo 403 incluye una unidad de cálculo de correlación cruzada y una unidad de determinación de valor de estimación de retardo. La unidad de cálculo de correlación cruzada está configurada para: para cada una de las tramas de la señal de micrófono en un rango de análisis de retardo, seleccionar señales de punto de frecuencia sin no linealidad en la señal de referencia y la trama de la señal de micrófono; y calcular un valor de correlación cruzada entre la señal de referencia y la trama de la señal de micrófono. La unidad de determinación de valor de estimación de retardo está configurada para determinar el valor de estimación de retardo basándose en valores de correlación cruzada entre la señal de referencia y las tramas de la señal de micrófono que se calculan por la unidad de cálculo de correlación cruzada.
Por ejemplo, la unidad de determinación del valor de estimación de retardo puede estar configurada para: seleccionar una posición correspondiente a una trama de la señal de micrófono con un valor de correlación cruzada máximo entre los valores de correlación cruzada entre la señal de referencia y las tramas de la señal de micrófono calculados por la unidad de cálculo de correlación cruzada como una posición de retardo actual; y determinar el valor de estimación de retardo actual basándose en la posición de retardo actual y una posición de la señal de referencia.
Adicionalmente, para hacer que el valor de estimación de retardo actual sea más robusto, al determinar el valor de estimación de retardo actual, la unidad de determinación del valor de estimación de retardo puede determinar adicionalmente si se satisfacen una o más de las siguientes condiciones robustas. Si se cumplen una o más de las siguientes condiciones robustas, el valor de estimación de retardo actual se determina basándose en la posición de retardo actual y la posición de la señal de referencia, de lo contrario, se realiza una siguiente estimación de retardo.
Las condiciones robustas incluyen: (1) un valor de correlación cruzada C(t) correspondiente a una posición de retardo actual es mayor que un valor de correlación cruzada C(t-1) correspondiente a una posición de retardo anterior; (2) para cada trama en un rango de análisis de retardo actual, una diferencia entre una posición correspondiente a un valor máximo de correlación cruzada Cmáx(t) y una posición correspondiente a una correlación cruzada mínima Cmin(t) es mayor que una primera diferencia preestablecida; (3) una diferencia entre un valor medio Cmedia(t) de los valores de correlación cruzada entre la señal de referencia y las tramas de la señal de micrófono en el rango de análisis de retardo y el valor de correlación cruzada C(t) correspondiente a la posición de retardo actual es mayor que una segunda diferencia preestablecida; y (4) la posición de retardo actual p(t) es menor que una posición de retardo anterior p(t-1).
Adicionalmente, en caso de que la señal de referencia se desplace y el filtro se actualice basándose en el retardo, se requiere que el valor de estimación de retardo sea cada vez más preciso con la convergencia del filtro. Para adquirir el retardo con mayor precisión, la unidad de determinación del valor de estimación de retardo puede seleccionar la posición correspondiente a la trama con un valor de correlación cruzada máximo como la posición de retardo candidata. Basándose en datos históricos, la posición de retardo candidata se castiga y/o recompensa de acuerdo con un cambio de la posición de retardo candidata, para adquirir finalmente un valor de estimación de retardo preciso. Específicamente, una posición correspondiente a una trama de la señal de micrófono con el valor de correlación cruzada más grande entre los valores de correlación cruzada entre la señal de referencia y las tramas de la señal de micrófono en el rango de análisis de retardo que se calculan en cada estimación de retardo sirve como candidato posición de retardo. Las posiciones de retardo candidatas se asignan en una matriz L-dimensional Sa, donde L es igual a un número total de tramas de la señal de micrófono en el rango de análisis de retardo. Se cuenta el número de veces que una posición de retardo candidata se repite continuamente. Si se cambia la posición de retardo candidata actual, un valor para la posición de retardo candidata actual se incrementa en un primer valor preestablecido t1, un valor para una posición de retardo candidata anterior se reduce en un segundo valor preestablecido t2, y los valores para las otras posiciones se reducen en un tercer valor preestablecido t3. Si la posición de retardo candidata actual no se cambia, el valor para la posición de retardo candidata actual aumenta en el primer valor preestablecido t1, y los valores para las otras posiciones disminuyen en el tercer valor preestablecido t3. El segundo valor preestablecido t2 es menor o igual que el tercer valor preestablecido t3. Si el valor de la posición de retardo candidata actual es mayor que un primer umbral, y el número de veces que la posición de retardo candidata actual se repite continuamente es mayor que un segundo umbral, el valor de estimación de retardo actual se determina basándose en la posición de retardo candidata actual y la posición de la señal de referencia. Valor de t1, t2 y t3 pueden determinarse basándose en experiencias o en un gran número de experimentos, y generalmente t3 es mayor o igual que t2. Por ejemplo, t1, t2 y t3 pueden establecerse en 2, 1 y 2.
Cabe señalar que, al determinar el valor de estimación de retardo de la manera anterior, la unidad de determinación del valor de estimación de retardo puede determinar adicionalmente si se satisfacen una o más de las condiciones robustas anteriores, de modo que el valor de retardo estimado actual sea más robusto.
En aplicaciones prácticas, el módulo de desplazamiento de señal 404 puede desplazar los datos de la señal de referencia por el valor de estimación de retardo actual determinado por la unidad de determinación de valor de estimación de retardo en cualquiera de las diferentes maneras.
Adicionalmente, en el caso anterior que, basándose en los datos históricos, la posición de retardo candidata se castiga y/o recompensa de acuerdo con el cambio de la posición de retardo candidata para adquirir finalmente el valor de estimación de retardo, y la precisión de una posición de retardo candidata estimada varía con los intervalos. Por lo tanto, el módulo de desplazamiento de señal 404 puede desplazar la señal de referencia de la siguiente manera. En caso de que el valor de estimación de retardo actual D-i(t) es menor o igual que un tercer umbral T3, los datos de la señal de referencia no se desplazan. En caso de que el valor de estimación de retardo actual D-i(t) es mayor que el tercer umbral T3 y menor que un cuarto umbral<t>4, los datos de la señal de referencia se desplazan en D-i(t)/2. En caso de que el valor de estimación de retardo actual D-i(t) es mayor o igual que el cuarto umbral T4, los datos de la señal de referencia se desplazan en D-i(t).
Además, para evitar la pérdida del contenido de la señal de referencia histórica cuando se desplaza la señal de referencia, como se muestra en la figura 5, el aparato incluye además un módulo de almacenamiento en caché 501 de acuerdo con otra realización de la presente divulgación. El módulo de almacenamiento en caché está configurado para almacenar en caché datos de una señal de referencia histórica.
Por consiguiente, en esta realización, el módulo de desplazamiento de señal 404 está configurado adicionalmente para desplazar los datos almacenados en caché de la señal de referencia histórica conjuntamente cuando se desplaza la señal de referencia.
En otra realización del aparato de acuerdo con la presente divulgación, cuando el filtro adaptativo 405 actualiza el coeficiente, si el valor de estimación de retardo actual es menor que una longitud del filtro, el coeficiente de filtro se desplaza basándose en el valor de estimación de retardo y el filtro se actualiza basándose en el coeficiente de filtro adaptativo desplazado, donde se restablece un coeficiente en una posición que no tiene valor después del desplazamiento. Por ejemplo, aquellos coeficientes de filtro que no tienen magnificencia de referencia se restablecen a 0. A continuación, el filtro se actualiza basándose en el coeficiente de filtro adaptativo de restablecimiento.
Con el aparato de cancelación de eco de acuerdo con las realizaciones de la presente divulgación, se detectan puntos de frecuencia con no linealidad en la señal de micrófono y la señal de referencia. Se calcula un valor de estimación de retardo actual basándose en señales de punto de frecuencia sin no linealidad en la señal de micrófono y la señal de referencia. Es decir, se estima un retardo entre la señal de referencia y la señal de micrófono sin no linealidad, de modo que el valor de estimación de retardo sea más preciso. Entonces, la señal de referencia se desplaza basándose en el valor de estimación de retardo actual. El filtro adaptativo se actualiza basándose en la señal de micrófono y la señal de referencia desplazada, para realizar la cancelación de eco, mejorando así eficazmente el efecto de la cancelación de eco.
Adicionalmente, en la estimación de retardo, el valor de estimación de retardo se corrige basándose en diversas condiciones robustas, de modo que el retardo estimado sea más robusto.
Adicionalmente, en el proceso de actualización del filtro adaptativo, almacenando en caché y desplazando conjuntamente los datos de la señal de referencia histórica, y restableciendo un coeficiente de filtro que no tiene importancia de referencia, se puede reducir un período de tiempo para la reconvergencia del filtro provocada por un cambio del retardo, reduciendo así una influencia de la reconvergencia en el rendimiento de la cancelación de eco.
Se proporciona adicionalmente un dispositivo de cancelación de eco basado en estimación de retardo de acuerdo con una realización de la presente divulgación. El dispositivo incluye un procesador, una memoria y un bus de sistema.
El procesador está conectado a la memoria a través del bus de sistema.
La memoria almacena uno o más programas que incluyen instrucciones que, cuando es ejecutado por el procesador, controlar el procesador para realizar cualquiera de los métodos de cancelación de eco anteriores basándose en la estimación de retardo.
Un medio de almacenamiento legible por ordenador se proporciona, además, de acuerdo con una realización a modo de ejemplo de la presente divulgación. El medio de almacenamiento legible por ordenador almacena instrucciones que, cuando se ejecutan por un dispositivo terminal, controla el dispositivo terminal para realizar cualquiera de los métodos de cancelación de eco anteriores basándose en la estimación de retardo.
Un producto de programa informático se proporciona además mediante una realización de la presente divulgación. El producto de programa informático, cuando se ejecutan por un dispositivo terminal, controla el dispositivo terminal para realizar cualquiera de los métodos de cancelación de eco anteriores basándose en la estimación de retardo.
Las realizaciones de esta memoria descriptiva se describen de manera progresiva, cada una de las cuales enfatiza las diferencias con respecto a otras, y las partes iguales o similares entre las realizaciones pueden referirse entre sí. Adicionalmente, las realizaciones de aparato descritas anteriormente son solo ilustrativas. Las unidades anteriores descritas como componentes separados pueden estar o no estar separadas físicamente. Un componente mostrado como una unidad puede ser o no ser una unidad física, es decir, puede estar ubicado en un solo lugar o puede estar distribuido en múltiples unidades de red. El objeto de las soluciones de la realización puede lograrse seleccionando una parte o todas las unidades basándose en requisitos reales, dentro del ámbito de las reivindicaciones adjuntas.
Las realizaciones de la presente divulgación se describen en detalle anteriormente. La presente divulgación se ilustra mediante realizaciones específicas. La descripción anterior de las realizaciones es solo para facilitar la comprensión del método y el aparato de acuerdo con la presente divulgación; son posibles muchas modificaciones y variaciones dentro del ámbito de las reivindicaciones adjuntas.

Claims (12)

REIVINDICACIONES
1. Un método de cancelación de eco basado en la estimación de retardo, que comprende:
recibir (101) una señal de micrófono y una señal de referencia, y preprocesar (101) la señal de micrófono y la señal de referencia para transformar la señal de referencia y la señal de micrófono de un dominio de tiempo en un dominio de frecuencia;
en donde el método de cancelación de eco escaracterizado porque comprende además:
determinar (102), en la señal de micrófono preprocesada y la señal de referencia preprocesada, señales de punto de frecuencia con no linealidad en un escenario de cancelación de eco actual;
calcular (103) un valor de estimación de retardo actual basándose en señales de punto de frecuencia sin no linealidad en la señal de micrófono y la señal de referencia;
desplazar (104) la señal de referencia basándose en el valor de estimación de retardo actual; y actualizar (105) un filtro adaptativo basándose en la señal de micrófono preprocesada y la señal de referencia desplazada, para realizar la cancelación de eco.
2. El método según la reivindicación 1, en donde la determinación (102), en la señal de micrófono preprocesada y la señal de referencia preprocesada, de las señales de punto de frecuencia con no linealidad en un escenario de cancelación de eco actual comprenden uno o más de:
una detección de señal de extremo lejano, que comprende determinar las señales de punto de frecuencia con no linealidad basándose en una o más de energía, una tasa de cruce por cero y una amplitud a corto plazo de la señal de referencia preprocesada;
una detección de señal de extremo dual, que comprende determinar las señales de punto de frecuencia con no linealidad basándose en una relación de energía de la señal de micrófono preprocesada a la energía de la señal de referencia preprocesada; y
una detección de no linealidad provocada por el hardware del dispositivo, que comprende en primer lugar calcular un valor medio de correlación entre la señal de referencia y la señal de micrófono en un rango de baja frecuencia, a continuación, calcular los valores medios de correlación entre la señal de referencia y la señal de micrófono en otros rangos de frecuencia en un intervalo de frecuencia predeterminado y, finalmente, determinar las señales de punto de frecuencia con no linealidad basándose en los valores medios de correlación en los otros rangos de frecuencia y el valor medio de correlación en el rango de baja frecuencia.
3. El método según la reivindicación 1, en donde el cálculo (103) de un valor de estimación de retardo actual basándose en señales de punto de frecuencia sin no linealidad en la señal de micrófono y la señal de referencia comprende:
para cada una de las tramas de la señal de micrófono en un rango de análisis de retardo, seleccionar señales de punto de frecuencia sin no linealidad en la señal de referencia y la trama de la señal de micrófono, y calcular un valor de correlación cruzada entre la señal de referencia y la trama de la señal de micrófono; y
determinar el valor de estimación de retardo basándose en valores de correlación cruzada calculados entre la señal de referencia y las tramas de la señal de micrófono.
4. El método según la reivindicación 3, en donde la determinación del valor de estimación de retardo basándose en valores de correlación cruzada calculados entre la señal de referencia y las tramas de la señal de micrófono comprende:
seleccionar una posición correspondiente a una trama de la señal de micrófono con un valor de correlación cruzada máximo entre los valores de correlación cruzada calculados entre la señal de referencia y las tramas de la señal de micrófono, como una posición de retardo actual; y
determinar el valor de estimación de retardo actual basándose en la posición de retardo actual y una posición de la señal de referencia.
5. El método según la reivindicación 3, en donde la determinación del valor de estimación de retardo actual basándose en valores de correlación cruzada calculados entre la señal de referencia y las tramas de la señal de micrófono comprende:
seleccionar, en cada estimación de retardo, una posición que corresponde a una trama de la señal de micrófono con un valor de correlación cruzada máximo entre los valores de correlación cruzada calculados entre la señal de referencia y las tramas de la señal de micrófono en el rango de análisis de retardo como una posición de retardo candidata; y asignar posiciones de retardo candidatas en una matriz L-dimensional Sa, en donde L es igual a un número total de tramas de la señal de micrófono en el rango de análisis de retardo, y contar el número de veces que una posición de retardo candidata se repite continuamente;
aumentar un valor para una posición de retardo candidata actual en un primer valor preestablecido t1, disminuir un valor para una posición de retardo candidata anterior en un segundo valor preestablecido t2, y disminuir los valores para otras posiciones en un tercer valor preestablecido t3, si se cambia la posición de retardo candidata actual; aumentar el valor para la posición de retardo candidata actual en el primer valor preestablecido t1, y disminuir los valores para otras posiciones en el tercer valor preestablecido t3, si la posición de retardo candidata actual no se cambia, en donde el segundo valor preestablecido t2 es menor o igual que el tercer valor preestablecido t3; y determinar el valor de estimación de retardo actual basándose en la posición de retardo candidata actual y una posición de la señal de referencia, si el valor para la posición de retardo candidata actual es mayor que un primer umbral y el número de veces que la posición de retardo candidata actual se repite continuamente es mayor que un segundo umbral.
6. El método según la reivindicación 5, en donde el desplazamiento (104) de la señal de referencia basándose en el valor de estimación de retardo actual comprende:
no desplazar los datos de la señal de referencia en un caso en el que el valor de estimación de retardo actual D-i(t) es menor o igual que un tercer umbral T3;
desplazar los datos de la señal de referencia en D-i(t)/2 en caso de que el valor de estimación de retardo actual D-i(t) es mayor que el tercer umbral T3 y menor que un cuarto umbral T4; y
desplazar los datos de la señal de referencia en Di(t) en caso de que el valor de estimación de retardo actual Di(t) es mayor o igual que el cuarto umbral T4.
7. El método de acuerdo con la reivindicación 4 o 5 o 6, en donde la determinación del valor de estimación de retardo basándose en valores de correlación cruzada calculados entre la señal de referencia y las tramas de la señal de micrófono comprende determinar que se cumplen una o más de las siguientes condiciones:
(1) un valor de correlación cruzada C(t) correspondiente a una posición de retardo actual es mayor que un valor de correlación cruzada C(t-1) correspondiente a una posición de retardo anterior;
(2) para cada trama en un rango de análisis de retardo actual, una diferencia entre una posición correspondiente a un valor máximo de correlación cruzada Cmáx(t) y una posición correspondiente a una correlación cruzada mínima Cmin(t) es mayor que una primera diferencia preestablecida;
(3) una diferencia entre un valor medio Cmedia(t) de los valores de correlación cruzada entre la señal de referencia y las tramas de la señal de micrófono en el rango de análisis de retardo y el valor de correlación cruzada C(t) correspondiente a la posición de retardo actual es mayor que una segunda diferencia preestablecida; y
(4) la posición de retardo actual p(t) es menor que una posición de retardo anterior p(t-1).
8. El método de acuerdo con una cualquiera de las reivindicaciones 1 a 6, que comprende, además:
almacenar en caché datos de una señal de referencia histórica; y
desplazar los datos almacenados en caché de la señal de referencia histórica conjuntamente cuando se desplaza la señal de referencia.
9. El método de acuerdo con una cualquiera de las reivindicaciones 1 a 6, en donde
si el valor de estimación de retardo actual es menor que una longitud del filtro adaptativo, la actualización del filtro adaptativo comprende:
desplazar un coeficiente de filtro adaptativo basándose en el valor de estimación de retardo y actualizar el filtro adaptativo basándose en el coeficiente de filtro adaptativo desplazado, en donde se restablece un coeficiente en una posición que no tiene valor después del desplazamiento, y el filtro adaptativo se actualiza basándose en el coeficiente de filtro adaptativo restablecido.
10. Un dispositivo de cancelación de eco basado en la estimación de retardo, que comprende un procesador, una memoria y un bus de sistema, en donde
el procesador está conectado a la memoria a través del bus de sistema; y
la memoria almacena uno o más programas que comprenden instrucciones que, cuando es ejecutado por el procesador, controla que el procesador lleve a cabo el método de acuerdo con una cualquiera de las reivindicaciones 1 a 9.
11. Un medio de almacenamiento legible por ordenador, almacena instrucciones que, cuando se ejecutan por un dispositivo terminal, controla que el dispositivo terminal realice el método de acuerdo con una cualquiera de las reivindicaciones 1 a 9.
12. Un producto de programa informático que, cuando se ejecutan por un dispositivo terminal, controla el dispositivo terminal para realizar el método de acuerdo con una cualquiera de las reivindicaciones 1 a 9.
ES18869573T 2017-10-23 2018-07-16 Método y aparato de cancelación de eco basados en estimación de retardo de tiempo Active ES2965954T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201710994195.XA CN107610713B (zh) 2017-10-23 2017-10-23 基于时延估计的回声消除方法及装置
PCT/CN2018/095759 WO2019080552A1 (zh) 2017-10-23 2018-07-16 基于时延估计的回声消除方法及装置

Publications (1)

Publication Number Publication Date
ES2965954T3 true ES2965954T3 (es) 2024-04-17

Family

ID=61079274

Family Applications (1)

Application Number Title Priority Date Filing Date
ES18869573T Active ES2965954T3 (es) 2017-10-23 2018-07-16 Método y aparato de cancelación de eco basados en estimación de retardo de tiempo

Country Status (8)

Country Link
US (1) US11323807B2 (es)
EP (1) EP3703052B1 (es)
JP (1) JP7018130B2 (es)
KR (1) KR102340999B1 (es)
CN (1) CN107610713B (es)
ES (1) ES2965954T3 (es)
HU (1) HUE065351T2 (es)
WO (1) WO2019080552A1 (es)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9947337B1 (en) * 2017-03-21 2018-04-17 Omnivision Technologies, Inc. Echo cancellation system and method with reduced residual echo
CN107610713B (zh) 2017-10-23 2022-02-01 科大讯飞股份有限公司 基于时延估计的回声消除方法及装置
CN109102821B (zh) * 2018-09-10 2021-05-25 思必驰科技股份有限公司 时延估计方法、系统、存储介质及电子设备
CN110166882B (zh) * 2018-09-29 2021-05-25 腾讯科技(深圳)有限公司 远场拾音设备、及远场拾音设备中采集人声信号的方法
CN109087662B (zh) * 2018-10-25 2021-10-08 科大讯飞股份有限公司 一种回声消除方法及装置
CN111223492A (zh) * 2018-11-23 2020-06-02 中移(杭州)信息技术有限公司 一种回声路径延迟估计方法及装置
CN109361828B (zh) * 2018-12-17 2021-02-12 北京达佳互联信息技术有限公司 一种回声消除方法、装置、电子设备及存储介质
AU2020310315A1 (en) * 2019-07-10 2022-01-27 SwipBox Development ApS Method of reusing a reusable transport packaging and a service point and system therefor
CN110349592B (zh) * 2019-07-17 2021-09-28 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
CN111031448B (zh) * 2019-11-12 2021-09-17 西安讯飞超脑信息科技有限公司 回声消除方法、装置、电子设备和存储介质
CN110992973A (zh) * 2019-11-29 2020-04-10 维沃移动通信有限公司 一种信号时延的确定方法和电子设备
TWI756595B (zh) * 2019-12-06 2022-03-01 瑞昱半導體股份有限公司 通訊裝置及回音消除方法
CN111246036A (zh) * 2020-02-17 2020-06-05 上海推乐信息技术服务有限公司 一种回声估计方法和装置
CN111402868B (zh) * 2020-03-17 2023-10-24 阿波罗智联(北京)科技有限公司 语音识别方法、装置、电子设备及计算机可读存储介质
CN111556410A (zh) * 2020-05-20 2020-08-18 南京中芯声学技术研究院 基于多工作模式麦克风的室内扩声系统工作模式切换方法
TWI743950B (zh) * 2020-08-18 2021-10-21 瑞昱半導體股份有限公司 訊號處理裝置、延遲估計方法與回音消除方法
CN112562709B (zh) * 2020-11-18 2024-04-19 珠海全志科技股份有限公司 一种回声消除信号处理方法及介质
CN112489670B (zh) * 2020-12-01 2023-08-18 广州华多网络科技有限公司 时延估计方法、装置、终端设备和计算机可读存储介质
KR20220102451A (ko) * 2021-01-13 2022-07-20 삼성전자주식회사 외부 장치에 의해 유입되는 에코를 제거하는 방법 및 전자 장치
TWI778502B (zh) 2021-01-22 2022-09-21 威聯通科技股份有限公司 回聲延時估計方法及回聲延時估計系統
CN113724722B (zh) * 2021-08-18 2023-12-26 杭州网易智企科技有限公司 回声延迟估计方法、装置、存储介质和计算设备
CN114613383B (zh) * 2022-03-14 2023-07-18 中国电子科技集团公司第十研究所 一种机载环境下多输入语音信号波束形成信息互补方法
CN114822575A (zh) * 2022-04-28 2022-07-29 深圳市中科蓝讯科技股份有限公司 一种双麦克风阵列回声消除方法、装置及电子设备
CN115297404A (zh) * 2022-08-04 2022-11-04 中国第一汽车股份有限公司 一种音频处理系统、方法和车辆

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2782180B1 (fr) * 1998-08-06 2001-09-07 France Telecom Dispositif de traitement numerique a filtrage frequentiel et a complexite de calcul reduite
US6937723B2 (en) 2002-10-25 2005-08-30 Avaya Technology Corp. Echo detection and monitoring
CN1691716A (zh) * 2004-04-23 2005-11-02 北京三星通信技术研究有限公司 回声消除装置
US7792281B1 (en) * 2005-12-13 2010-09-07 Mindspeed Technologies, Inc. Delay estimation and audio signal identification using perceptually matched spectral evolution
JP5125931B2 (ja) * 2008-09-19 2013-01-23 沖電気工業株式会社 音声通信装置及び音声通信プログラム
US9544698B2 (en) * 2009-05-18 2017-01-10 Oticon A/S Signal enhancement using wireless streaming
JP5235226B2 (ja) 2011-06-28 2013-07-10 日本電信電話株式会社 エコー消去装置及びそのプログラム
US9173025B2 (en) * 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
GB201309781D0 (en) * 2013-05-31 2013-07-17 Microsoft Corp Echo cancellation
GB201321052D0 (en) * 2013-11-29 2014-01-15 Microsoft Corp Detecting nonlinear amplitude processing
CN103700374B (zh) * 2013-12-25 2016-08-17 宁波菊风系统软件有限公司 确定声学回声消除中系统延时的方法及声学回声消除方法
GB201406574D0 (en) * 2014-04-11 2014-05-28 Microsoft Corp Audio Signal Processing
US20150371655A1 (en) * 2014-06-19 2015-12-24 Yang Gao Acoustic Echo Preprocessing for Speech Enhancement
JP6369192B2 (ja) 2014-07-18 2018-08-08 沖電気工業株式会社 エコー抑圧装置、エコー抑圧プログラム、エコー抑圧方法及び通信端末
GB2527865B (en) * 2014-10-30 2016-12-14 Imagination Tech Ltd Controlling operational characteristics of an acoustic echo canceller
GB201501791D0 (en) * 2015-02-03 2015-03-18 Microsoft Technology Licensing Llc Non-linear echo path detection
CN106033673B (zh) * 2015-03-09 2019-09-17 电信科学技术研究院 一种近端语音信号检测方法及装置
CN105472191B (zh) * 2015-11-18 2019-09-20 百度在线网络技术(北京)有限公司 一种跟踪回声时延的方法和装置
CN105825864B (zh) * 2016-05-19 2019-10-25 深圳永顺智信息科技有限公司 基于过零率指标的双端说话检测与回声消除方法
CN105872156B (zh) * 2016-05-25 2019-02-12 腾讯科技(深圳)有限公司 一种回声时延跟踪方法及装置
CN106847299B (zh) * 2017-02-24 2020-06-19 喜大(上海)网络科技有限公司 延时的估计方法及装置
CN107610713B (zh) * 2017-10-23 2022-02-01 科大讯飞股份有限公司 基于时延估计的回声消除方法及装置

Also Published As

Publication number Publication date
HUE065351T2 (hu) 2024-05-28
EP3703052A4 (en) 2021-04-28
EP3703052C0 (en) 2023-11-01
US11323807B2 (en) 2022-05-03
JP7018130B2 (ja) 2022-02-09
CN107610713B (zh) 2022-02-01
EP3703052B1 (en) 2023-11-01
WO2019080552A1 (zh) 2019-05-02
CN107610713A (zh) 2018-01-19
KR102340999B1 (ko) 2021-12-20
KR20200070346A (ko) 2020-06-17
EP3703052A1 (en) 2020-09-02
US20210051404A1 (en) 2021-02-18
JP2021500778A (ja) 2021-01-07

Similar Documents

Publication Publication Date Title
ES2965954T3 (es) Método y aparato de cancelación de eco basados en estimación de retardo de tiempo
CN111988690B (zh) 一种耳机佩戴状态检测方法、装置和耳机
JP7158806B2 (ja) オーディオ認識方法、ターゲットオーディオを位置決める方法、それらの装置、およびデバイスとコンピュータプログラム
US8194882B2 (en) System and method for providing single microphone noise suppression fallback
US9093077B2 (en) Reverberation suppression device, reverberation suppression method, and computer-readable storage medium storing a reverberation suppression program
CN106537501B (zh) 混响估计器
TWI633792B (zh) 聲場的高階保真立體音響表示法中主聲源方向之決定方法和裝置
CN103180900A (zh) 用于话音活动检测的系统、方法和设备
US20180190310A1 (en) De-reverberation control method and apparatus for device equipped with microphone
US20190267018A1 (en) Signal processing for speech dereverberation
CN111048061B (zh) 回声消除滤波器的步长获取方法、装置及设备
CN106338711A (zh) 一种基于智能设备的语音定向方法及系统
CN112997249B (zh) 语音处理方法、装置、存储介质及电子设备
RU2611973C2 (ru) Ослабление шума в сигнале
CN113160846B (zh) 噪声抑制方法和电子设备
US20210264940A1 (en) Position detection method, apparatus, electronic device and computer readable storage medium
CN115995234A (zh) 音频降噪方法、装置、电子设备及可读存储介质
WO2022227916A1 (zh) 图像处理方法、图像处理器、电子设备及存储介质
JP7189555B2 (ja) 音響処理装置、音響処理方法およびプログラム
WO2022150950A1 (zh) 评估传声器阵列一致性的方法和装置
CN116724352A (zh) 一种语音增强方法和系统
CN117202021A (zh) 一种音频信号处理方法、系统及电子设备
CN115410590A (zh) 一种语音增强方法和系统