"MÉTODO DE DETECÇÃO DE ECO, MÉTODO PARA DETERMINAR A SIMILARIDADE ENTRE UM PRIMEIRO SINAL E UM SEGUNDO SINAL, DETECTOR DE ECO, E, APARELHO PARA DETERMINAR A SIMILARIDADE ENTRE UM PRIMEIRO SINAL E UM SEGUNDO SINAL"
CAMPO TÉCNICO
A presente invenção relaciona-se em geral à detecção de similaridade de sinal e, em particular, a detecção de eco em sistemas de telecomunicação.
FUNDAMENTOS
Em algumas aplicações, é necessário detectar a presença de uma versão possivelmente modificada de um sinal de conversação conhecido em um sinal recebido que pode consistir de vários componentes de conversação e ruído e para estimar o retardo relativo do componente de interesse. Exemplos de tais aplicações são o controle de eco, coleta de estatísticas de rede e pontes de conferência multi partes.
O problema fundamental é ilustrado na Figura 1. Um sinal de conversação conhecido é retardado em um bloco de retardo 10 e é afetado por uma transformação desconhecida 12 em seu caminho para um ponto de somatório 14. Este pode ou não alcançar o ponto de somatório (a chave 16 pode estar aberta ou fechada). No ponto de somatório, o sinal é mixado com outros sinais de conversação e ruído. Em seu caminho de volta para o ponto a partir do qual o sinal original foi transmitido, o sinal do ponto de somatório 14 é novamente alterado por uma transformação desconhecida 18 e um bloco de retardo 20. O problema é detectar se uma versão possivelmente modificada do sinal de conversação conhecido está presente no sinal recebido e caso afirmativo estimar seu retardo relativo com respeito ao sinal de conversação conhecido. Isto é efetuado por um bloco de detecção e estimativa de retardo 22.
Um fenômeno de ouvir reflexões retardadas da própria voz é referido como eco. Em uma rede telefônica, a principal fonte do eco é a reflexão elétrica no assim chamado circuito híbrido conectando a parte de 4 fios da rede, com uma linha de assinante de dois fios. Este eco elétrico é comumente processado por canceladores de eco de rede instalados no sistema telefônico. O cancelador de eco de rede deveria normalmente ser instalado próximo à fonte de eco. Por exemplo, canceladores de eco de rede são requeridos nos pontos de conexão de mídia interfaceando redes de pacote (IP ou ATM) para redes PSTN ou Centros de Comutação de Serviços Móveis interfaceando redes móveis para redes PSTN. Similarmente, canceladores de eco de rede deveriam ser instalados em centrais internacionais, e em algumas situações em centrais telefônicas dentro de um país, se o retardo de transmissão de extremidade a extremidade exceder 25 ms, ver [1]. Em alguns casos, o cancelador de eco de rede pode, entretanto, estar ausente em sua localização adequada, isto é, em uma central telefônica próximo à fonte de eco. Se este é o caso, chamadas de longa distância para e a partir de tal localização sofrem de problemas de eco. Uma operadora internacional em um outro país pode desejar resolver o problema para seus próprios usuários, detectando as chamadas com eco geradas na localização distante e tomando medidas próprias para remover o eco. Para fazer isto, é necessário detectar o eco e estimar seu retardo.
Uma outra fonte de eco é o acoplamento acústico entre alto- falante e microfone de um telefone (terminal). Este tipo de eco pode ser retornado, por exemplo, de terminais móveis ou telefones IP. Idealmente, os terminais deveriam processar seus próprios ecos, de tal modo que nenhum eco fosse transmitido de volta para o sistema. Embora muitos dos terminais atualmente em uso sejam capazes de processar seus próprios ecos adequadamente, ainda há modelos que não o fazem.
O problema de eco acústico não é fácil de resolver na rede, ver [2], uma vez que o caminho de eco inclui codificadores e decodificadores de voz. Ainda mais, no caso de redes móveis, os sinais são transmitidos através de um canal rádio que introduz erros de bit no sinal. Isto torna o caminho de eco não linear e não espacionário e introduz um retardo desconhecido no caminho de eco, de tal modo que canceladores de eco de rede comuns geralmente não são capazes de conviver com ecos acústicos retornados de terminais móveis. Novamente, no sentido de conviver com os ecos, primeiramente necessita se detectar se o eco está presente na chamada, e caso afirmativo, estimar seu retardo.
Uma outra aplicação em que este tipo de detecção é útil, é a coleta de estatística de rede. Uma operadora de telecomunicações pode desejar coletar vários dados estatísticos relacionados à qualidade de chamadas telefônicas em sua rede. Algumas das estatísticas de interesse consistem na presença de ecos retornados a partir de terminais (por exemplo, telefones móveis ou telefone IP) e o retardo associado a estes ecos. Para realizar esta tarefa, a unidade de coleta de estatística poderia incluir um bloco de detecção e estimativa de retardo 22 conforme ilustrado na Figura 1. Neste exemplo, os resultados de detecção e estimativa deveriam ser armazenados em uma base de dados para uso posterior, em oposição ao uso imediato dos resultados para controle de eco nos exemplos anteriores. As estatísticas armazenadas na base de dados podem ser usadas para apresentar estatísticas de rede agregadas. Estas podem também ser usadas para pesquisa de defeitos se são recebidas pela operadora reclamações do usuário com vistas a qualidade de conversação.
Ainda uma outra aplicação é uma ponte de conferência multi partes, ver [3] em uma ponte multi parte para um sistema de telecomunicação, os sinais de microfone entrantes a partir das diferentes partes são digitalmente mixados e transmitidos ao alto-falante das diferentes partes. Como um exemplo, em uma realização básica, os sinais de entrada de todas as partes podem ser mixados e transmitidos a todas as partes. Por certas razões, por exemplo, para reduzir o nível de ruído de fundo do sinal transmitido, algumas implementações de pontes multi partes somente misturam os sinais de entrada a partir de um subconjunto fixo das partes. Esta escolha é tipicamente efetuada com base no nível de sinal e atividade de alto-falante das diferentes partes, onde os interlocutores ativos mais recentes são mantidos se nenhuma atividade de alto-falante estiver presente de qualquer outra parte. Uma modificação adicional à operação básica é que o sinal de microfone provenientes da parte A pode ser excluído da soma do sinal transmitido de volta à parte A. Razões para isto são que o sinal de microfone da parte A já está presente no alto-falante do interlocutor A (devido ao tom lateral no aparelho telefônico) e que se um retardo de transmissão significativo estiver presente no sistema, o sinal do microfone será percebido como um eco indesejável.
Com o uso crescente de vários terminais móveis (por exemplo, telefones celulares), situações onde dois ou mais usuários em uma chamada de conferência podem estar situados na mesma localização, tornar-se-á mais comum. Nestas situações, a conversação a partir do usuário A também estará presente como entrada para o microfone do usuário B. Com um retardo de transmissão significativo, este sinal proveniente do microfone do usuário B introduzirá um eco de interlocutor indesejável para o usuário A. Ainda mais, o sinal de microfone do usuário A será transmitido ao alto-falante do usuário B. Devido ao caminho direto da voz entre o interlocutor Aeo usuário B, isto pode, com um retardo de transmissão significativo no sistema, fazer com que o usuários B experimente um eco de ouvinte do interlocutor A. Similarmente, se ambos sinais de microfone dos usuários AeB são transmitidos às outras partes, este sinal pode conter um eco de ouvinte indesejável do interlocutor A. Daí, há uma necessidade de detectar conversação cruzada entre duas linhas de entrada para uma ponte de conferência multi partes e controlar a transmissão para os respectivos usuários, com base nesta conversação cruzada detectada. Neste relatório descritivo, o componente do sinal recebido originado do sinal conhecido, será referido como eco.
Há vários modos de detectar sinais de eco. Por exemplo, pode- se usar um conjunto de filtros adaptativos abrangendo o alcance de retardo de interesse e um histograma associado para determinar se um sinal de eco está presente e estimar seu retardo. Esta solução é descrita em [1]. Um problema com esta solução é seu alto custo computacional.
Um outro método conhecido é correlacionar a potência de sinal de enlace ascendente e enlace descendente para vários retardos de interesse. O eco pode ser detectado com base em observações da correlação de potência entre enlace ascendente e enlace descendente ao longo de um período de tempo. O eco é detectado se a correlação de potência para um certo retardo tiver estado presente durante um período suficientemente longo de tempo. Se o eco é detectado para vários retardos, o retardo em que a correlação de potência é maior é selecionado como a estimativa de retardo, ver [5]. Um problema desta solução é sua convergência lenta (a correlação de potência precisa estar presente durante um tempo suficientemente longo para detectar eco e estimar seu retardo de modo confiável).
Uma deficiência comum de ambos os métodos descritos é que estes não podem ser aplicados a conversação codificada diretamente, sem decodificar primeiramente os sinais de conversação. A capacidade de trabalhar diretamente no fluxo de bit codificado está se tornando crescentemente importante à medida que Operação Livre de Transcodificador (TrFO) e Operação Livre em Tandem (TFO) estão sendo introduzidas nas redes.
SUMÁRIO
Um objetivo da presente invenção é detecção de eco simplificada, e especialmente detecção de eco adequada para aplicação a fluxos de bits codificados. Um outro objetivo é uma medida adequada para representar a similaridade entre dois sinais.
Estes objetivos são alcançados de acordo com as reivindicações anexas.
A presente invenção é baseada em comparação de freqüência fundamental. Resumidamente, a presente invenção forma um conjunto de medidas de distância entre estimativas de freqüência fundamental de um primeiro sinal e estimativas de freqüência fundamental de um segundo sinal em retardos predeterminados com respeito ao primeiro sinal. A partir deste conjunto, uma medida de distância correspondendo à mais alta similaridade entre o primeiro e segundo sinais é selecionada. Se a medida de distância selecionada tem uma certa relação com um número de similaridade, o segundo sinal é classificado como incluindo um eco do primeiro sinal. Se foi encontrado um eco, o retardo correspondente à medida de distância selecionada pode ser usado como uma estimativa de retardo de eco.
BREVE DESCRIÇÃO DOS DESENHOS
A invenção, juntamente com objetivos e vantagens desta, pode ser melhor entendida fazendo referência à seguinte descrição, considerada juntamente com os desenhos que a acompanham, nos quais:
Figura 1 é um diagrama em blocos ilustrando geração e detecção de eco em geral;
Figura 2 é um diagrama em blocos de uma realização de um aparelho de detecção de similaridade de acordo com a presente invenção;
Figura 3 é um diagrama em blocos de uma realização de um detector de eco de acordo com a presente invenção;
Figura 4 é uma ilustração em fluxograma de uma realização do método de detecção de eco de acordo com a presente invenção;
Figura 5 é um diagrama em blocos de uma outra realização de um aparelho de detecção de similaridade de acordo com a presente invenção; Figura 6 é um diagrama em blocos de uma outra realização de um detector de eco de acordo com a presente invenção; e
Figura 7 é um diagrama em blocos ainda de uma outra realização de um detector de eco de acordo com a presente invenção.
DESCRIÇÃO DETALHADA
Na descrição seguinte, elementos executando as mesmas funções ou similares são providos das mesmas designações de referência.
No sentido de detectar eco, que é uma reflexão do sinal, necessita-se uma medida de similaridade entre os sinais de enlace ascendente e enlace descendente. O caminho de eco para o eco gerado pelos conjuntos portáteis móveis é não linear e não estacionário, o que torna difícil usar medidas de similaridade tradicionais aplicadas diretamente à forma de onda dos sinais.
Na seguinte descrição, o codec de conversação GSM AMR (Multi Taxa Adaptativo) será usado como um exemplo, porém raciocínio similar é possível com muitos outros couecs de voz, em particular aqueles baseados na tecnologia CELP (Predição Linear Excitada por Código). O codec AMR funciona em quadros de 20 ms (160 amostras) que são divididos em quatro sub quadros de 5 ms (40 amostras). Os parâmetros disponíveis em um fluxo de bit codificado AMR são os vetores LSP (Linha de Par Espectral), atrasos de freqüência fundamental fracionários (período de altura de som), vetores de código inovativos e os ganhos de freqüência fundamental e inovativos [6]. De acordo com a presente invenção, o período de freqüência fundamental é o parâmetro de escolha para detecção de eco. O período de freqüência fundamental ou freqüência fundamental do sinal de compensação é considerado como tendo uma melhor chance de passar por um sistema não linear desconhecido inalterado ou com uma pequena modificação, do que os outros parâmetros usados para representar a conversação em um codec AMR. Uma razão intuitiva para esta conclusão é que um sistema não linear provavelmente geraria harmônicos, porém não alteraria a freqüência fundamental de uma onda senoidal passando por ele. Ainda mais, em sistemas de rádio comunicação, o período de freqüência fundamental é freqüentemente protegido por codificação de canal.
Indiquemos o período de freqüência fundamental de enlace ascendente (ver Figura 1) para o sub quadro t por Tul(t) e o período de freqüência fundamental de enlace descendente para o sub quadro t-Δ por Tdl(t- AJ. O período de freqüência fundamental de enlace ascendente será tratado como uma variável randômica, devido à contribuição de erros de medição e contribuições do sinal verdadeiro a partir do lado móvel.
Indiquemos a diferença entre os períodos de freqüência fundamental de enlace ascendente e enlace descendente pelo processo:
w(t, Δ) = Tul(t) - Tdl(t-Δ) (1) Com estas definições, agora é possível usar o teste de hipóteses. Então, configure as seguintes hipóteses:
H1: o sinal de enlace ascendente contém eco conforme indicado pela similaridade dos períodos de freqüência fundamental de enlace ascendente e enlace descendente.
H0: um eco não está presente, e o período de freqüência fundamental de enlace ascendente é formado baseado somente nos sinais presentes no lado móvel.
Na hipótese Hi, o processo w(t, Δ) modela erros de estimativa de freqüência fundamental no codec de voz residente no telefone móvel, bem como a contribuição do sinal móvel verdadeiro. As simulações haviam indicado que a distribuição dos erros de estimativa pode ser aproximada por uma distribuição de Laplace e que a contribuição do sinal de extremidade próxima acarreta um piso uniforme para a função de distribuição. E então suposto que, sob a hipótese Hi a função de distribuição w(t, Δ) é dada por:
<formula>formula see original document page 10</formula>
onde:
β é um parâmetro de projeto (tipicamente entre 0,1 e 0,3) que pode ser usado para ponderar os componentes de Laplace e uniformes.
δ é o parâmetro (tipicamente ente 1 e 3) da distribuição de Laplace.
a, bsão variáveis determinadas pelos limites nos quais períodos de freqüência fundamental podem ser representados no codec de voz. No modo de 12,2 kbit/s do codec AMR, o período de freqüência fundamental varia de 18 a 143 e em outros modos de 20 a 143. Isto acarreta a = -125, b = 125 no modo de 2,2 kbit/s e a = -123, b = 123 em todos os outros modos.
a é uma constante normalizando a função de densidade de probabilidade de tal modo que a integral desta é a unidade. Esta constante é obtida resolvendo:
<formula>formula see original document page 10</formula>
o que acarreta:
<formula>formula see original document page 10</formula>
A Equação (2) pode ser reescrita de uma forma mais conveniente para derivação adicional:
<formula>formula see original document page 10</formula>
caso contrário Sob a hipótese Ho, a distribuição de w(t, Δ) é suposta uniforme dentro do intervalo [a, b], isto é:
<formula>formula see original document page 11</formula>
caso contrário
E suposto que os valores obtidos pelos processos randômicos w(t, Δ) em várias instâncias de tempo são estatisticamente independentes. Então, a densidade de probabilidade conjunta de N de tais densidades (correspondendo a N sub quadros; tipicamente N fica em torno de 100 ou mais) é o produto das densidades individuais:
<formula>formula see original document page 11</formula>
Um teste de relação de probabilidade, ver [7], pode ser designado para as hipóteses H0 e H1 mencionadas acima. E suposto que ambas as hipóteses apresentam a priori probabilidades iguais. Então, o teste é dado por:
<formula>formula see original document page 11</formula>
Tomando o logaritmo e simplificando (8) obtém-se o seguinte teste:
<formula>formula see original document page 11</formula>
É notado que o lado direito de (9) somente inclui constantes conhecidas. Então, esta pode ser representada por um limiar:
<formula>formula see original document page 11</formula> Similarmente, o segundo argumento da função mínima em (9) pode ser representado por uma constante de limite:
<formula>formula see original document page 12</formula>
Então, (9) pode ser escrita (usando a definição de w(t, Δ)) como:
<formula>formula see original document page 12</formula>
A distância D(Δ) representa uma medida da presença/ausência de um eco, tendo um retardo Δ. Quanto mais D(Δ) excede o limiar TH, mais certa se torna a presença de um eco com retardo Δ (hipótese Hi). Entretanto, deveria ser notado que D(Δ) somente representa uma medida da presença/ausência de um eco em uma distância específica no tempo. Uma expressão geral correspondendo a (12) para uma instância arbitrária t no tempo é:
<formula>formula see original document page 12</formula>
A Equação (13) pode agora ser usada como base para um detector de retardo de eco que detecta a presença/ausência de um eco com retardo Δ. O detector necessita computar a diagramas absoluta entre os períodos de freqüência fundamental de enlace ascendente e enlace descendente para o retardo Δ, limitar (saturar) as distâncias absolutas para serem menores que LIM, somar os resultados para todas as instâncias de tempo N e comparar a soma com o limiar TH. A estrutura de tal detector é mostrada na Figura 2. O detector inclui um subtrator 24 recebendo a freqüência fundamental de enlace ascendente Tul(t) e a freqüência fundamental de enlace descendente retardada Tdi(t-A). A distância ou sinais de diferença w(t, Δ) são enviados a uma unidade de valor absoluto 26 conectada a um limitador 28 e uma unidade de somatório 30, na qual os últimos N resultados são acumulados e divididos por Ν. A soma é então enviada a um classificador ou comparador 32, no qual é comparada ao limiar TH. Se o limiar é excedido, a hipótese H1 é considerada válida, isto é, um eco foi detectado para o retardo A, de outro modo a hipótese H0 é considerada válida, isto é, eco não está presente.
Figura 2 mostra a detecção para um único canal de retardo apresentando um retardo A. No sentido de ser capaz de detectar eco com um retardo desconhecido e estimar o retardo, é necessário implementar vários canais de retardo operando em paralelo, conforme mostrado na Figura 3. O retardo de eco corresponde ao retardo A com maior medida de distância associada D(t,Δ). Na Figura 3, um conjunto de detectores de similaridade de sinal 34, que podem ter a estrutura ilustrada na Figura 2, determina as medidas de distância D(t, Δmin), D(t, ΔMIN+]), ..., D(t, ΔMAX), para um conjunto de retardos Amin, Amin+],... , AmaX. Os retardos dependem da aplicação (onde o eco é esperado permanecer). Para detecção de eco móvel em um sistema GSM, AMjn permanece no intervalo de 100-160 ms c AmAx permanece no intervalo de 300-360 ms. Um seletor 36 seleciona o retardo Δ(t) correspondente à maior medida de distância D(t, Δ) e o classificador 32 emite o retardo correspondente Δ(t) se a medida de distância selecionada excede o limiar TH. Se esta não excede o limiar, o que indica que não há eco presente, um valor fictício, por exemplo 0, é gerado.
Em uma realização alternativa o detector de eco pode ser implementado como uma soma em andamento, isto é, no instante t computámos a medida de distância seguinte para cada um dos retardos de interesse e a comparamos com zero:
<formula>formula see original document page 13</formula>
onde TH e LIM correspondem às constantes em (13) e λ é um fator de ponderação usado para "esquecer" contribuições mais antigas para D(t, Δ). Por exemplo, valores adequados para as constantes são TH = 7 (TH tipicamente permanece no intervalo [4,7, 10,9]) e LIM = 9 (LIM tipicamente permanece no intervalo [7,1, 18,0]. O fator de ponderação λ permanece tipicamente no intervalo [0,9, 0,99]. Notar que, uma vez que a distância do período de freqüência fundamental absoluta é introduzida com um sinal menos em (14) uma grande medida de distância implica em que há similaridade entre os sinais de enlace ascendente e DL, e vice-versa, uma pequena medida de distância indica que nenhuma similaridade foi encontrada. O eco é detectado se qualquer das medidas de distância excede o nível zero. O retardo de eco corresponde ao Δ possuindo a maior medida de distância associada D(t, Δ) que excede zero.
Figura 4 é um fluxograma ilustrando uma realização do método de detecção de retardo de eco de acordo com a presente invenção. Em um instante de tempo particular t, a Etapa S1 determina Tul(t-m) e Tdl(t-m-Δ) para os possíveis valores de m e m-Δ Tipicamente, valores mais antigos são armazenados em memórias de armazenagem temporana. A Etapa S2 determina a medida de distância D(t, Δ) de acordo com (13). A Etapa S3 seleciona o maior D(t, Δ). A Etapa S4 testa se a medida de distância selecionada excede o limiar TH. Caso afirmativo, a Etapa S5 emite o retardo Δ correspondente à medida de distância selecionada D(t, Δ). De outro modo, a Etapa S6 emite um valor representando "sem eco", por exemplo, o valor 0.
Deveria ser notado que o modo particular de computar a medida de distância D(t, Δ) entre períodos de freqüência fundamental de enlace ascendente e enlace descendente não é crítico para a presente invenção. Uma outra realização da invenção, é para modelar a distribuição dos erros de estimativa w(t, Δ) como Gaussianos ao invés de Laplacianos. Neste caso, uma derivação similar conforme apresentado acima conduzirá a uma medida de distância quadrática oposta à medida de distância absoluta truncada acima.
De acordo com esta realização, a distância entre os períodos de freqüência fundamental dos sinais de enlace ascendente e enlace descendente é computada para diferentes retardos de sinal A usando uma janela retangular de N sub quadros (N=I6, por exemplo) como:
<formula>formula see original document page 15</formula>
Se o valor mínimo de
é menor que um limiar predefinido THq (por exemplo, 10), a presença de eco é detectada e o retardo de sinal pode ser encontrado a partir do retardo correspondente ao valor mínimo de DG(t, A). Figuras 5 e 6 ilustram esta realização. Na Figura 5, uma unidade de quadrado 40, quadra a diferença entre a freqüência fundamental de enlace ascendente Tul(t) e a freqüência fundamental de enlace descendente retardada Tdi(t-A). Estes quadrados são acumulados em uma unidade de somatório 42, e a soma resultante DG(t, Λ) é enviada a um classificador ou comparador 44, que a compara ao limiar THq (THg tipicamente permanece no intervalo [8, 12]). Se o limiar é excedido, nenhum eco está presente, caso contrário, um eco foi detectado.
Na realização ilustrada na Figura 6, um conjunto de detectores de similaridade de sinal 46, que podem ter a estrutura ilustrada na Figura 5, determina as medidas de distância D(t, ΔΜΙΝ), D(t, ΔΜΙΝ+]), ..., D(t, Δmax) para um conjunto de retardos predeterminados AMin, ΔΜΙΝ+1,... , Δmax. Um seletor 48 seleciona a menor medida de distância Do(t, A) e o classificador 44 emite o retardo correspondente A(t) se a medida de distância selecionada não excede o limiar THq. Se este excede o limiar, o que indica que não há eco presente, um valor fictício, por exemplo, 0 é gerado.
Em uma realização alternativa correspondente à Equação (14), a realização Gaussiana pode ser implementada como: <formula>formula see original document page 16</formula>
Uma outra realização da invenção é modelar a distribuição dos erros de estimativa w(t, Δ) como uma distribuição alfa-estável de Levy, ver [8]. As características importantes de uma distribuição adequada são que esta deveria ser simétrica em relação a zero e deveria ter uma máximo realmente estreito.
Embora a invenção seja especialmente útil se os sinais de conversação são codificados (TrFO ou TFO é usado para transmissão), esta pode também processar o caso de sinais não codificados, por exemplo, em formato ITU-T G.711 Iei-A ou lei-μ. Neste caso, necessita-se adicionar estimadores de freqüência fundamental do sinal de conversação conhecido e o sinal recebido ao detector. Um estimador de freqüência fundamental adequado é descrito por exemplo em [6]. Esta configuração é mostrada na Figura 7. Nesta realização, estimadores de freqüência fundamental 50 foram inseridos entre os sinais conhecidos e recebidos e o detector de eco da Figura 3.
Nas realizações descritas acima, uma medida de distância foi selecionada e então comparada a um limiar. Entretanto, uma outra possibilidade é comparar cada medida de distância ao limiar primeiramente, e então selecionar uma medida (max ou mim, dependendo a realização) a partir do conjunto de medidas que tenha passado na comparação de limiar.
Há diversas praticidades que podem ser adicionadas às estruturas de detector básicas derivadas acima:
• Sinais de conversação são não estacionários e não há ponto de andamento do detector de eco se a conversação de enlace descendente estiver faltando ou for silenciosa demais para gerar qualquer eco. Em uma realização prática, a medida de distância pode ser atualizada apenas se a potência de sinal de enlace descendente estiver acima de -40 dBmO, por exemplo.
• Similarmente, pode haver um limiar no ganho de freqüência fundamental de enlace descendente. Para o codec AMR, o limiar pode ser ajustado para 10000, por exemplo.
• A detecção pode ser efetuada somente em quadros de enlace ascendente "bons" isto é, quadros SID (Descritor de Inserção de Silêncio) e quadros corrompidos podem ser excluídos.
• Para permitir a rápida detecção de uma salva de eco espúria, as medidas de distância podem ser saturadas, por exemplo, em -200, isto é, sempre temos D(t, Δ) ≥ -200.
É um fato bem conhecido que o erro mais comum na estimativa de freqüência fundamental resulta em duas vezes o período de freqüência fundamental real. Esta característica pode ser explorada para reforçar o detector de eco. Na implementação particular da Equação (14) isto pode ser levado em conta adicionando um detector ao detector original, onde o período de freqüência fundamental de enlace descendente e comparado à metade do período de freqüência fundamental de enlace ascendente. Por exemplo, a Equação (14) pode ser modificada em:
<formula>formula see original document page 17</formula>
onde λ2, TH2, LIM2 correspondem a λ, TH, LIM na Equação (14), mas podem ter valores diferentes. Uma vez que estamos agora olhando para um canal relacionado aos erros de estimativa de freqüência fundamental mais prováveis cometidos pelo codificador no telefone móvel, é razoável selecionar as constantes TH2, LIM2 menores que TH, LIM em (14). Por exemplo, valores adequados para as constantes são TH2 = 4 (TH2 tipicamente permanece no intervalo [3, 5] e LIM2 = 6 (LIM2 permanece tipicamente no intervalo [5, 7]). Tipicamente, λ2 = λ para produzir a mesma "extensão de memória", mas isto não é estritamente necessário. Em uma realização ilustrativa, somente uma das atualizações dadas por (14) e (17) é usada em cada instante de tempo t. Isto é demonstrado pelo seguinte pseudo código:
<formula>formula see original document page 18</formula>
então atualize para D(t, Δ) usando (14) então atualize para D(t, Δ) usando (17)
Outros erros de estimativa de freqüência fundamental prováveis tais como metade da freqüência fundamental real podem ser processados similarmente.
A funcionalidade dos vários blocos da similaridade de sinal e detector de eco é tipicamente obtida por um ou vários microprocessadores ou combinações de microprocessador/processador de sinal e software correspondente.
Embora a presente invenção tenha sido descrita com referência a detecção de eco, o que implica em um certo retardo entre os sinais envolvidos, é verificado que os mesmos princípios podem ser de fato usados para detectar similaridade entre dois sinais em geral (com ou sem retardos mútuos).
Ainda mais, embora a presente invenção tenha sido descrita com referência a sinais de conversação, é verificado que os mesmos princípios são aplicáveis a sinais de áudio mais gerais possuindo conteúdo harmônico, tal como música. De fato, os mesmos princípios são aplicáveis a qualquer espécie de sinal que possa ser particularmente caracterizado por uma estimativa de freqüência fundamental.
A invenção descrita possui várias vantagens:
• Permite a rápida detecção e estimativa de retardo de uma réplica retardada e possivelmente distorcida de um sinal de conversação ou áudio conhecido em uma mistura de vários sinais e ruído de conversação e/ou áudio. Por exemplo, permite a rápida detecção e estimativa de retardo de eco móvel.
• É capaz de copiar com caminhos de eco não lineares.
• É capaz de funcionar em conversação codificada (apenas a extração do período de freqüência fundamental é requerida).
Será entendido pelos especialistas na técnica que várias modificações e mudanças podem ser feitas à presente invenção, sem se afastar do escopo desta, que é definido pelas reivindicações anexas.
REFERÊNCIAS
[1] ITU-T Recommendation G. 131, Control of talker echo.
[2] A. Eriksson et al., Mobile Crosstalk Control - Enhancing speech quality in mobile systems, Ericsson Review 1998, N0.2.
[3] US Patent 6.771.779, Reducing acoustic crosstalk in multi- microphone conference system by inverting estimated crosstalk matrix for filtering.
[4] US Patent 6.256.384, Method and apparatus for cancelling echo originatmg froni a mobile terminal.
[5] US Patent 6.466.666, Echo power estimation method for telephony system.
[6] 3GPP TS 26.090 V6.0.0 (2004-12) 3rd Generation Partnership Project; Technical Specification Group Services and System Aspects; Mandatory Speech Codec speech processing functions; Adaptative Multi-Rate (AMR) speech codec; Transcoding functions (Release 6).
[7] L. Van Trees, Detection, Estimation, and Modulation Theory, Wiley & Sons, 1971, pp. 19-33.
[8] Wikipedia, http://answers.com/topic/l-vy-distribution.