BR122017018551B1

BR122017018551B1 - Método, e, dispositivo para reamostrar um sinal de audiofrequência em um codificador ou um decodificador de sinal de audiofrequência

Info

Publication number: BR122017018551B1
Application number: BR122017018551-9A
Authority: BR
Inventors: Balazs Kovesi; Stéphane Ragot
Original assignee: Koninklijke Philips N.V.
Priority date: 2013-09-30
Filing date: 2014-09-26
Publication date: 2022-03-03
Also published as: SI3053163T1; PT3053163T; US20170372714A1; KR20210142765A; FI3330964T3; RS63937B1; FI3053163T3; KR102505502B1; KR20170103027A; JP6559658B2; HRP20230094T1; FR3011408A1; PT3330964T; JP2016541004A; JP6559741B2; WO2015044609A1; SI3330964T1; CN105684078B; MX2016003902A; EP3330964A1

Abstract

a invenção refere-se a um processo de reamostragem de um sinal de audiofrequência em uma codificação ou decodificação de sinal de audiofrequência. o processo é tal que compreende as etapas seguintes por bloco de sinal para reamostrar: - determinação (e401) por predição linear adaptativa de um número de amostras de sinal futuro, esse número sendo definido em função de um atraso de reamostragem escolhido; - construção (e402) de um vetor de suporte de reamostragem a partir pelo menos das amostras do bloco corrente e das amostras determinadas de sinal futuro; - aplicação (e403) de um filtro de reamostragem sobre as amostras do vetor de suporte de reamostragem. a invenção refere-se também a um dispositivo de reamostragem implementando o processo descrito, um codificador e um decodificador compreendendo pelo menos um dispositivo.

Description

[001] O presente pedido é dividido do BR 11 2016 006447 0, de 23/03/2016.

[002] A presente invenção refere-se ao processamento de um sinal de audiofrequência para sua transmissão ou sua armazenagem. Mais particularmente, a invenção se refere a uma mudança de frequência de amostragem no momento de uma codificação ou de uma decodificação do sinal de audiofrequência.

[003] Numerosas técnicas existem para comprimir (com perda) um sinal de audiofrequência como a palavra ou a música. A codificação pode ser efetuada diretamente na frequência de amostragem do sinal de entrada, como por exemplo, nas recomendações IUT-T G.711 ou G.729 onde o sinal de entrada é amostrado a 8 kHz e o codificador e decodificador funcionam nessa mesma frequência.

[004] Todavia, alguns métodos de codificação utilizam uma mudança de frequência de amostragem, por exemplo, para reduzir a complexidade da codificação, adaptar a codificação em função das diferentes sub-bandas de frequência para codificar, ou converter o sinal de entrada para que corresponda a uma frequência de amostragem interna predefinida do codificador.

[005] Na codificação em sub-bandas definida na recomendação UIT-T G.722, o sinal de entrada a 16 kHz é dividido em 2 sub-bandas (amostradas a 8 kHz) que são codificadas separadamente por um codificador de tipo MICDA (para "Modulação por Impulso e Codificação Diferencial adaptativa", ADPCM em inglês). Essa divisão em 2 subbandas é efetuada por um banco de filtros espelhos em quadrático para a resposta de impulso finita (FIR em inglês para "Finite Impulse Response") de ordem 23 que causa em teoria um atraso de análise/síntese (codificador + decodificador) de 23 amostras a 16 ms; esse banco de filtro é implementado com uma realização polifásica. A divisão em duas sub-bandas na G.722 permite atribuir de modo predeterminado débitos diferentes às duas sub-bandas em função da sua importância perceptual a priori e também reduzir a complexidade total de codificação executando dois codificadores de tipo MICDA para uma frequência mais baixa. Em contrapartida, induz um atraso algorítmico em relação a uma codificação MICDA direta.

[006] São conhecidos diferentes métodos de mudança de frequência de amostragem, ainda chamada reamostragem, de um sinal digital, usando, por exemplo, e de modo não exaustivo, um filtro FIR (para "Finite Impulse response" em inglês, ou Resposta de Impulso finita em francês) um filtro IIR para "Infinite Impulse response" em inglês, ou Resposta de Impulso infinita em francês) ou uma interpolação polinomial (como os splines). Uma revista dos métodos convencionais de reamostragem se encontra, por exemplo, no artigo R.W. Schafer, L.R. Rabiner, A Digital Signal Processing Approach to Interpolation, Proceedings of the IEEE, vol.61, n° 6, junho de 1973, pp. 692-702.

[007] A vantagem do filtro FIR (simétrico) resulta da sua implementação simplificada e - sob certas condições - da possibilidade de garantir uma fase linear. Uma filtragem de fase linear permite preservar a forma de onda do sinal de entrada, mas pode também ser acompanhada por uma dispersão temporal («ringing») podendo criar artefatos de tipo pré-ecos sobre transitórios. Esse método causa um atraso (que é função do comprimento da resposta de impulso), em geral da ordem de 1 para alguns ms para garantir características de filtragem adequadas (ondulação na largura de banda, nível de rejeição suficiente para suprimir o efeito serrilha ou as imagens espectrais, etc.).

[008] A alternativa de uma reamostragem por filtro IIR leva em geral a uma fase não linear, para pelo menos compensar a fase por um patamar suplementar de filtragem passa-tudo, como descrito por exemplo no artigo P.A. Regalia, S.K. Mitra, P.P. Vaidyanathan, The Digital AllPass Filter: A. Versatile Signal Processing Building Block, Proceedings of the IEEE, vol.76, n°.1, janeiro de 1988, com um exemplo de realização na rotina "iirgrpdelay" do software MATLAB; um filtro IIR é em geral de ordem menos elevada mas mais complexo para implementar em vírgula fixa, os estados (ou memórias) do filtro podendo atingir valores de grande dinâmica para a parte recursiva, e esse problema é ampliado se é utilizada uma compensação de fase por filtragem passa- tudo.

[009] A figura 1 ilustra um exemplo de subamostragem para uma razão de 4/5 com um filtro FIR de comprimento de 2*60+1=121 coeficientes a 64 kHz para passar de 16 kHz para 12,8 kHz. As abcissas representam o tempo (reconduzido em ms para representar os sinais cadenciados para frequências diferentes) e as ordenadas as amplitudes. Os quadrados no cimo representam as posições temporais das amostras do sinal de entrada a 16 kHz; se supõe aqui que essas amostras correspondem à extremidade de uma trama de 20 ms. As linhas verticais contínuas marcam os momentos de amostragem correspondentes a 16 kHz. Na parte inferior da figura, as linhas verticais a pontilhado marcam os momentos de amostragem correspondentes a 12,8 kHz e as estrelas simbolizam as amostras de saída a 12,8 kHz. Foi também representada a resposta de impulso (simétrica) de 121 coeficientes de um filtro FIR a 64 kHz, essa resposta é posicionada para calcular a última amostra da trama corrente a 12,8 kHz (a posição do máximo da resposta de impulso é alinhada com essa amostra). Os círculos mostram os valores utilizados (correspondentes ao momento de amostragem de entrada) em uma representação polifásica; para obter a amostra de saída se multiplicam esses valores pela amostra de entrada correspondente e se adicionam esses resultados. Se nota nessa figura que 12 amostras (até ao final da trama de entrada) a 12,8 kHz não podem ser calculadas exatamente porque as amostras de entrada após o final da trama corrente (começo da trama seguinte) não são ainda conhecidas; o atraso de subamostragem nas condições da figura 1 é de 12 amostras, ou seja, 12/12,8 = 0,9375 ms.

[010] Existem técnicas de redução do atraso introduzido pelas mudanças de frequência de amostragem de tipo FIR.

[011] Na norma 3GPP AMR-WB (também definida como a recomendação UIT-T G.722.2), o sinal de entrada amostrado a 16 kHz é subamostrado para uma frequência interna de 12,8 kHz antes de aplicar uma codificação de tipo CELP; o sinal decodificado a 12,8 kHz é em seguida reamostrado a 16 kHz e combinado com um sinal de banda alta.

[012] A vantagem de passar por uma frequência intermédia de 12,8 kHz é que ela permite reduzir a complexidade da codificação CELP e também ter um comprimento de trama múltipla com uma potência de 2, o que facilita a codificação de alguns parâmetros CELP. O método usado é uma reamostragem convencional de um fator de 4/5 por filtro FIR (de 121 coeficientes a 64 kHz), com uma realização polifásica para minimizar a complexidade.

[013] Em teoria, essa reamostragem no codificador e no decodificador AMR-WB deveria causar um atraso de um modo semelhante ao processamento representado na figura 1. No caso do codec AMR-WB, com um filtro FIR de 121 coeficientes, o atraso total deveria ser em teoria de 2x60 amostras a 64 kHz, ou seja, 2X15 amostras a 16 kHz ou 1,875 ms; efetivamente, uma técnica específica é implementada no codificador AMR-WB para eliminar (compensar) o atraso associado unicamente na parte de codificador e, portanto, dividir por 2 o atraso efetivo.

[014] Esse método de compensação é descrito na norma 3GPP TS 26.190, Cláusula 5.1 e na recomendação UIT-T G.722.2, Cláusula 5.1. O método de compensação de atraso de filtragem FIR consiste em adicionar, para cada nova trama amostrada a 16 kHz, a ser convertida para 12,8 kHz, um número predeterminado de zeros na extremidade da trama corrente. Esses zeros são definidos na frequência de amostragem de entrada e seu número corresponde ao atraso do filtro FIR de reamostragem para essa frequência (ou seja, 15 zeros adicionados a 16 kHz). A reamostragem é implementada por trama de 20 ms (320 amostras). A reamostragem no codificador AMR-WB é, portanto, equivalente para completar a trama de entrada de 320 amostras à esquerda (para o passado) por 30 amostras do final de trama precedente (memória de reamostragem) e à direita por 15 zeros para formar um vetor de 30+320+15=365 amostras, que é em seguida reamostrado com um fator de 4/5. O filtro FIR pode assim ser implementado com uma fase nula, portanto sem atraso, visto que se acrescenta um sinal futuro nulo. Em teoria a reamostragem FIR por um fator de 4/5 é efetuada de acordo com as etapas seguintes:

[015] - Sobreamostragem por 4 (de 16 kHz a 64 kHz) por adição de 3 amostras a 0 após cada amostra de entrada

[016] - Filtragem passa-baixo de função de transfer Hdecim(z) de tipo FIR simétrico de ordem de 120 a 64 kHz

[017] - Subamostragem por 5 (de 64 kHz a 12,8 kHz) apenas guardando uma amostra sobre cinco do sinal filtrado passa-baixo.

[018] Na prática, essa reamostragem é implementada de modo equivalente seguindo uma realização otimizada polifásica sem calcular o sinal intermédio a 64 kHz e sem concatenar o sinal para converter com zeros (ver o ficheiro «decim54.c» do código fonte do codec AMRWB); a filtragem FIR para cada « fase » é equivalente a um filtro FIR de ordem 24 a 12,8 kHz com um atraso de 12 amostras a 12,8 kHz, ou seja, 0,9375 ms.

[019] O resultado da reamostragem FIR de cada trama de 20 ms de 16 kHz a 12,8 kHz é idêntico a uma reamostragem efetuada sobreo sinal de entrada «completo» (não cortado em tramas) exceto para as últimas 12 amostras de cada trama resultante de 12,8 kHz que compreendem um erro devido à utilização de um bloco de zeros como sinal futuro em vez do «verdadeiro» sinal futuro que só está disponível na trama seguinte. Efetivamente, os zeros introduzidos simulam o caso de um sinal de entrada nulo na trama seguinte.

[020] Esse processamento é ilustrado no final de uma trama de 20 ms na figura 2 que representa as últimas amostras de entrada a 16 kHz pelos quadrados em cima; as linhas verticais marcam os momentos de amostragem correspondentes a 16 kHz. Na parte inferior da figura, as estrelas simbolizam as amostras de saída a 12,8 kHz que podem ser obtidas por subamostragem convencional com atraso de 12 amostras. Em seguida, os triângulos em baixo correspondem às 12 amostras a 12,8 kHz obtidas utilizando pelo menos uma amostra de valor nulo adicionada no final da trama para poder continuar a filtragem e reduzir o atraso. Essas amostras estão numeradas de #1 a #12 em função da sua posição em relação ao final da saída obtido com uma filtragem convencional. Se representou também a resposta de impulso do filtro a 64 kHz utilizado na posição correspondente à última amostra de saída a 12,8 kHz (o máximo da resposta de impulso é alinhado com essa amostra). Os círculos mostram os valores utilizados (correspondendo ao momento de amostragem de entrada) na representação polifásica; para obter a amostra de saída se multiplicam esses valores pela amostra de entrada correspondente ou por 0 para os valores após o final da trama e se adicionam esses resultados. Se pode observar que para essa última amostra quase a metade das amostras utilizadas da resposta de impulso é multiplicada pelos zeros adicionados, o que introduz, portanto, um erro de estimativa significativo. Se compreende também que o erro das primeiras amostras formadas após a filtragem convencional (isto é unicamente com o verdadeiro sinal de entrada) é baixo (o peso da resposta de impulso na sua extremidade é baixo) e quanto mais longe da filtragem convencional maior é o erro (o peso da resposta de impulso sendo então mais importante). Se poderá observar isso nos resultados das figuras 7.

[021] O método de compensação de atraso utilizado no codec AMR-WB, onde os zeros são adicionados no final de cada bloco (ou trama) de 20 ms para reamostrar, permite eliminar o atraso de reamostragem no codificador, mas não é satisfatória em geral quando os valores formados no final da trama corrente (com zeros adicionados na entrada) são diretamente codificados e não são substituídos pelos verdadeiros valores uma vez conhecido o sinal de entrada da trama seguinte. Efetivamente esses erros regulares no final de cada trama geram descontinuidades periódicas no momento da passagem para o verdadeiro sinal de saída no início de trama seguinte. Essas descontinuidades são muitas vezes audíveis e muito incômodas. É por isso que a compensação de atraso só é aplicada ao codificador e unicamente na parte de sinal futuro chamado «lookahead» em inglês, e não ao codificador AMR-WB.

[022] Efetivamente, no codificador AMR-WB, cada nova trama de entrada de 20 ms a 16 kHz corresponde a um segmento temporal correspondente aos últimos 15 ms da trama corrente para codificar por modelo ACELP e 5 ms de sinal futuro ("lookahead" em inglês). Os primeiros 5 ms da trama corrente para codificar foram já recebidos memorizados como "lookahead" do segmento precedente. As 12 últimas amostras obtidas após reamostragem de 16 a 12,8 kHz no codificador correspondem, portanto às últimas amostras do sinal futuro de 5 ms a 12,8 kHz. Depois disso, a trama corrente de 20 ms a 12,8 kHz (ou seja, 256 amostras) e os 5 ms de sinal futuro (ou seja, 64 amostras) é completada por 5 ms de sinal original passado ("loopback" em inglês) para formar o bufffer de análise LPC de 384 amostras (30 ms) que é ponderado por uma janela de análise LPC com o mesmo comprimento.

[023] As 12 últimas amostras do "lookahead" a 12,8 kHz compreendendo um erro de reamostragem têm um peso relativo muito baixo na janela que serve a predição linear (LPC), e a fortiori só têm impacto sobre o invólucro LPC estimado e esse impacto é muito insignificante. É importante assinalar que as 12 amostras erradas são substituídas pelos valores «exatos» de reamostragem na trama seguinte, portanto, o erro só está presente temporariamente na trama corrente para o sinal futuro (lookahead) e só impacta a análise LPC. Assim, a técnica de compensação de atraso do codificador AMR- WB não impacta a codificação da forma de onda do sinal na trama corrente no codec AMRWB. Esse modo é depois chamado: "utilização por trama com sinal futuro". As amostras assim formadas são apenas utilizadas de modo temporário para cálculos intermédios (análise LPC) e são substituídas pelas amostras corretamente reamostradas quando é conhecido o sinal da trama seguinte. É de notar que nessa configuração, para uma trama de saída de comprimento lg_out para cada trama, se formam lg_out + 12 amostras pela reamostragem.

[024] Essa técnica de compensação de atraso utilizada para o codificador AMR-WB não é aplicada ao decodificador AMR-WB.

[025] Assim, o codec (codificador+decodificador) tem um atraso algorítmico total de 25,9375 ms no codificador (20 ms trama + 5 ms de lookahead) e na reamostragem no decodificador (0,9375 ms).

[026] A técnica de compensação de atraso do codificador AMRWB não poderia ser utilizada para reduzir o atraso de filtragem QMF do codec G.722, porque degradaria muito a qualidade do sinal codificado. Com efeito no codec G.722 as amostras que resultam da filtragem (os sinais de banda baixa e de banda alta) constituem diretamente os sinais de entrada dos 2 sub-codecs MICDA que operam sem "lookahead" e que não permitem corrigir esses valores de uma trama para a outra. Esse modo será depois chamado; "utilização trama por trama contínua".

[027] A presente invenção vem melhorar a situação do estado da técnica.

[028] Propõe para esse fim, um processo de reamostragem de um sinal de audiofrequência em uma codificação ou decodificação de sinal de audiofrequência. O processo é tal que compreende as etapas seguintes por bloco de sinal para reamostrar:

[029] - determinação por predição linear adaptativa de um número de amostras de sinal futuro, esse número sendo definido em função de um atraso de reamostragem escolhido;

[030] - construção de um vetor de suporte de reamostragem a partir pelo menos das amostras do bloco corrente e das amostras determinadas de sinal futuro;

[031] - aplicação de um filtro de reamostragem sobre as amostras do vetor de suporte de reamostragem.

[032] Assim, a reamostragem de acordo com a invenção permite diminuir o atraso de reamostragem por filtro (por bloco ou por trama), guardando um desempenho muito próximo de uma reamostragem contínua. A predição do sinal futuro em cada bloco ou trama permite ter amostras mais próximas das amostras reais do que se essas amostras futuras forem fixadas em um valor de zero. O desempenho do processo de reamostragem para essas últimas amostras é, portanto, melhor.

[033] Esse processo de reamostragem é mais adaptativo uma vez que é possível adaptar o número de amostras de sinal futuro a ter em conta em função do atraso desejado. Para uma reamostragem sem atraso, o número de amostras de sinal futuro para determinar corresponde então ao atraso do filtro de reamostragem. Se é tolerado um atraso mais baixo do que o atraso do filtro, então o número de amostras de sinal futuro pode corresponder somente a uma parte do atraso do filtro de reamostragem.

[034] A adaptação do atraso de reamostragem sendo efetuado por bloco de sinal, é então possível trocar facilmente, de um bloco para um outro ou de uma trama para uma outra, diferentes configurações de reamostragem (como o filtro FIR utilizado para esse fim) ou trocar uma codificação direta de uma trama dada em uma certa frequência de amostragem para uma codificação da trama seguinte com reamostragem, ou vice-versa.

[035] As diferentes modalidades particulares de realização mencionadas mais adiante podem ser adicionadas independentemente ou em combinação umas com as outras, nas etapas do processo de reamostragem definido mais acima.

[036] Em uma modalidade simples de realização, a etapa de determinação por predição linear adaptativa compreende as etapas seguintes:

[037] - obtenção de coeficientes de um filtro de predição linear de ordem predeterminada;

[038] - obtenção das amostras de sinal futuro por aplicação do filtro de predição obtido para um sinal de excitação de valor de zero.

[039] Em uma modalidade de realização particular, os coeficientes do filtro de predição linear são obtidos por leitura de parâmetros memorizados na etapa de codificação ou de decodificação.

[040] Assim, quando o módulo de codificação, independente do dispositivo de reamostragem, compreende uma análise LPC que já determina os parâmetros do filtro de predição, não é necessário recalcular esses parâmetros no momento do processo de reamostragem. Basta apenas ler os parâmetros que foram memorizados (quantificados ou não).

[041] Em uma outra modalidade de realização, os coeficientes do filtro de predição linear são obtidos por análise a partir pelo menos das amostras do bloco corrente.

[042] A análise LPC é feita então diretamente no dispositivo de reamostragem.

[043] Em um exemplo de realização, a predição linear é efetuada sobre um sinal de audiofrequência em que se realizou um processamento de pré-acentuação.

[044] A pré-acentuação permite garantir uma maior estabilidade digital em uma implementação em vírgula fixa, em particular para os sinais tendo uma forte inclinação e dinâmica espectral. Reduz a dinâmica espectral do sinal, a distribuição da potência do sinal sobre as bandas de frequências se torna assim mais homogênea após a préacentuação. Os parâmetros de modelização após pré- acentuação têm uma dinâmica mais baixa, e é mais fácil garantir a estabilidade do sistema e mais fácil também instalar o algoritmo utilizando esse modelo com uma aritmética de vírgula fixa.

[045] Em modalidades possíveis de realização, a predição linear adaptativa é uma predição entre um dos métodos seguintes:

[046] - predição linear a curto prazo;

[047] - predição linear a longo prazo;

[048] - combinação de predição linear a curto prazo e de predição linear a longo prazo;

[049] - processo de dissimulação da trama apagada.

[050] Assim, qualquer tipo de predição mais ou menos exata é possível para a implementação do processo garantindo uma eficácia em termos de relação sinal para ruído interessante.

[051] A presente invenção visa também um dispositivo de reamostragem de um sinal de audiofrequência em um codificador ou decodificador de sinal de audiofrequência. O dispositivo é tal que compreende:

[052] - um módulo de predição linear adaptativa apto para determinar por bloco de sinal, um número de amostras de sinal futuro definido em função de um atraso de reamostragem escolhido;

[053] - um módulo de construção de um vetor de suporte de reamostragem a partir pelo menos das amostras do bloco corrente e das amostras determinadas de sinal futuro;

[054] - um filtro de reamostragem aplicado nas amostras do vetor de suporte de reamostragem.

[055] Esse dispositivo tem as mesmas vantagens que o processo descrito anteriormente que ele implementa.

[056] Em uma modalidade de realização particular, o módulo de predição linear adaptativa coopera com um módulo de análise por predição compreendido no módulo de codificação ou de decodificação por predição, do codificador ou do decodificador.

[057] Assim, a complexidade do dispositivo de reamostragem é reduzida visto que não tem necessidade de compreender módulo de análise LPC. Os parâmetros provenientes do módulo de análise do módulo de codificação ou de decodificação são memorizados no momento da codificação ou da decodificação e podem assim servir no momento da reamostragem.

[058] A presente invenção visa também um codificador e um decodificador de sinal de audiofrequência compreendendo pelo menos um dispositivo de reamostragem tal como descrito.

[059] Em uma modalidade de realização particular, o codificador ou o decodificador compreende um dispositivo de reamostragem utilizando pelo menos dois filtros de reamostragem tendo atrasos diferentes, pelo menos um dos filtros sendo implementado de acordo com o processo tal como descrito precedentemente para o qual a determinação do número de amostras de sinal futuro é função da diferença de atraso dos dois filtros de reamostragem utilizados.

[060] Os filtros de reamostragem estando muitas vezes associados a modos de codificação diferentes, essa modalidade de realização permite mudar facilmente de um modo de codificação para um outro sem que haja artefatos audíveis.

[061] A invenção visa um programa informático compreendendo instruções de código para a implementação das etapas do processo de reamostragem tal como descrito, quando essas instruções são executadas por um processador.

[062] Finalmente, a invenção se refere a um suporte de armazenagem, legível por um processador, integrado ou não no dispositivo de reamostragem, eventualmente amovível, memorizando um programa informático que implementa um processo de reamostragem tal como descrito anteriormente.

[063] Outras características e vantagens da invenção vão aparecer mais claramente com a leitura da seguinte descrição, dada unicamente a título de exemplo não limitativo, e feita com referência aos desenhos anexados, nos quais:

[064] - a figura 1 ilustra a resposta de impulso de um filtro de reamostragem em um método do estado da técnica tal como descrita anteriormente;

[065] - a figura 2 ilustra a resposta de impulso de um filtro de reamostragem em um método do estado da técnica com compensação do atraso por zeros tal como descrita anteriormente;

[066] - a figura 3 ilustra um exemplo de codificador de sinal de áudio compreendendo um dispositivo de reamostragem de acordo com uma modalidade de realização da invenção;

[067] - a figura 4a ilustra na forma de organograma, as etapas de um processo de reamostragem de acordo com uma modalidade de realização da invenção;

[068] - a figura 4b ilustra na forma de organograma, as etapas de uma variante de realização de um processo de reamostragem de acordo com a invenção;

[069] - a figura 5a ilustra na forma de organograma os detalhes da etapa de determinação do fator de pré-acentuação (também chamado pré-ênfase) de acordo com uma modalidade de realização da invenção;

[070] - a figura 5b ilustra na forma de organograma os detalhes da etapa de predição linear de acordo com uma modalidade de realização da invenção;

[071] - a figura 6 ilustra a forma de uma janela de análise utilizada em uma modalidade de realização da invenção;

[072] - as figuras 7a a 7l mostram para diferentes posições de amostra posterior à trama corrente de sinal para reamostrar, um comparativo da relação sinal para ruído em função da frequência central obtido pela aplicação em um sinal de teste do método de reamostragem do estado da técnica implementado no codificador AMR-WB e do método de reamostragem de acordo com uma primeira e uma segunda modalidade de realização da invenção;

[073] - as figuras 8a a 8c mostram para diferentes posições de amostra posterior à trama corrente de sinal para reamostrar, um comparativo da relação sinal para ruído para 3 casos diferentes de mudança de frequências de reamostragem de acordo com o método de reamostragem do estado da técnica implementado no codificador AMRWB e do método de reamostragem de acordo com uma primeira e segunda modalidade de realização da invenção; e

[074] - a figura 9 ilustra um exemplo de decodificador de sinal de áudio compreendendo um dispositivo de reamostragem de acordo com uma modalidade de realização da invenção;

[075] - a figura 10 ilustra uma representação material de um dispositivo de reamostragem de acordo com uma modalidade de realização da invenção.

[076] A figura 3 ilustra um exemplo de codificador de áudio compreendendo um dispositivo de reamostragem 300 de acordo com uma modalidade de realização da invenção.

[077] O codec ilustrado aqui é um codificador de sinais de áudio (mono), multidébitos (com débitos fixos de 7,2 a 128 kbit/s) funcionando nas frequências de amostragem de entrada e de saída de 8, 16, 32 ou 48 kHz. Há primeiro um interesse na parte de codificador representada na figura 3, o decodificador associado sendo descrito mais adiante em ligação com a figura 9.

[078] O sinal de entrada está dividido em tramas de 20 ms (bloco 310), cada trama pode ser codificada ou de acordo com uma aproximação temporal (TD para "Time Domain" em inglês) de tipo CELP (309) ou de acordo com uma aproximação de frequência (FD para "Frequency Domain" em inglês) de tipo MDCT (bloco 312) antes de ser multiplexada pelo modo de multiplexagem 313. Se considera aqui que as codificações de tipo CELP e MDCT são conhecidas do perito na técnica. A escolha do modo (bloco 311) - que inclui o da frequência interna de codificação - não é detalhada aqui.

[079] Nesse codec flexível em termos de débitos e de frequências de amostragem, são necessárias várias configurações de reamostragem de uma frequência ‘fIn’ (In para input) para uma frequência ‘fOut’ (Out para output). Em uma modalidade de realização descrita aqui, as configurações usadas estão listadas na tabela 1 mais abaixo:

[080] Nessa tabela, os valores de frequências a negrito indicam frequências «externas» (isto é, de entrada e/ou de saída) do codec, e os outros valores de frequências são frequências de amostragem «internas » para a codificação da banda baixa do sinal - de um modo semelhante à codificação AMR-WB que só dispõe de uma frequência externa a 16 kHz e de uma frequência interna a 12,8 kHz. "filt_lenin" representa o comprimento do filtro, "fac_num" representa o fator de sobreamostragem e "fac_den" o fator de subamostragem.

[081] Sem perda de generalidade, os filtros FIR são concebidos no exemplo ilustrado aqui de acordo com o método convencional chamado «método da janela», porque se trata da gestão de janelas de um seno cardinal (sin(x)/x). Os filtros FIR são concebidos por exemplo como explicado mais abaixo.

[082] Por exemplo, o filtro f_5_8_129 é obtido com o controle matlab seguinte:

[083] f_5_8_129=[0000 fir1(248,(3775/32000),hanning(249)) *4.999895 0 0 0 0]; com uma frequência de corte (-6 dB) a 64 kHz de 3775 Hz.

[084] Esses coeficientes são utilizados como um filtro de 16 coeficientes a 8000 Hz (ou 128 coeficientes a 64000 Hz) e como um filtro de 24 de coeficiente a 12800 Hz (ou 120 coeficientes a 64000 Hz, ignorando os últimos valores).

[085] O filtro f_12_180 é obtido com os controles matlab seguintes:

[086] ftmp = fir1(358,1/12,hanning(359));

[087] f_12_180 = [0 ftmp/ftmp(180) 0];

[088] com uma frequência de corte (-6 dB) a 192 kHz de 8000 Hz.

[089] O filtro f_15_180 é obtido com os controles matlab seguintes:

[090] ftmp = fir1(358,1/15,hanning(359));

[091] f_12_180 = [0 ftmp/ftmp(180), 0];

[092] Em variantes da invenção evidentemente se podem utilizar outros métodos de conceção de filtro FIR.

[093] Essas configurações de conversão são aqui justificadas, sem perda de generalidade, pela utilização de 2 frequências internas, 12,8 kHz e 16 kHz, no algoritmo de codificação. Não se detalha aqui como é efetuado o modo de escolha da frequência de amostragem interna (12,8 ou 16 kHz) nem a escolha do tipo de codificação a ser usada (bloco 311). Isso ultrapassa o quadro da invenção. No entanto, se notará que a escolha da frequência interna pode ser feita independentemente em cada trama, para uma mesma frequência de entrada e/ou de saída do codec, o que por exemplo significa que para a trama N se pode usar uma reamostragem de acordo com uma configuração i, para a trama N+1 uma reamostragem de acordo com a configuração j diferente de i (mas com a mesma frequência «externa»), e para a trama N+2 nenhuma reamostragem o que inclui uma codificação direta da trama para a frequência de entrada fin - na prática esse último caso só é possível na modalidade de realização privilegiada nas seguintes situações:

[094] se o modo de codificação escolhido é a codificação de tipo FD, que funciona sempre na frequência fIn

[095] se o modo de codificação escolhido é a codificação TD e a frequência de entrada fIn corresponde à frequência interna de codificação TD.

[096] No entanto, em uma variante da invenção, a codificação de tipo FD poderá ser forçada a funcionar na mesma frequência interna de codificação que a codificação TD, para de facilitar a comutação.

[097] Se note que a transição de uma codificação TD para uma codificação FD e vice-versa não é aqui descrita porque ultrapassa o quadro da invenção.

[098] Quando a frequência de amostragem do sinal de entrada fIn é superior à frequência de amostragem interna de codificação, o algoritmo de codificação TD COD ou FC COD prevê a codificação do sinal em banda alta (frequências superiores a 6,4 ou 7 kHz), essa codificação de banda alta não é detalhada aqui.

[099] Assim, o codificador compreende um dispositivo de reamostragem 300 que compreende um filtro de reamostragem parametrizável porque pode funcionar com várias configurações de coeficientes de filtro FIR (bloco 305). Nas modalidades de realização descritas mais adiante, o filtro de reamostragem é um filtro polifásico. A invenção também é aplicada a outros tipos de implementação de reamostragem por filtro FIR como por exemplo um filtro de reamostragem de complexidade não ótima que não faz intervir a representação polifásica. Por outro lado, a invenção também é aplicada a outras razões de conversão de frequência de amostragem.

[0100] Com a exceção das 3 primeiras configurações (do número 1 ao 3) todas as outras configurações utilizam um filtro polifásico de tipo FIR com um atraso de 0,9375 ms (12 amostras a 12,8 kHz, 15 amostras a 16 kHz, 30 amostras a 32 Khz e 45 amostras a 48 kHz).

[0101] A filtragem polifásica de reamostragem (bloco 305) nas configurações de 4 a 13 é efetuada de acordo com um algoritmo derivado da reamostragem polifásica por FIR definida no codec UIT G.718 (ver a realização no código fonte de G.718 no ficheiro "modify_fs.c").

[0102] Têm importância aqui as 3 primeiras configurações incluindo uma frequência de amostragem «externa» de 8000 Hz. Para essas configurações, é necessário um filtro FIR mais comprido para ter um desempenho de filtragem suficiente, em particular para garantir uma rejeição suficiente de imagens espectrais ou do efeito de serrilha espectral que podem acontecer nas frequências onde o ouvido é muito sensível.

[0103] Sem a implementação do processo de reamostragem da invenção, essas 3 configurações iriam causar normalmente 25 amostras de atraso a 12,8 kHz para o caso da reamostragem de 8000 Hz a 12800 Hz, 15 amostras de atraso a 8 kHz para os casos da reamostragem de 12800 Hz a 8000 Hz e da reamostragem de 16000 a 8000 Hz. Em geral, o atraso na frequência de amostragem de saída é arredondado para o número inteiro inferior de filt_len*fac_num/fac_den, onde flit_len é o comprimento do filtro, fac_num é o fator de sobreamostragem e fac_den é o fator de subamostragem (ver também na tabela 1), mas seria também possível considerar um atraso com uma fração de ^ de amostra.

[0104] A implementação, no dispositivo de reamostragem 300, do processo de reamostragem de acordo com a invenção e descrito ulteriormente com referência às figuras 4a e 4b, autoriza no caso desse codificador:

[0105] - A limitar o atraso efetivo das configurações de 1 a 3 para obter um atraso idêntico para as outras configurações de 4 a 13 de conversão (que têm um atraso de 0,9375 ms). Para isso, o dispositivo de reamostragem compreende um módulo 301 de predição linear adaptativa, apto para determinar, por trama de sinal, um número de amostras de sinal futuro definido em função de um atraso de reamostragem escolhido. É de notar que o número de amostras é em teoria parametrizável mas na prática é mantido constante para a configuração definida do codec.

[0106] - A poder mudar todas as configurações definidas de reamostragem, mesmo se o atraso teórico associado é diferente.

[0107] Em uma modalidade de realização particular da invenção que não é descrita na tabela 1, o codificador pode compreender vários (pelo menos dois) filtros polifásicos FIR de reamostragem que causam atrasos diferentes. Por exemplo em um codificador multidébito, para uma entrada que é sempre de 16000 Hz, se podem utilizar 2 núcleos de codificação para frequência interna em função do débito: 8000 Hz para os débitos mais baixos e 12800 Hz para os débitos mais altos. Para ter um desempenho de filtragem suficiente, em particular para garantir uma rejeição suficiente de imagens espectrais ou de efeito de serrilha espectral, a reamostragem de 16000 Hz a 8000 Hz necessita de um filtro FIR mais longo do que a reamostragem de 16000 Hz a 12800 Hz. Essas duas filtragens têm portanto um atraso diferente. Para poder mudar entre esses dois modos de codificação sem artefacto (no caso de mudança de débito) é preciso harmonizar esses atrasos (torná-los iguais). Se se reduz o comprimento do filtro FIR de reamostragem de 16000 Hz para 8000 Hz se degrada em geral a qualidade porque o efeito de serrilha espectral não seria suficientemente bem atenuado e se tornaria audível. Se se aumenta o comprimento do filtro FIR de reamostragem de 16000 Hz para 12800 Hz ou se se aplica um atraso suplementar sobre o sinal reamostrado, se aumenta o atraso global da codificação/decodificação que pode dificultar a interatividade.

[0108] Utilizando o processo de reamostragem da presente invenção se pode reduzir o atraso das filtragens FIR mais longas até ao nível de atraso da filtragem mais curto, sem perda significativa da qualidade, comparando com a filtragem de origem. Efetivamente os resultados de simulação mostram que as relações sinal para ruído são muito altas entre a filtragem normal e a filtragem de baixo atraso de acordo com a presente invenção. É também demonstrado pelos testes de escuta que a diferença entre os sinais obtidos com a filtragem normal e com a filtragem de baixo atraso de acordo com a presente invenção não é audível.

[0109] Assim, no caso apresentado aqui, o codificador (ou mesmo o decodificador) compreende dois filtros polifásicos de reamostragem cujos atrasos são diferentes. Pelo menos um dos filtros de reamostragem é um filtro implementado tal como descrito anteriormente de acordo com a invenção onde a determinação do número de amostras de sinal futuro é função da diferença de atraso dos dois filtros de reamostragem utilizados nos dois dispositivos.

[0110] Por exemplo, na tabela 1, as configurações 3 e 7 podem ser usadas para uma frequência externa de 16000 Hz e para frequências internas de 8000 Hz e 12800 Hz. Nesse caso se vê que o resultado na frequência de entrada (filt_len) é respectivamente de 30 e 15 amostras; portanto é preciso prever a diferença, ou seja, 15 amostras a 16000 Hz para poder reduzir o atraso da configuração 3 para o nível do atraso da configuração 7. A invenção detalhada mais adiante poderá ser utilizada para diminuir o atraso da configuração 3 e poder alternar entre as configurações 3 e 7 de modo transparente porque elas têm então o mesmo atraso de 15 amostras.

[0111] Se se voltar ao exemplo do codificador da figura 3 e das configurações listadas na tabela 1:

[0112] No caso da reamostragem de 8000 Hz a 12800 Hz, é preciso reduzir o atraso de 25 para 12 amostras, ou formar plus_sample_out=13 mais amostras a 12800 Hz, o que necessita da extrapolação de plus_sample_in=8 amostras a 8000 Hz.

[0113] Para o caso da reamostragem de 12800 Hz a 8000 Hz, é preciso reduzir o atraso de 15 para 7 amostras, ou seja, formar plus_sample_out=8 mais amostras a 8000 Hz, o que necessita da extrapolação de plus_sample_in=12 amostras a 12800 Hz.

[0114] Para o caso da reamostragem de 16000 Hz a 8000 Hz, é preciso reduzir o atraso de 15 para 7 amostras, ou seja, formar plus_sample_out=8 mais amostras a 8000 Hz, o que necessita da extrapolação de plus_sample_in=15 amostras a 16000 Hz. Se note que 8000 Hz 0,9375 ms corresponde a 7,5 amostras que se arredondou para baixo para 7 amostras.

[0115] O dispositivo de reamostragem 300 ilustrado na figura 3, recebe na entrada de blocos de sinal de áudio, nessa modalidade de realização são tramas de 20 ms recebidas pelo bloco 310 que possui também na memória um conjunto de amostras de tramas passadas.

[0116] Esse dispositivo de reamostragem compreende um módulo 301 de predição linear adaptativa apto para determinar por bloco ou por trama de sinal, um número de amostras de sinal futuro definido em função de um atraso de reamostragem escolhido.

[0117] Esse número de amostras de sinal futuro previsto serve para determinar o suporte de reamostragem definido pelo módulo 304 de construção do vetor de suporte de reamostragem. Esse vetor de suporte de reamostragem é, por exemplo, uma concatenação de amostras eventuais de sinal passado, das amostras do bloco ou da trama corrente e das amostras previstas de sinal futuro pelo módulo 301. As amostras do sinal passado servem como memória do filtro FIR de reamostragem.

[0118] Entretanto, a construção desse vetor de suporte compreende também a implementação seguinte:

[0119] - O sinal passado pode ser armazenado nas memórias do filtro FIR de reamostragem e, portanto, não é diretamente concatenado nas amostras da trama corrente (mas o sinal da trama corrente é mesmo a continuidade dessas memórias contendo o sinal passado)

[0120] - O sinal futuro previsto pode também ser armazenado em um vetor separado e sua reamostragem pode ser feita separadamente da do sinal da trama corrente, enquanto as memórias necessárias são atualizadas corretamente. No caso de reamostragem separada do sinal futuro, se formatam as memórias do filtro de reamostragem pelas últimas amostras da trama corrente. Novamente, apesar dessa separação o sinal futuro previsto é mesmo a continuação do sinal da trama corrente.

[0121] Nesse documento, sem perda de generalidade, o termo «construção do vetor de suporte» cobre também os casos onde os sinais não são realmente copiados uns após os outros em um mesmo vetor, mas armazenados em diferentes vetores.

[0122] O filtro 305 é então aplicado a esse vetor de suporte de reamostragem para obter um sinal reamostrado na frequência de saída pretendida.

[0123] O módulo 301 de predição linear pode compreender um módulo 302 de análise de predição a curto prazo (LPC) apto para determinar os coeficientes de um filtro de predição linear como descrito ulteriormente em relação à figura 4a. Esse módulo de análise LPC (302b) pode em uma outra modalidade de realização vantajosa estar compreendido no módulo de codificação por predição 309 da codificação temporal de tipo TD (por exemplo uma codificação CELP). Assim, um mesmo módulo de análise pode ser utilizado ao mesmo tempo para prever amostras futuras úteis para o dispositivo de reamostragem e para codificar o sinal antes da transmissão. Isso diminui, portanto, a complexidade do dispositivo de reamostragem que coopera com o módulo de análise do módulo de codificação.

[0124] O módulo 301 compreende, além disso, um módulo de filtragem 303 de predição pela filtragem 1/A(z) de um sinal nulo para obter um conjunto de amostras futuras buffut.

[0125] A figura 4a ilustra, portanto, as etapas principais de um processo de reamostragem de acordo com uma modalidade de realização da invenção.

[0126] As etapas desse processo são implementadas com a entrada (BufIn) das tramas de lg amostras para a frequência de amostragem de entrada fIn. Se acede também às amostras passadas desse sinal de entrada através das memórias. A partir desse sinal de entrada, a etapa E401 determina o número de amostras para prever plus_sample_in, em função do atraso desejado e prevê esse número de amostras do sinal futuro por predição linear. O resultado dessa predição é concatenado ao sinal de entrada (trama corrente e trama passada para as memórias) na etapa E402 de construção do vetor de suporte de reamostragem. Esse vetor de suporte é, portanto, em uma modalidade de realização, uma concatenação de amostras do sinal passado, das amostras da trama corrente e das amostras determinadas do sinal futuro.

[0127] Para a etapa E403, se efetua a filtragem de reamostragem por aplicação de um filtro de reamostragem, por exemplo para resposta de impulso finita (FIR), sobre as amostras do vetor de suporte de reamostragem, e o sinal reamostrado bufout é fornecido na saída, para a frequência de reamostragem de saída f out.

[0128] Vários casos são então possíveis:

[0129] - No caso de uma utilização trama por trama contínua (lg amostras na entrada), apenas as últimas lg_out = lg*fac_num/fac_den de amostras são calculadas.

[0130] - No caso em que devem ser obtidas mais amostras (utilização por trama com sinal futuro) (lg+plus_sample_in amostras de entrada) como é o caso no codificador da norma AMR-WB, lg_out+plus_sample_out amostras são calculadas, onde plus_sample_out=plus_sample_in*fac_num/fac_den. Efetivamente no codificador AMR-WB, é reamostrada a trama corrente de 20 ms e são reamostradas mais 15 amostras: a primeira etapa substitui o erro de reamostragem efetuado no momento da segunda etapa. Nesse exemplo, lg=320, plus_sample_in=15.

[0131] - A utilização pode também ser pontual quando é reamostrada por exemplo uma memória (uma porção ou bloco do sinal) por exemplo no caso de uma comutação entre dois modos de codificação. Nesse caso a entrada da reamostragem não é uma trama (por exemplo de 20 ms) mas um bloco de sinal. Para aplicar a invenção, é importante assinalar que é preciso dispor ou do passado do bloco para converter ou então de um modelo LPC já previamente calculado do passado - se vai notar que com uma codificação de tipo TD utilizando já uma predição linear, é possível em geral memorizar os parâmetros (coeficientes LPC ou equivalentes) calculados e/ou codificados no codificador e/ou no decodificador TD em cada trama. Assim em uma variante da invenção esses parâmetros LPC poderão ser reutilizados, o que simplifica a implementação do bloco 302 visto que se trata então de uma simples consulta de valores memorizados (eventualmente quantificados).

[0132] Paralelamente é atualizada a memória do filtro de reamostragem em E405. Novamente, vários casos são possíveis:

[0133] - No caso de uma utilização contínua com mais amostras para formar, como é o caso na norma AMR-WB, se memorizam as últimas mem_len amostras da trama de entrada, sem as amostras previstas: mem_sig(0...mem_len-1) = frame(lg- mem_len...lg.1).

[0134] Para a retomada da reamostragem, as amostras obtidas nafrequência de amostragem de saída substituem as amostras obtidas utilizando o sinal de entrada previsto.

[0135] - No caso de utilização trama por trama contínua não se substituem as amostras obtidas utilizando o sinal de entrada previsto, só se calculam lg_out amostras para a frequência de amostragem de saída. Se se considera que a nova trama começa na amostra de índice lg+plus_sample_in, a memória da filtragem FIR de reamostragem contém amostras passadas de índice (lg+plus_sample_in-mem_len... lg+plus_sample_in-1) em que uma parte dessa memória, de índice (lg... lg+plus_sample_in-1) pode ser ou o verdadeiro sinal ou o sinal previsto. Utilizando o verdadeiro sinal as primeiras amostras são iguais às obtidas com uma filtragem sem predição (resultado considerado ótimo) mas entre a última amostra obtida com a predição durante a trama anterior e a primeira amostra obtida com o verdadeiro sinal se pode ter uma pequena descontinuidade. No caso de utilização do sinal previsto na memória não há descontinuidade, mas um pequeno erro se espalha ainda em filt_len amostras. Na modalidade de realização privilegiada é utilizada a primeira solução porque essa pequena descontinuidade não é audível,

[0136] - No caso de utilização pontual a atualização de memória não é necessária após a reamostragem, pelo contrário é preciso formatar bem as memórias de reamostragem antes da operação de reamostragem, com o sinal de entrada passado correspondente.

[0137] Em uma variante, a análise LPC que serve para prever o sinal futuro é realizada não sobre o sinal direto na trama corrente, mas sobre o sinal pré-acentuado, proveniente da filtragem da trama corrente por um filtro da forma 1-μz-1 onde μ é calculado de modo adaptativo ou fixado em um valor predeterminado. Essa variante é ilustrada na figura 4b. Em relação à figura 4a, uma etapa E406 de determinação do fator de pré-acentuação μ é acrescentada. Utilizando esse fator μ o sinal de entrada é pré-acentuado para a etapa E407 por filtragem 1-μ.z-1. Se note que essa filtragem necessita de uma amostra de memória, portanto, nessa variante o tamanho da memória é para aumentar 1. O sinal pré-acentuado é a entrada das etapas E401 e E402. O sinal concatenado é em seguida desacentuado utilizando o mesmo fator μ para a etapa E408 por filtragem 1/ (1-μz-1). Se note que para um sinal dado, o encadeamento da pré-acentuação antes da análise LPC seguido por uma desacentuação de mesmo fator μ é transparente, isto é que se encontra exatamente o sinal de entrada. Portanto, se o sinal é memorizado antes da pré-acentuação somente a parte prevista deve ser desacentuada para reduzir a complexidade de cálculo. Essa parte prevista desacentuada é em seguida concatenada ao sinal memorizado para formar o vetor de suporte da reamostragem.

[0138] Várias técnicas existem para determinar o fator de préacentuação μ cujos valores estão entre -1 e 1.

[0139] - μ pode ser constante, por exemplo, μ=0,68

[0140] - μ pode ser constante dependendo da frequência de amostragem de entrada

[0141] - μ pode ser adaptativo em função de uma análise da inclinação do espectro (método conhecido do estado da técnica).

[0142] A figura 5a ilustra essa etapa E406 da figura 4b, de determinação do fator de pré-acentuação. Para a etapa E501, se abre o sinal por uma janela de análise. Para a etapa E502, se calcula uma autocorrelação de ordem M=1 (r(0) e r(1) e se aplica um limiar de ruído ("noise floor" em inglês) sobre r(0) na etapa E503, para evitar os problemas aritméticos dos sinais de entrada de nível baixo.

[0143] Essas etapas de autocorrelação, de aplicação de um limiar de ruído são descritas, por exemplo, na recomendação ITU-T G.729 parágrafo 3.2.1.

[0144] Esses cálculos de autocorrelações r(k) com uma janela de comprimento L, para os deslocamentos k=0,...M são da forma:

[0145] onde sw (n) = s(n).w(n) e s(n) corresponde às últimas L amostras do sinal da trama corrente e eventualmente de sinal passado se o comprimento L é superior ao comprimento da trama corrente.

[0146] Na modalidade de realização privilegiada, se utiliza uma janela LPC w(n) de comprimento L=240 cujo exemplo está ilustrado na figura 6.

[0147] Se pode ver que a forma dessa janela é assimétrica com o peso concentrado na extremidade do seu suporte (nas amostras mais recentes). Os controles Matlab para construir essa janela com L= 240 são por exemplo dados mais abaixo:

[0148] L1=L-8;

[0149] para i = 0: (L1-1)

[0150] w(i+1) = 0,54 - 0,46 * cos(2 * i * pi/ (2 * L1 — 1));

[0151] fim

[0152] para i = L1: (L-1)

[0153] w(i+1) = cos((i - L1) * 2 * pi/ (31));

[0154] fim

[0155] Em variantes da invenção, outros valores da ordem LPC M, outras formas e comprimentos de janela LPC poderão ser utilizados sem mudar a natureza da invenção. O «noise floor» poderá ser utilizado de modo convencional multiplicando o primeiro coeficiente de correlação por um fator >1 ou limitando o valor desse primeiro coeficiente para um valor mínimo.

[0156] Finalmente o fator é calculado para a etapa E504 como μ = r(1)/r(0).

[0157] A figura 5b descreve mais em detalhes, uma modalidade de realização da etapa E401 das figuras 4, de predição linear para determinar as amostras futuras de acordo com a invenção.

[0158] Por exemplo, essa etapa E401 pode compreender uma etapa E506 de cálculo de coeficientes de um filtro de predição linear de ordem predeterminada, a partir das amostras da trama corrente e eventualmente das amostras precedentes e uma etapa E507 de obtenção das amostras de sinal futuro por aplicação do filtro de predição calculado para um sinal de excitação de valor de zero.

[0159] As etapas E501, E502 e E503 das figuras 5a e 5b são semelhantes, mas com uma ordem de predição M diferente. Os outros parâmetros como a forma ou como o comprimento da janela de análise ou ainda o «noise floor» podem também ser diferentes. Nos 2 casos se podem utilizar os módulos comuns para reduzir a complexidade.

[0160] De modo mais exato, o sinal de entrada (pré-acentuado ou não) abre uma janela na etapa E501. Se pode, por exemplo, utilizar o mesmo tipo de janela como a ilustrada na figura 6. É calculada a função de autocorrelação para a ordem escolhida (no exemplo M=10) em E502 e é aplicado um limiar de ruído, "noise floor" sobre r(0) na etapa E503m, como descrito, por exemplo, no parágrafo 3.2 da norma G.729.

[0161] Para a etapa E505, se efetua uma etapa chamada «lag windowing» em inglês (método conhecido pelo perito na técnica), também descrita nomeadamente no parágrafo 3.2.1 da norma G.729.

[0162] Essa etapa de "Lag windowing" para a frequência de amostragem de entrada (fIn) é da forma: r(i) = r(i) * wlag(i), i = 0,...M

[0163] onde os coeficientes wlag (i) são definidos como se segue:

[0164] onde fs =fIn é a frequência do sinal para reamostrar e onde por exemplo fo = 60 Hz.

[0165] Para a etapa E506 (implementada pelo módulo 302 da figura 3) são calculados os coeficientes A[i], i=0, ...M, de um filtro de predição linear A(z) de ordem M pelo algoritmo de Levinson-Durbin como descrito em referência ao parágrafo 3.2.2 do G729 ou ao parágrafo 6.4.3 da norma AMR-WB. Na modalidade de realização privilegiada, se utiliza uma ordem LPC M=10.

[0166] Para a etapa E507 (implementada pelo módulo 303 da figura 3), o filtro de síntese 1/A(z) é aplicado a um sinal de zero para dar uma predição das amostras de sinal futuro.

[0167] Se efetua essa predição de modo recursivo, por filtragem 1/A(z) com entrada (sinal de excitação do filtro) nula, para plus_sample _in amostras na extremidade da trama de comprimento lg (i = lg ...lg+plus_sample_in-1):

[0168] Em uma variante da invenção, outros métodos de cálculo dos coeficientes de predição linear poderão ser utilizados, por exemplo se poderá utilizar o método de Burg implementado por exemplo no codificador SILK conhecido do estado da técnica.

[0169] Em uma outra variante, os coeficientes de predição linear poderão ser avaliados por uma aproximação de tipo LMS (Least Mean Squares) ou RLS (Recursive Least Squares) de filtragem adaptativa.

[0170] Em uma outra alternativa, os coeficientes LPC poderão ser diretamente obtidos de uma análise e/ou de quantificação dos parâmetros associados, efetuadas sobre o sinal no codificador de tipo TD (309) utilizando uma predição LPC (302b), até mesmo no codificador FD, com a condição de efetuar uma predição linear no codificador FD.

[0171] Por exemplo, no decodificador CELP do codec AMR-WB se dispõe de coeficientes LPC (de ordem16) em cada subtrama e em particular se podem utilizar os coeficientes LPC decodificados na última sub-trama para prever o sinal decodificado futuro e assim eliminar o atraso da reamostragem do decodificador CELP.

[0172] Em uma outra variante, a excitação nula (entrada zero) na etapa E507 pode ser substituída por uma excitação prevista, por exemplo por predição de pitch no domínio da excitação.

[0173] Em outras variantes da invenção, a predição linear (a curto prazo) será substituída por uma predição de pitch (a longo prazo) no domínio do sinal, essa predição pode ser fracionária ou multi-tap.

[0174] É de notar que seria possível efetuar a predição no domínio de frequência em vez de uma aproximação temporal; no entanto essa aproximação alternativa no domínio de frequência necessita de uma transformação de análise (por exemplo, FFT), uma predição do espectro futuro por exemplo por repetição das amplitudes e continuidade das fases das linhas espectrais mais importantes e uma transformação inversa de síntese ou uma síntese sinusoidal; essa alternativa é em geral mais complexa do que a aproximação temporal descrita anteriormente, porque a análise de frequência deve ter um suporte temporal suficientemente longo para dispor de uma resolução de frequência suficiente para identificar linhas espectrais (tons). Essa aproximação não é ideal quando se trata de extrapolar um número limitado de amostras (inferior ao comprimento da trama).

[0175] Ainda em uma outra modalidade de realização, a predição linear adaptativa descrita anteriormente pode ser substituída por um processo de dissimulação de trama apagada para extrapolar o sinal futuro por um modelo de sinal mais evoluído. Uma tal técnica é, por exemplo, descrita na patente europeia publicada com o número EPI 316 087.

[0176] Em outras variantes da invenção a reamostragem por filtro FIR poderá ser substituída por outros métodos de reamostragem por filtragem IIR ou a interpolação polinomial. Nesse caso o princípio permanece o mesmo: se prevê o sinal futuro e se aplica a reamostragem tendo em conta o sinal futuro. Em uma modalidade de realização se considera o caso de 2 configurações de reamostragem de atrasos diferentes e a invenção permite reconduzir o atraso mais longo para o valor do atraso mais baixo.

[0177] Para poder demonstrar bem a eficácia de reamostragem de baixo atraso de acordo com o processo da invenção descrito anteriormente no exemplo de reamostragem de 8000 Hz a 12800 Hz, se utiliza um sinal de teste contendo uma mistura de 10 sinusoides cuja frequência muda a cada segundo. Para o sinal de ésimo segundo as frequências desses sinusoides foram escolhidas de modo aleatório, em torno de uma frequência central fecentro(i), no intervalo [fecentro(i)-600, fecentro(i)+600] e fecentro(i) = 500+100*iHZ, i = 1 ...28.

[0178] As figuras 7a a 7l representam os resultados de uma comparação entre o método de reamostragem do estado da técnica em AMR-WB (a pontilhado), a do processo de acordo com a invenção com um filtro de predição de ordem de M=4 com janela de análise de 20 amostras (em linha descontínua) e a do processo de acordo com a invenção com um filtro de predição linear de ordem 10 com janela de análise de 240 amostras (linha contínua).

[0179] As figuras representam a relação sinal sobre ruído em função da frequência central do sinal de teste.

[0180] Cada figura corresponde a uma posição diferente da amostragem em relação ao final da trama convencional obtido com uma filtragem convencional (que corresponde à numeração #1, ..., #12 da figura 2). Por exemplo, a figura 7a representa a relação sinal para ruído (RSB, SNR em inglês) para as amostras na 2 a posição após o final da trama convencional. A figura 7b representa a relação sinal para ruído para a amostra prevista na 3a posição após a trama corrente, etc. A figura 7l representa, portanto, a relação sinal para ruído para a amostra prevista na 13a posição após a trama corrente.

[0181] Se pode observar que o RSB diminui com o aumento da posição porque se utilizam cada vez mais amostras previstas no momento da filtragem e que para a mesma posição, o RSB diminui com o aumento da frequência central porque as altas frequências são menos previsíveis. No entanto, em todos os casos, se observa que o método de acordo com a invenção, mesmo com baixa ordem de predição, é nitidamente mais eficiente do que o método usado no codificador AMR-WB.

[0182] A vantagem da utilização de uma predição de ordem baixa é sua fraca complexidade e a facilidade de implementação dos cálculos, sobretudo em aritmética de vírgula fixa. Quanto mais alta é a ordem, mais aumenta a complexidade e ao mesmo tempo se torna mais difícil garantir a estabilidade do filtro.

[0183] As figuras 8a a 8c mostram o mesmo tipo de resultado sobre uma base muito grande de sinal de palavra. Aí se vê o RSB em função da posição da amostra para 3 casos diferentes: de 8000 Hz a 12800 Hz na figura 8a, de 12800 Hz a 8000 Hz na figura 8b e de 16000 Hz a 8000 Hz na figura 8c. Novamente, o algoritmo de acordo com a invenção é claramente mais eficiente do que o utilizado no estado da técnica (AMR- WB), mesmo para baixa ordem de predição com janela curta.

[0184] A figura 9 ilustra um exemplo de decodificador de áudio compreendendo um dispositivo de reamostragem 300 de acordo com a invenção. O dispositivo de reamostragem é o mesmo que o descrito com referência à figura 3.

[0185] O decodificador ilustrado aqui é um decodificador de sinais de áudio (mono), multidébitos (com débitos fixos de 7,2 a 128 kbit/s) funcionando nas frequências de amostragem de saída de 8, 16, 32 ou 48 kHz.

[0186] Em função da trama recebida e desmultiplexada (bloco 901), a saída é mudada (904) entre a saída de um decodificador temporal (TD DEC) de tipo CELP (902) utilizando uma predição linear (902b) e um decodificador de frequência (FD DEC).

[0187] A figura 10 representa um exemplo de realização material de um dispositivo de reamostragem 300 de acordo com a invenção. Esse pode fazer parte integrante de um codificador, decodificador de sinal de audiofrequência ou de um equipamento que recebe sinais de audiofrequências.

[0188] Esse tipo de dispositivo compreende um processador PROC cooperando com um bloco de memória BM compreendendo uma memória de armazenagem e/ou de trabalho MEM.

[0189] Um tal dispositivo compreende um módulo de entrada E apto para receber tramas de sinal de áudio BufIn para uma frequência de amostragem fIn.

[0190] Compreende um módulo de saída S apto para transmitir o sinal de audiofrequência reamostrado BufOut para a frequência de amostragem fOut.

[0191] O bloco de memória pode vantajosamente compreender um programa informático compreendendo instruções de código para a implementação das etapas do processo de reamostragem no sentido da invenção, quando essas instruções são executadas pelo processador PROC, e nomeadamente as etapas de determinação por predição linear adaptativa de um número de amostras de sinal futuro, esse número sendo definido em função de um atraso de reamostragem escolhido, de construção de um vetor de suporte de reamostragem a partir pelo menos das amostras do bloco corrente e das amostras determinadas de sinal futuro, de aplicação de um filtro de reamostragem sobre as amostras do vetor de suporte de reamostragem.

[0192] Tipicamente, a descrição da figura 4a retoma as etapas de um algoritmo de um tal programa informático. O programa informático pode também ser armazenado em um suporte de memória legível por um leitor do dispositivo ou carregável no espaço memória desse.

[0193] A memória MEM registra de modo geral, todos os dados necessários para a implementação do processo.

Claims

1. MÉTODO, caracterizado por compreender as etapas de: reamostrar um sinal de audiofrequência usando um dispositivo de codificação ou decodificação de sinal de audiofrequência, sendo que a reamostragem compreende as seguintes ações para cada bloco de sinal a ser reamostrado: determinar, por meio de predição linear adaptativa, o número futuro de amostras de sinal, esse número sem do definido como função de um atraso escolhido de reamostragem; construir um vetor de suporte de reamostragem a partir pelo menos das amostras do bloco atual de sinal e das amostras de sinal futuras determinadas; e aplicar um filtro de reamostragem às amostras do vetor de suporte de reamostragem, - trocar entre dois modos de codificação; e - reamostrar o bloco de sinal atual por causa da troca.

2. MÉTODO, de acordo com a reivindicação 1, caracterizado pelo uso do filtro de reamostragem ser feito uma única vez por causa da troca entre dois modos de codificação.

3. MÉTODO, de acordo com a reivindicação 1 ou 2, caracterizado pelos parâmetros LPC utilizados para a trama do bloco de sinal atual serem reutilizados.

4. MÉTODO, de acordo com a reivindicação 1, caracterizado pela troca compreender alternar entre um primeiro modo de codificação operando em um domínio de tempo e um segundo modo operando em um domínio de frequência.

5. DISPOSITIVO PARA REAMOSTRAR UM SINAL DE AUDIOFREQUÊNCIA EM UM CODIFICADOR OU UM DECODIFICADOR DE SINAL DE AUDIOFREQUÊNCIA, sendo o dispositivo caracterizado por compreender: um módulo de predição linear adaptativa (301) que determina, em um bloco de sinal, um número de futuras amostras de sinal definido como função de um atraso escolhido de reamostragem; um módulo que constrói um vetor de suporte de reamostragem (304) a partir pelo menos das amostras do bloco atual de sinal e das amostras de sinal futuras determinadas; e um filtro de reamostragem (305) aplicado às amostras do vetor de suporte de reamostragem, sendo o dispositivo configurado para: - trocar entre dois modos de codificação; - reamostrar o bloco de sinal atual por causa da troca.

6. DISPOSITIVO, de acordo com a reivindicação 5, caracterizado pelos dois modos de codificação incluírem um primeiro modo de codificação operando em um domínio de tempo e um segundo modo operando em um domínio de frequência.