BR112016018694B1

BR112016018694B1 - Conceito para codificação de informação

Info

Publication number: BR112016018694B1
Application number: BR112016018694-0A
Authority: BR
Inventors: Bãckstrõm Tom; Christian Fischer Pedersen; Fischer Johannes; Hüttenberger Matthias; Pino Alfonso
Original assignee: Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V.
Priority date: 2014-03-07
Filing date: 2015-02-09
Publication date: 2022-09-06
Also published as: JP6420356B2; CN106068534A; ES2721029T3; JP2021006922A; JP2017513048A; EP3097559B1; WO2015132048A1; EP4318471A3; US20210335373A1; EP4318471A2; BR112016018694A2; CN111179952B; US20160379656A1; TW201537566A; JP6772233B2; KR20160129891A; JP7077378B2; SG11201607433YA; MX2016011516A; MY192163A

Abstract

CONCEITO PARA CODIFICAÇÃO DE INFORMAÇÃO. A presente invenção fornece um codificador de informação para codificar um sinal de informação (SI), caracterizado por compreender: um analisador (2), a fim de obter coeficientes lineares de previsão de um polinomial preditivo A(z); um conversor (3) para converter os coeficientes lineares de previsão do polinomial preditivo A(z) em valores de frequência f1...fn de uma represen-tação de frequência espectral do polinomial preditivo A (z), em que o conver-sor (3) determina os valores de frequência f1...fn, analisando um par de polinomiais P (z) e Q (z) sendo definido como P (z) = A (z) + z-m-l A (z-1) e Q (z) = A (z) - z-m-l A(z-1), em que m é uma ordem do polinomial preditivo A (z) e l é maior ou igual à zero, em que o conversor (3) é configurado para obter os valores de frequência (f1...fn), estabelecendo um espectro estritamente real (RES) derivado de P (z) e um espectro estritamente imaginário (IES) de Q (z) e identificando os zeros do espectro estritamente real (RES) derivado de P (z) e do espectro estritamente imaginário (IES) derivado de Q (z); um quantizador (4) para obter os valores da frequência quantizada (fq1...fqn) dos valores de frequência(f1...fn); e um produtor de fluxo de bits contínuo (5) para produzir um fluxo de bits contínuo compreendendo os valores de frequência quantizados (fq1...fqn).

Description

DESCRIÇÃO

[0001] O paradigma mais frequentemente utilizado em codificação de fala é a Previsão Linear Excitada por Código Algébrico (ACELP | Algebraic Code Excited Linear Prediction), que é utilizada em padrões como a família AMR, G.718 e MPEG USAC [1-3]. Ela se baseia na fala de modelagem utilizando um modelo de origem, consistindo em um previsor linear (LP | linear predictor) para modelar o envelope espectral, um previsor de período longo (LTP | long time predictor) para modelar a frequência fundamental e um livro de códigos algébrico para o residual.

[0002] Os coeficientes do modelo preditivo linear são muito sensíveis à quantização, pela qual geralmente eles são primeiro transformados em Frequências Espectrais de Linha (LSFs | Line Spectral Frequencies) ou Frequências Espectrais de Imitância (ISFs | Imittance Spectral Frequencies) antes da quantização. Os domínios LSF/ISF são robustos a erros de quantização e, nesses domínios, a estabilidade do previsor pode ser prontamente preservada, pela qual ela oferece o domínio adequado para quantização [4].

[0003] As LSFs/ISFs, a seguir referidas como valores de frequência, podem ser obtidas de um polinomial preditivo linear A(z) da ordem m, conforme segue. Os polinomiais do Par de Espectro de Linha são definidos como

onde l = 1 para o Par de Espectro de Linha e l = 0 para a representação do Par de Espectro de Imitância, mas qualquer l > 0 é, em princípio, válido. A seguir, será, então, assumido apenas que l > 0.

[0004] Observe que o previsor original pode sempre ser reconstruído utilizando A(z) = 1/2 [P(z)+Q(z)]. Os polinomiais P(z) e Q(z), assim, contêm toda a informação de A(z).

[0005] A propriedade central dos polinomiais LSP/ISP é que se e apenas se A(z) tiver todas as suas raízes dentro do círculo da unidade, então, as raízes de P(z) e Q(z) serão entrelaçadas no círculo da unidade. Visto que as raízes de P(z) e Q(z) estão no círculo da unidade, elas podem ser representadas apenas por seus ângulos. Esses ângulos correspondem às frequências e visto que os espectros de P(z) e Q(z) têm linhas verticais em seus espectros de magnitude logarítmica em frequências correspondentes às raízes, as raízes são referidas como valores de frequência.

[0006] Segue-se que os valores de frequência codificam toda a informação do previsor A(z). Além disso, observou-se que os valores de frequência são robustos a erros de quantização, de modo que um pequeno erro em um dos valores de frequência produz um pequeno erro no espectro do previsor reconstruído, que está localizado no espectro, próximo à frequência correspondente. Devido à essas propriedades favoráveis, a quantização nos domínios LSF ou ISF é utilizada em todos os codecs de fala de fluxo principal [1-3].

[0007] Um dos desafios ao utilizar os valores de frequência é, no entanto, encontrar suas localizações eficientemente dos coeficientes a partir dos polinomiais P(z) e Q(z). Depois disso, encontrar as raízes de polinomiais é um problema clássico e difícil. Os métodos previamente propostos para essa tarefa incluem as seguintes abordagens: • Uma das abordagens anteriores utiliza o fato de que zeros residem no círculo da unidade, pelo qual eles aparecem como zeros no espectro de magnitude [5]. Considerando a transformada discreta de Fourier dos coeficientes de P(z) e Q(z), pode-se, assim, buscar vales no espectro de magnitude. Cada vale indica a localização de uma raiz e, se o espectro for amostrado de forma suficiente, pode-se encontrar todas as raízes. Esse método, entretanto, produz apenas uma posição aproximada, pois é difícil determinar a posição exata da localização do vale. • A abordagem mais utilizada frequentemente se baseia nos polinomiais de Chebyshev e foi apresentada em [6]. Ela depende da percepção de que os polinomiais P(z) e Q(z) são simétricos e antissimétricos, respectivamente, pela qual eles contêm muita informação redundante. Pela remoção de zeros comuns em z = ±1 e com a substituição x = z + z-1 (que é conhecida como a transformada de Chebyshev), os polinomiais podem ser transformados em uma representação alternativa FP(x) e FQ(x). Esses polinomiais são metade da ordem de P(z) e Q(z) e eles têm apenas raízes reais na faixa de -2 à +2. Observe que os polinomiais FP(x) e FQ(x) têm valores reais quando x é real. Além disso, visto que as raízes são simples, FP(x) e FQ(x) terá um cruzamento zero em cada uma de suas raízes. • Nos codecs de fala, como o AMR-WB, essa abordagem é aplicada de modo que os polinomiais FP(x) e FQ(x) sejam avaliados em uma grade fixa no eixo real para encontrar todos os cruzamentos zero. As localizações da raiz são ainda refinadas pela interpolação linear ao redor do cruzamento zero. A vantagem dessa abordagem é a complexidade reduzida devido à omissão de coeficientes redundantes.

[0008] Embora os métodos descritos acima funcionem suficientemente nos codecs existentes, eles apresentam vários problemas.

[0009] O problema a ser solucionado é fornecer um conceito melhorado para codificação de informação.

[0010] Em um primeiro aspecto, o problema é solucionado por um codificador de informação para codificar um sinal de informação. O codificador de informação é caracterizado por compreender: um analisador para analisar o sinal de informação, a fim de obter coeficientes lineares de previsão de um polinomial preditivo A(z); um conversor para converter os coeficientes lineares de previsão do polinomial preditivo A(z) em valores de frequência de uma representação de frequência espectral do polinomial preditivo A(z), em que o conversor é configurado para determinar os valores de frequência, analisando um par de polinomiais P(z) e Q(z), sendo definido como P(z) = A(z) + z-m-l A(z-1) e Q(z) = A(z) - z-m-l A(z-1), em que m é uma ordem do polinomial preditivo A(z) e l é maior ou igual à zero, em que o conversor é configurado para obter os valores de frequência, estabelecendo um espectro estritamente real derivado de P(z) e um espectro estritamente imaginário de Q(z) e identificando zeros do espectro estritamente real derivado de P(z) e do espectro estritamente imaginário derivado de Q(z); um quantizador para obter valores de frequência quantizada dos valores de frequência; e um produtor de fluxo de bits contínuo produzir um fluxo de bits contínuo, compreendendo os valores de frequência quantizada.

[0011] O codificador de informação, de acordo com a invenção, utiliza uma busca cruzada de zero, enquanto que a abordagem espectral para localizar as raízes, de acordo com a técnica prévia, depende de localizar os vales no espectro de magnitude. Entretanto, ao buscar vales, a precisão é mais pobre do que buscar cruzamentos zero. Considere, por exemplo, a sequência [4, 2, 1, 2, 3]. Claramente, o menor valor é o terceiro elemento, pelo qual o zero ficaria em algum lugar entre o segundo e o quarto elemento. Em outras palavras, não é possível determinar se o zero está à direita ou à esquerda do terceiro elemento. Entretanto, se for considerada a sequência [4, 2, 1, -2, -3], pode-se ver imediatamente que o cruzamento zero está entre o terceiro e o quarto elementos, pelos quais nossa margem de erro é reduzida pela metade. Segue-se que com a abordagem magnitude-espectro, é necessário duplicar o número de pontos de análise para obter a mesma precisão que com a busca de cruzamento zero.

[0012] Em comparação com a avaliação das magnitudes |P (z)| e |Q(z)|, a abordagem de cruzamento zero tem uma vantagem significativa na precisão. Considere, por exemplo, a sequência 3, 2, -1, -2. Com a abordagem de cruzamento zero, é óbvio que o zero fica entre 2 e -1. Entretanto, estudando a sequência de magnitude correspondente 3, 2, 1, 2, pode-se apenas concluir que o zero fica em algum lugar entre o segundo e o último elemento. Em outras palavras, com a abordagem de cruzamento zero a precisão é dupla em comparação à abordagem com base na magnitude.

[0013] Além disso, o codificador de informação, de acordo com a invenção, pode utilizar longos previsores, como m = 128. Ao contrário disso, a transformada de Chebyshev realiza suficientemente apenas quando o comprimento de A(z) é relativamente pequeno, por exemplo, m < 20. Para longos previsores, a transformada de Chebyshev é numericamente instável, pela qual a implementação prática do algoritmo é impossível.

[0014] As propriedades principais do codificador de informação proposto são, assim, aquelas que podem chegar à mais alta ou melhor precisão como o método com base em Chebyshev, visto que cruzamentos zeros são pesquisados e porque uma conversão de domínio de tempo em domínio de frequência é realizada, de modo que zeros podem ser encontrados com complexidade computacional muito baixa.

[0015] Como resultado, o codificador de informação, de acordo com a invenção, determina ambos os zeros (raízes) mais precisamente, mas também com baixa complexidade computacional.

[0016] O codificador de informação, de acordo com a invenção, pode ser utilizado em qualquer aplicação de processamento de sinal que precisa determinar o espectro de linha de uma sequência. Aqui, o codificador de informação é exemplarmente discutido na codificação de fala de contexto. A invenção é aplicável em um dispositivo de codificação de fala, áudio e/ou vídeo ou aplicação, que emprega um previsor linear para modelar o envelope de magnitude espectral, limiar de mascaramento de frequência perceptual, limiar de mascaramento temporal, limiar de mascaramento temporal perceptual, ou outros formatos de envelope, ou outras representações equivalentes à um formato de envelope como um sinal de autocorrelação, que utiliza um espectro de linha para representar a informação do envelope, para codificação, análise ou processamento, que precisa de um método para determinar o espectro de linha de um sinal de entrada, como uma fala ou sinal de áudio geral, e onde o sinal de entrada é representado como um filtro digital ou outra sequência de números.

[0017] O sinal de informação pode ser, por exemplo, um sinal de áudio ou um sinal de vídeo. Os valores de frequência podem ser frequências de linhas espectrais ou frequências espectrais de limitância. Os valores de frequência quantizada transmitidos dentro do fluxo de bits contínuo permitirão que um decodificador decodifique o fluxo de bits contínuo a fim de recriar o sinal de áudio ou o sinal de vídeo.

[0018] De acordo com uma aplicação preferida da invenção o conversor compreende um dispositivo de determinação para determinar os polinomiais P(z) e Q(z) do polinomial preditivo A(z).

[0019] De acordo com a aplicação preferida da invenção, o conversor compreende um identificador de zero para identificar os zeros do espectro estritamente real derivado de P(z) e do espectro estritamente imaginário derivado de Q(z).

[0020] De acordo com uma aplicação preferida da invenção, o identificador de zero é configurado para identificar os zeros por a) iniciação com o espectro real em frequência nula; b) aumento da frequência até uma mudança de sinal no espectro real ser encontrada; c) aumento de frequência até uma mudança de sinal adicional no espectro imaginário ser encontrada; e d) repetição das etapas b) e c) até todos os zeros serem encontrados.

[0021] Observe que Q(z) e, assim, a parte imaginária do espectro sempre tem um zero na frequência nula. Visto que as raízes estão se sobrepondo a P(z) e, assim, a parte real do espectro, então, será sempre não zero na frequência nula. Pode-se, dessa forma, iniciar com a parte real na frequência nula e aumentar a frequência até a primeira mudança de sinal ser encontrada, o que indica o primeiro cruzamento zero e, assim, o primeiro valor da frequência.

[0022] Visto que as raízes são entrelaçadas, o espectro de Q(z) terá a próxima mudança no sinal. Assim, pode-se aumentar a frequência até uma mudança de sinal para o espectro de Q(z) ser encontrada. Esse processo, então, pode ser repetido, alternando entre os espectros P(z) e Q(z), até todos os valores de frequência terem sido encontrados. A abordagem utilizada para localizar o cruzamento zero nos espectros é, então, similar à abordagem aplicada no domínio de Chebyshev [6, 7].

[0023] Visto que os zeros de P(z) e Q(z) são entrelaçados, pode-se alternar entre buscar zeros nas partes real e complexa, de modo que sejam encontrados todos os zeros em uma passagem e reduzida a complexidade pela metade em comparação à uma busca completa.

[0024] De acordo com uma aplicação preferida da invenção, o identificador de zero é configurado para identificar os zeros por interpolação.

[0025] Além da abordagem de cruzamento zero, pode-se aplicar prontamente a interpolação de modo que se pode estimar a posição do zero com precisão ainda mais alta, por exemplo, como é realizado nos métodos convencionais, por exemplo [7].

[0026] De acordo com uma aplicação preferida da invenção, o conversor compreende um dispositivo de preenchimento zero para adicionar um ou mais coeficiente(s), tendo um valor “0” para os polinomiais P(z) e Q(z) para produzir um par de polinomiais alongados Pe(z) e Qe(z). A precisão pode ser melhorada, ainda, estendendo o comprimento do espectro avaliado. Com base na informação sobre o sistema, é possível de fato, em alguns casos, determinar uma distância mínima entre os valores de frequência e, assim, determinar o comprimento mínimo do espectro com o qual todos os valores de frequência podem ser encontrados [8].

[0027] De acordo com uma aplicação preferida da invenção, o conversor é configurado de modo que, durante a conversão dos coeficientes lineares de previsão em valores de frequência de uma representação de frequência espectral do polinomial preditivo A(z), pelo menos, uma parte das operações com coeficientes conhecidos como tendo o valor “0” dos polinomiais alongados Pe(z) e Qe(z) seja omitida.

[0028] O aumento do comprimento do espectro, entretanto, também aumenta a complexidade computacional. O maior contribuinte para a complexidade é a transformada de domínio de tempo em transformada de domínio de frequência, tal como uma transformada rápida de Fourier, dos coeficientes de A(z). Visto que o vetor do coeficiente foi preenchido com zero no comprimento desejado, ele é, contudo, muito esparso. Esse fato pode ser prontamente utilizado para reduzir a complexidade. Esse é um problema bastante simples, no sentido de que alguém sabe exatamente quais coeficientes são zero, pelos quais em cada iteração da transformada rápida de Fourier pode-se simplesmente omitir as operações que envolvem zeros. A aplicação de tal transformada rápida de Fourier esparsa é direta e qualquer programador especialista na técnica pode implementá-la. A complexidade de tal implementação é O(N log2(1 + m + l)), onde N é o comprimento do espectro e m e l são definidos como antes.

[0029] De acordo com uma aplicação preferida da invenção, o conversor compreende um formador polinomial composto configurado para estabelecer um polinomial composto Ce(Pe(z), Qe(z)) dos polinomiais alongados Pe(z) e Qe(z).

[0030] De acordo com uma aplicação preferida da invenção, o conversor é configurado de modo que o espectro estritamente real derivado de P(z) e o espectro estritamente imaginário de Q(z) sejam estabelecidos por uma única transformada de Fourier pela transformação do polinomial composto Ce(Pe(z), Qe(z)).

[0031] De acordo com uma aplicação preferida invenção, o conversor compreende um dispositivo de transformada de Fourier para transformada de Fourier do par de polinomiais P(z) e Q(z) ou um ou mais polinomial(is) derivado(s) do par de polinomiais P(z) e Q(z) em um domínio de frequência e um dispositivo de ajuste para ajustar uma fase do espectro derivado de P(z), de modo que seja estritamente real, e para ajustar uma fase do espectro derivado de Q(z), de modo que seja estritamente imaginário. O dispositivo de transformada de Fourier pode ser basear na transformada rápida de Fourier ou na transformada discreta de Fourier.

[0032] De acordo com uma aplicação preferida da invenção, o dispositivo de ajuste é configurado como um comutador de coeficiente para comutação circular de coeficientes do par de polinomiais P(z) e Q(z) ou um ou mais polinomial(is) derivado(s) do par de polinomiais P(z) e Q(z).

[0033] De acordo com uma aplicação preferida da invenção, o comutador de coeficiente é configurado para comutação circular de coeficientes de modo que um ponto médio original de uma sequência de coeficientes seja alterado na primeira posição da sequência.

[0034] Em teoria, sabe-se bem que a transformada de Fourier de uma sequência simétrica tem valor real e sequências assimétricas têm espectros de Fourier puramente imaginários. No presente caso, nossa sequência de entrada são os coeficientes de polinomial P(z) ou Q(z) que têm comprimento m + l, enquanto que pode-se preferir ter a transformada discreta de Fourier de um comprimento muito maior N » (m + l). A abordagem convencional para criar espectros de Fourier mais longos é o preenchimento zero do sinal de entrada. Entretanto, o zero preenchimento da sequência tem que ser cuidadosamente implementado de modo que as simetrias sejam retidas.

[0035] Primeiro, um polinomial P(z) com coeficientes [p0, p1, p2, p1, p0] é considerado.

[0036] A forma na qual algoritmos FFT são geralmente aplicados exige que o ponto da simetria seja o primeiro elemento, pelo qual, quando aplicado, por exemplo, em MATLAB pode-se escrever fft([p2, p1, p0, p0, p1]) para obter uma saída com valor real. Especificamente, uma mudança circular pode ser aplicada, de modo que o ponto de simetria corresponda ao elemento de ponto médio, isso é, o coeficiente p2 seja alternado à esquerda, de modo que esteja na primeira posição. Os coeficientes que estavam no lado esquerdo de p2 são, então, anexos à extremidade da sequência.

[0037] Para uma sequência com zero preenchimento [p0, p1, p2, p1, p0, 0, 0 . . . 0] pode-se aplicar o mesmo processo. A sequência [p2, p1, p0, 0, 0 . . . 0, p0, p1] terá, assim, uma transformada discreta de Fourier com valor real. Aqui, o número de zeros nas sequências de entrada é N - m - l, se N for o comprimento do espectro desejado.

[0038] De modo correspondente, considere os coeficientes [q0, q1, 0, -q1, -q0] correspondendo ao polinomial Q(z). Aplicando uma mudança circular, de modo que o ponto médio anterior fique na primeira posição, obtém-se [0, -q1, -q0, q0, q1] que tem uma transformada discreta de Fourier puramente imaginária. A transformada preenchida com zero pode, então, ser considerada para a sequência [0, -q1, -q0, 0, 0 . . . 0, q0, q1]

[0039] Observe que o que foi mencionado acima se aplica apenas para os casos onde o comprimento da sequência é ímpar, pelo qual m + l é par. Para casos onde m + l é ímpar, tem-se duas opções. Pode-se implementar a mudança circular no domínio de frequência ou aplicar uma DFT com metade das amostras (vide abaixo).

[0040] De acordo com uma aplicação preferida da invenção, o dispositivo de ajuste é configurado como um comutador de fase para alternar uma fase da saída do dispositivo de transformada de Fourier.

[0041] De acordo com uma aplicação preferida da invenção, o comutador de fase é configurado para alternar a fase da saída do dispositivo de transformada de Fourier multiplicando uma posição de frequência k-ésima com exp(i2nkh/N), em que N é o comprimento da amostra e h = (m+l)/2.

[0042] Sabe-se bem que uma mudança circular no domínio de tempo é equivalente a uma rotação de fase no domínio de frequência. Especificamente, uma mudança de h = (m + l)/2 passos no domínio de tempo corresponde à multiplicação da posição de frequência k-ésima com exp(-i2nkh/N), onde N é o comprimento do espectro. Ao invés da mudança circular, pode- se, assim, aplicar uma multiplicação no domínio de frequência para obter exatamente o mesmo resultado. O custo dessa abordagem é uma complexidade levemente elevada. Observe que h = (m + l)/2 é um número inteiro apenas quando m + l for par. Quando m + l for ímpar, a mudança circular exigiria um atraso pelo número racional de passos, que é difícil de implementar diretamente. Em vez disso, pode-se aplicar a mudança correspondente no domínio de frequência pela rotação de fase descrita acima.

[0043] De acordo com a aplicação preferida da invenção, o conversor compreende um dispositivo de transformada de Fourier para transformada de Fourier do par de polinomiais P(z) e Q(z) ou um ou mais polinomial(is) derivado(s) do par de polinomiais P(z) e Q(z) em um domínio de frequência com metade das amostras de modo que o espectro seja estritamente real e de modo que o de Q(z) seja estritamente imaginário.

[0044] Uma alternativa é implementar uma DFT com metade das amostras. Especificamente, enquanto que a DFT convencional é definida como

pode-se definir a DFT de meia amostra DFT como

[0045] Uma implementação rápida, como FFT, pode ser prontamente desenvolvida para essa formulação.

[0046] O benefício dessa formulação é que agora o ponto de simetria está em n = 1/2 em vez do comum n = 1. Com essa DFT de meia amostra, então, com uma sequência [2, 1, 0, 0, 1, 2] seria obtido um espectro de Fourier com valor real.

[0047] No caso de m+l ímpar para um polinomial P(z) com coeficientes p0, p1, p2, p2, p1, p0 pode-se, então, com uma DFT de meia amostra e zero preenchimento, obter-se um espectro com valor real quando a sequência de entrada for [p2, p1, p0, 0, 0 . . . 0, p0, p1, p2].

[0048] Correspondentemente, para um polinomial Q(z), pode-se aplicar a DFT de meia amostra na sequência [-q2, -q1, -q0, 0, 0 . . . 0, q0, q1, q2] para obter um espectro puramente imaginário.

[0049] Com esses métodos, para qualquer combinação de m e l, pode-se obter um espectro com valor real para um polinomial P(z) e um espectro puramente imaginário para qualquer Q(z). De fato, visto que os espectros de P(z) e Q(z) são puramente reais e imaginários, respectivamente, pode-se armazená-los em um único espectro complexo, que, então, corresponde ao espectro de P(z) + Q(z) = 2A(z). A escala pelo fator 2 não muda a localização das raízes, pela qual pode ser ignorada. Pode-se, assim, obter os espectros de P(z) e Q(z) avaliando apenas o espectro de A(z) utilizando uma única FFT. Precisa-se apenas aplicar a mudança circular, conforme explicado acima, aos coeficientes de A(z).

[0050] Por exemplo, com m = 4 e l = 0, os coeficientes de A(z) são [a0, a1, a2, a3, a4] que pode ser preenchido com zero em um comprimento arbitrário N por [a0, a1, a2, a3, a4, 0, 0 . . . 0].

[0051] Se, então, for aplicada uma mudança circular de etapas (m + l)/2 = 2, obtém-se [a2, a3, a4, 0, 0 . . . 0, a0, a1].

[0052] Considerando a DFT dessa sequência, tem-se o espectro de P(z) e Q(z) nas partes real e complexa do espectro.

[0053] De acordo com uma aplicação preferida da invenção, o conversor compreende um formador polinomial composto configurado para estabelecer um polinomial composto C(P(z), Q(z)) dos polinomiais P(z) e Q(z).

[0054] De acordo com uma aplicação preferida da invenção, o conversor é configurado de modo que o espectro estritamente real derivado de P(z) e o espectro estritamente imaginário de Q(z) sejam estabelecidos por uma única transformada de Fourier, por exemplo, uma transformada rápida de Fourier (FFT), transformando um polinomial composto C(P(z), Q(z)).

[0055] Os polinomiais P (z) e Q(z) são simétricos e assimétricos, respectivamente, com o eixo da simetria em z-(m+i)/2. Segue-se que os espectros de z-(m+l)/2P(z) e z-(m+l)/2Q(z), respectivamente, avaliados no círculo da unidade z = exp(iθ), são com valores real e complexo, respectivamente. Visto que os zeros estão no círculo da unidade, pode-se encontra-los buscando cruzamentos zero. Além disso, a avaliação no círculo por unidade pode ser implementada simplesmente por uma transformada rápida de Fourier.

[0056] Como os espectros correspondentes à z-(m+l)/2P (z) e z-(m+l)/2Q(z) são reais e complexos, respectivamente, 2 pode-se implementá-los com uma única transformada rápida de Fourier. Especificamente, se for considerada a soma z-(m+l)/2(P (z) + Q(z)), então, as partes real e complexa dos espectros correspondem à z-(m+l)/2 P(z) e z-(m+l)/2 Q(z), respectivamente. Além disso, visto que

pode-se considerar diretamente a FFT de 2z-(m+l)/2 A(z) para obter os espectros correspondentes à z—(m+i)/2 p(z) e z-(m+l)/2 Q(z), sem determinar explicitamente P(z) e Q(z). Visto que existe um interesse apenas nas localizações de zeros, 1 pode-se, em vez disso, omitir a multiplicação pela escala 2 e avaliar z-(m+l)/2 A(z) por FFT. Observe que visto que A(z) tem apenas coeficientes não zero m + 1, pode-se utilizar a remoção de FFT para reduzir a complexidade [11]. Para certificar-se de que todas as raízes são encontradas, deve-se utilizar uma FFT de comprimento suficientemente alto N que o espectro é avaliado em pelo menos uma frequência entre a cada dois zeros.

[0057] De acordo com uma aplicação preferida da invenção, o conversor compreende um dispositivo de limitação para limitar a faixa numérica dos espectros dos polinomiais P (z) e Q(z) multiplicando os polinomiais P(z) e Q(z) ou um ou mais polinomial(is) derivado(s) dos polinomiais P(z) e Q(z) com um polinomial de filtro B(z), em que o polinomial de filtro B(z) é simétrico e não tem quaisquer raízes em um círculo da unidade.

[0058] Codecs de fala são frequentemente implementados no dispositivo móvel com recursos limitados, pelos quais as operações numéricas podem ser implementadas com representações de ponto fixo. Portanto, é essencial que os algoritmos implementados operem com representações numéricas cuja faixa é limitada. Para envelopes espectrais de fala comum, a faixa numérica do espectro de Fourier é, entretanto, tão grande que é necessária uma implementação de 32 bits da FFT para garantir que as localizações de cruzamento zero sejam retidas.

[0059] Uma FFT de 16 bits pode, por outro lado, ser frequentemente implementada com complexidade inferior, pela qual seria útil limitar os valores de faixa espectral para adaptar à faixa de 16 bits. Das equações |P (eiθ) | < 2|A(eiθ ) | e |Q(eiθ ) | 2|A(eiθ ) | sabe-se que pela limitação da faixa numérica de B(z)A(z) também limita-se a faixa numérica de B(z)P (z) e B(z)Q(z). Se B(z) não tem zeros no círculo da unidade, então, B(z)P (z) e B(z)Q(z) terá o mesmo cruzamento zero no círculo da unidade as P (z) e Q(z). Além disso, B(z) tem que ser simétrico de modo que z-(m+l+n)/2P (z)B(z) e z-(m+l+n)/2Q(z)B(z) permaneçam simétricos e antissimétricos e seus espectros sejam puramente reais e imaginários, respectivamente. Em vez de avaliar o espectro de z(n+l)/2A(z) pode-se, assim, avaliar z(n+l+n)/2A(z)B(z), onde B(z) é um polinomial simétrico de ordem n sem raízes no círculo da unidade. Em outras palavras, pode-se aplicar a mesma abordagem conforme descrito acima, mas primeiro multiplicando A(z) com filtro B(z) e aplicando uma mudança de fase modificada z-(m+l+n)/2.

[0060] A tarefa remanescente é desenhar um filtro B(z), de modo que a faixa numérica de A(z)B(z) seja limitada, com a restrição que B(z) deve ser simétrico e sem raízes no círculo da unidade. O filtro mais simples que atende as exigências é um filtro de fase linear de ordem 2

onde βk e R são os parâmetros e | β2| > 2| β1|. Pelo ajuste de βk, pode-se modificar a inclinação espectral e, assim, reduzir, a faixa numérica do produto A(z)B1(z). Uma abordagem computacionalmente muito eficiente é escolher β, de modo que a magnitude em frequência 0 e Nyquist seja igual, |A(1)B1(1)| = |A(-1)B1(-1)|, pelo qual pode-se escolher, por exemplo,

[0061] Essa abordagem provê um espectro aproximadamente plano.

[0062] Observa-se (vide também a figura 5) que enquanto A(z) tem um caractere de alta passagem, B1(z) é de baixa passagem, pelo qual o produto A(z)B1(z) tem, conforme esperado, magnitude igual em 0- e frequência de Nyquist e é mais ou menos plano. Visto que B1(z) tem apenas um grau de liberdade, obviamente não se pode esperar que o produto seria completamente plano. Ainda, observe que a razão entre o pico mais alto e o vale mais baixo de B1(z)A(z) pode ser muito menor que de A(z). Isso significa que obteve-se o efeito desejado; a faixa numérica de B1(z)A(z) é muito menor que a de A(z).

[0063] Um segundo método ligeiramente mais complexo é calcular a autocorrelação rk da resposta de impulso de A(0.5z). Aqui, a multiplicação por 0,5 move os zeros de A(z) na direção de origem, pela qual a magnitude espectral é reduzida aproximadamente pela metade. Por meio da aplicação de Levinson- Durbin na autocorrelação rk, obtém-se um filtro H(z) de ordem n que é de fase mínima. Pode-se, então, definir B2(z) = z-nH(z)H(z-1) para obter um |B2(z)A(z) |que é aproximadamente constante. Será observado que a faixa de |B2(z)A(z)| é menor que a de |B1(z)A(z)|. Abordagens adicionais para o desenho de B(z) podem ser prontamente encontradas na literatura clássica do desenho de FIR [18].

[0064] De acordo com uma aplicação preferida da invenção, o conversor compreende um dispositivo de limitação para limitar a faixa numérica dos espectros dos polinomiais alongados Pe(z) e Qe(z) ou um ou mais polinomial(is) derivado(s) dos polinomiais alongados Pe(z) e Qe(z) multiplicando os polinomiais alongados Pe(z) e Qe(z) com um polinomial de filtro B(z), em que o polinomial de filtro B(z) é simétrico e não tem quaisquer raízes em um círculo da unidade. B(z) pode ser encontrado conforme explicado acima.

[0065] Em um aspecto adicional, o problema é solucionado por um método para operar um codificador de informação para codificar um sinal de informação. O método compreende as etapas de: analisar o sinal de informação a fim de obter coeficientes lineares de previsão de um polinomial preditivo A(z); converter os coeficientes lineares de previsão do polinomial preditivo A(z) em valores de frequência f1...fn de uma representação de frequência espectral do polinomial preditivo A(z), em que os valores de frequência fi.fn são determinados analisando um par de polinomiais P(z) e Q(z) sendo definido como P(z) = A(z) + z-m-l A(z-i) e Q(z) = A(z) - z-m-l A(z-1), em que m é uma ordem do polinomial preditivo A(z) e l é maior ou igual à zero, em que os valores de frequência f1.fn são obtidos estabelecendo um espectro estritamente real derivado de P(z) e um espectro estritamente imaginário de Q(z) e identificando zeros do espectro estritamente real derivado de P(z) e o espectro estritamente imaginário derivado de Q(z); obter os valores de frequência quantizada fq1...fqn dos valores de frequência f1...fn; e produzir um fluxo de bits contínuo compreendendo os valores de frequência quantizada fq1.fqn.

[0066] Além disso, o programa é observado por um programa de computador para, ao executar em um processador, executar o método de acordo com a invenção.

[0067] As aplicações preferidas da invenção são subsequentemente discutidas com relação aos desenhos anexos, nos quais:

[0068] A Figura 1 ilustra uma aplicação de um codificador de informação, de acordo com a invenção, em uma visualização esquemática;

[0069] A Figura 2 ilustra uma relação exemplar de A(z), P (z) e Q(z);

[0070] A Figura 3 ilustra uma primeira aplicação do conversor do codificador de informação, de acordo com a invenção, em uma visualização esquemática;

[0071] A Figura 4 ilustra uma segunda aplicação do conversor do codificador de informação, de acordo com a invenção, em uma visualização esquemática;

[0072] A Figura 5 ilustra um espectro de magnitude exemplar de um previsor A(z), os filtros de nivelamento correspondentes B1(z) e B2(z) e os produtos A(z)B1(z) e A(z)B2(z);

[0073] A Figura 6 ilustra uma terceira aplicação do conversor do codificador de informação, de acordo com a invenção, em uma visualização esquemática;

[0074] A Figura 7 ilustra uma quarta aplicação do conversor do codificador de informação, de acordo com a invenção, em uma visualização esquemática; e

[0075] A Figura 8 ilustra uma quinta aplicação do conversor do codificador de informação, de acordo com a invenção, em uma visualização esquemática.

[0076] A figura 1 ilustra uma aplicação de um codificador de informação (1) de acordo com a invenção em uma visualização esquemática.

[0077] O codificador de informação (1) para codificar um sinal de informação (IS), compreende: um analisador (2) para analisar o sinal de informação (IS), a fim de obter coeficientes lineares de previsão de um polinomial preditivo A(z); um conversor (3) para converter os coeficientes lineares de previsão do polinomial preditivo A(z) em valores de frequência f1.fn de uma representação de frequência espectral RES, IES do polinomial preditivo A(z), em que o conversor (3) é configurado para determinar os valores de frequência f1...fn analisando um par de polinomiais P(z) e Q(z) sendo definido como P(z) = A(z) + z-m-l A(z-1) e Q(z) = A(z) - z-m-l A(z-1), em que m é uma ordem do polinomial preditivo A(z) e l é maior ou igual à zero, em que o conversor (3) é configurado para obter os valores de frequência f1.fn estabelecendo um espectro estritamente real RES derivado de P(z) e um espectro estritamente imaginário IES de Q(z) e identificando zeros do espectro estritamente real RES derivado de P(z) e o espectro estritamente imaginário IES derivado de Q(z); um quantizador (4) para obter os valores da frequência quantizada fq1...fqn dos valores de frequência f1.fn; e um produtor de fluxo de bits contínuo (5) que produz um fluxo de bits contínuo BS compreendendo os valores de frequência quantizada fq1.fqn.

[0078] O codificador de informação (1), de acordo com a invenção, utiliza uma busca de cruzamento zero, enquanto que a abordagem espectral para encontrar as raízes de acordo com a técnica prévia depende da localização de vales no espectro de magnitude. Entretanto, ao buscar vales, a precisão é mais pobre que ao buscar cruzamentos zero. Considere, por exemplo, a sequência [4, 2, 1, 2, 3]. Claramente, o menor valor é o terceiro elemento, pelo qual o zero ficaria em qualquer lugar entre o segundo e o quarto elemento. Em outras palavras, pode-se não determinar se o zero está à direita ou à esquerda do terceiro elemento. Entretanto, se for considerada a sequência [4, 2, 1, -2, -3], pode-se ver imediatamente que o cruzamento zero está entre o terceiro e o quarto elemento, pelos quais nossa margem de erro é reduzida pela metade. Segue-se que com a abordagem magnitude-espectro, precisa-se duplicar o número de pontos de análise para obter a mesma precisão que com a busca de cruzamento zero.

[0079] Em comparação à avaliação das magnitudes |P (z)| e |Q(z)|, a abordagem de cruzamento zero tem uma vantagem significativa na precisão. Considere, por exemplo, a sequência 3, 2, -1, -2. Com a abordagem de cruzamento zero é óbvio que o zero fica entre 2 e -1. Entretanto, pelo estudo da sequência de magnitude corresponde 3, 2, 1, 2, pode-se concluir apenas que o zero fica em algum lugar entre o segundo e o último elemento. Em outras palavras, com a abordagem de cruzamento zero a precisão é dupla em comparação à abordagem com base na magnitude.

[0080] Além disso, o codificador de informação, de acordo com a invenção, pode utilizar longos previsores, como m = 128. Ao contrário disso, a transformada de Chebyshev realiza suficientemente apenas quando o comprimento de A(z) é relativamente pequeno, por exemplo, m < 20. Para previsores longos, a transformada de Chebyshev é numericamente instável pela qual a implementação prática do algoritmo é impossível.

[0081] As propriedades principais do codificador de informação proposto (1) são, assim, aquelas que podem obter precisão tão alta ou melhor que o método com base em Chebyshev visto que cruzamentos zeros são buscados e porque uma conversão de domínio de tempo em domínio de frequência é feita, de modo que os zeros podem ser encontrados com complexidade computacional muito baixa.

[0082] Como resultado, o codificador de informação (1), de acordo com a invenção, determina ambos os zeros (raízes) mais precisamente, mas também com baixa complexidade computacional.

[0083] O codificador de informação (1), de acordo com a invenção, pode ser utilizado em qualquer aplicação de processamento de sinal que precisa determinar o espectro de linha de uma sequência. Aqui, o codificador de informação (1) é exemplarmente discutido na codificação de fala de contexto. A invenção é aplicável em um dispositivo de codificação de fala, áudio e/ou vídeo ou aplicação, que emprega um previsor linear para modelar o envelope de magnitude espectral, limiar de mascaramento de frequência perceptual, limiar de mascaramento temporal, limiar de mascaramento temporal perceptual, ou outros formatos de envelope, ou outras representações equivalentes à um formato de envelope como um sinal de autocorrelação, que utiliza um espectro de linha para representar a informação do envelope, para codificação, análise ou processamento, que precisa de um método para determinar o espectro de linha de um sinal de entrada, como uma fala ou sinal de áudio geral, e onde o sinal de entrada é representado como um filtro digital ou outra sequência de números.

[0084] O sinal de informação (IS) pode ser, por exemplo, um sinal de áudio ou um sinal de vídeo.

[0085] A figura 2 ilustra uma relação exemplar de A(z), P (z) e Q(z). As linhas pontilhadas verticais descrevem os valores de frequência f1_fe. Observe que a magnitude é expressa em um eixo linear em vez da escala decibel, a fim de manter os cruzamentos zero visíveis. Podemos ver que as frequências de linhas espectrais ocorrem nos cruzamentos de zeros de P (z) e Q(z). Além disso, as magnitudes de P (z) e Q(z) são menores ou iguais do que 2|A(z)| em qualquer local; |P (eiθ )| < 2|A(eiθ ) | e |Q(eiθ )| < 2|A(eiθ ) | .

[0086] A figura 3 ilustra uma primeira aplicação do conversor do codificador de informação, de acordo com a invenção, em uma visualização esquemática.

[0087] De acordo com uma aplicação preferida da invenção, o conversor (3) compreende um dispositivo de determinação (6) para determinar os polinomiais P(z) e Q(z) do polinomial preditivo A(z).

[0088] De acordo com uma aplicação preferida invenção, o conversor compreende um dispositivo de transformada de Fourier (8) para transformada de Fourier do par de polinomiais P(z) e Q(z) ou um ou mais polinomial(is) derivado(s) do par de polinomiais P(z) e Q(z) em um domínio de frequência e um dispositivo de ajuste (7) para ajustar uma fase do espectro RES derivado de P(z) de modo que seja estritamente real e para ajustar uma fase do espectro IES derivado de Q(z) de modo que seja estritamente imaginário. O dispositivo de transformada de Fourier pode ser 8 com base na transformada rápida de Fourier ou na transformada discreta de Fourier.

[0089] De acordo com uma aplicação preferida da invenção, o dispositivo de ajuste (7) é configurado como um comutador de coeficiente (7) para comutação circular de coeficientes do par de polinomiais P(z) e Q(z) ou um ou mais polinomial(is) derivado(s) do par de polinomiais P(z) e Q(z).

[0090] De acordo com uma aplicação preferida da invenção, o comutador de coeficiente (7) é configurado para comutação circular de coeficientes de modo que um ponto médio original de uma sequência de coeficientes seja mudado para a primeira posição da sequência.

[0091] Em teoria, é bem conhecido que a transformada de Fourier de uma sequência simétrica é de valor real e as sequências assimétricas têm espectros de Fourier puramente imaginários. No presente caso, nossa sequência de entrada são os coeficientes de polinomial P(z) ou Q(z) que têm comprimento m + l, enquanto que seria preferido ter a transformada discreta de Fourier de um comprimento muito maior N » (m + l). A abordagem convencional para criar espectros de Fourier mais longos é zero preenchimento do sinal de entrada. Entretanto, zero preenchimento da sequência deve ser cuidadosamente implementado de modo que as simetrias sejam retidas.

[0092] Primeiro, um polinomial P(z) com coeficientes [p0, p1, p2, p1, p0] é considerado.

[0093] A forma que os algoritmos de transformada rápida de Fourier são geralmente aplicados exige que o ponto de simetria seja o primeiro elemento, pelo qual, quando aplicado, por exemplo, em MATLAB, pode-se escrever fft([p2, p1, p0, p0, p1]) para obter uma saída com valor real. Especificamente, uma mudança circular pode ser aplicada, de modo que o ponto de simetria correspondente ao elemento de ponto médio, isso é, coeficiente p2 seja mudado para à esquerda, de modo que fique na primeira posição. Os coeficientes que estavam à esquerda de p2 são, então, anexos à extremidade da sequência.

[0094] Para uma sequência com preenchimento zero [p0, p1, p2, p1, p0, 0, 0 . . . 0] pode-se aplicar o mesmo processo. A sequência [p2, p1, p0, 0, 0 . . . 0, p0, p1] terá, assim, uma transformada discreta de Fourier com valor real. Aqui o número de zeros nas sequências de entrada é N - m - l se N for o comprimento do espectro desejado.

[0095] Correspondentemente, considere os coeficientes [q0, q1, 0, -q1, -q0] correspondente ao polinomial Q(z). Aplicando uma mudança circular, de modo que o ponto médio anterior chegue à primeira posição, obtém-se [0, -q1, -q0, q0, q1] que tem uma transformada discreta de Fourier puramente imaginária. A transformada preenchida com zero pode, então, ser considerada para a sequência [0, -q1, -q0, 0, 0 . . . 0, q0, q1]

[0096] Observe que o que foi mencionado acima se aplica apenas para casos onde o comprimento da sequência é ímpar, pela qual m + l é par. Para casos onde m + l é ímpar, tem-se duas opções. Pode-se implementar a mudança circular no domínio de frequência ou aplicar uma DFT com metade das amostras.

[0097] De acordo com a aplicação preferida da invenção, o conversor (3) compreende um identificador de zero (9) para identificar os zeros do espectro estritamente real RES derivados de P(z) e o espectro estritamente imaginário IES derivado de Q(z).

[0098] De acordo com uma aplicação preferida da invenção, o identificador de zero (9) é configurado para identificar os zeros por a) iniciação com o espectro real em frequência nula; b) aumento da frequência até uma mudança de sinal no espectro real ser encontrada; c) aumento de frequência até uma mudança de sinal adicional no espectro imaginário ser encontrada; e d) repetição das etapas b) e c) até todos os zeros serem encontrados.

[0099] Observe que Q(z) e, assim, a parte imaginária IES do espectro sempre tem um zero na frequência nula. Visto que as raízes estão sobrepondo-se, P(z) e, assim, a parte real RES do espectro então será sempre não zero na frequência nula. Pode-se, dessa forma, iniciar com a parte real RES na frequência nula e aumentar a frequência até a primeira mudança de sinal ser encontrada, o que indica o primeiro cruzamento zero e, assim, o primeiro valor da frequência f1.

[0100] Visto que as raízes são entrelaçadas, o espectro IES de Q(z) terá a próxima mudança no sinal. Assim, pode-se aumentar a frequência até uma mudança de sinal para o espectro de Q(z) ser encontrada. Esse processo então pode ser repetido, alternando entre os espectros P(z) e Q(z), até todos os valores de frequência f1_fn, tenham sido encontrados. A abordagem utilizada para localizar o cruzamento zero nos espectros RES e IES é, então, similar à abordagem aplicada no domínio de Chebyshev [6, 7].

[0101] Visto que os zeros de P (z) e Q(z) são entrelaçados, pode-se alternar entre buscar zeros nas partes real RES e complexa IES, de modo que seja encontrado todos os zeros em uma passagem e reduzam a complexidade pela metade em comparação à uma busca completa.

[0102] De acordo com uma aplicação preferida da invenção, o identificador de zero é configurado para identificar os zeros por interpolação.

[0103] Além da abordagem de cruzamento zero, pode-se aplicar prontamente a interpolação, de modo que se pode estimar a posição do zero com precisão ainda mais alta, por exemplo, como é realizado nos métodos convencionais, por exemplo [7].

[0104] A figura 4 ilustra uma segunda aplicação do conversor (3) do codificador de informação (1), de acordo com a invenção, em uma visualização esquemática.

[0105] De acordo com uma aplicação preferida da invenção, o conversor (3) compreende um dispositivo de preenchimento zero (10) para adicionar um ou mais coeficiente(s), tendo um valor “0”, aos polinomiais P(z) e Q(z) para produzir um par de polinomiais alongados Pe(z) e Qe(z). A precisão pode ainda ser melhorada estendendo o comprimento do espectro avaliado RES, IES. Com base na informação sobre o sistema, é possível de fato, em alguns casos, determinar uma distância mínima entre os valores de frequência f1.fn, e, determinar o comprimento mínimo do espectro RES, IES com o qual todos os valores de frequência f1...fn podem ser encontrados [8].

[0106] De acordo com uma aplicação preferida da invenção, o conversor (3) é configurado de modo que durante a conversão dos coeficientes lineares de previsão em valores de frequência f1.fn, de uma representação de frequência espectral RES, IES do polinomial preditivo A(z) pelo menos uma parte das operações com coeficientes conhecidos para ter o valor “0” dos polinomiais alongados Pe(z) e Qe(z) seja omitida.

[0107] O aumento do comprimento do espectro, entretanto, também aumenta a complexidade computacional. O maior contribuinte para a complexidade é o domínio de tempo para transformada de domínio de tempo, como uma transformada rápida de Fourier, dos coeficientes de A(z). Visto que o vetor do coeficiente foi preenchido com zero no comprimento desejado, é, entretanto, muito esparso. Esse fato pode ser prontamente utilizado para reduzir a complexidade. Esse é um problema bastante simples no sentido que alguém sabe exatamente quais coeficientes são zero, pelos quais em cada iteração da transformada rápida de Fourier pode-se simplesmente omitir as operações que envolvem zeros. A aplicação de tal transformada rápida de Fourier esparsa é direta e qualquer programador especialista na técnica pode implementá-la. A complexidade de tal implementação é O(N log2(1 + m + l)),onde N é o comprimento do espectro e m e l são definidos como antes.

[0108] De acordo com uma aplicação preferida da invenção, o conversor compreende um dispositivo de limitação (11) para limitar a faixa numérica dos espectros dos polinomiais alongados Pe(z) e Qe(z) ou um ou mais polinomial(is) derivado(s) dos polinomiais alongados Pe(z) e Qe(z) multiplicando os polinomiais alongados Pe(z) e Qe(z) com um polinomial de filtro B(z), em que o polinomial de filtro B(z) é simétrico e não tem quaisquer raízes em um círculo da unidade. B(z) pode ser encontrado conforme explicado acima.

[0109] A figura 5 ilustra um espectro de magnitude exemplar de um previsor A(z), os filtros de nivelamento correspondentes B1(z) e B2(z) e os produtos A(z)B1(z) e A(z)B2(z). A linha pontilhada horizontal mostra o nível de A(z)B1(z) nas frequências 0 e Nyquist.

[0110] De acordo com uma aplicação preferida (não mostrada) da invenção, o conversor (3) compreende um dispositivo de limitação (11) para limitar a faixa numérica dos espectros RES, IES dos polinomiais P(z) e Q(z) multiplicando os polinomiais P(z) e Q(z) ou um ou mais polinomial(is) derivado(s) dos polinomiais P(z) e Q(z) com um polinomial de filtro B(z), em que o polinomial de filtro B(z) é simétrico e não tem quaisquer raízes em um círculo da unidade.

[0111] Codecs de fala são frequentemente implementados no dispositivo móvel com recursos limitados, pelos quais as operações numéricas devem ser implementadas com representações de ponto fixo. Portanto, é essencial que os algoritmos implementados operem com representações numéricas cuja faixa é limitada. Para envelopes espectrais de fala comum, a faixa numérica do espectro de Fourier é, entretanto, tão grande que é necessária uma implementação de 32 bits da FFT para garantir que as localizações de cruzamento zero sejam retidas.

[0112] Uma FFT de 16 bits pode, por outro lado, ser frequentemente implementada com complexidade inferior, pela qual seria útil limitar os valores de faixa espectral para adaptar à faixa de 16 bits. Das equações |P (eiθ ) | 2|A(eiθ ) | e |Q(eiθ) | - 2|A(eiθ ) | sabe-se que pela limitação da faixa numérica de B(z)A(z) também limita-se a faixa numérica de B(z)P (z) e B(z)Q(z). Se B(z) não tem zeros no círculo da unidade, então, B(z)P (z) e B(z)Q(z) terá o mesmo cruzamento zero no círculo da unidade as P (z) e Q(z). Além disso, B(z) tem que ser simétrico, de modo que z-(m+l+n)/2P (z)B(z) e z-(m+l+n)/2Q(z)B(z) permaneçam simétricos e antissimétricos e seus espectros sejam puramente reais e imaginários, respectivamente. Em vez de avaliar o espectro de z(n+l)/2A(z) pode-se, assim, avaliar z(n+l+n)/2A(z)B(z), onde B(z) é um polinomial simétrico de ordem n sem raízes no círculo da unidade. Em outras palavras, pode-se aplicar a mesma abordagem conforme descrito acima, mas primeiro multiplicando A(z) com filtro B(z) e aplicando uma mudança de fase modificada z-(m+l+n)/2.

[0113] A tarefa remanescente é desenhar um filtro B(z), de modo que a faixa numérica de A(z)B(z) seja limitada, com a restrição de que B(z) deve ser simétrico e sem raízes no círculo da unidade. O filtro mais simples que atende as exigências é um filtro de fase linear de ordem 2 B1(z) = β0 + β1z-1 + β2z-2, onde βk E R são os parâmetros e | β2| > 2|β1|. Pelo ajuste de βk, pode-se modificar a inclinação espectral e, assim, reduzir, a faixa numérica do produto A(z)B1(z). Uma abordagem computacionalmente muito eficiente é escolher β, de modo que a magnitude em frequência 0 e Nyquist seja igual, |A(1)B1(1)| = |A(-1)B1(-1)|, pelo qual pode-se escolher, por exemplo, β0 = A(1) - A(-1) e β1 = 2 (A(1) + A(-1) ) .

[0114] Essa abordagem provê um espectro aproximadamente plano.

[0115] Observa-se da figura 5 que, enquanto A(z) tem um caractere de alta passagem, B1(z) é de baixa passagem, pelo qual o produto A(z)B1(z) tem, conforme esperado, magnitude igual em frequência 0 e de Nyquist e é mais ou menos plano. Visto que B1(z) tem apenas um grau de liberdade, obviamente não se pode esperar que o produto seria completamente plano. Ainda, observe que a razão entre o pico mais alto e o vale mais baixo de B1(z)A(z) pode ser muito menor que de A(z). Isso significa que obteve-se o efeito desejado; a faixa numérica de B1(z)A(z) é muito menor que a de A(z).

[0116] Um segundo método ligeiramente mais complexo é calcular a autocorrelação rk da resposta de impulso de A(0,5z). Aqui a multiplicação por 0,5 move os zeros de A(z) na direção de origem, pela qual a magnitude espectral é reduzida aproximadamente pela metade. Por meio da aplicação de Levinson- Durbin na autocorrelação rk, obtém-se um filtro H(z) de ordem n que é de fase mínima. Pode-se, então, definir B2(z) = z-nH(z)H(z-1) para obter um |B2(z)A(z) | que é aproximadamente constante. Será observado que a faixa de |B2(z)A(z)|é menor que a de |B1(z)A(z)|. Abordagens adicionais para o desenho de B(z) podem ser prontamente encontradas na literatura clássica do desenho de FIR [18].

[0117] A figura 6 ilustra uma terceira aplicação do conversor (3) do codificador de informação (1), de acordo com a invenção, em uma visualização esquemática.

[0118] De acordo com uma aplicação preferida da invenção, o dispositivo de ajuste (12) é configurado como um comutador de fase (12) para alternar uma fase da saída do dispositivo de transformada de Fourier (8).

[0119] De acordo com uma aplicação preferida da invenção, o comutador de fase (12) é configurado para alternar a fase da saída do dispositivo de transformada de Fourier (8) multiplicando uma posição de frequência k-ésima com exp(i2πkh/N), em que N é o comprimento da amostra e h = (m+l)/2.

[0120] É bem conhecido que uma mudança circular no domínio de tempo é equivalente à uma rotação de fase no domínio de frequência. Especificamente, uma mudança de h = (m + l)/2 passos no domínio de tempo corresponde à multiplicação da posição de frequência k-ésima com exp(-i2πkh/N ), onde N é o comprimento do espectro. Em vez da mudança circular, pode-se, assim, aplicar uma multiplicação no domínio de frequência para obter exatamente o mesmo resultado. O custo dessa abordagem é uma complexidade levemente elevada. Observe que h = (m + l)/2 é um número inteiro apenas quando m + l for par. Quando m + l for ímpar, a mudança circular exigiria um atraso pelo número racional de passos, que é difícil de implementar diretamente. Em vez disso, pode-se aplicar a mudança correspondente no domínio de frequência pela rotação de fase descrita acima.

[0121] A figura 7 ilustra uma quarta aplicação do conversor (3) do codificador de informação (1), de acordo com a invenção, em uma visualização esquemática.

[0122] De acordo com uma aplicação preferida da invenção, o conversor (3) compreende um formador polinomial composto (13) configurado para estabelecer um polinomial composto C(P(z), Q(z)) dos polinomiais P(z) e Q(z).

[0123] De acordo com uma aplicação preferida da invenção, o conversor (3) é configurado de modo que o espectro estritamente real derivado de P(z) e o espectro estritamente imaginário de Q(z) sejam estabelecidos por uma única transformada de Fourier, por exemplo, uma transformada rápida de Fourier (FFT), transformando um polinomial composto C(P(z), Q(z)).

[0124] Os polinomiais P (z) e Q(z) são simétrico e antissimétricos, respectivamente, com o eixo de simetria em z-(m+l)/2.Segue-se que os espectros de z-(m+l)/2P(z) e z-(m+l)/2Q(z), respectivamente, avaliados no círculo da unidade z = exp(iθ), têm valores reais e complexos, respectivamente. Visto que os zeros estão no círculo da unidade, pode-se encontra-los buscando cruzamentos zero. Além disso, a avaliação no círculo por unidade pode ser implementada simplesmente por uma transformada rápida de Fourier.

[0125] Como os espectros correspondentes à z-(m+l)/2P (z) e z-(m+l)/2Q(z) são reais e complexos, respectivamente, 2 pode-se implementá-los com uma única transformada rápida de Fourier. Especificamente, se considerar a soma z-(m+l)/2(P (z) + Q(z)), então, as partes real e complexa dos espectros correspondem à z-(m+l)/2 P(z) e z-(m+l)/2 Q(z), respectivamente. Além disso, visto que z-(m+l)/2 (P (z) + Q(z)) = 2z-(m+l)/2 A(z), pode-se considerar diretamente a FFT de 2z-(m+l)/2 A(z) para obter os espectros correspondentes à z-(m+l)/2 P(z) e z-(m+l)/2 Q(z), sem determinar explicitamente P(z) e Q(z). Visto que existe um interesse apenas nas localizações de zeros, 1 pode- se, em vez disso, omitir a multiplicação pela escala (2) e avaliar z-(m+l)/2 A(z) por FFT. Observe que, visto que A(z) tem apenas coeficientes não zero m + 1, pode-se utilizar a remoção de FFT para reduzir a complexidade [11]. Para certificar-se de que todas as raízes são encontradas, deve-se utilizar uma FFT de comprimento suficientemente alto N que o espectro é avaliado em pelo menos uma frequência entre a cada dois zeros.

[0126] De acordo com uma aplicação preferida (não mostrada) da invenção, o conversor (3) compreende um formador polinomial composto configurado para estabelecer um polinomial composto Ce(Pe(z), Qe(z)) dos polinomiais alongados Pe(z) e Qe(z).

[0127] De acordo com uma aplicação preferida (não mostrada) da invenção, o conversor é configurado de modo que o espectro estritamente real derivado de P(z) e o espectro estritamente imaginário de Q(z) sejam estabelecidos por uma única transformada de Fourier transformando o polinomial composto Ce(Pe(z), Qe(z)).

[0128] A figura 8 ilustra uma quinta aplicação do conversor (3) do codificador de informação (1) de acordo com a invenção em uma visualização esquemática.

[0129] De acordo com aplicação preferida da invenção, o conversor (3) compreende um dispositivo de transformada de Fourier (14) para transformada de Fourier do par de polinomiais P(z) e Q(z) ou um ou mais polinomial(is) derivado(s) do par de polinomiais P(z) e Q(z) em um domínio de frequência com metade das amostras de modo que o espectro derivado de P(z) seja estritamente real e de modo que o espectro derivado de Q(z) seja estritamente imaginário.

[0130] Uma alternativa é implementar uma DFT com metade das amostras. Especificamente, enquanto a DFT convencional é definida como

pode-se definir a DFT de meia amostra como

[0131] Uma rápida implementação, como FFT, pode ser prontamente desenvolvida para essa formulação.

[0132] O benefício dessa formulação é que agora o ponto de simetria está em n = 1/2 em vez do comum n = 1. Com essa DFT de meia amostra, então, seria obtido com uma sequência [2, 1, 0, 0, 1, 2] um espectro de Fourier com valor real RES.

[0133] No caso de m+l ímpar, para um polinomial P(z) com coeficientes p0, p1, p2, p2, p1, p0 pode-se, então, com uma DFT de meia amostra e zero preenchimento obter um espectro com valor real quando a sequência de entrada for [p2, p1, p0, 0, 0 . . . 0, p0, p1, p2].

[0134] Correspondentemente, para um polinomial Q(z) pode-se aplicar a DFT de meia amostra na sequência [-q2, -q1, -q0, 0, 0 . . . 0, q0, q1, q2] para se obter um espectro puramente imaginário IES.

[0135] Com esses métodos, para qualquer combinação de m e l, pode-se obter um espectro com valor real para um polinomial P(z) e um espectro puramente imaginário para qualquer Q(z). De fato, visto que os espectros de P(z) e Q(z) são puramente reais e imaginários, respectivamente, pode-se armazená-los em um único espectro complexo, que, então, corresponde ao espectro de P(z) + Q(z) = 2A(z). A escala pelo fator 2 não muda a localização das raízes, pela qual pode ser ignorada. Pode-se, assim, obter os espectros de P(z) e Q(z) avaliando apenas o espectro de A(z) utilizando uma única FFT. Precisa-se apenas aplicar a mudança circular, conforme explicado acima, aos coeficientes de A(z).

[0136] Por exemplo, com m = 4 e l = 0, os coeficientes de A(z) são [a0, a1, a2, a3, a4] que pode ser preenchido com zero em um comprimento arbitrário N por [a0, a1, a2, a3, a4, 0, 0 . . . 0].

[0137] Se, então, for aplicada uma mudança circular de (m + l)/2 = 2 passos, obtém-se [a2, a3, a4, 0, 0 . . . 0, a0, a1].

[0138] Considerando a DFT dessa sequência, tem-se o espectro de P(z) e Q(z) nas partes reais RES e nas partes complexas IES do espectro.

[0139] O algoritmo geral no caso onde m + l é par pode ser afirmado como segue. Deixe os coeficientes de A(z), denotados por ak , residirem em um buffer de comprimento N. 1. Aplique uma mudança circular em ak de (m + l)/2 passos à esquerda. 2. Calcule a transformada rápida de Fourier da sequência ak e denote-a por Ak. 3. Até todos os valores de frequência terem sido encontrados, comece com k = 0 e alterne entre (a) Enquanto sign(real(Ak)) = sign(real(Ak+1)) aumente k := k + 1. Visto que o cruzamento zero foi encontrado, armazene k na lista de valores de frequência. (b) Enquanto sign(imag(Ak)) = sign(imag(Ak+1)) aumentam k := k + 1. Uma vez que o cruzamento zero foi encontrado, armazene k na lista de valores de frequência. 4. Para cada valor da frequência, interpole entre Ak e Ak+1 para determinar a posição precisa.

[0140] Aqui as funções sign(x), real(x) e imag(x) se referem ao sinal de x, a parte real de x e a parte imaginária de x, respectivamente.

[0141] Para o caso de m + l ímpar, a mudança circular é reduzida para (m + l - 1)/2 passos à esquerda e a transformada rápida de Fourier regular é substituída pela transformada rápida de Fourier de meia amostra.

[0142] De modo alternativo, podemos sempre substituir a combinação de mudança circular e 1a transformada de Fourier, por transformada rápida de Fourier e uma mudança de fase no domínio de frequência.

[0143] Para localizações mais precisas das raízes, é possível utilizar o método proposto acima para fornecer uma primeira suposição e, então, aplicam uma segunda etapa que refina a root loci. Para o refinamento, podemos aplicar qualquer método clássico de localização da raiz polinomial como método de Durand-Kerner, Aberth-Ehrlich, o método GaussNewton de Laguerre método ou outros [11-17].

[0144] Em uma formulação, o método apresentado consiste nas seguintes etapas: (a) Para uma sequência de comprimento m + l + 1 preenchida com zero ao comprimento N, onde m + l é par, aplique uma mudança circular de (m + l)/2 passos à esquerda, de modo que o comprimento do buffer seja N e corresponda ao espectro de comprimento da saída desejado, ou para uma sequência de comprimento m + l + 1 preenchida com zero para o comprimento N, onde m + l é ímpar, aplique uma mudança circular de (m + l - 1)/2 passos à esquerda, de modo que o comprimento do buffer seja N e corresponda ao espectro com comprimento da saída desejado. (b) se m + l for par, aplique uma DFT regular na sequência. Se m+l for ímpar, aplique uma DFT de meia amostra na sequência, conforme descrito pela Eq. 3 ou uma representação equivalente. (c) se o sinal de entrada estava simétrico ou antissimétrico, busque cruzamentos zero da representação de domínio de frequência a armazene as localizações em uma lista.

[0145] Se o sinal de entrada era uma sequência composta B(z) = P (z) + Q(z), busque cruzamentos zero em ambas as partes, real e imaginária, da representação do domínio de frequência e armazene as localizações em uma lista. Se o sinal de entrada era uma sequência composta B(z) = P (z)+Q(z), e as raízes de P (z) e Q(z) alternam ou têm estrutura similar, busque cruzamentos zero alternando a parte real e a parte imaginária da representação do domínio de frequência e armazene as localizações em uma lista.

[0146] Em outra formulação, o método apresentado consiste nas seguintes etapas (a) Para um sinal de entrada que tem a mesma forma que no ponto anterior, aplique a DFT na sequência de entrada. (b) Aplique uma rotação de fase aos valores de domínio de frequência, que é equivalente à uma mudança circular do sinal de entrada por (m + l)/2 passos à esquerda. (c) Aplique uma busca de cruzamento zero, como foi feito no ponto anterior.

[0147] Com relação ao codificador (1) e aos métodos das aplicações descritas, o seguinte é mencionado:

[0148] Embora alguns aspectos tenham sido descritos no contexto de um aparelho, é evidente que esses aspectos também representam uma descrição do método correspondente, onde um bloco ou dispositivo corresponde à uma etapa do método ou um recurso de uma etapa do método. De forma análoga, os aspectos descritos no contexto de uma etapa do método também representam uma descrição de um bloco ou item ou recurso correspondente de um aparelho correspondente.

[0149] Dependendo de certas exigências de implementação, as aplicações da invenção podem ser implementadas em hardware ou software. A implementação pode ser realizada utilizando um meio de armazenamento digital, por exemplo, um disquete, um DVD, um CD, uma memória ROM, um PROM, uma EPROM, uma EEPROM ou uma memória FLASH, tendo sinais de controle eletronicamente legíveis armazenados em si que cooperam (ou são capazes de cooperação) com um sistema de computador programável, de modo que o respectivo método seja realizado.

[0150] Algumas aplicações, de acordo com a invenção, compreendem um transportador de dados tendo sinais de controle eletronicamente legíveis que são capazes de cooperar com um sistema de computador programável, de modo que um dos métodos aqui descritos seja realizado.

[0151] De modo geral, as aplicações da presente invenção podem ser implementadas como um produto de programa de computador com um código de programa, o código de programa sendo operativo para realizar um dos métodos quando o produto do programa de computador é executado em um computador. O código de programa pode, por exemplo, ser armazenado em uma portadora legível por máquina.

[0152] Outras aplicações compreendem o programa de computador para realizar um dos métodos descritos aqui, armazenados em um transportador legível por máquina ou um meio de armazenamento não transitório.

[0153] Em outras palavras, uma aplicação do método inventivo é, portanto, um programa de computador tendo um código de programa para realizar um dos métodos aqui descritos, quando o programa de computador for executado em um computador.

[0154] Uma aplicação adicional dos métodos inventivos é, portanto, um transportador de dados (ou um meio de armazenamento digital ou a meio legível por computador) compreendendo, gravado nele, o programa de computador para realizar um dos métodos aqui descritos.

[0155] Uma aplicação adicional do método inventivo é, portanto, um fluxo de dados ou uma sequência de sinais que representa o programa de computador para realizar um dos métodos aqui descritos. O fluxo de dados ou a sequência de sinais pode, por exemplo, ser configurado(a) para transferência através de uma conexão de comunicação de dados, por exemplo, via Internet.

[0156] Uma aplicação adicional compreende um meio de processamento, por exemplo, um computador ou um dispositivo de lógica programável, configurado para ou adaptado para realizar um dos métodos aqui descritos.

[0157] Uma aplicação adicional compreende um computador, tendo instalado nele o programa de computador para realizar um dos métodos aqui descritos.

[0158] Em algumas aplicações, um dispositivo lógico programável (por exemplo, um arranjo de portas de campo programável) pode ser utilizado para realizar algumas ou todas as funcionalidades dos métodos aqui descritos. Em algumas aplicações, um arranjo de portas de campo programável pode cooperar com um microprocessador, a fim de realizar um dos métodos aqui descritos. De modo geral, os métodos são vantajosamente realizados por qualquer aparelho de hardware.

[0159] Embora a presente invenção tenha sido descrita em termos de várias aplicações, há alterações, permutações e equivalentes que recaem no escopo da presente invenção. Deve ser observado, ainda, que há muitas formas alternativas de implementar os métodos e composições da presente invenção. É intenção, portanto, que as reivindicações anexas a seguir sejam interpretadas como incluindo todas essas alterações, permutações e equivalentes que recaem no verdadeiro espírito e escopo da presente invenção.

[0160] SINAIS DE REFERÊNCIA: 1. codificador de informação 2. analisador 3. conversor 4. quantizador 5. produtor de fluxo de bits contínuo 6. dispositivo de determinação 7. comutador de coeficiente 8. dispositivo de transformada de Fourier 9. identificador de zero 10. dispositivo de preenchimento zero 11. dispositivo de limitação 12. comutador de fase 13. formador polinomial composto 14. dispositivo de transformada de Fourier de meia amostra 15. sinal de informação RES espectro real IES espectro imaginário 16. fn valores de frequência 17. ...fqn valores de frequência quantizada BS fluxo de bits contínuo REFERÊNCIAS:

[0161] [1] B. Bessette, R. Salami, R. Lefebvre, M. Jelinek, J. Rotola-Pukkila, J. Vainio, H. Mikkola, and K. Jãrvinen, “The adaptive multirate wideband speech codec (AMR- WB)”, Speech and Audio Processing, IEEE Transac- tions on, vol. 10, no. 8, pp. 620-636, 2002.

[0162] [2] ITU-T G.718, “Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s”, 2008.

[0163] [3] M. Neuendorf, P. Gournay, M. Multrus, J. Lecomte, B. Bessette, R. Geiger, S. Bayer, G. Fuchs, J. Hilpert, N. Rettelbach, R. Salami, G. Schuller, R. Lefebvre, and B. Grill, “Unified speech and audio coding scheme for high quality at low bitrates”, in Acoustics, Speech and Signal Processing. ICASSP 2009. IEEE Int Conf, 2009, pp. 1-4.

[0164] [4] T. Bãckstrom and C. Magi, “Properties of line spectrum pair polynomials - a review”, Signal Processing, vol. 86, no. 11, pp. 3286-3298, November 2006.

[0165] [5] G. Kang and L. Fransen, “Application of line-spectrum pairs to low-bit- rate speech encoders”, in Acoustics, Speech, and Signal Processing, IEEE International Conference on ICASSP’85., vol. 10. IEEE, 1985, pp. 244-247.

[0166] [6] P. Kabal and R. P. Ramachandran, “The computation of line spectral frequencies using Chebyshev polynomials”, Acoustics, Speech and Signal Processing, IEEE Transactions on, vol. 34, no. 6, pp. 1419-1426, 1986.

[0167] [7] 3GPP TS 26.190 V7.0.0, “Adaptive multirate (AMR-WB) speech codec”, 2007.

[0168] [8] T. Bãckstrom, C. Magi, and P. Alku, “Minimum separation of line spec- tral frequencies”, IEEE Signal Process. Lett., vol. 14, no. 2, pp. 145-147, February 2007.

[0169] [9] T. Bãckstrom, “Vandermonde factorization of Toeplitz matrices and applications in filtering and warping,” IEEE Trans. Signal Process., vol. 61, no. 24, pp. 6257-6263, 2013.

[0170] [10] V. F. Pisarenko, “The retrieval of harmonics from a covariance function”, Geophysical Journal of the Royal Astronomical Society, vol. 33, no. 3, pp. 347-366, 1973.

[0171] [11] E. Durand, Solutions Numériques des Équations Algébriques. Paris: Masson, 1960.

[0172] [12] I. Kerner, “Ein Gesamtschrittverfahren zur Berechnung der Nullstellen von Polynomen”, Numerische Mathematik, vol. 8, no. 3, pp. 290-294, May 1966.

[0173] [13] O. Aberth, “Iteration methods for finding all zeros of a polynomial simultaneously”, Mathematics of Computation, vol. 27, no. 122, pp. 339-344, April 1973.

[0174] [14] L. Ehrlich, “A modified newton method for polynomials”, Communications of the ACM, vol. 10, no. 2, pp. 107-108, February 1967.

[0175] [15] D. Starer and A. Nehorai, “Polynomial factorization algorithms for adaptive root estimation”, in Int. Conf. on Acoustics, Speech, and Signal Processing, vol. 2. Glasgow, UK: IEEE, May 1989, pp. 1158-1161.

[0176] [16] ——, “Adaptive polynomial factorization by coefficient matching”, IEEE Transactions on Signal Processing, vol. 39, no. 2, pp. 527-530, February 1991.

[0177] [17] G. H. Golub and C. F. van Loan, Matrix Computations, 3rd ed. John Hopkins University Press, 1996.

[0178] [18] T. Saramãki, “Finite impulse response filter design”, Handbook for Digital Signal Processing, pp. 155-277, 1993.

Claims

1. Codificador de informação para codificar um sinal de informação (IS), o codificador de informação (1) compreendendo: um analisador (2) para analisar o sinal de informação (IS) a fim de obter coeficientes de predição linear de um polinômio preditivo A(z); um conversor (3) para converter os coeficientes de predição linear do polinômio preditivo A (z) em valores de frequência (f1...fn) de uma representação de frequência espectral do polinômio preditivo A (z), em que o conversor (3) está configurado para determinar os valores de frequência (f1.fn) analisando um par de polinômios P(z) e Q(z) sendo definidos como P(z)= A(z) +z -m-l A(z-1) e Q(z) = A(z) - z-m-l A(z-1), em que m é uma ordem do polinômio preditivo A(z) e l é maior ou igual a zero, em que o conversor (3) é configurado para obter os valores de frequência (f1.fn) estabelecendo um espectro estritamente real (RES) derivado de P(z) e um espectro estritamente imaginário (IES) de Q(z) e identificando zeros do espectro estritamente real (RES) derivado de P(z) e do espectro estritamente imaginário (IES) derivado de Q(z); um quantizador (4) para obter valores de frequência quantizados (fq1.fqn) a partir dos valores de frequência (f1.fn); e um produtor de fluxo de bits (5) para produzir um fluxo de bits compreendendo os valores de frequência quantizados (fq1...fqn); caracterizado por o conversor (3) compreende um dispositivo limitador (11) para limitar a faixa numérica dos espectros (RES, IES) dos polinômios P(z) e Q(z) multiplicando os polinômios P(z) e Q(z) ou um ou mais polinômios derivados dos polinômios P(z) e Q(z) com um polinômio de filtro B(z), em que o polinômio de filtro B(z) é simétrico e não tem raízes em um círculo unitário.

2. Codificador de informação de acordo com a reivindicação anterior, caracterizado pelo fato de que o conversor (3) compreende um dispositivo de determinação (6) para determinar os polinômios P(z) e Q(z) a partir do polinômio preditivo A(z).

3. Codificador de informação de acordo com uma das reivindicações anteriores, em que o conversor (3) compreende um identificador de zero (9) para identificar os zeros do espectro estritamente real (RES) derivado de P(z) e o espectro estritamente imaginário (IES) derivado de Q(z), em que o identificador de zero (9) é configurado para identificar os zeros por a) começando com o espectro real (RES) em frequência nula; b) aumentar a frequência até que uma mudança de sinal no espectro real (RES) seja encontrada; c) aumentar a frequência até que uma nova mudança de sinal no espectro imaginário (IES) seja encontrada; e d) repetir os passos b) ec) até que todos os zeros sejam encontrados.

4. Codificador de informação, de acordo com a reivindicação 2 ou 3, caracterizado pelo fato de que o identificador de zero é configurado para identificar os zeros por interpolação.

5. Codificador de informação, de acordo com uma das reivindicações anteriores, caracterizado pelo fato de que o conversor (3) compreende um dispositivo de preenchimento de zero (10) para adicionar um ou mais coeficientes tendo um valor "0" para os polinômios P(z) e Q(z) de modo a produzir um par de polinômios alongados Pe(z) e Qe(z).

6. Codificador de informação, de acordo com a reivindicação 5, caracterizado pelo fato de que o conversor (3) é configurado de tal forma que durante a conversão dos coeficientes de predição linear em valores de frequência (f1...fn) da representação de frequência espectral (RES, IES) do O polinômio preditivo A (z) pelo menos uma parte das operações com coeficientes conhecidos por terem o valor "0" dos polinômios alongados Pe(z) e Qe(z)são omitidos.

7. Codificador de informação, de acordo com a reivindicação 5 ou 6, caracterizado pelo fato de que o conversor (3) compreende um formador polinomial composto configurado para estabelecer um polinômio composto Ce(Pe(z), Qe(z))a partir dos polinômios alongados Pe(z) e Qe(z).

8. Codificador de informação, de acordo com a reivindicação anterior, caracterizado pelo fato de que o conversor (3) é configurado de tal forma que o espectro estritamente real (RES) derivado de P(z) e o espectro estritamente imaginário (IES) de Q(z) são estabelecidos por uma única transformada de Fourier pela transformação do polinômio composto Ce(Pe(z), Qe(z)).

9. Codificador de informação, de acordo com uma das reivindicações anteriores, caracterizado pelo fato de que o conversor (3) compreende um dispositivo de transformação de Fourier (8) para transformar Fourier do par de polinômios P(z) e Q(z) ou um ou mais polinômios derivados do par de polinômios P(z) e Q(z) em um domínio de frequência e um dispositivo de ajuste (7, 12) para ajustar uma fase do espectro (RES) derivado de P(z) de modo que seja estritamente real e para ajustar uma fase do espectro (IES) derivada de Q(z) de forma que seja estritamente imaginária.

10. Codificador de informação, de acordo com a reivindicação anterior, caracterizado pelo fato de que o dispositivo de ajuste (7, 12) é configurado como um deslocador de coeficiente (7) para deslocamento circular de coeficientes do par de polinômios P(z) e Q(z) ou aquele ou mais polinômios derivados do par de polinômios P(z) e Q(z).

11. Codificador de informação, de acordo com a reivindicação anterior, caracterizado pelo fato de que o deslocador de coeficiente (7) é configurado para deslocamento circular de coeficientes de tal forma que um ponto médio original de uma sequência de coeficientes é deslocado para a primeira posição da sequência.

12. Codificador de informação de acordo com a reivindicação 9, caracterizado pelo fato de que o dispositivo de ajuste (7, 12) é configurado como um deslocador de fase (12) para deslocar uma fase da saída do dispositivo de transformada de Fourier (8).

13. Codificador de informação, de acordo com a reivindicação anterior, caracterizado pelo fato de que o deslocador de fase (12) é configurado para mudar a fase da saída do dispositivo de transformada de Fourier (8) multiplicando um bin de frequência k-ésima com exp(i2πkh/N), em que N é o comprimento da amostra e h = (m+l)/2.

14. Codificador de informação, de acordo com uma das reivindicações 1 a 8, caracterizado pelo fato de que o conversor (3) compreende um dispositivo de transformada de Fourier (14) para transformar Fourier do par de polinômios P(z) e Q(z) ou um ou mais polinômios derivados do par de polinômios P(z) e Q(z) em um domínio de frequência com meias amostras de modo que o espectro (RES) derivado de P (z) seja estritamente real e de modo que o espectro (IES) derivado de Q(z) é estritamente imaginário.

15. Codificador de informação, de acordo com uma das reivindicações 1 a 6, caracterizado pelo fato de que o conversor (3) compreende um formador polinomial composto (13) configurado para estabelecer um polinômio composto C (P(z), Q(z)) a partir dos polinômios P(z) e Q(z).

16. Codificador de informação, de acordo com a reivindicação anterior, caracterizado pelo fato de que o conversor (3) é configurado de tal forma que o espectro estritamente real (RES) derivado de P (z) e o espectro estritamente imaginário (IES) de Q (z) são estabelecidos por uma única transformada de Fourier ao transformar o polinômio composto C (P(z), Q(z)).

17. Codificador de informação, de acordo com uma das reivindicações 5 a 16, caracterizado pelo fato de que o conversor (3) compreende um dispositivo de limitação (11) para limitar a faixa numérica dos espectros (RES, IES) dos polinômios alongados Pe(z) e Qe(z) ou um ou mais polinômios derivados dos polinômios alongados Pe(z) e Qe(z) multiplicando os polinômios alongados Pe(z) e Qe(z) com um polinômio de filtro B(z), em que o polinômio de filtro B(z) é simétrico e não tem raízes em um círculo unitário.

18. Método para operar um codificador de informação (1) para codificar um sinal de informação (IS), o método compreende as etapas de: analisar o sinal de informação (IS) a fim de obter coeficientes de predição linear de um polinômio preditivo A(z); converter os coeficientes de predição linear do polinômio preditivo A(z) em valores de frequência (f1...fn) de uma representação de frequência espectral (RES, IES) do polinômio preditivo A(z), em que os valores de frequência (f1.fn) são determinados analisando um par de polinômios P(z) e Q(z) sendo definidos como P(z) = A(z) + z-m-l A(z-1) e Q(z) = A(z) - z-m-l A(z-1), em que m é uma ordem do polinômio preditivo A (z) e I é maior ou igual a zero, em que os valores de frequência (f1...fn) são obtidos estabelecendo um espectro estritamente real (RES) derivado de P(z) e um espectro estritamente imaginário (IES) de Q(z) e identificando zeros do espectro estritamente real (RES) derivado de P(z) e do espectro estritamente imaginário (IES) derivado de Q(z); obtenção de valores de frequência quantizados (fq1...fqn) a partir dos valores de frequência (fi...fn); e produzir um fluxo de bits (BS) compreendendo os valores de frequência quantizados (fqi.fqn); caracterizado por limitar o intervalo numérico dos espectros (RES, IES) dos polinômios P(z) e Q(z) multiplicando os polinômios P(z) e Q(z) ou um ou mais polinômios derivados dos polinômios P(z) e Q(z) com um polinômio de filtro B (z), em que o polinômio de filtro B(z) é simétrico e não tem raízes em um círculo unitário.