BRPI0709450B1

BRPI0709450B1 - codificação de sinal de informação

Info

Publication number: BRPI0709450B1
Application number: BRPI0709450A
Authority: BR
Inventors: Jens Hirschfeld; Ulrich Krämer; Manfred Lutzky; Gerald Schuller; Stefan Wabnik
Original assignee: Fraunhofer Ges Forschung
Priority date: 2006-05-12
Filing date: 2007-02-28
Publication date: 2020-02-04
Also published as: EP2022043B1; US9754601B2; US10446162B2; JP2009537033A; BRPI0709450A8; ATE542217T1; DE102006022346A1; AU2007250308B2; CN101443842B; CA2651745C; KR100986924B1; PL2022043T3; CN101443842A; MX2008014222A; NO340674B1; DE102006022346B4; RU2407145C2; US20180012608A1; BRPI0709450A2; HK1121569A1

Abstract

<b>ificaçao de sinal de informaçao <d> quantização muito grosseira que ultrapassa a medida determinada pelo limite de mascaramento, sem ou somente com muito pouca perda de qualidade, é permitida quantizando não imediatamente o sinal pré-filtrado, mas um erro de predição obtido pela predição adaptativa para frente do sinal pré-filtrado. devido à adaptatividade para frente, o erro de quantização não tem efeito negativo na predição no lado do decodificador.

Description

CODIFICAÇÃO DE SINAL DE INFORMAÇÃO

Descrição

A presente invenção se refere à codificação de sinal de informação, como a codificação de áudio ou vídeo.

0 uso de codificação de áudio digital nas novas redes de comunicações, assim como nas produções profissionais de áudio em comunicações bidirecionais em tempo real exige uma codificação algorítmica muito barata, assim como um retardo de codificação muito pequeno. Um cenário típico em que a aplicação da 10 codificação de áudio digital se torna crítica no sentido do tempo de retardo existe quando são usados simultaneamente sinais diretos, isto é, não codificados e transmitidos, isto é, codificados e decodificados. Portanto, os exemplos são as produções ao vivo usando microfones sem fio e monitoramento 15 simultâneo (no ouvido) ou produções dispersas, onde os artistas tocam simultaneamente em diferentes estúdios. O período total tempo de retardo tolerável nessas aplicações é menor que 10 ms. Se, por exemplo, forem usadas linhas participantes assimétricas para as comunicações, a taxa de bits é outro fator limitador.

O retardo algorítmico dos codificadores padrão de áudio, como o MPEG-1 3 (MP3), MPEG-2 AAC e MPEG-2/4 com faixas de baixo retardo entre 20 ms a vários 100 ms, em que é feita referência, por exemplo, ao artigo de M. Lutzky, G. Schuller, M. Gayer; U. Kraemer, S. Wabnik: A guideline to audio codec delay, 25 apresentado na 116^a Convenção AES, Berlim, Maio de 2004. Os codificadores de voz operam em menores taxas de bits e com menor retardo algorítmico, mas proporcionam somente uma limitada qualidade de áudio.

A lacuna mencionada acima entre os codificadores padrão de áudio, por um lado, e os codificadores de voz por outro lado é, por exemplo, fechada por um tipo de esquema de codificação descrito no artigo de B. Edler, C. Faller e G. Schuller, Perceptual Audio Coding Using a Time-Varying Linear Pre- and Pósfiltro, apresentado na 109^a Convenção AES, Los Angeles, em setembro de 2000, de acordo com o qual o sinal a ser codificado é filtrado com o inverso do limite de marcação no lado do codificador, sendo subseqüentemente quantizado para realizar a redução de irrelevância, sendo o sinal quantizado fornecido para codificação de entropia para realizar a redução de redundância separada da redução de irrelevância, enquanto o sinal quantizado pré-filtrado é reconstruído no lado do decodificador e filtrado em um pós-filtro com o limite de marcação como função de transmissão. Esse esquema de codificação, denominado abaixo de esquema de codificação ULD, resulta em uma qualidade perceptual que pode ser

comparada a codificadores padrão	de áudio, como o MP3,	para taxas
de bits de	aproximadamente 80	kBit/s	ou mais	por	canal.	Um
codificador	deste tipo é, por	exemplo,	também	descrito na	WO
2005/078703	Al.
	Particularmente,	os	codificadores	ULD	lá

descritos usam filtros lineares controlados psicoacusticamente para a formação do ruído quantizado. Devido à sua estrutura, o ruído quantizador se situa sempre no limite dado, mesmo quando nenhum sinal estiver em um dado domínio de frequência. O ruído permanece inaudível, enquanto corresponder ao limite psicoacústico de mascaramento. Para obter uma taxa de bits que seja ainda menor que a taxa de bits predeterminada por este limite, o ruído quantizador deve ser aumentado, o que torna o ruído audível. Particularmente, o ruído se torna audível nos domínios sem porções de sinais. Portanto, os exemplos são freqüências de áudio muito baixas ou muito altas. Normalmente, existem somente porções muito baixas de sinais nesses domínios, enquanto o limite de mascaramento é alto. Se o limite de mascaramento aumenta uniformemente em todo o domínio de frequência, o ruído quantizador se situa em um maior limite, mesmo quando não existir sinal, de maneira que o ruído quantizador se torna audível como um sinal que soa espúrio. Os codificadores baseados em sub-banda não têm esse problema, já que somente quantizam sub-bandas com sinais menores que o limite para zero.

problema supramencionado que ocorre quando a taxa de bits admissível cai abaixo de uma taxa de bits mínima, que não causa ruído quantizador espúrio e que é determinado pelo limite de mascaramento, não é o único. Além disso, os codificadores ULD descritos nas referências acima passam por um. procedimento complexo para a obtenção de uma taxa constante de dados, particularmente já que é usado um loop de iteração, que deve ser passado para determinar, por bloco de amostragem, um valor do fator de amplificação que ajuste uma dimensão de etapa de dequantização.

É o objetivo da presente invenção prover um esquema de codificação de informações que torne possível permitir o curto tempo de retardo comum em tipos de codificadores ULD em baixa taxa de bits e ainda uma alta qualidade de codificação.

Este objetivo é alcançado pelos equipamentos de acordo com a reivindicação 1 ou 24, métodos de acordo com a reivindicação 44 ou 45, assim como um codificador de acordo com a reivindicação 47 e um decodificador de acordo com a reivindicação 48 .

A idéia central da presente invenção é o achado que é possível uma quantização extremamente grosseira que ultrapasse a medida determinada pelo limite de mascaramento, sem ou somente com perdas de qualidade muito pequenas, pela não quantização direta do sinal pré-filtrado, mas um erro de predição obtido pela predição adaptativa para frente do pré-filtrado. Devido à adaptatividade para frente, o erro de quantização não tem efeito negativo sobre o coeficiente de predição.

De acordo com outra configuração, o sinal préfiltrado é mesmo quantizado de forma não linear ou mesmo clipado, isto é, quantizado por uma função de quantização, que mapeia os valores não quantizados do erro de predição nos índices de quantização dos estágios de quantização, e cujo curso é mais inclinado abaixo de um limite do que acima de um limite. Assim, o ruído PSD aumentado em relação ao limite de mascaramento devido à baixa taxa disponível de bits ajusta o sinal PSD, de maneira que a violação do limite de mascaramento não ocorre nas partes espectrais sem a porção de sinal, que ainda melhora a qualidade de audição ou mantém a qualidade de audição, respectivamente, apesar da decrescente taxa de bits disponível.

De acordo com outra configuração da presente invenção, a quantização é mesmo quantizada ou limitada, respectivamente, por clipagem [clipping], isto é, pela quantização em um número limitado e fixo de níveis ou de estágios de quantização, respectivamente. Pela predição do sinal pré-filtrado pela predição adaptativa para frente, a quantização grosseira não tem efeito negativo nos próprios coeficientes de predição. Quantizando até um número fixo de níveis de quantização, a prevenção de iteração para a obtenção de uma taxa de bits constante é habilitada de maneira inerente.

De acordo com outra configuração da presente invenção, uma dimensão de etapa de quantização ou altura da etapa, respectivamente, entre o número fixo de níveis de quantização é determinado de maneira adaptativa para trás a partir dos índices anteriores de nível de quantização obtidos pela quantização, de forma que, por um lado, apesar de um número muito baixo de níveis de quantização, a melhor ou pelo menos uma melhor quantização possível do erro de predição ou do sinal residual, respectivamente, pode ser obtida, sem precisar fornecer outras informações auxiliares ao lado do decodificador. Por outro lado, é possível garantir que erros de transmissão durante a transmissão do sinal residual quantizado para o lado do decodificador somente tenha um efeito de curto prazo no lado do decodificador com a adequada configuração do ajuste de dimensão da etapa adaptativa para trás.

	As configurações preferidas	da	invenção serão
discutidas	abaixo, com referência aos desenhos	de	acompanhamento.
Mostram:
	A Fig. 1 é um diagrama	de	blocos de um

codificador de acordo com uma configuração da presente invenção;

As Figs. 2a/b são gráficos mostrando de forma exemplar o curso do espectro de ruído em relação ao limite de mascaramento e à densidade do espectro de potência do sinal para o caso do codificador de acordo com a reivindicação 1 (gráfico a) ou do caso comparativo de um codificador com predição adaptativa para trás do sinal pré-filtrado e iterative e do limite de mascaramento em bloco do ajuste de dimensão da etapa de quantização (gráfico b), respectivamente;

As Figs. 3a/3b e 3c são gráficos mostrando como exemplo a densidade do espectro de potência do sinal em relação à densidade do espectro de potência do erro ou ruído, respectivamente, das diferentes extensões de clipe ou diferentes números de níveis de quantização, respectivamente, para o caso que, como no codificador da Fig. 1, seja feita a predição adaptativa para frente do sinal pré-filtrado, mas ainda um ajuste de dimensão de etapa de quantização iterativa;

A Fig. 4 é um diagrama de blocos de uma estrutura do codificador de coeficientes no codificador da Fig. 1, de acordo com uma configuração da presente invenção;

A Fig. 5 um diagrama de blocos de um. decodificador para a decodificação de um sinal de informação codificado pelo codificador da Fig. 1 de acordo com uma configuração da presente invenção;

A Fig. 6 um diagrama de blocos de uma estrutura dos codificadores de coeficientes no codificador da Fig. 1 ou do

decodificador da Fig. 5,	de	acordo	com	uma configuração da
presente invenção;
A Fig. 7 é	um	gráfico	para	ilustração dos testes
de audição; e
As Figs.	8a	a 8c	são	gráficos de funções

exemplares de quantização que podem ser usadas na quantização e nos meios de clipe/quantização, respectivamente, nas Figs. 1, 4, 5 e 6.

Antes que as configurações da presente invenção sejam discutidas em maiores detalhes com referência aos desenhos, primeiro, para uma melhor compreensão das vantagens e dos princípios dessas configurações, será discutida uma possível implementação de um esquema de codificação do tipo ULD como exemplo comparativo, baseado nas vantagens essenciais e considerações subjacentes às configurações subsequentes, que finalmente levaram a essas configurações, podendo ser ilustradas com maior clareza.

Como já descrito na introdução da descrição, existe a necessidade de uma versão ULD para menores taxas de bits de, por exemplo, 64 k Bit/s, com comparável qualidade perceptual, assim como de um esquema mais simples para a obtenção de uma taxa de bits constante, particularmente para as menores taxas de bits

pretendidas.	Além disso,	seria vantajoso quando	o tempo	de
recuperação	após um erro	de transmissão permanecesse	baixo ou	no
mínimo.	Para a	redução de redundância	do sinal

psicoacusticamente pré-processado, o codificador ULD de comparação usa uma predição de loop fechado adaptativa para trás de amostra. Isto significa que o cálculo dos coeficientes de predição no codificador e no decodificador somente se baseia em amostras passadas ou já quantizadas e de sinais reconstruídos. Para a obtenção de uma adaptação ao sinal ou ao sinal pré-filtrado, respectivamente, é calculado novamente um novo conjunto de coeficientes previsores para cada amostra. Isto resulta na vantagem que longos previsores ou fórmulas de determinação de valores de predição, isto é, particularmente possam ser usados previsores tendo um grande número de coeficientes previsores, já que não existe requisito de transmitir os coeficientes previsores do codificador para o lado do decodificador. Por outro lado, isto significa que o erro de predição quantizado deve ser transmitido ao decodificador sem perdas de exatidão, para a obtenção de coeficientes de predição que sejam idênticos àqueles subjacentes ao processo de codificação. De outra forma, os valores previstos ou predicados, respectivamente, no codificador e no decodificador não seriam idênticos entre si, o que provocaria um processo de codificação instável. Em vez disso, no codificador ULD de comparação, é necessário o reset periódico do previsor tanto no lado do decodificador como do lado do codificador para permitir o acesso seletivo ao fluxo codificado de bits, assim como para interromper a propagação de erros de transmissão. Entretanto, os resets periódicos fazem crescer as taxa de bits, o que não apresenta problemas para um canal com taxa de bits variável, mas para canais com taxa de bits fixa,, onde o crescimento da taxa de bits limita o limite inferior de um ajuste constante da taxa de bits.

Como resultado da subsequente e mais detalhada descrição do esquema de codificação de comparação ULD com as configurações da presente invenção, essas configurações diferem do esquema de codificação de comparação pelo uso de uma predição adaptativa em bloco para frente com um ajuste da etapa de dimensão de quantização adaptativa para trás, em vez de uma predição adaptativa para trás de amostra. Por um lado, isto deve ser uma desvantagem que os previsores devem ser mais curtos para limitarem a quantidade de informações auxiliares necessárias para a transmissão dos coeficientes de predição exigidos na direção do lado do codificador, o que novamente pode resultar na eficiência reduzida do codificador, mas, por outro lado, isto tem a vantagem que o procedimento das subseqüentes configurações ainda funciona efetivamente para maiores erros de quantização, que são o resultado das taxas de bits reduzidas, de maneira que o previsor no lado do decodif icador pode ser usado para a conformação do ruído quantizador.

Como resultado também da comparação subsequente, comparada com o codificador ULD de comparação, a taxa de bits está limitada pela limitação da faixa de valores do remanescente da predição antes da transmissão. Isto resulta em uma conformação de ruídos modificada comparada com o esquema de codificação ULD de comparação, e também leva a diferentes e menos espúrios problemas de audição. Além disso, é gerada uma taxa de bits constante sem o uso de loops iterativos. Também, reset é incluído de maneira inerente em todos os blocos de amostras como resultado da adaptação para frente em bloco. Além disso, nas configurações abaixo descritas, é usado um esquema de codificação para coeficientes de pré-filtro e coeficientes de predição para frente, que usa codificação de diferença com controle de dimensão da etapa de quantização adaptativa para trás para uma representação dos coeficientes LSF (freqüência de linha espectral). O esquema proporciona acesso em bloco aos coeficientes, gera uma taxa de bits de informações auxiliares constante sendo, além disto, robusto contra erros de transmissão, como será descrito abaixo.

A seguir, serão descritos em maiores detalhes o codificador ULD de comparação e a estrutura do decodificador, seguido pela descrição das configurações da presente invenção e a ilustração de suas vantagens na transmissão a partir de maiores taxas constantes de bits para menores taxas de bits.

No esquema de codificação ULD de comparação, o sinal de entrada do codificador é analisado no lado do codificador por um modelo perceptual ou modelo de audição, respectivamente, para a obtenção das informações sobre as porções perceptualmente irrelevantes do sinal. Essas informações são usadas para o controle de um pré-filtro por meio de coeficientes de filtro com variação de tempo. Portanto, o pré-filtro normaliza o sinal de entrada com relação a seu limite de mascaramento. Os coeficientes de filtro são calculados uma vez para cada bloco de 128 amostras, quantizados e transmitidos para o lado do codificador como informações auxiliares.

Após a multiplicação do sinal pré-filtrado por um fator de amplificação e subtraindo o sinal previsto adaptativo para trás, o erro de predição é quantizado por um quantizador uniforme, isto é, um quantizador com dimensão uniforme de etapa. Como já mencionado acima, o sinal previsto é obtido por meio da predição de loop fechado adaptativa para trás de amostra. Assim, não é necessária a transmissão de coeficientes de predição ao decodificador. Subsequentemente, o sinal quantizado residual de predição é codificado por entropia. Para a obtenção de uma taxa de bits constante, é provido um loop, que repete as etapas de multiplicação, predição, quantização e codificação por entropia várias vezes para cada um dos blocos de amostras pré-filtradas.

Após a iteração, é determinado o maior fator de amplificação de um conjunto de valores predeterminados de amplificação, que ainda esteja em conformidade com a condição de uma taxa de bits constante. Este valor de amplificação é transmitido ao decodificador. Entretanto, se for determinado um valor de amplificação menor que um, o ruído quantizador será perceptível após a decodificação, isto é, seu espectro é conformado de maneira similar ao do limite de mascaramento, mas sua potência total é maior que a predeterminada pelo modelo de predição. Para porções do espectro do sinal de entrada, o ruído quantizador pode mesmo ser maior que o próprio espectro do sinal de entrada, que novamente gera problemas audíveis em porções do espectro, onde de outra forma não havería sinal audível, devido ao uso de um codificador preditivo. Os efeitos causados pelo ruído quantizador representam um fator de limitação quando forem de interesse menores taxas constantes de bits.

Continuando com a descrição do esquema ULD de comparação, os coeficientes de pré-filtro são meramente transmitidos como diferenças LSF intraframe, e também somente logo que estas ultrapassarem um determinado limite. Para evitar a propagação de erro de transmissão por um período ilimitado, o sistema é reiniciado periodicamente. Podem ser usadas outras técnicas para minimizar uma redução na percepção do sinal decodificado no caso de erros de transmissão. O esquema de transmissão gera uma taxa de bits variável de informações auxiliares, que é nivelada no loop supramencionado, ajustando adequadamente o fator de amplificação supramencionado.

A codificação de entropia do sinal quantizado residual de predição no caso do codificador ULD de comparação compreende métodos, como o de Golomb, Huffman ou o método de codificação aritmética. A codificação de entropia deve ser reiniciada periodicamente e gera uma de forma inerente uma taxa variável de bits, que é novamente nivelada pelo loop supramencionado.

No caso do esquema de codificação ULD de comparação, o sinal quantizado residual de predição no decodificador é obtido a partir da codificação de entropia, quando são adicionados o remanescente da predição e o sinal previsto, a soma é multiplicada pelo inverso do fator de amplificação transmitido, e daí, o sinal reconstruído de saída é gerado por meio do pós-filtro, tendo uma resposta de freqüência inversa à do pré-filtro, em que o pós-filtro usa os coeficientes transmitidos de pré-filtro.

O codificador ULD de comparação do tipo ora descrito obtém, por exemplo, um retardo geral do codificador/decodificador de 5,33 a 8 ms nas frequências de amostra de 32 kHz a 48 kHz. Sem iterações (loop espúrio) , gera taxas de bits na faixa de 80 a 96 kBit/s. Como acima descrito, em menores taxas constantes de bits, a qualidade de audição é reduzida neste codificador, devido ao aumento uniforme do espectro de ruído. Além disso, devido às iterações, o esforço para a obtenção de uma taxa uniforme de bits é alto. As configurações descritas abaixo superam ou minimizam essas desvantagens. Com uma taxa constante de dados de transmissão, o esquema de codificação das configurações descritas abaixo provoca uma conformação alterada de ruídos do erro de quantização e não exige iteração.

Mais precisamente, no supramencionado esquema de codificação ULD de comparação, no caso da taxa constante de dados de transmissão em um processo iterative, é determinado um multiplicador, com a ajuda do qual o sinal proveniente do pré-filtro é multiplicado antes da quantização, em que o ruído quantizador é espectralmente branco, o que provoca um ruído quantizador no decodificador que é conformado como o limite de audição, mas que se situa um pouco abaixo ou um pouco acima do limite de audição, dependendo do multiplicador selecionado, que pode como descrito acima, ser também interpretado como uma mudança do limite de audição determinado. Em conexão com isso, resulta o ruído quantizador após a decodificação, cuja potência no domínio individual de frequências pode até ultrapassar a potência do sinal de entrada no respectivo domínio de freqüência. Os problemas de codificação resultantes são claramente audíveis. As configurações descritas abaixo conformam o ruído quantizador, de maneira que sua densidade espectral de potência não é mais espectralmente branca. A quantização grosseira/ limitação ou clipagem, respectivamente, do sinal do pré-filtro também conforma o ruído resultante quantizador similar na densidade espectral de potência do sinal do pré-filtro. Assim, o ruído quantizador no decodificador é conformado de maneira a permanecer abaixo da densidade espectral de potência do sinal de entrada. Isto pode ser interpretado como uma deformação do limite de audição determinado. Os problemas de codificação resultantes são menos espúrios que no esquema de codificação ULD de comparação. Além disso, as subsequentes configurações não exigem um processo de iteração, o que reduz a complexidade.

Como pela descrição do esquema de codificação ULD de comparação acima foi provida uma base suficiente para ter atenção às vantagens subjacentes e as considerações das seguintes configurações para a descrição dessas configurações, primeiro, será descrita abaixo a estrutura de um codificador de acordo com uma configuração da presente invenção.

O codificador da Fig. 1, geralmente indicado por 10, compreende uma entrada 12 para o sinal de informação a ser codificado, assim como uma saída 14 para o sinal de informação codificado, onde é exemplarmente suposto que abaixo disto se trata de um sinal de áudio, e exemplarmente em particular um sinal de áudio já amostrado, apesar de também ser possível uma amostragem dentro do codificador subsequente à entrada 12. As amostras do sinal de saída que chegam são indicadas por x(n) na Fig. 1.

Como mostrado na Fig. 1, o codificador 10 pode ser dividido em um meio de determinação de limite de mascaramento 16, um meio pré-filtro 18, um meio de predição preditivo para frente 20 e um meio de quantização/clipe 22, assim como meio de geração de fluxo de bits 24. 0 meio de determinação de limite de mascaramento 16 opera de acordo com um modelo perceptual ou modelo de audição, respectivamente, para a determinação de uma representação do mascaramento ou do limite de audição, respectivamente, do sinal de áudio de chegada na entrada 12 usando o modelo perceptual, que indica uma porção do sinal de áudio que é irrelevante com relação à capacidade de percepção ou de audição, respectivamente, ou representa um limite espectral da frequência em que a energia espectral permanece inaudível devido aos efeitos psicoacústicos de cobertura ou não é percebido pelas pessoas, respectivamente. Como será descrito abaixo, o meio de determinação determina o limite de mascaramento de forma em bloco, isto é, determina o limite de mascaramento por bloco dos blocos subseqüentes de amostras do sinal de áudio. Seriam também possíveis outros procedimentos. A representação do limite de mascaramento como vem do meio de determinação 16 pode, ao contrário da descrição subsequente, particularmente com relação à Fig. 4, também ser uma representação por amostras espectrais do limite de mascaramento espectral.

O pré-filtro ou meio de pré-estimação 18 está acoplado tanto ao meio de determinação de limite de mascaramento 16 como à entrada 12 e filtra o sinal de saída para normalizá-lo com relação ao limite de mascaramento para a obtenção de um sinal pré-filtrado f(n). O meio pré-filtro 18 se baseia, por exemplo, em um filtro linear e é implementado para ajustar os coeficientes de filtro na dependência da representação do limite de mascaramento provido pelo limite de mascaramento do meio de determinação 16, de maneira que a função de transmissão do filtro linear corresponda substancialmente ao inverso do limite de mascaramento. O ajuste dos coeficientes de filtro pode ser feito em bloco, em meio bloco, como no caso descrito abaixo dos blocos que se sobrepõem na metade da determinação do limite de mascaramento, ou em amostras, por exemplo, interpolando os coeficientes de filtro obtidos pelas representações de limite de mascaramento determinadas em bloco, ou pelos coeficientes de filtro daí obtidos através das folgas interblocos.

O meio de predição para frente 20 está acoplado ao meio pré-filtro 18, para submeter as amostras f (n) do sinal pré-filtrado, que são filtradas de maneira adaptativa no domínio do tempo usando o limite psicoacústico de mascaramento para uma predição adaptativa para frente, para a obtenção de um sinal previsto f (n) , um sinal residual r(n) que representa um erro de predição do sinal pré-filtrado f (n) , e uma representação dos coeficientes de filtro de predição, baseado em que o sinal previsto pode ser reconstruído. Particularmente, o meio de predição adaptativa para frente 20 é implementado para determinar a representação dos coeficientes de filtro de predição imediatamente a partir do sinal pré-filtrado f e não somente baseado em uma quantização subsequente do sinal residual r. Assim, como será discutido em maiores detalhes abaixo com referência à Fig. 4, os coeficientes de filtro de predição são representados no domínio LFS, em particular sob a forma de um residual de predição LFS, outras representações são também possíveis, como uma representação intermediária na forma de coeficientes lineares de filtro. Além disso, o meio 20 realiza a determinação do coeficiente de filtro de predição de acordo com a descrição subsequente exemplarmente em bloco, isto é, por bloco em subseqüentes blocos de amostras f(n) do sinal pré-filtrado, onde, entretanto, são também possíveis outros procedimentos. O meio 20 é então implementado para determinar o sinal previsto f por meio desses coeficientes de filtro de predição determinados, e para subtraí-los do sinal pré-filtrado f, em que a determinação do sinal previsto é feita, por exemplo, por meio de um filtro linear, cujos coeficientes de filtro são ajustados de acordo com as representações do coeficiente de predição determinada de forma adaptativa para frente. 0 sinal residual disponível no lado do decodificador, isto é, o sinal residual quantizado e clipado i_c(n), adicionado aos valores do sinal de saída do filtro de saída anteriormente, pode servir como sinal de entrada do filtro, como será discutido abaixo em maiores detalhes.

O meio de quantização/clipe 22 está acoplado ao meio de predição 20, para quantização ou clipagem, respectivamente, do sinal residual por meio de uma função de quantização que mapeia os valores r(n) do sinal residual até um número constante e limitado de níveis de quantização, e para a

transmissão	do	sinal residual	quantizado	assim obtido	sob a	forma
dos índices	de	quantização i_c	(n), como já	mencionado,	para o	meio
de predição	adaptativa para frente 20.
		0 sinal	residual	quantizado	i_c(n) ,	a

representação dos coeficientes de predição determinados pelo meio 20, assim como a representação do limite de mascaramento determinado pelo meio 16 compõem as informações fornecidas para o lado do decodificador por meio do sinal codificado 14, em que, portanto, o meio de geração de fluxo de bits 24 é provido exemplarmente na Fig. 1, para combinar as informações de acordo com um fluxo serial de bits ou uma transmissão em pacote, possivelmente usando outra codificação sem perdas.

Antes que seja discutida a estrutura mais detalhada do codificador da Fig. 1, o modo de operação do codificador 1 será descrito abaixo com base na estrutura acima do codificador 10. Filtrando o sinal de áudio pelo meio pré-filtro 18 com uma função de transmissão correspondente ao inverso do limite de mascaramento, resulta um sinal pré-filtrado f(n), que obtém uma densidade espectral de potência do erro por quantização uniforme, que corresponde principalmente a um ruído branco, e resultaria em um espectro de ruído similar ao limite de mascaramento pela filtragem no pós-filtro no lado do decodificador. Entretanto, primeiro, o sinal residual f é reduzido a um erro de predição r pelo meio de predição adaptativa para frente 20 por um sinal previsto adaptado para frente f por subtração. A subsequente quantização grosseira deste erro de predição r pelo meio de quantização/clipagem 22 não tem efeito nos coeficientes de predição do meio de predição 20, nem no codificador ou no lado do decodificador, já que o cálculo dos coeficientes de predição é feito de maneira adaptativa para frente e, portanto, baseada nos valores não quantizados f(n). A quantização não é somente feita de maneira grosseira, no sentido que é usada uma dimensão da etapa de quantização grosseira, mas também é feita de maneira grosseira no sentido que mesmo a quantização é somente feita em um número constante e limitado de níveis de quantização, de maneira que para a representação de cada sinal residual quantizado i_c(n) ou cada índice de quantização no sinal de áudio codificado 14 somente um número fixo de bits é necessário, o que permite de forma inerente uma taxa de bits constante com relação aos valores residuais i_c(n) . Como será descrito abaixo, a quantização é feita principalmente pela quantização em níveis de quantização uniformemente espaçados de um número fixo, a abaixo exemplarmente de um número de somente três níveis de quantização, onde é feita a quantização, por exemplo, de maneira que um valor de sinal residual não quantizado r(n) seja quantizado até o próximo nível de quantização, para obter o índice de quantização i_c(n) do nível de quantização correspondente dele. Valores extremamente altos e extremamente baixos do sinal residual não quantizado r(n) são assim mapeados com relação ao respectivo nível de quantização mais alto ou mais baixo, respectivamente, ou ao respectivo índice do nível de quantização, respectivamente, mesmo quando forem mapeados em um maior nível de quantização em quantização uniforme com a mesma dimensão de etapa. Assim, o sinal residual r é também clipado ou limitado, respectivamente, pelo meio 22. Entretanto, este último tem o efeito, como será discutido abaixo, que o erro PSD (PSD = densidade espectral de potência) do sinal pré-filtrado não é mais um ruído branco, mas se aproxima do sinal PSD do sinal pré-filtrado, dependendo do grau de clipagem. No lado do decodificador, tem o efeito que o ruído PSD permanece abaixo do sinal PSD mesmo em taxas de bits que são menores que as predeterminadas pelo limite de mascaramento.

A seguir, será descrita a estrutura do codificador da Fig. 1 em maiores detalhes. Particularmente, o meio de determinação de limite de mascaramento 16 compreende um determinador de limite de mascaramento ou um modelo perceptual 26, respectivamente, operando de acordo com o modelo perceptual, um módulo de cálculo do coeficiente de pré-filtro 28 e um codificador de coeficientes 30, que são conectados na ordem indicada entre a entrada 12 e o meio pré-filtro 18, assim como o gerador de fluxo de bits 24. 0 meio pré-filtro 18 compreende um decodificador de coeficientes 32 cuja entrada está ligada à saída do codificador de coeficientes 30, assim como o pré-filtro 34, que é, por exemplo, um filtro linear adaptativo, e que está ligado com sua entrada de dados à entrada 12 e com sua saída de dados ao meio 20, enquanto sua entrada de adaptação para a adaptação dos coeficientes de filtro está conectada à uma saída do decodificador de coeficientes

32. O meio de predição 20 compreende um módulo de cálculo do coeficiente de predição 36, um codificador de coeficientes 38, um decodificador de coeficientes 40, um subtrator 42, um filtro de predição 44, um elemento de retardo 46, outro somador 48 e um dequantizador 50. 0 módulo de cálculo do coeficiente de predição 46 e o codificador de coeficientes 38 estão conectados em série nessa ordem entre a saída do pré-filtro 34 e a entrada do decodificador de coeficientes 40 ou outra entrada do gerador de fluxo de bits 24, respectivamente, cooperando para a determinação de uma representação dos coeficientes de predição em bloco de maneira adaptativa para frente. 0 decodificador de coeficientes 40 está conectado entre o codificador de coeficientes 38 e o filtro de predição 44, que é, por exemplo, um filtro de predição linear.

Além da entrada do coeficiente de predição ligada ao decodificador de coeficientes 40, o filtro 44 compreende uma entrada de dados e uma saída de dados, à qual está ligado em loop fechado, que compreende, fora o filtro 44, o somador 48 e o elemento de retardo 46. Particularmente, o elemento de retardo 46 está ligado entre o somador 48 e o filtro 44, enquanto a saída de dados do filtro 44 está ligada à primeira entrada do somador 48. Acima disso, a saída de dados do filtro 44 está também ligada à uma entrada invertida do subtrator 42. Uma entrada não invertida do subtrator 42 está ligada à saída do pré-filtro 34 enquanto a segunda entrada do somador 48 está ligada à uma saída do dequantizador 50. Uma entrada de dados do dequantizador 50 está acoplada ao meio de quantização/clipagem 22 assim como a uma entrada de controle da dimensão da etapa do dequantizador 50. O meio de quantização/clipagem 22 compreende um módulo quantizador 52 assim como um bloco de adaptação de dimensão de etapa 54, onde novamente módulo quantizador 52 consiste de um quantizador uniforme 56 com dimensão de etapa uniforme e controlável e um limitador 58, que estão ligados em série na ordem especificada entre uma saída do subtrator 42 e a outra entrada do gerador de fluxo de bits 24, e onde o bloco de adaptação de dimensão de etapa 54 novamente compreende um módulo de adaptação de dimensão de etapa 60 e um membro de retardo 62, que estão ligados em série na ordem especificada entre a saída do limitador 58 e a entrada de controle da dimensão da etapa do quantizador 56. Além disso, a saída do limitador 58 está ligada à entrada de dados do dequantizador 50, onde a entrada de controle da dimensão da etapa do dequantizador 50 está também ligada ao bloco de adaptação de dimensão de etapa 60. Uma saída do gerador de fluxo de bits 24 forma novamente a saída 14 do codificador 10.

Depois que a estrutura detalhada do codificador da Fig. 1 foi descrita em detalhes acima, seu modo de operação será descrito abaixo. 0 módulo do modelo perceptual 26 determina ou estima, respectivamente, o limite de mascaramento de maneira em bloco a partir do sinal de áudio. Portanto, o módulo do modelo perceptual 26 usa, por exemplo, uma DFT de comprimento 256, isto é, um comprimento de bloco de 256 amostras x(n), com 50% de sobrepasso entre os blocos, o que resulta em um retardo do codificador 10 de 128 amostras do sinal de áudio. A estimativa da saída do limite de mascaramento pelo módulo do modelo perceptual 26 é, por exemplo, representada de forma amostrada espectralmente em uma banda Bark ou escala de freqüência linear. O limite de mascaramento produzido por bloco pelo módulo do modelo perceptual 26 é usado no módulo de cálculo do coeficiente 24 para o cálculo dos coeficientes de filtro de um filtro predeterminado, isto é, o filtro 34. Os coeficientes calculados pelo módulo 28 podem, por exemplo, ser coeficientes LPC, que modelam o limite de mascaramento. Os coeficientes de pré-filtro de cada bloco são novamente codificados pelo codificador de coeficientes 30, que será discutido em maiores detalhes com referência à Fig. 4. O decodificador de coeficientes 34 decodifica os coeficientes de pré-filtro codificados para reaver os coeficientes de pré-filtro do módulo 28, onde o pré-filtro 34 obtém novamente esses parâmetros ou coeficientes de pré-filtro, respectivamente, e os usa, de maneira a normalizar o sinal de entrada x(n) com relação a seu limite de mascaramento ou os filtra com uma função de transmissão, respectivamente, que corresponde essencialmente ao inverso do limite de mascaramento. Comparado ao sinal de entrada, a quantidade do sinal pré-filtrado resultante f (n) é significativamente menor.

No módulo de cálculo do coeficiente de predição 36, as amostras f (n) do sinal pré-filtrado são processadas de maneira em bloco, em que a divisão em blocos pode corresponder exemplarmente ao do sinal de áudio 12 pelo módulo do modelo perceptual 26, mas não precisa fazer isto. Para cada bloco de amostras pré-filtradas, o módulo de cálculo do coeficiente 36 calcula coeficientes de predição para uso pelo_; filtro de predição 44. Portanto, o módulo de cálculo do coeficiente 36 realiza, por exemplo, a análise LPC (LPC = codificação preditiva) por bloco do sinal pré-filtrado para a obtenção dos coeficientes de predição. O codificador de coeficientes 38 então codifica os coeficientes de predição de maneira similar ao codificador de coeficientes 30, como será discutido em maiores detalhes abaixo, e envia esta representação dos coeficientes de predição ao gerador de fluxo de bits 24 e particularmente ao decodificador de coeficientes 40, onde este último usa a representação do coeficiente de predição obtida para aplicar os coeficientes de predição obtidos na análise LPC pelo módulo de cálculo do coeficiente 36 para o filtro linear 44, de maneira que o previsor de loop fechado que consiste no loop fechado de filtro 44, membro de retardo 46 e somador 48 gerem o

Λ sinal previsto f (n) , que é novamente subtraído do sinal préfiltrado f(n) pelo subtrator 42. O filtro linear 44 é, por exemplo, um filtro de predição linear do tipo A(z) = ¹ de comprimento N, onde o decodificador de coeficientes 40 ajusta os valores ai na dependência dos coeficientes de predição calculados pelo módulo de cálculo do coeficiente 36, isto é, as pesagens com as quais os valores anteriormente previstos f (n) mais os valores de sinal residual dequantizado são pesados e então somados para a obtenção de um novo ou do atual, respectivamente, valor previsto f .

O remanescente da predição r(n) obtida pelo subtrator 22 está sujeito à quantização uniforme, isto é, quantização com dimensão uniforme da etapa de quantização, no quantizador 56, onde a dimensão da etapa Δ(η) varia com o tempo, sendo calculada ou determinada, respectivamente, pelo módulo de adaptação de dimensão de etapa de maneira adaptativa para trás, isto é, a partir dos valores residuais quantizados para os valores residuais anteriores r(m<n). Mais precisamente, o quantizador uniforme 56 envia um valor residual quantizado q(n) por valor residual r(n), que pode ser expresso como q(n) = i (η) · Δ(η) e pode ser denominado de etapa quantizadora provisória com índice. O índice de quantização provisório i (n) é novamente clipado pelo limitador 58, em uma quantidade C = [-c;c], onde c é uma constante c e{l,2,...}. Particularmente, o limitador 58 é implementado de maneira que todos os valores de índice provisório i(n) com |i(n)|> c sejam determinados em -c ou c, dependendo o que estiver mais próximo. Somente a sequência de índices ou a série i_c (n) , respectivamente, clipada ou limitada é enviada pelo limitador 58 ao gerador de fluxo de bits 24, ao dequantizador 50 e ao bloco de adaptação de dimensão de etapa 54 ou ao elemento de retardo 62, respectivamente, porque o membro de retardo 62, assim como todos os demais membros de retardo nas presentes configurações, retarda os valores de chegada em uma amostra.

Agora, é feito o controle de dimensão da etapa adaptativa para trás por meio do bloco de adaptação de dimensão de etapa 54, onde este usa valores de seqüência de índices passados i_c(n) retardados pelo membro de retardo 62 para a adaptação constante da dimensão da etapa Δ(η), de maneira que a área limitada pelo limitador 58, isto é, a área estabelecida pelos índices de quantização permitidos ou os níveis de quantização correspondentes, respectivamente, seja colocada de maneira que a probabilidade estatística de ocorrência de valores residuais não quantizados r(n), ocorra nos níveis permitidos de quantização o mais uniformemente possível no fluxo gerado da seqüência de índice quantizadora clipada i_c(n). Particularmente, o módulo de adaptação de dimensão de etapa 60 calcula, por exemplo, a atual dimensão de etapa Δ(η), por exemplo, usando os dois índices de quantização clipados imediatamente precedentes i_c(n-l) e i_z(n-2), assim como o valor da dimensão de etapa determinado imediatamente anterior Δ(η1) a Δ(η) = βΔ(η-Ι) + δ(η), com β e[0.0;1.0[, δ(η) = δ₀ para |i_c (n1) + i_c(n-2)| < I e δ(η) = δι for |i_c(n-l) + i_c(n-2)| >1, onde δ₀, δ^. e I são constantes adequadamente ajustadas, assim como β.

Como será discutido em maiores detalhes abaixo com referência à Fig. 5, o decodificador usa a seqüência de índice de quantização obtida i_c(n) e a seqüência de dimensão da etapa Δ(η), que também é calculada de maneira adaptativa para trás para a reconstrução da seqüência de valor dequantizado q_c(n) calculando i_c(n) · Δ(η), que também é feito no codificador 10 da Fig. 1, isto é, pelo dequantizador 50 no meio de predição 20. Como no lado do decodificador, a seqüência de valor residual q_c(n) construída dessa forma, está sujeita a uma adição dos valores previstos f (n) de maneira em amostras, em que a adição é feita no codificador 10 por meio do somador 48. Apesar de reconstruído ou dequantizado, respectivamente, o sinal pré-filtrado assim obtido não é mais usado no codificador 10, exceto para o cálculo dos subseqüentes valores previstos f (η) , o pós-filtro gera daí a seqüência de amostra de áudio decodificada y(n) no lado do decodificador, que cancela a normalização pelo pré-filtro 34.

ruído quantizador introduzido na seqüência de índice de quantização q_c(n) não é mais branco, devido à clipagem. Em vez disso, sua forma espectral copia a do sinal pré-filtrado. Para ilustrar o fato, é feita brevemente referência à Fig. 3, que mostra, nos gráficos a, b e c, o PSD do sinal pré-filtrado (gráfico superior) e o PSD do erro de quantização (respectivo gráfico inferior) para diferentes números ou estágios de níveis de quantização, respectivamente, isto é, para C = [-15,-15] no gráfico a, para uma faixa limitadora de [-7; 7] no gráfico b, e uma faixa de clipagem de [-1,-1] no gráfico c. Para clareza, ainda deve ser notado que o PSD que segue os erros PSDs dos gráficos A-C foram plotados com um desvio de -lOdB. Como pode ser visto, o sinal préfiltrado corresponde a um ruído colorido com potência de σ² = 34. Na quantização com uma dimensão de etapa Δ = 1, o sinal se situa dentro de [-21,-21] , isto é, as amostras do sinal pré-filtrado têm uma distribuição de ocorrência ou formam um histograma, respectivamente, que se situa neste domínio. Para os gráficos a até c na Fig. 3, a faixa quantizadora foi limitada, como mencionado, a [-15,-15] em a), [-7,-7] em b) e [-1,-1] em c) . O erro de quantização foi medido como a diferença entre o sinal préfiltrado não quantizado e o sinal pré-filtrado decodificado. Como pode ser visto, um ruído quantizador é adicionado ao sinal préfiltrado aumentando a clipagem ou com limitação aumentada do número de níveis de quantização, que copia o PSD do sinal préfiltrado, em que o grau de cópia depende da rigidez ou da extensão, respectivamente, da clipagem aplicada. Como conseqüência, depois da pós-filtragem, o espectro do ruído quantizador no lado do decodificador copia mais o PSD do sinal de entrada de áudio. Isto significa que o ruído quantizador permanece abaixo do espectro do sinal após a decodificação. Este efeito está ilustrado na Fig. 2, que mostra no gráfico a, para o caso da predição adaptativa para trás, isto é, predição de acordo com o esquema ULD de comparação descrito acima, e no gráfico b, para o caso de predição adaptativa para frente com clipagem aplicada de acordo com a Fig. 1, respectivamente, três cursos em um domínio de freqüência normalizado, isto é, a partir de cima para baixo, o sinal PSD, isto é, o PSD do sinal de áudio, o erro de quantização PSD ou o ruído quantizador após a decodificação (linha reta) e o limite de mascaramento (linha pontilhada). Como pode ser visto, o ruído quantizador do codificador ULD de comparação (Fig. 2a) é formado como o limite de mascaramento e ultrapassa o espectro do sinal para porções do sinal. 0 efeito da predição adaptativa para frente do sinal pré-filtrado combinado com a clipagem ou limitação subsequente, respectivamente, do número do nível de quantização está agora claramente ilustrado na Fig. 2b, onde pode ser visto que o ruído quantizador é sempre mais baixo que o espectro do sinal e sua forma representam uma mistura do espectro do sinal com o limite de mascaramento. Nos testes de audição, foi achado que os problemas de codificação de acordo com a Fig. 2b são menos espúrios, isto é, a qualidade percebida de audição é melhor.

A descrição acima do modo de operação do codificador da Fig. 1 está concentrada no pós-processamento do sinal pré-filtrado f(n), para a obtenção dos índices de quantização clipados i_c(n) a serem transmitidos para o lado do decodificador. Como se originam de uma quantidade com um número constante e limitado de índices, podem ser representados pelo mesmo número de bits dentro do fluxo de dados codificados na saída

14. Portanto, o gerador de fluxo de bits 24 usa, por exemplo, um mapeamento de injeção dos índices de quantização para m palavras bit que podem ser representadas por um número predeterminado de bits m.

A descrição a seguir se refere à transmissão do pré-filtro ou dos coeficientes de predição, respectivamente, calculados pelos módulos de cálculo dos coeficientes 28 e 36 para o lado do decodif icador, isto é, particularmente com uma configuração da estrutura dos codificadores de coeficientes 30 e 38 .

Como mostrado, os codificadores de coeficientes de acordo com a configuração da Fig. 4 compreendem um módulo de conversão LSF 102, um primeiro subtrator 104, um segundo subtrator 106, um quantizador uniforme 108 com dimensão de etapa de quantização uniforme e ajustável, um limitador 110, um dequantizador 112, um terceiro somador 114, dois membros de retardo 116 e 118, um filtro de predição 120 com coeficientes de filtro fixos ou coeficientes de filtro constantes, respectivamente, assim como um módulo de adaptação de dimensão de etapa 122. Os coeficientes de filtro a serem codificados se situam em uma entrada 124, onde uma saída 126 é provida para o envio da representação codificada.

Uma entrada do módulo de conversão LSF 102 segue diretamente a entrada 124. O subtrator 104 com sua entrada não invertida e sua saída está conectado entre a saída do módulo de conversão LSF 102 e uma primeira entrada do subtrator 106, onde uma constante l_c é aplicada à entrada do subtrator 104. 0 subtrator 106 está conectado à sua entrada não invertida e sua saída entre o primeiro subtrator 104 e o quantizador 108, onde sua entrada invertida está acoplada a uma saída do filtro de predição 120. Junto com o membro de retardo 118 e o somador 114, o filtro de predição 120 forma um previsor de loop fechado, que está conectado em série em loop com feedback, de maneira que o membro de retardo 118 está conectado entre a saída do somador 114 e a entrada do filtro de predição 120, e a saída do filtro de predição 120 está conectada a uma primeira entrada do somador 114. A estrutura remanescente corresponde novamente principalmente a um dos meios 22 do codificador 10, isto é, o quantizador 108 está conectado entre a saída do subtrator 106 e a entrada do limitador 110, cuja saída está novamente conectada à saída 126, a uma entrada do membro de retardo 116 e a uma entrada do dequantizador 112. A saída do membro de retardo 116 está conectada a uma entrada do módulo de adaptação de dimensão de etapa 122, que assim forma em conjunto um bloco de adaptação de dimensão de etapa. Uma saída do módulo de adaptação de dimensão de etapa 122 está conectada às entradas de controle da dimensão da etapa do quantizador 108 e o dequantizador 112. A saída do dequantizador 112 está conectada à segunda entrada do somador 114.

Depois de ter sido descrita acima a estrutura do codificador de coeficientes, será descrito abaixo seu modo de operação, onde é novamente feita referência à Fig. 1. A transmissão tanto dos pré-filtros como dos coeficientes preditores ou previsores, respectivamente, ou de suas codificações, respectivamente, é feita usando um esquema de codificação de taxa de bits constante, que é feita pela estrutura de acordo com a Fig.

4. Depois, no módulo de conversão LSF 102, os coeficientes de filtro, isto é, os coeficientes de pré-filtro ou de predição, respectivamente, são primeiro convertidos em valores LSF 1 (n) ou transferidos para o domínio LSF, respectivamente. Toda frequência de linha espectral 1 (n) é então processada pelos elementos residuais na Fig. 4 como a seguir. Isto significa que a descrição a seguir se refere somente a uma freqüência de linha espectral, onde o processamento do curso é feito para todas as frequências de linha espectral. Por exemplo, o módulo 102 gera valores LSF para cada conjunto de coeficientes de pré-filtro que representam um limite de mascaramento, ou um bloco de coeficientes de predição que prevê o sinal pré-filtrado. 0 subtrator 104 subtrai um valor constante de referência l_c do valor calculado 1 (n) , em que uma faixa suficiente de l_c varia, por exemplo, entre 0 e π. A partir da diferença resultante l_d(n), o subtrator 106 subtrai um valor previsto í_d(n), que é calculado pelo previsor de loop fechado 120, 118 e 114 incluindo o filtro de predição 120, como um filtro linear, com coeficientes fixos A(z) . O restante, isto é, o valor residual, é quantizado pelo quantizador de dimensão da etapa adaptativa 108, em que os índices de quantização enviados pelo quantizador 108 são clipados pelo limitador 110 até o sub-conjunto dos índices de quantização recebidos por ele, como, por exemplo, para todos os índices de quantização clipados l_e(n), quando são enviados pelo limitador 110, aplica-se o seguinte: V : l_e(n) e {1,0,1}. Para a adaptação da dimensão de etapa de quantização de Δ(η) do residual quantizador LSF 108, o módulo de adaptação de dimensão de etapa 122 e o membro de retardo 116 cooperam, por exemplo, no sentido descrito com relação ao bloco de adaptação de dimensão de etapa 54 com referência à Fig. 1; entretanto, possivelmente com uma diferente função de adaptação ou com diferentes constantes β, I, δ₀, ôi e I. Apesar do quantizador 108 usar a atual dimensão de etapa para a quantização do atual valor residual para l_e(n), o dequantizador 112 usa uma dimensão da etapa Δι(η) para a dequantização deste valor índice l_e(n) novamente e para fornecer o valor resultante reconstruído ao valor residual LSF, como foi enviado pelo subtrator 106, ao somador 114, que adiciona este valor ao valor previsto correspondente í_d(n), e o fornece por meio do membro de retardo 118, retardado por uma amostra ao filtro 120 para o cálculo do valor LSF previsto l_d(n) para o próximo valor LSF l_d(n).

Se os dois codificadores de coeficientes 30 e 38 forem implementados da maneira descrita na Fig. 4, o codificador 10 da Fig. 1 preenche uma condição de taxa constante de bits sem usar qualquer loop. Devido à adaptação para frente em bloco dos coeficientes LPC e o esquema de codificação aplicado, não é necessário nenhum reset explícito do previsor.

Antes que os resultados dos testes de audição, que foram obtidos por um codificador de acordo com as Figs. 1 e 4, será discutida abaixo a estrutura de um decodificador de acordo com uma configuração da presente invenção, que é adequada para a decodificação de um fluxo codificado de dados deste codificador, em que é feita referência às Figs. 5 e 6. A Fig. 6 também mostra a estrutura do decodificador de coeficientes da Fig. 1.

O decodificador geralmente indicado por 200 na Fig. 5 compreende uma entrada 202 para receber o fluxo codificado de dados, uma saída 204 para envio do fluxo decodificado de áudio y(n), assim como um meio dequantizador 206 tendo um número limitado e constante de níveis de quantização, um meio de predição 208, um meio de reconstrução 210, assim como um meio pós-filtro

212. Além disso, é provido um extrator 214, que está acoplado à entrada 202 e implementado para extrair, do fluxo codificado de bits de entrada, o sinal residual de pré-filtro quantizado e clipado i_c(n), as informações codificadas sobre os coeficientes de pré-filtro e as informações codificadas sobre os coeficientes de predição, como foram gerados dos codificadores de coeficientes 30 e 38 (Fig. 1) e para enviá-los às respectivas saídas. O meio dequantizador 206 está acoplado ao extrator 214 para obter os índices de quantização i_c(n) dele e para fazer a dequantização desses índices em um número limitado e constante de níveis de quantização, isto é, - mantendo a mesma notação acima - {-c · A(n); c - Δ(η)}, para obter um sinal de pré-filtro dequantizado ou reconstruído q_c(n), respectivamente. O meio de predição 208 está acoplado ao extrator 214 para a obtenção de um sinal previsto para o sinal pré-filtrado, isto é, f_C(n) a partir das informações sobre os coeficientes de predição. O meio de predição 208 está acoplado ao extrator 214 para determinar um sinal previsto para o sinal

Λ pré-filtrado, isto é, f (n) , a partir das informações sobre os coeficientes de predição, em que o meio de predição 208 de acordo com a configuração da Fig. 5 está também conectado a uma saída do meio de reconstrução 210. O meio de reconstrução 210 é dotado de meios para reconstruir o sinal pré-filtrado, com base no sinal previsto f (n) e nos sinais residuais dequantizados q_c(n). Essa reconstrução é então usada pelo subseqüente meio pós-filtro 212 para filtrar o sinal pré-filtrado com base nas informações do coeficiente pré-filtro recebidas do extrator 214, de maneira que a normalização com relação ao limite de mascaramento seja cancelada para a obtenção do sinal de áudio decodificado y(n).

Após ter sido descrita acima a estrutura básica do decodificador da Fig. 5, a estrutura do decodificador 200 será discutida em maiores detalhes. Particularmente, o dequantizador 206 compreende um bloco de adaptação de dimensão de etapa de um membro de retardo 216 e um módulo de adaptação de dimensão de etapa 218, assim como um dequantizador uniforme 220. O dequantizador 220 está conectado a uma saída do extrator 214 com sua entrada de dados, para obter os índices de quantização i_c(n). Além disso, o módulo de adaptação de dimensão de etapa 218 está conectado a esta saída do extrator 214 por meio do membro de retardo 216, cuja saída está novamente conectada à entrada de controle da dimensão da etapa do dequantizador 220. A saída do dequantizador 220 está conectada a uma primeira entrada do somador 222, que forma o meio de reconstrução 210. O meio de predição 208 compreende um decodificador de coeficientes 224, um filtro de predição 226, assim como um membro de retardo 228. O decodificador de coeficientes 224, o somador 222, o filtro de predição 226 e o membro de retardo 228 correspondem aos elementos 40, 44, 46 e 48 do codificador 10 com relação a seus modos de operação e suas conectividades. Em particular, a saída do filtro de predição 226 está conectada a outra entrada do somador 222, cuja saída é novamente reenviada à entrada de dados do filtro de predição 226 por meio do membro de retardo 22 8, assim como acoplada ao meio pós-filtro 212. O decodificador de coeficientes 224 está conectado entre uma outra saída do extrator 214 e a entrada de adaptação do filtro de predição 226. 0 meio pós-filtro compreende um decodificador de coeficientes 230 e um pós-filtro 232, em que uma entrada de dados do pós-filtro 232 está conectada a uma saída do somador 222 e uma saída de dados do pós-filtro 232 está conectada à saída 204, enquanto uma entrada de adaptação do pós-filtro 232 está conectada a uma saída do decodificador de coeficientes 230 para adaptar o pós-filtro 232, cuja entrada está novamente conectada a outra saída do extrator 214.

Como já mencionado, o extrator 214 extrai os índices de quantização i_c(n) que representam o sinal residual de pré-filtro quantizado do fluxo codificado de dados em uma entrada 202. No dequantizador uniforme 220, esses índices de quantização são dequantizados para os valores residuais quantizados q_c(n). De forma inerente, essa dequantização permanece dentro dos níveis de quantização permitidos, já que os índices de quantização i_c(n) já foram clipados no lado do codificador. A dimensão da etapa de adaptação é feita de maneira adaptativa para trás, da mesma forma que no bloco de adaptação de dimensão de etapa 54 do codificador da Fig. 1. Sem erros de transmissão, o dequantizador 220 gera os mesmos valores que o dequantizador 50 do codificador da Fig. 1. Portanto, os elementos 222, 226, 228 e 224 com base nos coeficientes de predição codificados obtêm o mesmo resultado obtido no codificador 10 da Fig. 1 na saída do somador 48, isto é, um sinal de pré-filtro dequantizado ou reconstruído, respectivamente. O último é filtrado no pós-filtro 232, com uma função de transmissão correspondendo ao limite de mascaramento, em que o pós-filtro 232 é ajustado de forma adaptativa pelo decodificador de coeficientes 230, que ajusta de maneira adequada o pós-filtro 230 ou seus coeficientes de filtro, respectivamente, com base nas informações do coeficiente pré-filtro.

Supondo que o codificador 10 seja dotado dos codificadores de coeficientes 30 e 38, que são implementados como descrito na Fig. 4, o decodificador de coeficientes 224 e 230 do codificador 200, como também o decodificador de coeficientes 40 do codificador 10 estão estruturados como mostrado na Fig. 6. Como pode ser visto, o decodificador de coeficientes compreende dois membros de retardo 302, 304, um módulo de adaptação de dimensão de etapa 3 06 formando um bloco de adaptação de dimensão de etapa junto com o membro de retardo 3 02, um dequantizador uniforme 3 08 com dimensão uniforme de etapa, um filtro de predição 310, dois somadores 312 e 314, um módulo de reconversão LSF 316, assim como uma entrada 318 para receber os valores residuais LSF quantizados l_e(n) com desvio constante -l_c e uma saída 320 para enviar a predição reconstruída ou os coeficientes de pré-filtro, respectivamente. Assim, o membro de retardo 302 está conectado entre uma entrada do módulo de adaptação de dimensão de etapa 306 e a entrada 318, uma entrada do dequantizador 308 estando também conectada a uma entrada 318, e uma dimensão de etapa de entrada de adaptação do dequantizador 308 está conectada a uma saída do módulo de adaptação de dimensão de etapa 306. O modo de operação e a conectividade dos elementos 302, 306 e 308 correspondem a um dos 112, 116 e 122 na Fig. 4. Um previsor de loop fechado do membro de retardo 304, um filtro de predição 310 e um somador 312, que estão conectados em um loop comum conectando o membro de retardo 304 entre uma saída do somador 312 e uma entrada do filtro de predição 310, e conectando uma primeira entrada do somador 312 à saída do dequantizador 308, e conectando uma segunda entrada do somador 312 a uma saída do filtro de predição 310, estão ligados a uma saída do dequantizador 308. Os elementos 304, 310 e 312 correspondem aos elementos 120, 118 e 114 da Fig. 4 em seus modos de operação e conectividade. Além disso, a saída do somador 312 está ligada a uma primeira entrada do somador 314, na segunda entrada do qual é aplicado o valor constante l_c, onde, de acordo com a presente configuração, a constante l_c é uma quantidade combinada, que está presente tanto no codificador como no decodificador e assim não tem que ser transmitida como parte das informações auxiliares, apesar disto também ser possível. O módulo LSF de reconversão 316 está conectado entre uma saída do somador 314 e a saída 320.

Os índices do sinal residual LSF l_e(n) que chegam na entrada 318 são dequantizados pelo dequantizador 308, onde o dequantizador 308 usa os valores da dimensão de etapa adaptativa para trás Δ(η), que foram determinados de maneira adaptativa para trás pelo módulo de adaptação de dimensão de etapa 306 dos já dequantizados índices de quantização, isto é, aqueles que foram retardados de uma amostra pelo membro de retardo 302. O somador 312 soma o sinal previsto aos valores residuais LSF dequantizados, que calcula a combinação do membro de retardo 304 e do filtro de predição 210 a partir das somas que o somador 312 já realizou anteriormente, e assim representa os valores LSF reconstruídos, que são somente dotados de um desvio constante pelo desvio constante l_c. Este último é corrigido pelo somador 314 adicionando o valor l_c aos valores LSF, enviados pelo somador 312. Assim, na saída do somador 314, o resultado dos valores LSF reconstruídos, são convertidos pelo módulo 316 do domínio LSF de volta para a predição reconstruída ou coeficientes de pré-filtro, respectivamente. Portanto, o módulo LSF de reconversão 316 considera todas as freqüências de linha espectral, considerando que a discussão dos outros elementos da Fig. 6 ficou limitada à descrição de uma frequência de linha espectral. Entretanto, os elementos 302-314 também realizam as medidas supramencionadas nas outras freqüências de linha espectral.

Depois de prover as configurações acima do codificador como do decodificador, serão apresentados os resultados do teste de audição abaixo com base na Fig. 7, já que foram obtidos por meio de um esquema de codificação de acordo com as Figs. 1, 4, 5 e 6. Nos testes realizados, foram testados tanto o codificador de acordo com as Figs. 1, 4 e 6 como um codificador de acordo com o esquema de codificação ULD de comparação discutidos no início da descrição das Figs., em um teste de audição de acordo com o padrão MUSHRA, em que foram omitidos os moderadores. O teste MUSHRA foi feito em um computador laptop com conversor externo digital/análogo e amplificador/fones de ouvido STAX em um ambiente de escritório silencioso. Foi formado um grupo de oito ouvintes do teste, entre ouvintes peritos e não peritos. Antes que os participantes começassem o teste de audição, tiveram a oportunidade de ouvir um conjunto de teste. Os testes foram feitos com doze arquivos de áudio mono do conjunto de testes MPEG, em que todos apresentaram uma freqüência de amostra de 32 kHz, isto é, esOl (Suzanne Vega), es02 (fala masculina, Alemão), es03 (fala feminina, Inglês), scOl (trompete), sc02 (orquestra), sc03 (pop music), siOl (címbalo), si02 (castanholas), si03 (afinador), smOl (gaita de foles), sm02 (vibrafone), sm03 (instrumento de cordas).

Para o esquema de codificação ULD de comparação, foi usada uma predição adaptativa para trás com comprimento de 64 na implementação, junto com um codificador Golomb de adaptação para trás para a codificação de entropia, com uma taxa de bits constante de 64 kBit/s. Em contraste, para a implementação do codificador de acordo com as Figs. 1, 4 e 6, foi usado um previsor de adaptação para frente com comprimento de 12, em que o número de diferentes níveis de quantização foi limitado a 3, isto é, de maneira que Vn : i_c(n) e (-1,0,1). Isto resultou, em conjunto com as informações auxiliares codificadas, em uma taxa de bits constante de 64 kBit/s, que significa a mesma taxa de bits.

Os resultados dos testes de audição MUSHRA estão mostrados na Fig. 7, onde são mostrados tanto os valores médios como os intervalos de confiança de 95 %, para as doze peças de teste individualmente como para o resultado total de todas as peças. Enquanto os intervalos de confiança se sobrepõem, não existem diferenças estatisticamente significativas entre os métodos de codificação.

A peça esOl (Suzanne Vega) é um bom exemplo da superioridade do esquema de codificação de acordo com as Figs. 1, 4, 5 e 6 em menores taxas de bits. As maiores porções do espectro do sinal decodificado mostram menos problemas audíveis, quando comparadas ao esquema de codificação ULD de comparação. Isso resulta em uma taxa significativamente maior do esquema de acordo com as Figs. 1, 4, 5 e 6.

Os transientes de sinal da peça sm02 (Vibrafone) têm maior exigência de taxa de bits para o esquema de codificação ULD de comparação. Nos 64kBit/s usados, o esquema de codificação ULD de comparação gera problemas espúrios de codificação nos blocos completos de amostras. Em contraste, o codificador que opera de acordo com as Figs. 1, 4 e 6 proporciona qualidade de audição ou qualidade perceptual significativamente aperfeiçoada, respectivamente. A classificação geral, vista no gráfico da Fig. 7 à direita do esquema de codificação formado de acordo com as Figs. 1, 4 e 6 obteve uma classificação significativamente melhor que o esquema de codificação ULD de comparação. No geral, este esquema de codificação obteve uma classificação geral de boa qualidade de áudio, sob as condições dadas de teste.

Em resumo, a partir das configurações supramencionadas, resulta um esquema de codificação de áudio com baixo retardo, que usa uma predição adaptativa em bloco para frente em conjunto com clipagem/limitação em vez de uma predição de amostras com adaptação para trás. A conformação de ruídos difere do esquema de codificação ULD de comparação. O teste de audição demonstrou que as configurações supramencionadas são superiores ao método de adaptação para trás, de acordo com o esquema de codificação ULD de comparação no caso de menores taxas de bits. Subsequentemente, são candidatos para o fechamento da folga da taxa de bits entre os codificadores de voz de alta qualidade e os codificadores de áudio de baixo retardo. No geral, as configurações supramencionadas proporcionam a possibilidade de esquemas de codificação de áudio com retardo muito baixo de 6 - 8 ms para taxas de bits reduzidas, que têm as seguintes vantagens quando comparados ao codificador ULD de comparação. São mais resistentes contra grandes erros de quantização, tem outras capacidades de conformação de ruídos, melhor capacidade de obtenção de uma taxa de bits constante, e mostra um melhor comportamento de recuperação de erros. O problema do ruído quantizador audível em posições sem sinal, que é o caso no esquema de codificação ULD de comparação, é solucionado pela configuração de uma forma modificada de aumento do ruído quantizador acima do limite de mascaramento, isto é, adicionando o espectro do sinal ao limite de mascaramento, em vez de aumentar uniformemente o limite de mascaramento até certo ponto. Assim, não existe ruído quantizador audível nas posições sem sinal.

Em outras palavras, as configurações acima diferem do esquema de codificação ULD de comparação da seguinte maneira. No esquema de codificação ULD de comparação, é usada a predição adaptativa para trás, o que significa que os coeficientes do filtro de predição A(z) são atualizados amostra a amostra a partir dos valores de sinal previamente decodificados. É usado um quantizador com uma dimensão de etapa variável, em que a dimensão da etapa adapta todas as 128 amostras usando as informações dos codificadores de entropia, sendo transmitidas como informações auxiliares para o lado do decodif icador. Com este procedimento, a dimensão de etapa de quantização é aumentada, adicionado mais ruído branco ao sinal pré-filtrado e aumentando de maneira uniforme o limite de mascaramento. Se a predição adaptativa para trás for substituída por uma predição em bloco de adaptação para frente no esquema de codificação ULD de comparação, o que significa que os coeficientes do filtro de predição A(z) são calculados uma vez para 128 amostras das amostras pré-filtradas não quantizadas e transmitidas como informações auxiliares, e se a dimensão de etapa de quantização for adaptada para as 128 amostras usando as informações do codificador de entropia e transmitidas como informações auxiliares para o lado do decodificador, a dimensão de etapa de quantização ainda estará aumentada, como é o caso no esquema de codificação ULD de comparação, mas a atualização do previsor não é afetada por qualquer quantização. As configurações acima usaram somente uma predição em bloco adaptada para frente, onde, além disso, o quantizador somente recebeu um número dado 2N+1 de estágios de quantização tendo dimensão fixa de etapa. Para os sinais pré-filtrados x(n) com amplitudes fora da faixa do quantizador [-ΝΔ;ΝΔ], o sinal quantizado foi limitado a [-ΝΔ;ΝΔ]. Isto resulta em um ruído quantizador com um PSD, que não é mais branco, mas copia o PSD do sinal de entrada, isto é, o sinal de áudio pré-filtrado.

Como conclusão, o seguinte deve ser notado nas configurações acima. Primeiro, deve ser observado que existem diferentes possibilidades para a transmissão de informações sobre a representação do limite de mascaramento, como obtidas pelo módulo do modelo perceptual 26 dentro do codificador para o préfiltro 34 ou filtro de predição 44, respectivamente, e para o decodificador, existindo particularmente para o pós-filtro 232 e o filtro de predição 226. Particularmente, deve ser notado que não é necessário que os decodificadores de coeficientes 32 e 40 dentro do codificador recebam exatamente as mesmas informações com relação ao limite de mascaramento, como enviadas pela saída 14 do codificador e como são recebidas na saída 202 do decodificador. Em vez disso, é possível que, por exemplo, em uma estrutura do codificador de coeficientes 3 0 de acordo com a Fig. 4, os índices obtidos l_e(n), assim como os índices de quantização do sinal residual do pré-filtro i_c(n) se originem também somente a partir de uma quantidade de três valores, isto é, -1, 0, 1, e que o gerador de fluxo de bits 24 mapeie esses índices tão claramente que correspondam a n bit palavras. De acordo com uma configuração de acordo com a Figs. 1, 4 ou 5, 6, respectivamente, os índices de quantização de pré-filtro, os índices de quantização de coeficiente de predição e/ou os índices de quantização de préfiltro, cada qual originado de uma quantidade -1, 0, 1, são mapeados em grupos de cinco para 8-bit palavras, que corresponde ao mapeamento de 3⁵ possibilidades em 2⁸ bit palavras. Como o mapeamento não é subjetivo, várias 8-bit palavras ficam não utilizadas e podem ser usadas de outras formas, como para sincronização ou para si.

Nessa ocasião, deve ser notado o seguinte. Acima, foi descrito com referência à Fig. 6 que a estrutura dos decodificadores de coeficientes 32 e 230 é idêntica. Nesse caso, o pré-filtro 34 e o pós-filtro 232 são implementados de maneira que ao aplicar os mesmos coeficientes de filtro, tenham uma função de transmissão inversa entre si. Entretanto, é claro ser também possível que, por exemplo, o codificador de coeficientes 32 faça outra conversão dos coeficientes de filtro, de maneira que o préfiltro tenha uma função de transmissão que corresponda principalmente ao inverso do limite de mascaramento, considerando que o pós-filtro tenha uma função de transmissão que corresponda principalmente ao limite de mascaramento.

Nas configurações acima, foi suposto que o limite de mascaramento é calculado no módulo 26. Entretanto, deve ser notado que o limite calculado não precisa corresponder exatamente ao limite psicoacústico, mas pode representar uma estimativa mais ou menos exata de si, que pode não considerar todos os efeitos psicoacústicos, mas somente alguns deles. Em particular, o limite pode representar um limite psicoacusticamente motivado, que tenha sido deliberadamente submetido a uma modificação, em contraste com uma estimativa do limite de mascaramento psicoacústico.

Além disso, deve ser notado que a adaptação para trás do tamanho da etapa na quantização dos valores do sinal residual de pré-filtro não precisa necessariamente estar presente. Em vez disso, em determinados casos de aplicação, pode ser suficiente um tamanho de etapa fixa.

Além disso, deve ser notado que a presente invenção não se limita ao campo da codificação de áudio. Em vez disso, o sinal a ser codificado também pode ser um sinal usado para estimular uma ponta de dedo em uma luva ciberespaço, onde o modelo perceptual 26 nesse caso considera determinadas características tácteis, que o sentido humano do toque não mais pode perceber. Outro exemplo de um sinal de informação a ser codificado seria, por exemplo, um sinal de vídeo. Particularmente, o sinal de informação a ser codificado podería ser uma informação de luminosidade de um ponto pixel ou de imagem, respectivamente, em que o modelo perceptual 26 também poderia considerar diferentes efeitos de cobertura temporal, local e psicovisual de frequência, isto é, um limite visual de mascaramento.

Além disso, deve ser notado que o quantizador 56 e o limitador 58 ou quantizador 108 e o limitador 110, respectivamente, não precisam ser componentes separados. Em vez disso, o mapeamento dos valores não quantizados com relação aos valores quantizados/clipados também poderia ser feito por mapeamento simples. Por outro lado, o quantizador 56 ou o quantizador 108, respectivamente, também poderiam ser feitos por uma série de conexões de um divisor seguido por um quantizador com dimensão de etapa uniforme e constante, em que o divisor usaria o valor da dimensão de etapa Δ(η) obtido do respectivo módulo de adaptação da dimensão da etapa como divisor, enquanto o sinal residual a ser codificado formasse o dividendo. O quantizador tendo uma dimensão de etapa uniforme e constante podería ser provido como simples módulo de arredondamento, que arredonda o resultado da divisão até o próximo inteiro, em que o limitador subseqüente limitaria então o inteiro como supramencionado até um inteiro do valor permitido C. No dequantizador respectivo, uma dequantização uniforme seria simplesmente feita com Δ(η) como multiplicador.

Além disso, deve ser notado que as configurações acima foram restritas a aplicações com taxa de bits constante. Entretanto, a presente invenção não se limita a este fato, sendo somente uma alternativa possível a quantização pela clipagem, por exemplo, do sinal pré-filtrado usado nessas configurações. Em vez da clipagem, podería ser usada a função de quantização com curva de característica não linear. Para ilustrar, é feita referência às Figs. 8a a 8c. A Fig. 8a mostra a função de quantização usada acima que resulta da clipagem em três estágios de quantização, isto é, a função de etapa com três estágios 402a, b, c, que mapeia valores não quantizados (eixo x) em índices de quantização (eixo y) , em que a altura do estágio de quantização ou a dimensão da etapa de quantização Δ(η) está também marcada. Como pode ser visto, valores não quantizados maiores que Δ(η)/2 são clipados no respectivo próximo estágio 402a ou c, respectivamente. A Fig. 8b mostra de forma geral a função de quantização que resulta da clipagem a 2n+l estágios de quantização. A dimensão da etapa de quantização Δ(η) está novamente mostrada. As funções de quantização das Figs. 8a e 8b representam funções de quantização, onde a quantização entre os limites -Δ(η) e Δ(η) ou -ΝΔ(η) e ΝΔ(η) ocorre de maneira uniforme, isto é, com a mesma altura de estágio, em que a função do estágio de quantização é feita de maneira plana, o que corresponde à clipagem. A Fig. 8c mostra uma função de quantização não linear, em que a função de quantização é feita em uma área entre -ΝΔ(η) e ΝΔ(η) não completamente plana, mas com menor inclinação, isto é, com maior dimensão de etapa ou altura de estágio, respectivamente, comparada à primeira área. Esta quantização não linear não resulta, de forma inerente, em uma taxa constante de bits, como foi o caso nas configurações acima, mas também gera a deformação supramencionada do ruído de quantização, de maneira que se ajuste ao sinal PSD. Somente como medida de precaução, deve ser notado com referência às Figs. 8a-c, que em vez de áreas de quantização uniforme, pode ser usada quantização não uniforme onde, por exemplo, a altura de estágio aumenta continuadamente, em que as alturas de estágio poderíam ser escaláveis via um valor de ajuste de altura de estágio Δ(η) enquanto mantém suas relações mútuas. Portanto, por exemplo, o valor não quantizado pode ser mapeado por meio de uma função não linear até um valor intermediário no respectivo quantizador, onde tanto antes como depois da multiplicação por Δ(η) ser feita, e finalmente o valor resultante ser uniformemente quantizado. No respectivo dequantizador, pode ser feito o inverso, que significa uma dequantização uniforme por meio de Δ(η) seguida pelo mapeamento inverso não linear ou, ao contrário, o mapeamento de conversão não linear primeiro seguido pela dequantização por Δ(η). Finalmente, deve ser notado ser também possível uma contínua e uniforme, isto é, uma quantização linear por meio da obtenção do efeito supramencionado de deformação do erro PSD, quando a altura do estágio é ajustada tão alta ou a quantização é tão grosseira que esta quantização funciona efetivamente como uma quantização não linear com relação à estatística do sinal a ser quantizado, como o sinal pré-filtrado, em que este ajuste de altura de estágio é tornado novamente possível pela adaptatividade para frente da predição.

Além disso, as configurações supramencionadas podem também variar com relação ao processamento do fluxo codificado de bits. Particularmente, o gerador e o extrator do fluxo de bits 214, respectivamente, podem ser omitidos.

Os diferentes índices de quantização, isto é, os valores residuais dos sinais pré-filtrados, os valores residuais dos coeficientes de pré-filtro e os valores residuais dos coeficientes de predição podem também ser transmitidos em paralelo entre si, armazenados ou disponibilizados de outra forma para decodificação, separadamente por canais individuais. Por outro lado, no caso em que uma taxa constante de bits não é imperativa, esses dados também podem ser codificados por entropia.

Particularmente, as funções acima nos blocos das Figs. 1, 4, 5 e 6 podem implementados individualmente ou em combinações por rotinas de subprogramas. Alternativamente, a implementação do equipamento da invenção sob a forma de um circuito integrado é também possível, onde esses blocos são implementados, por exemplo, como partes individuais de um ASIC.

Particularmente, deve ser notado que, dependendo das circunstâncias, o esquema da invenção também pode ser implementado em software. A implementação pode ser feita em um meio de memória digital, particularmente em um disco ou CD com sinais de controle de leitura eletrônica, que possam cooperar com um sistema de computador programável, de maneira que o método respectivo seja executado. Em geral, portanto, a invenção consiste 10 também de um produto de programa de computador dotado de um código de programas armazenado em um veículo de leitura por máquina para a realização do método da invenção quando o produto de programa de computador opera em um computador. Em outras palavras, a invenção pode ser realizada como um programa de computador tendo um código 15 de programas para a realização do método quando o programa de computador opera em um computador.

Claims

REIVINDICAÇÕES

1. Equipamento para a codificação de um sinal de informação em um sinal de informação codificado, caracterizado pelo fato de que compreende:

um meio (16) para a determinação de uma representação de um limite de psicopercepção motivada, que indica uma porção do sinal de informação irrelevante com relação à percepção, usando um modelo perceptual;

um meio (18) para a filtragem do sinal de informação para a normalização do sinal de informação com relação ao limite de psicopercepção motivada, para a obtenção de um sinal pré-filtrado;

um meio (20) para a predição do sinal préfiltrado de maneira adaptativa para frente, para obter um sinal previsto, um erro de predição do sinal pré-filtrado e uma representação de coeficientes de predição, com base em que o sinal pré-filtrado possa ser reconstruído; e um meio (22) para a quantização do erro de predição, de maneira a obter um erro de predição quantizado, compreendendo o fato de que o sinal de informação codificado compreende informações sobre a representação do limite de psicopercepção motivada, a representação dos coeficientes de predição e o erro de predição quantizado.
2. Equipamento, de acordo com a reivindicação 1, caracterizado pelo fato de que o meio (22) para quantização é implementado para quantizar o erro de predição por meio da função de quantização, que mapeia valores não quantizados do erro de predição em índices de quantização de estágios de quantização, e cujo curso abaixo de um limite é

Petição 870190109269, de 28/10/2019, pág. 7/20

2/14 mais inclinado que acima de um limite.
3. Equipamento, de acordo com a reivindicação

1 ou 2, caracterizado pelo fato de que o meio (22) para

quantização é implementado para obter uma altura da etapa de quantização A(n) da função de quanti zação de maneira adaptativa para trás, a partir do erro de predição quantizado. 4. Equipamento, de acordo com qualquer uma

das reivindicações anteriores, caracterizado pelo fato de que o meio (22) para a quantização do erro de predição é implementado de maneira que os valores não quantizados do erro de predição são quantizados por meio de clipagem pela função de quantização, que mapeia os valores não quantizados do erro de predição nos índices de quantização de um primeiro número constante e limitado de estágios de quantização para a obtenção do erro de predição quantizado.

5. Equipamento, de acordo com a reivindicação 4, caracterizado pelo fato de que o meio (22) para quantização é implementado para obter a altura da etapa de quantização A(n) da função de quantização para a quantização de um valor (r(n)) do erro de predição de maneira adaptativa para trás de dois índices passados de quantização ic(n-1) e i_c(n-2) do erro de predição quantizado de acordo com A(n) = β A(n-1) + δ(π), com βε [0,0;1,0], δ (n) = δ₀ para |i_c(n-1) + i_c(n2)| < I e δ(π) = δ₁ para |i_c(n-1) + i_c(n-2)| > I com parâmetros constantes δ₀, δ₁, I, onde A(n-1) representa uma altura da etapa de quantização obtida para a quantização de um valor prévio do erro de predição.

6. Equipamento, de acordo com as

Petição 870190109269, de 28/10/2019, pág. 8/20

3/14 reivindicações de 4 ou 5, caracterizado pelo fato de que o meio para quantização é implementado para quantizar o erro de predição de maneira não linear.

7. Equipamento, de acordo com uma das reivindicações de 4 a 6, caracterizado pelo fato de que o primeiro número constante e limitado é 3.

8. Equipamento, de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o meio (16) para determinação é implementado para estabelecer o limite de psicopercepção motivada de maneira em bloco a partir do sinal de informação.

9. Equipamento, de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o meio (16) para determinação é implementado para representar o limite de psicopercepção motivada no domínio LSF.

10. Equipamento, de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o meio (16) para determinação é implementado para estabelecer o limite de psicopercepção motivada de maneira em bloco e para representá-lo em coeficientes filtrados, para submeter os coeficientes de filtro a uma predição e para submeter um sinal residual de coeficiente de filtro resultante da predição a uma quantização por meio de outra função de quantização, que mapeia os valores não quantizados do sinal residual de coeficiente de filtro em índices de quantização de estágios de quantização, e cujo curso abaixo de outro limite é mais inclinado que acima do outro limite, para a obtenção de um sinal residual de coeficiente de filtro quantizado, onde o sinal de informação codificado também

Petição 870190109269, de 28/10/2019, pág. 9/20
4/14 inclui informações sobre o sinal residual de coeficiente de filtro quantizado.

11. Equipamento, de acordo com a reivindicação 10, caracterizado pelo fato de que o meio (16) para a determinação é implementado de maneira que os valores não quantizados do sinal residual de coeficiente de filtro sejam quantizados por meio de clipagem pela outra função de quantização, que mapeia os valores não quantizados do sinal residual de coeficiente de filtro em índices de quantização de um segundo número constante e limitado de estágios de quantização.

12. Equipamento, de acordo com a reivindicação 11, caracterizado pelo fato de que o meio (16) para determinação é implementado de maneira que a predição é feita de maneira adaptativa para trás com base nos índices de quantização do sinal residual de coeficiente de filtro quantizado.

13. Equipamento, de acordo com uma das reivindicações de 10 a 12, caracterizado pelo fato de que o meio (16) para determinação é implementado de maneira que a predição dos coeficientes de filtro é feita usando um filtro de predição com coeficientes constantes.

14. Equipamento, de acordo com uma das reivindicações de 9 a 13, caracterizado pelo fato de que o meio (16) para determinação é ainda implementado para submeter os coeficientes de filtro de maneira a representarem o limite de psicopercepção motivada a uma subtração por um valor constante, antes de submetê-lo à predição.

15. Equipamento, de acordo com qualquer uma

Petição 870190109269, de 28/10/2019, pág. 10/20
5/14 das reivindicações anteriores, caracterizado pelo fato de que o meio (20) para a predição do sinal pré-filtrado de maneira adaptativa para frente ainda compreende:

um meio (36) para a determinação dos coeficientes de filtro de predição a partir do sinal préfiltrado; e um meio (44, 46, 48) para a predição do sinal pré-filtrado por meio de um filtro (44) controlado pelos coeficientes de filtro de predição.

16. Equipamento, de acordo com a reivindicação 15, caracterizado pelo fato de que o meio (36) para determinação é implementado para estabelecer os coeficientes de filtro de predição de maneira em bloco a partir do sinal pré-filtrado.

17. Equipamento, de acordo com a reivindicação 15 ou 16, caracterizado pelo fato de que o meio (36) para determinação é implementado para representar os coeficientes de filtro de predição no domínio LSF.

18. Equipamento, de acordo com uma das reivindicações de 15 a 17, caracterizado pelo fato de que o meio (36) para determinação é implementado para estabelecer os coeficientes de filtro de predição de maneira em bloco, para submeter os coeficientes de filtro de predição a uma predição, e para submeter um sinal residual do coeficiente de filtro de predição resultante da predição à quantização por uma terceira função de quantização, que mapeia os valores não quantizados do sinal residual do coeficiente de filtro de predição a índices de quantização de estágios de quantização, e cujo curso abaixo de um terceiro limite é mais inclinado

Petição 870190109269, de 28/10/2019, pág. 11/20
6/14 que acima do terceiro limite, para a obtenção de um sinal residual do coeficiente de filtro de predição quantizado, em que o sinal de informação codificado também compreende informações sobre o sinal residual do coeficiente de filtro de predição quantizado.

19. Equipamento, de acordo com a reivindicação 18, caracterizado pelo fato de que o meio (36) para determinação é implementado de maneira que os valores não quantizados do sinal residual do coeficiente de filtro de predição são quantizados por meio de clipagem dos índices de quantização do terceiro número de estágios de quantização pela terceira função de quantização, que mapeia os valores não quantizados do sinal residual do coeficiente de filtro de predição para quantizar os índices de um terceiro número constante e limitado de estágios de quantização.

20. Equipamento, de acordo com a reivindicação 18, caracterizado pelo fato de que o meio (36) para determinação é implementado de maneira que a predição é feita de maneira adaptativa para trás com base nos índices de quantização do sinal residual dos coeficientes do filtro de predição quantizados para um ou vários blocos anteriores do sinal pré-filtrado.

21. Equipamento, de acordo com uma das reivindicações de 18 a 19, caracterizado pelo fato de que o meio (36) para determinação é implementado de maneira que a predição dos coeficientes de filtro de predição seja realizada usando um filtro de predição com coeficientes constantes.

22. Equipamento, de acordo com uma das

Petição 870190109269, de 28/10/2019, pág. 12/20
7/14 reivindicações de 18 a 21, caracterizado pelo fato de que o meio (36) para determinação é ainda implementado para submeter os coeficientes de filtro de predição a uma subtração por um valor constante antes de submetê-lo à predição.

23. Equipamento, de acordo com qualquer uma das reivindicações anteriores, que é implementado para a codificação de um sinal de áudio ou de um sinal de vídeo como sinal de informação, caracterizado pelo fato de que o modelo perceptual é um modelo psicoacústico e o limite de psicopercepção motivada um limite psicoacusticamente motivado, ou o modelo perceptual é um modelo psicovisual e o limite de psicopercepção motivada é um limite psicovisualmente motivado.

24. Equipamento para a decodificação de um sinal de informação codificado compreendendo informações sobre uma representação de um limite de psicopercepção motivada, uma representação de coeficientes de predição e um erro de predição quantizado em um sinal de informação decodificado, caracterizado pelo fato de que compreende:

um meio (206) para a dequantização do erro de predição quantizado para a obtenção de um erro de predição dequantizado;

um meio (208) para a determinação de um sinal previsto com base nos coeficientes de predição, que foram obtidos por predição adaptativa para frente;

um meio (210) para a reconstrução de um sinal pré-filtrado com base no sinal previsto e o erro de predição dequantizado; e

Petição 870190109269, de 28/10/2019, pág. 13/20
8/14 um meio (212) para a filtragem do sinal préfiltrado para reconversão de uma normalização com relação ao limite de psicopercepção motivada na obtenção do sinal de informação decodificado.

25. Equipamento, de acordo com a reivindicação 24, caracterizado pelo fato de que o meio (206) para dequantização é implementado para dequantizar o erro de predição quantizado e um número limitado e constante de estágios de quantização.

26. Equipamento, de acordo com a reivindicação 25, caracterizado pelo fato de que o meio (206) para dequantização é implementado para obter a altura da etapa de quantização Δ(π) entre os estágios de quantização de maneira adaptativa para trás a partir dos índices já dequantizdos de quantização do erro de predição quantizado.

27. Equipamento, de acordo com a reivindicação 25 ou 26, caracterizado pelo fato de que o meio (260) para dequantização é implementado para obter a altura da etapa de quantização (A(n)) entre os estágios de quantização para a dequantização de um índice de quantização do erro de predição quantizado de maneira adaptativa para trás a partir dos dois anteriores índices de quantização ic(n-1) e ic(n-2) do erro de predição quantizado de acordo com Δ(π) = βΑ(π-1) + δ(π) com [0,0;1,0],δ(n) = δ₀ para |ic(n-1) + ic(n-2)| < I e δ(π) = δ1 para |i_c(n-1) + i_c(n-2)| > I tendo parâmetros constantes δ₀, δ₁, I, onde A(n-1) representa a altura da etapa de quantização obtida para dequantização ic(n-1).

28. Equipamento, de acordo com uma das

Petição 870190109269, de 28/10/2019, pág. 14/20
9/14 reivindicações de 25 a 27, caracterizado pelo fato de que o número constante e limitado é menor ou igual a 32.

29. Equipamento, de acordo com uma das reivindicações de 25 a 28, caracterizado pelo fato de que o número constante e limitado é 3.

30. Equipamento, de acordo com uma das reivindicações de 24 a 29, caracterizado pelo fato de que o meio (212) para filtragem compreende:

um meio (230) para a determinação dos coeficientes de filtro de limite perceptual a partir das informações sobre a representação do limite de psicopercepção motivada de maneira em bloco para blocos de uma seqüência de blocos do sinal pré-filtrado; e um pós-filtro (232) para a filtragem do sinal pré-filtrado usando os coeficientes de filtro de limite perceptual.

31. Equipamento, de acordo com uma das reivindicações de 24 a 30, caracterizado pelo fato de que o meio (230) para determinação é implementado para obter os coeficientes de filtro de limite perceptual pela reconversão de um domínio LSF.

32. Equipamento, de acordo com uma das reivindicações de 24 a 31, caracterizado pelo fato de que o meio (230) para determinação é implementado para obter índices de quantização de um sinal residual de coeficiente de filtro quantizado a partir da representação do limite de psicopercepção motivada, para dequantizá-lo até um segundo número limitado e constante de níveis de quantização, para a obtenção de um sinal residual de coeficiente de filtro

Petição 870190109269, de 28/10/2019, pág. 15/20

10/14 dequantizado, para predizer os coeficientes de filtro que representam o limite de psicopercepção motivada e para adicioná-lo ao sinal residual de coeficiente de filtro dequantizado e para converter um sinal residual de coeficiente de filtro reconstruído que resulta da soma pela reconversão nos coeficientes de filtro de limite perceptual.

33. Equipamento, de acordo com a reivindicação 32, caracterizado pelo fato de que o meio (230) para determinação é implementado de maneira que a predição é feita de maneira adaptativa para trás com base nos já preditos coeficientes de filtro que representam o limite de psicopercepção motivada.

34. Equipamento, de acordo com as reivindicações 32 ou 33, caracterizado pelo fato de que o meio (230) para determinação é implementado de maneira que a predição dos coeficientes de filtro que representam o limite de psicopercepção motivada é feita usando um filtro de predição com coeficientes constantes.

35 . Equipamento, de acordo com uma das reivindicações de 32 a 34, caracterizado pelo fato de que o meio (230) para a determinação é ainda implementado para submeter o sinal residual de coeficiente de filtro reconstruído que resulta da soma a uma soma com um valor constante antes da reconversão. 36 . Equipamento, de acordo com uma das reivindicações de 24 a 37, caracterizado pelo fato de que o meio (208) para a determinação de um sinal previsto ainda

compreende:

um meio (224) para a determinação de

Petição 870190109269, de 28/10/2019, pág. 16/20

11/14 coeficientes de filtro de predição a partir da representação dos coeficientes de predição compreendidos no sinal de informação codificado; e um meio (226, 228) para a predição do sinal pré-filtrado por meio de um filtro (226) controlado pelos coeficientes de filtro de predição.

37. Equipamento, de acordo com a reivindicação 36, caracterizado pelo fato de que o meio (224) para a determinação coeficientes de filtro de predição é implementado para determiná-lo de maneira em bloco para blocos de uma seqüência de blocos do sinal pré-filtrado.

38. Equipamento, de acordo com uma das reivindicações 36 ou 37, caracterizado pelo fato de que o meio (224) para determinação é implementado para obter os coeficientes de filtro de predição pela reconversão de um domínio LSF.

39. Equipamento, de acordo com uma das reivindicações de 36 a 38, caracterizado pelo fato de que o meio (224) para determinação é implementado para obter índices de quantização de um sinal residual do coeficiente de predição quantizado da representação dos coeficientes de predição, para dequantizá-lo até um terceiro número limitado e constante de níveis de quantização para a obtenção de um sinal residual do coeficiente de predição dequantizado, para predizer coeficientes de filtro de predição e para adicionálos ao sinal residual do coeficiente de predição dequantizado e para converter um sinal residual do coeficiente de predição reconstruído que resulta da soma pela reconversão nos coeficientes de filtro de predição.

Petição 870190109269, de 28/10/2019, pág. 17/20
12/14

40. Equipamento, de acordo com a reivindicação 39, caracterizado pelo fato de que o meio (224) para determinação é implementado de maneira que a predição seja feita de maneira adaptativa para trás com base nos já preditos coeficientes de predição.

41. Equipamento, de acordo com a reivindicação 39 ou 40, caracterizado pelo fato de que o meio (224) para determinação é implementado de maneira que a predição dos coeficientes de predição é feita usando um filtro de predição com coeficientes constantes.

42. Equipamento, de acordo com uma das reivindicações de 39 a 41, caracterizado pelo fato de que o meio (224) para a determinação é ainda implementado para

submeter o sinal residual do coeficiente de predição reconstruído que resulta da soma a uma soma com o valor constante antes da reconversão. 43. Equipamento, de acordo com uma das

reivindicações de 24 a 42, caracterizado pelo fato de que é implementado para a decodificação de um sinal de áudio ou de um sinal de vídeo como sinal de informação, e compreendendo o fato de que o limite de psicopercepção motivada é um limite de mascaramento acústico ou um limite de mascaramento visual.

44. Método para a codificação de um sinal de informação em um sinal de informação codificado, caracterizado pelo fato de que compreende:

usar um modelo de percepção, determinando uma representação de um limite de psicopercepção motivada que indica uma porção do sinal de informação sem relevância com relação à percepção;

Petição 870190109269, de 28/10/2019, pág. 18/20
13/14 filtrar o sinal de informação para a normalização do sinal de informação com relação ao limite de psicopercepção motivada para a obtenção de um sinal préfiltrado;

predizer o sinal pré-filtrado de maneira adaptativa para frente para obter um sinal pré-filtrado, um erro de predição para o sinal pré-filtrado e uma representação de coeficientes de predição, baseado em que o sinal pré-filtrado possa ser reconstruído; e quantizar o erro de predição para obter um erro de predição quantizado, em que o sinal de informação codificado compreende informações sobre a representação do limite de psicopercepção motivada, da representação dos coeficientes de predição e do erro de predição quantizado.

45. Método para a decodificação de um sinal de informação codificado, compreendendo informações sobre a representação de um limite de psicopercepção motivada, uma representação de coeficientes de predição e do erro de predição quantizado em um sinal de informação decodificado, caracterizado pelo fato de que compreende:

dequantizar o erro de predição quantizado para obter um erro de predição dequantizado;

determinar um sinal previsto com base nos coeficientes de predição, que foram obtidos por predição adaptativa para frente;

reconstruir um sinal pré-filtrado com base no sinal previsto e o erro de predição dequantizado; e filtrar o sinal pré-filtrado para a conversão da normalização com relação ao limite de psicopercepção

Petição 870190109269, de 28/10/2019, pág. 19/20
14/14 motivada para obter o sinal de informação decodificado.