BRPI0709450A2 - codificação de sinal de informação - Google Patents

codificação de sinal de informação Download PDF

Info

Publication number
BRPI0709450A2
BRPI0709450A2 BRPI0709450-7A BRPI0709450A BRPI0709450A2 BR PI0709450 A2 BRPI0709450 A2 BR PI0709450A2 BR PI0709450 A BRPI0709450 A BR PI0709450A BR PI0709450 A2 BRPI0709450 A2 BR PI0709450A2
Authority
BR
Brazil
Prior art keywords
prediction
signal
quantization
filter
limit
Prior art date
Application number
BRPI0709450-7A
Other languages
English (en)
Inventor
Schuller Gerald
Lutzky Manfred
Ulrich Kr Mer
Wabnik Stefan
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of BRPI0709450A2 publication Critical patent/BRPI0709450A2/pt
Publication of BRPI0709450A8 publication Critical patent/BRPI0709450A8/pt
Publication of BRPI0709450B1 publication Critical patent/BRPI0709450B1/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

<B>IFICAçAO DE SINAL DE INFORMAçAO <D> quantização muito grosseira que ultrapassa a medida determinada pelo limite de mascaramento, sem ou somente com muito pouca perda de qualidade, é permitida quantizando não imediatamente o sinal pré-filtrado, mas um erro de predição obtido pela predição adaptativa para frente do sinal pré-filtrado. Devido à adaptatividade para frente, o erro de quantização não tem efeito negativo na predição no lado do decodificador.

Description

"CODIFICAÇÃO DE SINAL DE INFORMAÇÃO"
Descrição
A presente invenção se refere à codificação de sinal de informação, como a codificação de áudio ou vídeo.
0 uso de codificação de áudio digital nas novasredes de comunicações, assim como nas produções profissionais de áudio em comunicações bidirecionais em tempo real exige uma codificação algorítmica muito barata, assim como um retardo de codificação muito pequeno. Um cenário típico em que a aplicação da codificação de áudio digital se torna crítica no sentido do tempo de retardo existe quando são usados simultaneamente sinais diretos, isto é, não codificados e transmitidos, isto é, codificados e decodificados. Portanto, os exemplos são as produções ao vivo usando microfones sem fio e monitoramento simultâneo (no ouvido) ou produções "dispersas", onde os artistas tocam simultaneamente em diferentes estúdios. O período total tempo de retardo tolerável nessas aplicações é menor que 10 ms. Se, por exemplo, forem usadas linhas participantes assimétricas para as comunicações, a taxa de bits é outro fator limitador.
O retardo algorítmico dos codificadores padrão deáudio, como o MPEG-I 3 (MP3), MPEG-2 AAC e MPEG-2/4 com faixas de baixo retardo entre 20 ms a vários 100 ms, em que é feita referência, por exemplo, ao artigo de M. Lutzky, G. Schuller, M. Gayer,· U. Kraemer, S. Wabnik: "A guideline to áudio codec delay", apresentado na 116a Convenção AES, Berlim, Maio de 2004. Os codificadores de voz operam em menores taxas de bits e com menor retardo algorítmico, mas proporcionam somente uma limitada qualidade de áudio.A lacuna mencionada acima entre os codificadores padrão de áudio, por um lado, e os codificadores de voz por outro lado é, por exemplo, fechada por um tipo de esquema de codificação descrito no artigo de B. Edler, C. Faller e G. Schuller, "Perceptual Audio Coding Using a Time-Varying Linear Pre- and Pós-filtro", apresentado na 109a Convenção AES, Los Angeles, em setembro de 2000, de acordo com o qual o sinal a ser codificado é filtrado com o inverso do limite de marcação no lado do codificador, sendo subseqüentemente quantizado para realizar a redução de irrelevância, sendo o sinal quantizado fornecido para codificação de entropia para realizar a redução de redundância separada da redução de irrelevância, enquanto o sinal quantizado pré-filtrado é reconstruído no lado do decodificador e filtrado em um pós-filtro com o limite de marcação como função de transmissão.
Esse esquema de codificação, denominado abaixo de esquema de codificação ULD, resulta em uma qualidade perceptual que pode ser comparada a codificadores padrão de áudio, como o MP3, para taxas de bits de aproximadamente 80 kBit/s ou mais por canal. Um codificador deste tipo é, por exemplo, também descrito na WO 2005/078703 Al.
Particularmente, os codificadores ULD lá descritos usam filtros lineares controlados psicoacusticamente para a formação do ruído quantizado. Devido à sua estrutura, o ruído quantizador se situa sempre no limite dado, mesmo quando nenhum sinal estiver em um dado domínio de freqüência. 0 ruído permanece inaudível, enquanto corresponder ao limite psicoacústico de mascaramento. Para obter uma taxa de bits que seja ainda menor que a taxa de bits predeterminada por este limite, o ruídoquantizador deve ser aumentado, o que torna o ruído audível. Particularmente, o ruído se torna audível nos domínios sem porções de sinais. Portanto, os exemplos são freqüências de áudio muito baixas ou muito altas. Normalmente, existem somente porções muito baixas de sinais nesses domínios, enquanto o limite de mascaramento é alto. Se o limite de mascaramento aumenta uniformemente em todo o domínio de freqüência, o ruído quantizador se situa em um maior limite, mesmo quando não existir sinal, de maneira que o ruído quantizador se torna audível como um sinal que soa espúrio. Os codificadores baseados em sub-banda não têm esse problema, já que somente quantizam sub-bandas com sinais menores que o limite para zero.
O problema supramencionado que ocorre quando a taxa de bits admissível cai abaixo de uma taxa de bits mínima, que não causa ruído quantizador espúrio e que é determinado pelo limite de mascaramento, não é o único. Além disso, os codificadores ULD descritos nas referências acima passam por um procedimento complexo para a obtenção de uma taxa constante de dados, particularmente já que é usado um Ioop de iteração, que deve ser passado para determinar, por bloco de amostragem, um valor do fator de amplificação que ajuste uma dimensão de etapa de dequant i zação.
É o objetivo da presente invenção prover um esquema de codificação de informações que torne possível permitir o curto tempo de retardo comum em tipos de codificadores ULD em baixa taxa de bits e ainda uma alta qualidade de codificação.
Este objetivo é alcançado pelos equipamentos de acordo com a reivindicação 1 ou 24, métodos de acordo com areivindicação 44 ou 45, assim como um codificador de acordo com a reivindicação 47 e um decodificador de acordo com a reivindicação 48.
A idéia central da presente invenção é o achado que é possível uma quantização extremamente grosseira que ultrapasse a medida determinada pelo limite de mascaramento, sem ou somente com perdas de qualidade muito pequenas, pela não quantização direta do sinal pré-filtrado, mas um erro de predição obtido pela predição adaptativa para frente do pré-filtrado. Devido à adaptatividade para frente, o erro de quantização não tem efeito negativo sobre o coeficiente de predição.
De acordo com outra configuração, o sinal pré-filtrado é mesmo quantizado de forma não linear ou mesmo clipado, isto é, quantizado por uma função de quantização, que mapeia os valores não quantizados do erro de predição nos índices de quantização dos estágios de quantização, e cujo curso é mais inclinado abaixo de um limite do que acima de um limite. Assim, o ruído PSD aumentado em relação ao limite de mascaramento devido à baixa taxa disponível de bits ajusta o sinal PSD, de maneira que a violação do limite de mascaramento não ocorre nas partes espectrais sem a porção de sinal, que ainda melhora a qualidade de audição ou mantém a qualidade de audição, respectivamente, apesar da decrescente taxa de bits disponível.
De acordo com outra configuração da presente invenção, a quantização é mesmo quantizada ou limitada, respectivamente, por clipagem [clipping], isto é, pela quantização em um número limitado e fixo de níveis ou de estágios de quantização, respectivamente. Pela predição do sinal pré-filtradopela predição adaptativa para frente, a quantização grosseira não tem efeito negativo nos próprios coeficientes de predição. Quantizando até um número fixo de níveis de quantização, a prevenção de iteração para a obtenção de uma taxa de bits constante é habilitada de maneira inerente.
De acordo com outra configuração da presente invenção, uma dimensão de etapa de quantização ou altura da etapa, respectivamente, entre o número fixo de níveis de quantização é determinado de maneira adaptativa para trás a partir dos índices anteriores de nível de quantização obtidos pela quantização, de forma que, por um lado, apesar de um número muito baixo de níveis de quantização, a melhor ou pelo menos uma melhor quantização possível do erro de predição ou do sinal residual, respectivamente, pode ser obtida, sem precisar fornecer outras informações auxiliares ao lado do decodificador. Por outro lado, é possível garantir que erros de transmissão durante a transmissão do sinal residual quantizado para o lado do decodificador somente tenha um efeito de curto prazo no lado do decodif icador com a adequada configuração do ajuste de dimensão da etapa adaptativa para trás.
As configurações preferidas da invenção serão discutidas abaixo, com referência aos desenhos de acompanhamento. Mostram:
A Fig. 1 é um diagrama de blocos de um codificador de acordo com uma configuração da presente invenção;
As Figs. 2a/b são gráficos mostrando de forma exemplar o curso do espectro de ruído em relação ao limite de mascaramento e à densidade do espectro de potência do sinal para ocaso do codificador de acordo com a reivindicação 1 (gráfico a) ou do caso comparativo de um codificador com predição adaptativa para trás do sinal pré-filtrado e iterativo e do limite de mascaramento em bloco do ajuste de dimensão da etapa de quantização (gráfico b), respectivamente;
As Figs. 3a/3b e 3c são gráficos mostrando como exemplo a densidade do espectro de potência do sinal em relação à densidade do espectro de potência do erro ou ruído, respectivamente, das diferentes extensões de clipe ou diferentes números de níveis de quantização, respectivamente, para o caso que, como no codificador da Fig. 1, seja feita a predição adaptativa para frente do sinal pré-filtrado, mas ainda um ajuste de dimensão de etapa de quantização iterativa;
A Fig. 4 é um diagrama de blocos de uma estrutura do codificador de coeficientes no codificador da Fig. 1, de acordo com uma configuração da presente invenção;
A Fig. 5 um diagrama de blocos de um decodificador para a decodificação de um sinal de informação codificado pelo codificador da Fig. 1 de acordo com uma configuração da presente invenção;
A Fig. 6 um diagrama de blocos de uma estrutura dos codificadores de coeficientes no codificador da Fig. 1 ou do decodif icador da Fig. 5, de acordo com uma configuração da presente invenção;
A Fig. 7 é um gráfico para ilustração dos testesde audição; e
As Figs. 8a a 8c são gráficos de funções exemplares de quantização que podem ser usadas na quantização enos meios de clipe/quantização, respectivamente, nas Figs. 1, 4, 5 e 6.
Antes que as configurações da presente invenção sejam discutidas em maiores detalhes com referência aos desenhos, primeiro, para uma melhor compreensão das vantagens e dos princípios dessas configurações, será discutida uma possível implementação de um esquema de codificação do tipo ULD como exemplo comparativo, baseado nas vantagens essenciais e considerações subjacentes às configurações subseqüentes, que finalmente levaram a essas configurações, podendo ser ilustradas com maior clareza.
Como já descrito na introdução da descrição, existe a necessidade de uma versão ULD para menores taxas de bits de, por exemplo, 64 k Bit/s, com comparável qualidade perceptual, assim como de um esquema mais simples para a obtenção de uma taxa de bits constante, particularmente para as menores taxas de bits pretendidas. Além disso, seria vantajoso quando o tempo de recuperação após um erro de transmissão permanecesse baixo ou no mínimo.
Para a redução de redundância do sinalpsicoacusticamente pré-processado, o codificador ULD de comparação usa uma predição de Ioop fechado adaptativa para trás de amostra. Isto significa que o cálculo dos coeficientes de predição no codificador e no decodificador somente se baseia em amostras passadas ou já quantizadas e de sinais reconstruídos. Para a obtenção de uma adaptação ao sinal ou ao sinal pré-filtrado, respectivamente, é calculado novamente um novo conjunto de coeficientes previsores para cada amostra. Isto resulta navantagem que longos previsores ou fórmulas de determinação de valores de predição, isto é, particularmente possam ser usados previsores tendo um grande número de coeficientes previsores, já que não existe requisito de transmitir os coeficientes previsores do codificador para o lado do decodificador. Por outro lado, isto significa que o erro de predição quantizado deve ser transmitido ao decodif icador sem perdas de exatidão, para a obtenção de coeficientes de predição que sejam idênticos àqueles subjacentes ao processo de codificação. De outra forma, os valores previstos ou predicados, respectivamente, no codificador e no decodificador não seriam idênticos entre si, o que provocaria um processo de codificação instável. Em vez disso, no codificador ULD de comparação, é necessário o reset periódico do previsor tanto no lado do decodif icador como do lado do codificador para permitir o acesso seletivo ao fluxo codificado de bits, assim como para interromper a propagação de erros de transmissão. Entretanto, os resets periódicos fazem crescer as taxa de bits, o que não apresenta problemas para um canal com taxa de,bits variável, mas para canais com taxa de bits fixa, onde o crescimento da taxa de bits limita o limite inferior de um ajuste constante da taxa de bits.
Como resultado da subseqüente e mais detalhada descrição do esquema de codificação de comparação ULD com as configurações da presente invenção, essas configurações diferem do esquema de codificação de comparação pelo uso de uma predição adaptativa em bloco para frente com um ajuste da etapa de dimensão de quantização adaptativa para trás, em vez de uma predição adaptativa para trás de amostra. Por um lado, isto deve ser umadesvantagem que os previsores devem ser mais curtos para limitarem a quantidade de informações auxiliares necessárias para a transmissão dos coeficientes de predição exigidos na direção do lado do codificador, o que novamente pode resultar na eficiência reduzida do codificador, mas, por outro lado, isto tem a vantagem que o procedimento das subseqüentes configurações ainda funciona efetivamente para maiores erros de quantização, que são o resultado das taxas de bits reduzidas, de maneira que o previsor no lado do decodif icador pode ser usado para a conformação do ruído quantizador.
Como resultado também da comparação subseqüente, comparada com o codificador ULD de comparação, a taxa de bits está limitada pela limitação da faixa de valores do remanescente da predição antes da transmissão. Isto resulta em uma conformação de ruídos modificada comparada com o esquema de codificação ULD de comparação, e também leva a diferentes e menos espúrios problemas de audição. Além disso, é gerada uma taxa de bits constante sem o uso de loops iterativos. Também, "reset" é incluído de maneira inerente em todos os blocos de amostras como resultado da adaptação para frente em bloco. Além disso, nas configurações abaixo descritas, é usado um esquema de codificação para coeficientes de pré-filtro e coeficientes de predição para frente, que usa codificação de diferença com controle de dimensão da etapa de quantização adaptativa para trás para uma representação dos coeficientes LSF (freqüência de linha espectral). O esquema proporciona acesso em bloco aos coeficientes, gera uma taxa de bits de informações auxiliares constante sendo, além disto, robusto contra erros de transmissão, como será descrito abaixo.A seguir, serão descritos em maiores detalhes o codificador ULD de comparação e a estrutura do decodificador, seguido pela descrição das configurações da presente invenção e a ilustração de suas vantagens na transmissão a partir de maiores taxas constantes de bits para menores taxas de bits.
No esquema de codificação ULD de comparação, o sinal de entrada do codificador é analisado no lado do codificador por um modelo perceptual ou modelo de audição, respectivamente, para a obtenção das informações sobre as porções perceptualmente irrelevantes do sinal. Essas informações são usadas para o controle de um pré-filtro por meio de coeficientes de filtro com variação de tempo. Portanto, o pré-filtro normaliza o sinal de entrada com relação a seu limite de mascaramento. Os coeficientes de filtro são calculados uma vez para cada bloco de 128 amostras, quantizados e transmitidos para o lado do codificador como informações auxiliares.
Após a multiplicação do sinal pré-filtrado por um fator de amplificação e subtraindo o sinal previsto adaptativo para trás, o erro de predição é quantizado por um quantizador uniforme, isto é, um quantizador com dimensão uniforme de etapa. Como já mencionado acima, o sinal previsto é obtido por meio da predição de Ioop fechado adaptativa para trás de amostra. Assim, não é necessária a transmissão de coeficientes de predição ao decodificador. Subseqüentemente, o sinal quantizado residual de predição é codificado por entropia. Para a obtenção de uma taxa de bits constante, é provido um Ioop, que repete as etapas de multiplicação, predição, quantização e codificação por entropia várias vezes para cada um dos blocos de amostras pré-filtradas.Após a iteração, é determinado o maior fator de amplificação de um conjunto de valores predeterminados de amplificação, que ainda esteja em conformidade com a condição de uma taxa de bits constante. Este valor de amplificação é transmitido ao decodificador. Entretanto, se for determinado um valor de amplificação menor que um, o ruído quantizador será perceptível após a decodificação, isto é, seu espectro é conformado de maneira similar ao do limite de mascaramento, mas sua potência total é maior que a predeterminada pelo modelo de predição. Para porções do espectro do sinal de entrada, o ruído quantizador pode mesmo ser maior que o próprio espectro do sinal de entrada, que novamente gera problemas audíveis em porções do espectro, onde de outra forma não haveria sinal audível, devido ao uso de um codificador preditivo. Os efeitos causados pelo ruído quantizador representam um fator de limitação quando forem de interesse menores taxas constantes de bits.
Continuando com a descrição do esquema ULD de comparação, os coeficientes de pré-filtro são meramente transmitidos como diferenças LSF intraframe, e também somente logo que estas ultrapassarem um determinado limite. Para evitar a propagação de erro de transmissão por um período ilimitado, o sistema é reiniciado periodicamente. Podem ser usadas outras técnicas para minimizar uma redução na percepção do sinal decodificado no caso de erros de transmissão. 0 esquema de transmissão gera uma taxa de bits variável de informações auxiliares, que é nivelada no Ioop supramencionado, ajustando adequadamente o fator de amplificação supramencionado.
A codificação de entropia do sinal quantizadoresidual de predição no caso do codificador ULD de comparação compreende métodos, como o de Golomb, Huffman ou o método de codificação aritmética. A codificação de entropia deve ser reiniciada periodicamente e gera uma de forma inerente uma taxa variável de bits, que é novamente nivelada pelo Ioop supramencionado.
No caso do esquema de codificação ULD de comparação, o sinal quantizado residual de predição no decodificador é obtido a partir da codificação de entropia, quando são adicionados o remanescente da predição e o sinal previsto, a soma é multiplicada pelo inverso do fator de amplificação transmitido, e daí, o sinal reconstruído de saída é gerado por meio do pós-filtro, tendo uma resposta de freqüência inversa à do pré-filtro, em que o pós-filtro usa os coeficientes transmitidos de pré-filtro.
0 codificador ULD de comparação do tipo ora descrito obtém, por exemplo, um retardo geral do codif icador/decodif icador de 5,33 a 8 ms nas freqüências de amostra de 32 kHz a 48 kHz. Sem iterações (loop espúrio), gera taxas de bits na faixa de 80 a 96 kBit/s. Como acima descrito, em menores taxas constantes de bits, a qualidade de audição é reduzida neste codificador, devido ao aumento uniforme do espectro de ruído. Além disso, devido âs iterações, o esforço para a obtenção de uma taxa uniforme de bits é alto. As configurações descritas abaixo superam ou minimizam essas desvantagens. Com uma taxa constante de dados de transmissão, o esquema de codificação das configurações descritas abaixo provoca uma conformação alterada de ruídos do erro de quantização e não exige iteração.Mais precisamente, no supramencionado esquema de codificação ULD de comparação, no caso da taxa constante de dados de transmissão em um processo iterativo, é determinado um multiplicador, com a ajuda do qual o sinal proveniente do pré-filtro é multiplicado antes da quantização, em que o ruído quantizador é espectralmente branco, o que provoca um ruído quantizador no decodificador que é conformado como o limite de audição, mas que se situa um pouco abaixo ou um pouco acima do limite de audição, dependendo do multiplicador selecionado, que pode como descrito acima, ser também interpretado como uma mudança do limite de audição determinado. Em conexão com isso, resulta o ruído quantizador após a decodificação, cuja potência no domínio individual de freqüências pode até ultrapassar a potência do sinal de entrada no respectivo domínio de freqüência. Os problemas de codificação resultantes são claramente audíveis. As configurações descritas abaixo conformam o ruído quantizador, de maneira que sua densidade espectral de potência não é mais espectralmente branca. A quantização grosseira/ limitação ou clipagem, respectivamente, do sinal do pré-filtro também conforma o ruído resultante quantizador similar na densidade espectral de potência do sinal do pré-filtro. Assim, o ruído quantizador no decodificador é conformado de maneira a permanecer abaixo da densidade espectral de potência do sinal de entrada. Isto pode ser interpretado como uma deformação do limite de audição determinado. Os problemas de codificação resultantes são menos espúrios que no esquema de codificação ULD de comparação. Além disso, as subseqüentes configurações não exigem um processo de iteração, o que reduz a complexidade.
Como pela descrição do esquema de codificação ULDde comparação acima foi provida uma base suficiente para ter atenção às vantagens subjacentes e as considerações das seguintes configurações para a descrição dessas configurações, primeiro, será descrita abaixo a estrutura de um codificador de acordo com uma configuração da presente invenção.
O codificador da Fig. 1, geralmente indicado por 10, compreende uma entrada 12 para o sinal de informação a ser codificado, assim como uma saída 14 para o sinal de informação codificado, onde é exemplarmente suposto que abaixo disto se trata de um sinal de áudio, e exemplarmente em particular um sinal de áudio já amostrado, apesar de também ser possível uma amostragem dentro do codificador subseqüente à entrada 12. As amostras do sinal de saída que chegam são indicadas por x(n) na Fig. 1.
Como mostrado na Fig. 1, o codificador 10 pode ser dividido em um meio de determinação de limite de mascaramento 16, um meio pré-filtro 18, um meio de predição preditivo para frente 20 e um meio de quantização/clipe 22, assim como meio de geração de fluxo de bits 24. O meio de determinação de limite de mascaramento 16 opera de acordo com um modelo perceptual ou modelo de audição, respectivamente, para a determinação de uma representação do mascaramento ou do limite de audição, respectivamente, do sinal de áudio de chegada na entrada 12 usando o modelo perceptual, que indica uma porção do sinal de áudio que é irrelevante com relação à capacidade de percepção ou de audição, respectivamente, ou representa um limite espectral da freqüência em que a energia espectral permanece inaudível devido aos efeitos psicoacústicos de cobertura ou não é percebido pelas pessoas, respectivamente. Como será descrito abaixo, o meio de determinação16 determina o limite de mascaramento de forma em bloco, isto é, determina o limite de mascaramento por bloco dos blocos subseqüentes de amostras do sinal de áudio. Seriam também possíveis outros procedimentos. A representação do limite de mascaramento como vem do meio de determinação 16 pode, ao contrário da descrição subseqüente, particularmente com relação à Fig. 4, também ser uma representação por amostras espectrais do limite de mascaramento espectral.
0 pré-filtro ou meio de pré-estimação 18 está acoplado tanto ao meio de determinação de limite de mascaramento 16 como à entrada 12 e filtra o sinal de saída para normalizá-lo com relação ao limite de mascaramento para a obtenção de um sinal pré-filtrado f (n). 0 meio pré-filtro 18 se baseia, por exemplo, em um filtro linear e é implementado para ajustar os coeficientes de filtro na dependência da representação do limite de mascaramento provido pelo limite de mascaramento do meio de determinação 16, de maneira que a função de transmissão do filtro linear corresponda substancialmente ao inverso do limite de mascaramento. O ajuste dos coeficientes de filtro pode ser feito em bloco, em meio bloco, como no caso descrito abaixo dos blocos que se sobrepõem na metade da determinação do limite de mascaramento, ou em amostras, por exemplo, interpolando os coeficientes de filtro obtidos pelas representações de limite de mascaramento determinadas em bloco, ou pelos coeficientes de filtro daí obtidos através das folgas interblocos.
0 meio de predição para frente 20 está acoplado ao meio pré-filtro 18, para submeter as amostras f (n) do sinal pré-filtrado, que são filtradas de maneira adaptativa no domíniodo tempo usando o limite psicoacústico de ma.scaramento para uma predição adaptativa para frente, para a obtenção de um sinalprevisto f (η), um sinal residual r(n) que representa um erro de predição do sinal pré-filtrado f(η), e uma representação dos coeficientes de filtro de predição, baseado em que o sinal previsto pode ser reconstruído. Particularmente, o meio de predição adaptativa para frente 20 é implementado para determinar a representação dos coeficientes de filtro de predição imediatamente a partir do sinal pré-filtrado f e não somente baseado em uma quantização subseqüente do sinal residual r. Assim, como será discutido em maiores detalhes abaixo com referência à Fig. 4, os coeficientes de filtro de predição são representados no domínio LFS, em particular sob a forma de um residual de predição LFS, outras representações são também possíveis, como uma representação intermediária na forma de coeficientes lineares de filtro. Além disso, o meio 20 realiza a determinação do coeficiente de filtro de predição de acordo com a descrição subseqüente exemplarmente em bloco, isto é, por bloco em subseqüentes blocos de amostras f(n) do sinal pré-filtrado, onde, 20 entretanto, são também possíveis outros procedimentos. 0 meio 2éentão implementado para determinar o sinal previsto f por meio desses coeficientes de filtro de predição determinados, e para subtraí-los do sinal pré-filtrado f, em que a determinação do sinal previsto é feita, por exemplo, por meio de um filtro linear, cujos coeficientes de filtro são ajustados de acordo com as representações do coeficiente de predição determinada de forma adaptativa para frente. 0 sinal residual disponível no lado dodecodificador, isto é, o sinal residual quantizado e clipado ic(n), adicionado aos valores do sinal de saída do filtro de saída anteriormente, pode servir como sinal de entrada do filtro, como será discutido abaixo em maiores detalhes.
O meio de quantização/clipe 22 está acoplado ao meio de predição 20, para quantização ou clipagem, respectivamente, do sinal residual por meio de uma função de quantização que mapeia os valores r(n) do sinal residual até um número constante e limitado de níveis de quantização, e para a transmissão do sinal residual quantizado assim obtido sob a forma dos índices de quantização ic (η) , como já mencionado, para o meio de predição adaptativa para frente 20.
O sinal residual quantizado ic(n), a representação dos coeficientes de predição determinados pelo meio 20, assim como a representação do limite de mascaramento determinado pelo meio 16 compõem as informações fornecidas para o lado do decodif icador por meio do sinal codificado 14, em que, portanto, o meio de geração de fluxo de bits 24 é provido exemplarmente na Fig. 1, para combinar as informações de acordo com um fluxo serial de bits ou uma transmissão em pacote, possivelmente usando outra codificação sem perdas.
Antes que seja discutida a estrutura mais detalhada do codificador da Fig. 1, o modo de operação do codificador 1 será descrito abaixo com base na estrutura acima do codificador 10. Filtrando o sinal de áudio pelo meio pré-filtro 18 com uma função de transmissão correspondente ao inverso do limite de mascaramento, resulta um sinal pré-filtrado f (η), que obtém uma densidade espectral de potência do erro por quantização uniforme,que corresponde principalmente a um ruído branco, e resultaria em um espectro de ruído similar ao limite de mascaramento pela filtragem no pós-filtro no lado do decodificador. Entretanto, primeiro, o sinal residual f é reduzido a um erro de predição pelo meio de predição adaptativa para frente 20 por um sinalprevisto adaptado para frente f por subtração. A subseqüente quantização grosseira deste erro de predição r pelo meio de quantização/clipagem 22 não tem efeito nos coeficientes de predição do meio de predição 20, nem no codificador ou no lado do decodificador, já que o cálculo dos coeficientes de predição é feito de maneira adaptativa para frente e, portanto, baseada nos valores não quantizados f (η) . A quantização não é somente feita de maneira grosseira, no sentido que é usada uma dimensão da etapa de quantização grosseira, mas também é feita de maneira grosseira no sentido que mesmo a quantização é somente feita em um número constante e limitado de níveis de quantização, de maneira que para a representação de cada sinal residual quantizado ic(n) ou cada índice de quantização no sinal de áudio codificado 14 somente um número fixo de bits é necessário, o que permite de forma inerente uma taxa de bits constante com relação aos valores residuais ic (n). Como será descrito abaixo, a quantização é feita principalmente pela quantização em níveis de quantização uniformemente espaçados de um número fixo, a abaixo exemplarmente de um número de somente três níveis de quantização, onde é feita a quantização, por exemplo, de maneira que um valor de sinal residual não quantizado r(n) seja quantizado até o próximo nível de quantização, para obter o índice de quantização ic(n) do nível de quantização correspondente dele. Valores extremamente altos eextremamente baixos do sinal residual não quantizado r(n) são assim mapeados com relação ao respectivo nível de quantização mais alto ou mais baixo, respectivamente, ou ao respectivo índice do nível de quantização, respectivamente, mesmo quando forem mapeados em um maior nível de quantização em quantização uniforme com a mesma dimensão de etapa. Assim, o sinal residual r é também "clipado" ou limitado, respectivamente, pelo meio 22. Entretanto, este último tem o efeito, como será discutido abaixo, que o erro PSD (PSD = densidade espectral de potência) do sinal pré-filtrado não é mais um ruído branco, mas se aproxima do sinal PSD do sinal pré-filtrado, dependendo do grau de clipagem. No lado do decodificador, tem o efeito que o ruído PSD permanece abaixo do sinal PSD mesmo em taxas de bits que são menores que as predeterminadas pelo limite de mascaramento.
A seguir, será descrita a estrutura docodificador da Fig. 1 em maiores detalhes. Particularmente, o meio de determinação de limite de mascaramento 16 compreende um determinador de limite de mascaramento ou um modelo perceptual 26, respectivamente, operando de acordo com o modelo perceptual, um módulo de cálculo do coeficiente de pré-filtro 28 e um codificador de coeficientes 30, que são conectados na ordem indicada entre a entrada 12 e o meio pré-filtro 18, assim como o gerador de fluxo de bits 24. 0 meio pré-filtro 18 compreende um decodif icador de coeficientes 32 cuja entrada está ligada à saída do codificador de coeficientes 30, assim como o pré-filtro 34, que é, por exemplo, um filtro linear adaptativo, e que está ligado com sua entrada de dados à entrada 12 e com sua saída de dados ao meio 20, enquanto sua entrada de adaptação para a adaptação dos coeficientes defiltro está conectada à uma saída do decodificador de coeficientes 32. O meio de predição 20 compreende um módulo de cálculo do coeficiente de predição 36, um codificador de coeficientes 38, um decodificador de coeficientes 40, um subtrator 42, um filtro de predição 44, um elemento de retardo 46, outro somador 48 e um dequantizador 50. O módulo de cálculo do coeficiente de predição 46 e o codificador de coeficientes 38 estão conectados em série nessa ordem entre a saída do pré-filtro 34 e a entrada do decodificador de coeficientes 40 ou outra entrada do gerador de fluxo de bits 24, respectivamente, cooperando para a determinação de uma representação dos coeficientes de predição em bloco de maneira adaptativa para frente. O decodificador de coeficientes 40 está conectado entre o codificador de coeficientes 38 e o filtro de predição 44, que é, por exemplo, um filtro de predição linear. Além da entrada do coeficiente de predição ligada ao decodificador de coeficientes 40, o filtro 44 compreende uma entrada de dados e uma saída de dados, à qual está ligado em loop fechado, que compreende, fora o filtro 44, o somador 48 e o elemento de retardo 46. Particularmente, o elemento de retardo 46 está ligado entre o somador 48 e o filtro 44, enquanto a saída de dados do filtro 44 está ligada à primeira entrada do somador 48. Acima disso, a saída de dados do filtro 44 está também ligada à uma entrada invertida do subtrator 42. Uma entrada não invertida do subtrator 42 está ligada à saída do pré-filtro 34, enquanto a segunda entrada do somador 48 está ligada à uma saída do dequantizador 50. Uma entrada de dados do dequantizador 50 está acoplada ao meio de quantização/clipagem 22 assim como a uma entrada de controle da dimensão da etapa do dequantizador 50. 0 meio dequantização/clipagem 22 compreende um módulo quantizador 52 assim como um bloco de adaptação de dimensão de etapa 54, onde novamente módulo quantizador 52 consiste de um quantizador uniforme 56 com dimensão de etapa uniforme e controlável e um limitador 58, que estão ligados em série na ordem especificada entre uma saída do subtrator 42 e a outra entrada do gerador de fluxo de bits 24, e onde o bloco de adaptação de dimensão de etapa 54 novamente compreende um módulo de adaptação de dimensão de etapa 60 e um membro de retardo 62, que estão ligados em série na ordem especificada entre a saída do limitador 58 e a entrada de controle da dimensão da etapa do quantizador 56. Além disso, a saída do limitador 58 está ligada à entrada de dados do dequantizador 50, onde a entrada de controle da dimensão da etapa do dequantizador 50 está também ligada ao bloco de adaptação de dimensão de etapa 60. Uma saída do gerador de fluxo de bits 24 forma novamente a saída 14 do codificador 10.
Depois que a estrutura detalhada do codificador da Fig. 1 foi descrita em detalhes acima, seu modo de operação será descrito abaixo. O módulo do modelo perceptual 26 determina ou estima, respectivamente, o limite de mascaramento de maneira em bloco a partir do sinal de áudio. Portanto, o módulo do modelo perceptual 26 usa, por exemplo, uma DFT de comprimento 256, isto é, um comprimento de bloco de 256 amostras x(n), com 50% de sobrepasso entre os blocos, o que resulta em um retardo do codificador 10 de 12 8 amostras do sinal de áudio. A estimativa da saída do limite de mascaramento pelo módulo do modelo perceptual 26 é, por exemplo, representada de forma amostrada espectralmente em uma banda Bark ou escala de freqüência linear. 0 limite demascaramento produzido por bloco pelo módulo do modelo perceptual 26 é usado no módulo de cálculo do coeficiente 24 para o cálculo dos coeficientes de filtro de um filtro predeterminado, isto é, o filtro 34. Os coeficientes calculados pelo módulo 28 podem, por exemplo, ser coeficientes LPC, que modelam o limite de mascaramento. Os coeficientes de pré-filtro de cada bloco são novamente codificados pelo codificador de coeficientes 30, que será discutido em maiores detalhes com referência à Fig. 4. 0 decodificador de coeficientes 34 decodifica os coeficientes de pré-filtro codificados para reaver os coeficientes de pré-filtro do módulo 28, onde o pré-filtro 34 obtém novamente esses parâmetros ou coeficientes de pré-filtro, respectivamente, e os usa, de maneira a normalizar o sinal de entrada x(n) com relação a seu limite de mascaramento ou os filtra com uma função de transmissão, respectivamente, que corresponde essencialmente ao inverso do limite de mascaramento. Comparado ao sinal de entrada, a quantidade do sinal pré-filtrado resultante f(n) é significativamente menor.
No módulo de cálculo do coeficiente de predição 36, as amostras f(n) do sinal pré-filtrado são processadas de maneira em bloco, em que a divisão em blocos pode corresponder exemplarmente ao do sinal de áudio 12 pelo módulo do modelo perceptual 26, mas não precisa fazer isto. Para cada bloco de amostras pré-filtradas, o módulo de cálculo do coeficiente 36 calcula coeficientes de predição para uso pelo filtro de predição 44. Portanto, o módulo de cálculo do coeficiente 36 realiza, por exemplo, a análise LPC (LPC = codificação preditiva) por bloco do sinal pré-filtrado para a obtenção dos coeficientes de predição. Ocodificador de coeficientes 38 então codifica os coeficientes de predição de maneira similar ao codificador de coeficientes 30, como será discutido em maiores detalhes abaixo, e envia esta representação dos coeficientes de predição ao gerador de fluxo de bits 24 e particularmente ao decodif icador de coeficientes 40, onde este último usa a representação do coeficiente de predição obtida para aplicar os coeficientes de predição obtidos na análise LPC pelo módulo de cálculo do coeficiente 36 para o filtro linear 44, de maneira que o previsor de Ioop fechado que consiste no Ioop fechado de filtro 44, membro de retardo 46 e somador 48 gerem osinal previsto f (η), que é novamente subtraído do sinal pré-filtrado f (n) pelo subtrator 42. 0 filtro linear 44 é, porexemplo, um filtro de predição linear do tipo A(z) = ΣΓ=ι%2-1 de comprimento N, onde o decodificador de coeficientes 40 ajusta os valores a na dependência dos coeficientes de predição calculados pelo módulo de cálculo do coeficiente 36, isto é, as pesagens comas quais os valores anteriormente previstos f (n) mais os valores de sinal residual dequantizado são pesados e então somados para a obtenção de um novo ou do atual, respectivamente, valor previsto f.
0 remanescente da predição r(n) obtida pelo subtrator 22 está sujeito à quantização uniforme, isto é, quantização com dimensão uniforme da etapa de quantização, no quantizador 56, onde a dimensão da etapa Δ(η) - varia com o tempo, sendo calculada ou determinada, respectivamente, pelo módulo de adaptação de dimensão de etapa de maneira adaptativa para trás, isto é, a partir dos valores residuais quantizados para os valoresresiduais anteriores r(m<n). Mais precisamente, o quantizador uniforme 56 envia um valor residual quantizado q(n) por valor residual r(n), que pode ser expresso como q(n) = i (η) · Δ(η) e pode ser denominado de etapa quantizadora provisória com índice. O índice de quantização provisório i (n) é novamente clipado pelo limitador 58, em uma quantidade C= [-c,-c] , onde c é uma constante c e{l,2,...}. Particularmente, o limitador 58 é implementado de maneira que todos os valores de índice provisório i (n) com |i(n) |> c sejam determinados em -c ou c, dependendo o que estiver maispróximo. Somente a seqüência de índices ou a série ic(n), respectivamente, clipada ou limitada é enviada pelo limitador 58 ao gerador de fluxo de bits 24, ao dequantizador 50 e ao bloco de adaptação de dimensão de etapa 54 ou ao elemento de retardo 62, respectivamente, porque o membro de retardo 62, assim como todos os demais membros de retardo nas presentes configurações, retarda os valores de chegada em uma amostra.
Agora, é feito o controle de dimensão da etapa adaptativa para trás por meio do bloco de adaptação de dimensão de etapa 54, onde este usa valores de seqüência de índices passados ic(n) retardados pelo membro de retardo 62 para a adaptação constante da dimensão da etapa Δ(η), de maneira que a área limitada pelo limitador 58, isto é, a área estabelecida pelos índices de quantização "permitidos" ou os níveis de quantização correspondentes, respectivamente, seja colocada de maneira que a probabilidade estatística de ocorrência de valores residuais não quantizados r(n), ocorra nos níveis permitidos de quantização o mais uniformemente possível no fluxo gerado da seqüência de índice quantizadora clipada ic(n). Particularmente, o módulo de adaptaçãode dimensão de etapa 60 calcula, por exemplo, a atual dimensão de etapa Δ(η), por exemplo, usando os dois índices de quantização clipados imediatamente precedentes ic(n-l) e i2(n-2), assim como o valor da dimensão de etapa determinado imediatamente anterior Δ(η-1) a Δ(η) = βΑ(η-Ι) + δ (η), com β e[0.0;1.0[, δ (η) = δ0 para |ic(n-1) + ic (η-2) I < I e δ(η) = δι for |ic(n-l) + ic(n-2)| >1, onde δ0, δχ e I são constantes adequadamente ajustadas, assim como β.
Como será discutido em maiores detalhes abaixo com referência à Fig. 5, o decodificador usa a seqüência de índice de quantização obtida ic(n) e a seqüência de dimensão da etapa Δ(η), que também é calculada de maneira adaptativa para trás para a reconstrução da seqüência de valor dequantizado qc(n) calculando ic(n) · Δ(η), que também é feito no codificador 10 da Fig. 1, isto é, pelo dequantizador 50 no meio de predição 20. Como no lado do decodificador, a seqüência de valor residual qc(n) construídadessa forma, está sujeita a uma adição dos valores previstos f (n) de maneira em amostras, em que a adição é feita no codificador 10 por meio do somador 48. Apesar de reconstruído ou dequantizado, respectivamente, o sinal pré-filtrado assim obtido não é mais usado no codificador 10, exceto para o cálculo dos subseqüentesvalores previstos f (η) , o pós-filtro gera daí a seqüência de amostra de áudio decodificada y(n) no lado do decodificador, que cancela a normalização pelo pré-filtro 34.
O ruído quantizador introduzido na seqüência de índice de quantização qc (n) não é mais branco, devido à clipagem. Em vez disso, sua forma espectral copia a do sinal pré-filtrado. Para ilustrar o fato, é feita brevemente referência â Fig. 3, quemostra, nos gráficos a, b e c, o PSD do sinal pré-filtrado (gráfico superior) e o PSD do erro de quantização (respectivo gráfico inferior) para diferentes números ou estágios de níveis de quantização, respectivamente, isto é, para C = [-15;15] no gráfico a, para uma faixa limitadora de [-7; 7] no gráfico b, e uma faixa de clipagem de [-1;1] no gráfico c. Para clareza, ainda deve ser notado que o PSD que segue os erros PSDs dos gráficos A-C foram plotados com um desvio de -IOdB. Como pode ser visto, o sinal pré-filtrado corresponde a um ruído colorido com potência de σ2 = 34.
Na quantização com uma dimensão de etapa Δ = 1, o sinal se situa dentro de [-21/21], isto é, as amostras do sinal pré-filtrado têm uma distribuição de ocorrência ou formam um histograma, respectivamente, que se situa neste domínio. Para os gráficos a até c na Fig. 3, a faixa quantizadora foi limitada, como mencionado, a [~15;15] em a), [-7;7] em b) e [~1;1] em c). 0 erro de quantização foi medido como a diferença entre o sinal pré-filtrado não quantizado e o sinal pré-filtrado decodificado. Como pode ser visto, um ruído quantizador é adicionado ao sinal pré-filtrado aumentando a clipagem ou com limitação aumentada do número de níveis de quantização, que copia o PSD do sinal pré-filtrado, em que o grau de cópia depende da rigidez ou da extensão, respectivamente, da clipagem aplicada. Como conseqüência, depois da pós-filtragem, o espectro do ruído quantizador no lado do decodificador copia mais o PSD do sinal de entrada de áudio. Isto significa que o ruído quantizador permanece abaixo do espectro do sinal após a decodificação. Este efeito está ilustrado na Fig. 2, que mostra no gráfico a, para o caso da predição adaptativa para trás, isto é, predição de acordo com oesquema ULD de comparação descrito acima, e no gráfico b, para o caso de predição adaptativa para frente com clipagem aplicada de acordo com a Fig. 1, respectivamente, três cursos em um domínio de freqüência normalizado, isto é, a partir de cima para baixo, o sinal PSD, isto é, o PSD do sinal de áudio, o erro de quantização PSD ou o ruído quantizador após a decodificação (linha reta) e o limite de mascaramento (linha pontilhada). Como pode ser visto, o ruído quantizador do codificador ULD de comparação (Fig. 2a) é formado como o limite de mascaramento e ultrapassa o espectro do sinal para porções do sinal. 0 efeito da predição adaptativa para frente do sinal pré-filtrado combinado com a clipagem ou limitação subseqüente, respectivamente, do número do nível de quantização está agora claramente ilustrado na Fig. 2b, onde pode ser visto que o ruído quantizador é sempre mais baixo que o espectro do sinal e sua forma representam uma mistura do espectro do sinal com o limite de mascaramento. Nos testes de audição, foi achado que os problemas de codificação de acordo com a Fig. 2b são menos espúrios, isto é, a qualidade percebida de audição é melhor.
A descrição acima do modo de operação do codificador da Fig. 1 está concentrada no pós-processamento do sinal pré-filtrado f(η), para a obtenção dos índices de quantização clipados ic (n) a serem transmitidos para o lado do decodificador. Como se originam de uma quantidade com um número constante e limitado de índices, podem ser representados pelo mesmo número de bits dentro do fluxo de dados codificados na saída 14. Portanto, o gerador de fluxo de bits 24 usa, por exemplo, um mapeamento de injeção dos índices de quantização para m palavras bit que podem ser representadas por um número predeterminado debits m.
A descrição a seguir se refere à transmissão do pré-filtro ou dos coeficientes de predição, respectivamente, calculados pelos módulos de cálculo dos coeficientes 28 e 36 para o lado do decodif icador, isto é, particularmente com uma configuração da estrutura dos codificadores de coeficientes 30 e 38.
Como mostrado, os codificadores de coeficientes de acordo com a configuração da Fig. 4 compreendem um módulo de conversão LSF 102, um primeiro subtrator 104, um segundo subtrator 106, um quantizador uniforme 108 com dimensão de etapa de quantização uniforme e ajustável, um limitador 110, um dequantizador 112, um terceiro somador 114, dois membros de retardo 116 e 118, um filtro de predição 120 com coeficientes de filtro fixos ou coeficientes de filtro constantes, respectivamente, assim como um módulo de adaptação de dimensão de etapa 122. Os coeficientes de filtro a serem codificados se situam em uma entrada 124, onde uma saída 126 é provida para o envio da representação codificada.
Uma entrada do módulo de conversão LSF 102 seguediretamente a entrada 124. O subtrator 104 com sua entrada não invertida e sua saída está conectado entre a saída do módulo de conversão LSF 102 e uma primeira entrada do subtrator 106, onde uma constante Ic é aplicada à entrada do subtrator 104. O subtrator 106 está conectado à sua entrada não invertida e sua saída entre o primeiro subtrator 104 e o quantizador 108, onde sua entrada invertida está acoplada a uma saída do. filtro de predição 120. Junto com o membro de retardo 118 e o somador 114, o filtrode predição 120 forma um previsor de Ioop fechado, que está conectado em série em Ioop com feedback, de maneira que o membro de retardo 118 está conectado entre a saída do somador 114 e a entrada do filtro de predição 120, e a saída do filtro de predição 120 está conectada a uma primeira entrada do somador 114. A estrutura remanescente corresponde novamente principalmente a um dos meios 22 do codificador 10, isto é, o quantizador 108 está conectado entre a saída do subtrator 106 e a entrada do limitador 110, cuja saída está novamente conectada à saída 126, a uma entrada do membro de retardo 116 e a uma entrada do dequantizador 112. A saída do membro de retardo 116 está conectada a uma entrada do módulo de adaptação de dimensão de etapa 122, que assim forma em conjunto um bloco de adaptação de dimensão de etapa. Uma saída do módulo de adaptação de dimensão de etapa 122 está conectada às entradas de controle da dimensão da etapa do quantizador 108 e o dequantizador 112. A saída do dequantizador 112 está conectada à segunda entrada do somador 114.
Depois de ter sido descrita acima a estrutura do codificador de coeficientes, será descrito abaixo seu modo de operação, onde é novamente feita referência à Fig. 1. A transmissão tanto dos pré-filtros como dos coeficientes preditores ou previsores, respectivamente, ou de suas codificações, respectivamente, é feita usando um esquema de codificação de taxa de bits constante, que é feita pela estrutura de acordo com a Fig. 4. Depois, no módulo de conversão LSF 102, os coeficientes de filtro, isto é, os coeficientes de pré-filtro ou de predição, respectivamente, são primeiro convertidos em valores LSF 1 (n) ou transferidos para o domínio LSF, respectivamente. Toda freqüênciade linha espectral 1 (n) é então processada pelos elementos residuais na Fig. 4 como a seguir. Isto significa que a descrição a seguir se refere somente a uma freqüência de linha espectral, onde o processamento do curso é feito para todas as freqüências de linha espectral. Por exemplo, o módulo 102 gera valores LSF para cada conjunto de coeficientes de pré-filtro que representam um limite de mascaramento, ou um bloco de coeficientes de predição que prevê o sinal pré-filtrado. O subtrator 104 subtrai um valor constante de referência Ic do valor calculado 1(η), em que uma faixa suficiente de Ic varia, por exemplo, entre 0 e π. A partir da diferença resultante Id (η), o subtrator 106 subtral um valorprevisto ld(n), que é calculado pelo previsor de Ioop fechado 120, 118 e 114 incluindo o filtro de predição 120, como um filtro linear, com coeficientes fixos A(z). 0 restante, isto é, o valor residual, é quantizado pelo quantizador de dimensão da etapa adaptativa 108, em que os índices de quantização enviados pelo quantizador 108 são clipados pelo limitador 110 até o sub-conjunto dos índices de quantização recebidos por ele, como, por exemplo, para todos os índices de quantização clipados Ie(n), quando são enviados pelo limitador 110, aplica-se o seguinte: V : Ie (n) e {-1,0,1}. Para a adaptação da dimensão de etapa de quantização de Δ(η) do residual quantizador LSF 108, o módulo de adaptação de dimensão de etapa 122 e o membro de retardo 116 cooperam, por exemplo, no sentido descrito com relação ao bloco de adaptação de dimensão de etapa 54 com referência à Fig. 1; entretanto, possivelmente com uma diferente função de adaptação ou com diferentes constantes β, I, δ0, ôi e I. Apesar do quantizador 108usar a atual dimensão de etapa para a guantização do atual valor residual para Ie (η), o dequantizador 112 usa uma dimensão da etapa A1 (n) para a dequantização deste valor índice Ie (n) novamente e para fornecer o valor resultante reconstruído ao valor residual LSF, como foi enviado pelo subtrator 106, ao somador 114, que adiciona este valor ao valor previsto correspondente ld(n), e o fornece por meio do membro de retardo 118, retardado por uma amostra ao filtro 120 para o cálculo do valor LSF previsto ld(n) para o próximo valor LSF Id (n) .
Se os dois codificadores de coeficientes 30 e 38 forem implementados da maneira descrita na Fig. 4, o codificador 10 da Fig. 1 preenche uma condição de taxa constante de bits sem usar qualquer loop. Devido à adaptação para frente em bloco dos coeficientes LPC e o esquema de codificação aplicado, não é necessário nenhum reset explícito do previsor.
Antes que os resultados dos testes de audição, que foram obtidos por um codificador de acordo com as Figs. 1 e 4, será discutida abaixo a estrutura de um decodificador de acordo com uma configuração da presente invenção, que é adequada para a decodificação de um fluxo codificado de dados deste codificador, em que é feita referência às Figs. 5 e 6. A Fig. 6 também mostra a estrutura do decodificador de coeficientes da Fig. 1.
O decodificador geralmente indicado por 200 na Fig. 5 compreende uma entrada 202 para receber o fluxo codificado de dados, uma saída 204 para envio do fluxo decodificado de áudio y(n), assim como um meio dequantizador 206 tendo um número limitado e constante de níveis de quantização, um meio de predição 208, um meio de reconstrução 210, assim como um meio pós-filtro212. Além disso, é provido um extrator 214, que está acoplado à entrada 202 e implementado para extrair, do fluxo codificado de bits de entrada, o sinal residual de pré-filtro quantizado e clipado ic(n), as informações codificadas sobre os coeficientes de pré-filtro e as informações codificadas sobre os coeficientes de predição, como foram gerados dos codificadores de coeficientes 30 e 38 (Fig. 1) e para enviá-los às respectivas saídas. 0 meio dequantizador 206 está acoplado ao extrator 214 para obter os índices de quantização ic (n) dele e para fazer a dequantização desses índices em um número limitado e constante de níveis de quantização, isto é, - mantendo a mesma notação acima - {-c · Δ (η) ; c · Δ(η)}, para obter um sinal de pré-filtro dequantizado ou reconstruído qc(n), respectivamente. 0 meio de predição 208 está acoplado ao extrator 214 para a obtenção de um sinal previsto para
o sinal pré-filtrado, isto e, f cin) partir das informaçoes sobre os coeficientes de predição. 0 meio de predição 208 está acoplado ao extrator 214 para determinar um sinal previsto para o sinalpré-filtrado, isto é, f (η), a partir das informações sobre os coeficientes de predição, em que o meio de predição 208 de acordo com a configuração da Fig. 5 está também conectado a uma saída do meio de reconstrução 210. O meio de reconstrução 210 é dotado de meios para reconstruir o sinal pré-f iltrado, com base no sinalprevisto f (n) e nos sinais residuais dequantizados qc(n). Essa reconstrução é então usada pelo subseqüente meio pós-filtro 212 para filtrar o sinal pré-filtrado com base nas informações do coeficiente pré-filtro recebidas do extrator 214, de maneira que a normalização com relação ao limite de mascaramento seja canceladapara a obtenção do sinal de áudio decodificado y(n).
Após ter sido descrita acima a estrutura básica do decodificador da Fig. 5, a estrutura do decodificador 200 será discutida em maiores detalhes. Particularmente, o dequantizador 206 compreende um bloco de adaptação de dimensão de etapa de um membro de retardo 216 e um módulo de adaptação de dimensão de etapa 218, assim como um dequantizador uniforme 220. 0 dequantizador 220 está conectado a uma saída do extrator 214 com sua entrada de dados, para obter os índices de quantização ic(n). Além disso, o módulo de adaptação de dimensão de etapa 218 está conectado a esta saída do extrator 214 por meio do membro de retardo 216, cuja saída está novamente conectada à entrada de controle da dimensão da etapa do dequantizador 220. A saída do dequantizador 220 está conectada a uma primeira entrada do somador 222, que forma o meio de reconstrução 210. 0 meio de predição 208 compreende um decodificador de coeficientes 224, um filtro de predição 226, assim como um membro de retardo 228. O decodif icador de coeficientes 224, o somador 222, o filtro de predição 226 e o membro de retardo 228 correspondem aos elementos 40, 44, 46 e 48 do codificador 10 com relação a seus modos de operação e suas conectividades. Em particular, a saída do filtro de predição 226 está conectada a outra entrada do somador 222, cuja saída é novamente reenviada à entrada de dados do filtro de predição 226 por meio do membro de retardo 228, assim como acoplada ao meio pós-filtro 212. 0 decodificador de coeficientes 224 está conectado entre uma outra saída do extrator 214 e a entrada de adaptação do filtro de predição 226. 0 meio pós-filtro compreende um decodificador de coeficientes 230 e um pós-filtro 232, em que umaentrada de dados do pós-filtro 232 está conectada a uma saída do somador 222 e uma saída dè dados do pós-filtro 232 está conectada à saída 204, enquanto uma entrada de adaptação do pós-filtro 232 está conectada a uma saída do decodificador de coeficientes 230 para adaptar o pós-filtro 232, cuja entrada está novamente conectada a outra saída do extrator 214.
Como já mencionado, o extrator 214 extrai os índices de quantização ic(n) que representam o sinal residual de pré-filtro quantizado do fluxo codificado de dados em uma entrada 202. No dequantizador uniforme 220, esses índices de quantização são dequantizados para os valores residuais quantizados qc(n). De forma inerente, essa dequantização permanece dentro dos níveis de quantização permitidos, já que os índices de quantização ic(n) já foram clipados no lado do codificador. A dimensão da etapa de adaptação é feita de maneira adaptativa para trás, da mesma forma que no bloco de adaptação de dimensão de etapa 54 do codificador da Fig. 1. Sem erros de transmissão, o dequantizador 220 gera os mesmos valores que o dequantizador 50 do codificador da Fig. 1. Portanto, os elementos 222, 226, 228 e 224 com base nos coeficientes de predição codificados obtêm o mesmo resultado obtido no codificador 10 da Fig. 1 na saída do somador 48, isto é, um sinal de pré-filtro dequantizado ou reconstruído, respectivamente. 0 último é filtrado no pós-filtro 232, com uma função de transmissão correspondendo ao limite de mascaramento, em que o pós-filtro 232 é ajustado de forma adaptativa pelo decodificador de coeficientes 230, que ajusta de maneira adequada o pós-filtro 230 ou seus coeficientes de filtro, respectivamente, com base nas informações do coeficiente pré-filtro.Supondo que o codificador 10 seja dotado dos codificadores de coeficientes 30 e 38, que são implementados como descrito na Fig. 4, o decodif icador de coeficientes 224 e 230 do codificador 200, como também o decodificador de coeficientes 40 do codificador 10 estão estruturados como mostrado na Fig. 6. Como pode ser visto, o decodificador de coeficientes compreende dois membros de retardo 302, 304, um módulo de adaptação de dimensão de etapa 3 06 formando um bloco de adaptação de dimensão de etapa junto com o membro de retardo 3 02, um dequantizador uniforme 308 com dimensão uniforme de etapa, um filtro de predição 310, dois somadores 312 e 314, um módulo de reconversão LSF 316, assim como .uma entrada 318 para receber os valores residuais LSF quantizados Ie (n) com desvio constante -Ic e uma saída 320 para enviar a predição reconstruída ou os coeficientes de pré-filtro, respectivamente. Assim, o membro de retardo 302 está conectado entre uma entrada do módulo de adaptação de dimensão de etapa 306 e a entrada 318, uma entrada do dequantizador 308 estando também conectada a uma entrada 318, e uma dimensão de etapa de entrada de adaptação do dequantizador 308 está conectada a uma saída do módulo de adaptação de dimensão de etapa 306. 0 modo de operação e a conectividade dos elementos 302, 306 e 308 correspondem a um dos 112, 116 e 122 na Fig. 4. Um previsor de Ioop fechado do membro de retardo 304, um filtro de predição 310 e um somador 312, que estão conectados em um Ioop comum conectando o membro de retardo 304 entre uma saída do somador 312 e uma entrada do filtro de predição 310, e conectando uma primeira entrada do somador 312 à saída do dequantizador 308, e conectando uma segunda entrada do somador 312 a uma saída do filtro de predição 310, estão ligados a uma saídado dequantizador 308. Os elementos 304, 310 e 312 correspondem aos elementos 120, 118 e 114 da Fig. 4 em seus modos de operação e conectividade. Além disso, a saída do somador 312 está ligada a uma primeira entrada do somador 314, na segunda entrada do qual é aplicado o valor constante lc, onde, de acordo com a presente configuração, a constante Ic é uma quantidade combinada, que está presente tanto no codificador como no decodificador e assim não tem que ser transmitida como parte das informações auxiliares, apesar disto também ser possível. 0 módulo LSF de reconversão 316 está conectado entre uma saída do somador 314 e a saída 320.
Os índices do sinal residual LSF Ie (n) que chegam na entrada 318 são dequantizados pelo dequantizador 308, onde o dequantizador 308 usa os valores da dimensão de etapa adaptativa para trás Δ(η), que foram determinados de maneira adaptativa para trás pelo módulo de adaptação de dimensão de etapa 306 dos já dequantizados índices de quantização, isto é, aqueles que foram retardados de uma amostra pelo membro de retardo 302. O somador 312 soma o sinal previsto aos valores residuais LSF dequantizados, que calcula a combinação do membro de retardo 304 e do filtro de predição 210 a partir das somas que o somador 312 já realizou anteriormente, e assim representa os valores LSF reconstruídos, que são somente dotados de um desvio constante pelo desvio constante lc. Este último é corrigido pelo somador 314 adicionando o valor Ic aos valores LSF, enviados pelo somador 312. Assim, na saída do somador 314, o resultado dos valores LSF reconstruídos, são convertidos pelo módulo 316 do domínio LSF de volta para a predição reconstruída ou coeficientes de pré-filtro, respectivamente. Portanto, o módulo LSF de reconversão 316considera todas as freqüências de linha espectral, considerando que a discussão dos outros elementos da Fig. 6 ficou limitada à descrição de uma freqüência de linha espectral. Entretanto, os elementos 302-314 também realizam as medidas supramencionadas nas outras freqüências de linha espectral.
Depois de prover as configurações acima do codificador como do decodificador, serão apresentados os resultados do teste de audição abaixo com base na Fig. 7, já que foram obtidos por meio de um esquema de codificação de acordo com as Figs. 1, 4, 5 e 6. Nos testes realizados, foram testados tanto o codificador de acordo com as Figs. 1, 4 e 6 como um codificador de acordo com o esquema de codificação ULD de comparação discutidos no início da descrição das Figs., em um teste de audição de acordo com o padrão MUSHRA, em que foram omitidos os moderadores. 0 teste MUSHRA foi feito em um computador laptop com conversor externo digital/análogo e amplificador/fones de ouvido STAX em um ambiente de escritório silencioso. Foi formado um grupo de oito ouvintes do teste, entre ouvintes peritos e não peritos. Antes que os participantes começassem o teste de audição, tiveram a oportunidade de ouvir um conjunto de teste. Os testes foram feitos com doze arquivos de áudio mono do conjunto de testes MPEG, em que todos apresentaram uma freqüência de amostra de 32 kHz, isto é, esOl (Suzanne Vega), es02 (fala masculina, Alemão), es03 (fala feminina, Inglês), scOl (trompete), sc02 (orquestra), sc03 (pop music), siOl (címbalo), si02 (castanholas), si03 (afinador), smOl (gaita de foles), sm02 (vibrafone), sm03 (instrumento de cordas).
Para o esquema de codificação ULD de comparação,foi usada uma predição adaptativa para trás com comprimento de 64 na implementação, junto com um codificador Golomb de adaptação para trás para a codificação de entropia, com uma taxa de bits constante de 64 kBit/s. Em contraste, para a implementação do codificador de acordo com as Figs. 1, 4 e 6, foi usado um previsor de adaptação para frente com comprimento de 12, em que o número de diferentes níveis de quantização foi limitado a 3, isto é, de maneira que Vn : ic(n) e {-1,0,1}. Isto resultou, em conjunto com as informações auxiliares codificadas, em uma taxa de bits constante de 64 kBit/s, que significa a mesma taxa de bits.
Os resultados dos testes de audição MUSHRA estão mostrados na Fig. 7, onde são mostrados tanto os valores médios como os intervalos de confiança de 95 %, para as doze peças de teste individualmente como para o resultado total de todas as peças. Enquanto os intervalos de confiança se sobrepõem, não existem diferenças estatisticamente significativas entre os métodos de codificação.
A peça esOl (Suzanne Vega) é um bom exemplo da superioridade do esquema de codificação de acordo com as Figs. 1, 4, 5 e 6 em menores taxas de bits. As maiores porções do espectro do sinal decodificado mostram menos problemas audíveis, quando comparadas ao esquema de codificação ULD de comparação. Isso resulta em uma taxa significativamente maior do esquema de acordo com as Figs. 1, 4, 5 e 6.
Os transientes de sinal da peça sm02 (Vibrafone)têm maior exigência de taxa de bits para o esquema de codificação ULD de comparação. Nos 64kBit/s usados, o esquema de codificação ULD de comparação gera problemas espúrios de codificação nosblocos completos de amostras. Em contraste, o codificador que opera de acordo com as Figs. 1, 4 e 6 proporciona qualidade de audição ou qualidade perceptual significativamente aperfeiçoada, respectivamente. A classificação geral, vista no gráfico da Fig. 7 à direita do esquema de codificação formado de acordo com as Figs. 1, 4 e 6 obteve uma classificação significativamente melhor que o esquema de codificação ULD de comparação. No geral, este esquema de codificação obteve uma classificação geral de "boa qualidade de áudio", sob as condições dadas de teste.
Em resumo, a partir das configurações supramencionadas, resulta um esquema de codificação de áudio com baixo retardo, que usa uma predição adaptativa em bloco para frente em conjunto com clipagem/limitação em vez de uma predição de amostras com adaptação para trás. A conformação de ruídos difere do esquema de codificação ULD de comparação. O teste de audição demonstrou que as configurações supramencionadas são superiores ao método de adaptação para trás, de acordo com o esquema de codificação ULD de comparação no caso de menores taxas de bits. Subseqüentemente, são candidatos para o fechamento da folga da taxa de bits entre os codificadores de voz de alta qualidade e os codificadores de áudio de baixo retardo. No geral, as configurações supramencionadas proporcionam a possibilidade de esquemas de codificação de áudio com retardo muito baixo de 6 - 8 ms para taxas de bits reduzidas, que têm as seguintes vantagens quando comparados ao codificador ULD de comparação. São mais resistentes contra grandes erros de quantização, tem outras capacidades de conformação de ruídos, melhor capacidade de obtenção de uma taxa de bits constante, e mostra um melhorcomportamento de recuperação de erros. O problema do ruído quantizador audível em posições sem sinal, que é o caso no esquema de codificação ULD de comparação, é solucionado pela configuração de uma forma modificada de aumento do ruído quantizador acima do limite de mascaramento, isto é, adicionando o espectro do sinal ao limite de mascaramento, em vez de aumentar uniformemente o limite de mascaramento até certo ponto. Assim, não existe ruído quantizador audível nas posições sem sinal.
Em outras palavras, as configurações acima diferem do esquema de codificação ULD de comparação da seguinte maneira. No esquema de codificação ULD de comparação, é usada a predição adaptativa para trás, o que significa que os coeficientes do filtro de predição A(z) são atualizados amostra a amostra a partir dos valores de sinal previamente decodificados. É usado um quantizador com uma dimensão de etapa variável, em que a dimensão da etapa adapta todas as 128 amostras usando as informações dos codificadores de entropia, sendo transmitidas como informações auxiliares para o lado do decodificador. Com este procedimento, a dimensão de etapa de quantização é aumentada, adicionado mais ruído branco ao sinal prê-filtrado e aumentando de maneira uniforme o limite de mascaramento. Se a predição adaptativa para trás for substituída por uma predição em bloco de adaptação para frente no esquema de codificação ULD de comparação, o que significa que os coeficientes do filtro de predição A(z) são calculados uma vez para 128 amostras das amostras pré-filtradas não quantizadas e transmitidas como informações auxiliares, e se a dimensão de etapa de quantização for adaptada para as 128 amostras usando as informações do codificador de entropia e transmitidascomo informações auxiliares para o lado do decodificador, a dimensão de etapa de quantização ainda estará aumentada, como é o caso no esquema de codificação ULD de comparação, mas a atualização do previsor não é afetada por qualquer quantização. As configurações acima usaram somente uma predição em bloco adaptada para frente, onde, além disso, o quantizador somente recebeu um número dado 2N+1 de estágios de quantização tendo dimensão fixa de etapa. Para os sinais pré-filtrados x(n) com amplitudes fora da faixa do quantizador [-ΝΔ;ΝΔ], o sinal quantizado foi limitado a [-ΝΔ/ΝΔ]. Isto resulta em um ruído quantizador com um PSD, que não é mais branco, mas copia o PSD do sinal de entrada, isto é, o sinal de áudio pré-filtrado.
Como conclusão, o seguinte deve ser notado nas configurações acima. Primeiro, deve ser observado que existem diferentes possibilidades para a transmissão de informações sobre a representação do limite de mascaramento, como obtidas pelo módulo do modelo perceptual 26 dentro do codificador para o pré-filtro 34 ou filtro de predição 44, respectivamente, e para o decodificador, existindo particularmente para o pós-filtro 232 e o filtro de predição 226. Particularmente, deve ser notado que não é necessário que os decodificadores de coeficientes 32 e 40 dentro do codificador recebam exatamente as mesmas informações com relação ao limite de mascaramento, como enviadas pela saída 14 do codificador e como são recebidas na saída 202 do decodificador. Em vez disso, é possível que, por exemplo, em uma estrutura do codificador de coeficientes 30 de acordo com a Fig. 4, os índices obtidos Ie (n), assim como os índices de quantização do sinal residual do pré-filtro ic(n) se originem também somente a partirde uma quantidade de três valores, isto é, -1, 0, 1, e que o gerador de fluxo de bits 24 mapeie esses índices tão claramente que correspondam a η bit palavras. De acordo com uma configuração de acordo com a Figs. 1, 4 ou 5, 6, respectivamente, os índices de quantização de pré-filtro, os índices de quantização de coeficiente de predição e/ou os índices de quantização de pré-filtro, cada qual originado de uma quantidade -1, 0, 1, são mapeados em grupos de cinco para 8-bit palavras, que corresponde ao mapeamento de 35 possibilidades em 28 bit palavras. Como o mapeamento não é subjetivo, várias 8-bit palavras ficam não utilizadas e podem ser usadas de outras formas, como para sincronização ou para si.
Nessa ocasião, deve ser notado o seguinte. Acima, foi descrito com referência à Fig. 6 que a estrutura dos decodificadores de coeficientes 32 e 230 é idêntica. Nesse caso, o pré-filtro 34 e o pós-filtro 232 são implementados de maneira que ao aplicar os mesmos coeficientes de filtro, tenham uma função de transmissão inversa entre si. Entretanto, é claro ser também possível que, por exemplo, o codificador de coeficientes 32 faça outra conversão dos coeficientes de filtro, de maneira que o pré-filtro tenha uma função de transmissão que corresponda principalmente ao inverso do limite de mascaramento, considerando que o pós-filtro tenha uma função de transmissão que corresponda principalmente ao limite de mascaramento.
Nas configurações acima, foi suposto que o limitede mascaramento é calculado no módulo 26. Entretanto, deve ser notado que o limite calculado não precisa corresponder exatamente ao limite psicoacústico, mas pode representar uma estimativa maisou menos exata de si, que pode não considerar todos os efeitos psicoacústicos, mas somente alguns deles. Em particular, o limite pode representar um limite psicoacusticamente motivado, que tenha sido deliberadamente submetido a uma modificação, em contraste com uma estimativa do limite de mascaramento psicoacústico.
Além disso, deve ser notado que a adaptação para trás do tamanho da etapa na quantização dos valores do sinal residual de pré-filtro não precisa necessariamente estar presente. Em vez disso, em determinados casos de aplicação, pode ser suficiente um tamanho de etapa fixa.
Além disso, deve ser notado que a presente invenção não se limita ao campo da codificação de áudio. Em vez disso, o sinal a ser codificado também pode ser um sinal usado para estimular uma ponta de dedo em uma luva ciberespaço, onde o modelo perceptual 2 6 nesse caso considera determinadas características tácteis, que o sentido humano do toque não mais pode perceber. Outro exemplo de um sinal de informação a ser codificado seria, por exemplo, um sinal de vídeo. Particularmente, o sinal de informação a ser codificado poderia ser uma informação de luminosidade de um ponto pixel ou de imagem, respectivamente, em que o modelo perceptual 26 também poderia considerar diferentes efeitos de cobertura temporal, local e psicovisual de freqüência, isto é, um limite visual de mascaramento.
Além disso, deve ser notado que o quantizador 56 e o limitador 58 ou quantizador 108 e o limitador 110, respectivamente, não precisam ser componentes separados. Em vez disso, o mapeamento dos valores não quantizados com relação aos valores quantizados/clipados também poderia ser feito pormapeamento simples. Por outro lado, o quantizador 56 ou o quantizador 108, respectivamente, também poderiam ser feitos por uma série de conexões de um divisor seguido por um quantizador com dimensão de etapa uniforme e constante, em que o divisor usaria o valor da dimensão de etapa Δ(η) obtido do respectivo módulo de adaptação da dimensão da etapa como divisor, enquanto o sinal residual a ser codificado formasse o dividendo. 0 quantizador tendo uma dimensão de etapa uniforme e constante poderia ser provido como simples módulo de arredondamento, que arredonda o resultado da divisão até o próximo inteiro, em que o limitador subseqüente limitaria então o inteiro como supramencionado até um inteiro do valor permitido C. No dequantizador respectivo, uma dequantização uniforme seria simplesmente feita com Δ(η) como multiplicador.
Além disso, deve ser notado que as configuraçõesacima foram restritas a aplicações com taxa de bits constante. Entretanto, a presente invenção não se limita a este fato, sendo somente uma alternativa possível a quantização pela clipagem, por exemplo, do sinal pré-filtrado usado nessas configurações. Em vez da clipagem, poderia ser usada a função de quantização com curva de característica não linear. Para ilustrar, é feita referência às Figs. 8a a 8c. A Fig. 8a mostra a função de quantização usada acima que resulta da clipagem em três estágios de quantização, isto é, a função de etapa com três estágios 4 02a, b, c, que mapeia valores não quantizados (eixo x) em índices de quantização (eixo y) , em que a altura do estágio de quantização ou a dimensão da etapa de quantização Δ(η) está também marcada. Como pode ser visto, valores não quantizados maiores que Δ(η)/2 são clipados norespectivo próximo estágio 402a ou c, respectivamente. A Fig. 8b mostra de forma geral a função de quantização que resulta da clipagem a 2n+l estágios de quantização. A dimensão da etapa de quantização Δ(η) está novamente mostrada. As funções de quantização das Figs. 8a e 8b representam funções de quantização, onde a quantização entre os limites -Δ(η) e Δ(η) ou -ΝΔ(η) e ΝΔ(η) ocorre de maneira uniforme, isto é, com a mesma altura de estágio, em que a função do estágio de quantização é feita de maneira plana, o que corresponde à clipagem. A Fig. 8c mostra uma função de quantização não linear, em que a função de quantização é feita em uma área entre -ΝΔ(η) e ΝΔ(η) não completamente plana, mas com menor inclinação, isto é, com maior dimensão de etapa ou altura de estágio, respectivamente, comparada à primeira área. Esta quantização não linear não resulta, de forma inerente, em uma taxa constante de bits, como foi o caso nas configurações acima, mas também gera a deformação supramencionada do ruído de quantização, de maneira que se ajuste ao sinal PSD. Somente como medida de precaução, deve ser notado com referência às Figs. 8a-c, que em vez de áreas de quantização uniforme, pode ser usada quantização não uniforme onde, por exemplo, a altura de estágio aumenta continuadamente, em que as alturas de estágio poderiam ser escaláveis via um valor de ajuste de altura de estágio Δ(η) enquanto mantém suas relações mútuas. Portanto, por exemplo, o valor não quantizado pode ser mapeado por meio de uma função não linear até um valor intermediário no respectivo quantizador, onde tanto antes como depois da multiplicação por Δ(η) ser feita, e finalmente o valor resultante ser uniformemente quantizado. No respectivo dequantizador, pode ser feito o inverso, que significauma dequantização uniforme por meio de Δ(η) seguida pelo mapeamento inverso não linear ou, ao contrário, o mapeamento de conversão não linear primeiro seguido pela dequantização por Δ(η). Finalmente, deve ser notado ser também possível uma contínua e uniforme, isto é, uma quantização linear por meio da obtenção do efeito supramencionado de deformação do erro PSD, quando a altura do estágio é ajustada tão alta ou a quantização é tão grosseira que esta quantização funciona efetivamente como uma quantização não linear com relação à estatística do sinal a ser quantizado, como o sinal pré-filtrado, em que este ajuste de altura de estágio é tornado novamente possível pela adaptatividade para frente da predição.
Além disso, as configurações supramencionadas podem também variar com relação ao processamento do fluxo codificado de bits. Particularmente, o gerador e o extrator do fluxo de bits 214, respectivamente, podem ser omitidos.
Os diferentes índices de quantização, isto é, os valores residuais dos sinais pré-filtrados, os valores residuais dos coeficientes de pré-filtro e os valores residuais dos coeficientes de predição podem também ser transmitidos em paralelo entre si, armazenados ou disponibilizados de outra forma para decodificação, separadamente por canais individuais. Por outro lado, no caso em que uma taxa constante de bits não é imperativa, esses dados também podem ser codificados por entropia.
Particularmente, as funções acima nos blocos dasFigs. 1, 4, 5 e 6 podem implementados individualmente ou em combinações por rotinas de subprogramas. Alternativamente, a implementação do equipamento da invenção sob a forma de umcircuito integrado é também possível, onde esses blocos são implementados, por exemplo, como partes individuais de um ASIC.
Particularmente, deve ser notado que, dependendo das circunstâncias, o esquema da invenção também pode ser implementado em software. A implementação pode ser feita em um meio de memória digital, particularmente em um disco ou CD com sinais de controle de leitura eletrônica, que possam cooperar com um sistema de computador programável, de maneira que o método respectivo seja executado. Em geral, portanto, a invenção consiste também de um produto de programa de computador dotado de um código de programas armazenado em um veículo de leitura por máquina para a realização do método da invenção quando o produto de programa de computador opera em um computador. Em outras palavras, a invenção pode ser realizada como um programa de computador tendo um código de programas para a realização do método quando o programa de computador opera em um computador.

Claims (48)

1. Equipamento para a codificação de um sinal de informação em um sinal de informação codificado, caracterizado pelo fato de que compreende: um meio (16) para a determinação de uma representação de um limite de psicopercepção motivada, que indica uma porção do sinal de informação irrelevante com relação à percepção, usando um modelo perceptual; um meio (18) para a filtragem do sinal de informação para a normalização do sinal de informação com relação ao limite de psicopercepção motivada, para a obtenção de um sinal pré-filtrado; um meio (20) para a predição do sinal pré-filtrado de maneira adaptativa para frente, para obter um sinal previsto, um erro de predição do sinal pré-filtrado e uma representação de coeficientes de predição, com base em que o sinal pré-filtrado possa ser reconstruído; e um meio (22) para a quantização do erro de predição, de maneira a obter um erro de predição quantizado, caracterizado pelo fato de que o sinal de informação codificado compreende informações sobre a representação do limite de psicopercepção motivada, a representação dos coeficientes de predição e o erro de predição quantizado.
2. Equipamento, de acordo com a reivindicação 1, caracterizado pelo fato de que o meio (22) para quantização é implementado para quantizar o erro de predição por meio da função de quantização, que mapeia valores não quantizados do erro de predição em índices de quantização de estágios de quantização, e cujo curso abaixo de um limite é mais inclinado que acima de um limite.
3. Equipamento, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que o meio (22) para quantizaçãoé implementado para obter uma altura da etapa de quantização Δ(η) da função de quantização de maneira adaptativa para trás, a partir do erro de predição quantizado.
4. Equipamento, de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o meio(22) para a quantização do erro de predição é implementado de maneira que os valores não quantizados do erro de predição são quantizados por meio de clipagem pela função de quantização, que mapeia os valores não quantizados do erro de predição nos índices de quantização de um primeiro número constante e limitado de estágios de quantização para a obtenção do erro de predição quantizado.
5. Equipamento, de acordo com a reivindicação 4, caracterizado pelo fato de que o meio (22) para quantização éimplementado para obter a altura da etapa de quantização Δ(η) da função de quantização para a quantização de um valor (r(n)) do erro de predição de maneira adaptativa para trás de dois índices passados de quantização ic(n-l) e ic(n-2) do erro de predição quantizado de acordo com Δ(η) = β Δ(η-1) + δ(η), com /Se [0,0;1,0] ,δ(η) = δ0 para |ic(n-l) + ic(n-2)| < I e δ(η) = δι para |ic(n-l) + ic(n-2)| > I com parâmetros constantes δ0, δι, I, onde Δ(η-1) representa uma altura da etapa de quantização obtida para a quantização de um valor prévio do erro de predição.
6. Equipamento, de acordo com as reivindicações de 4 ou 5, caracterizado pelo fato de que o meio para quantizaçãoé implementado para quantizar o erro de predição de maneira não linear.
7. Equipamento, de acordo com uma das reivindicações de 4 a 6, caracterizado pelo fato de que o primeiro número constante e limitado é 3 .
8. Equipamento, de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o meio (16) para determinação é implementado para estabelecer o limite de psicopercepção motivada de maneira em bloco a partir do sinal de informação.
9. Equipamento, de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o meio (16) para determinação é implementado para representar o limite de psicopercepção motivada no domínio LSF.
10. Equipamento, de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o meio (16) para determinação é implementado para estabelecer o limite de psicopercepção motivada de maneira em bloco e para representá-lo em coeficientes filtrados, para submeter os coeficientes de filtro a uma predição e para submeter um sinal residual de coeficiente de filtro resultante da predição a uma quantização por meio de outra função de quantização, que mapeia os valores não quantizados do sinal residual de coeficiente de filtro em índices de quantização de estágios de quantização, e cujo curso abaixo de outro limite é mais inclinado que acima do outro limite, para a obtenção de um sinal residual de coeficiente de filtro quantizado, onde o sinal de informação codificado também inclui informações sobre o sinal residual de coeficiente de filtro quantizado.
11. Equipamento, de acordo com a reivindicação 10, caracterizado pelo fato de que o meio (16) para a determinaçãoé implementado de maneira que os valores não quantizados do sinal residual de coeficiente de filtro sejam quantizados por meio de clipagem pela outra função de quantização, que mapeia os valores não quantizados do sinal residual de coeficiente de filtro em índices de quantização de um segundo número constante e limitado de estágios de quantização.
12. Equipamento, de acordo com a reivindicação 11, caracterizado pelo fato de que o meio (16) para determinação é implementado de maneira que a predição é feita de maneiraadaptativa para trás com base nos índices de quantização do sinal residual de coeficiente de filtro quantizado.
13. Equipamento, de acordo com uma das reivindicações de 10 a 12, caracterizado pelo fato de que o meio (16) para determinação é implementado de maneira que a prediçãodos coeficientes de filtro é feita usando um filtro de predição com coeficientes constantes.
14. Equipamento, de acordo com uma das reivindicações de 9 a 13, caracterizado pelo fato de que o meio (16) para determinação é ainda implementado para submeter oscoeficientes de filtro de maneira a representarem o limite de psicopercepção motivada a uma subtração por um valor constante, antes de submetê-lo à predição.
15. Equipamento, de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o meio(20) para a predição do sinal pré-filtrado de maneira adaptativa para frente ainda compreende: um meio (36) para a determinação dos coeficientes de filtro de predição a partir do sinal pré-filtrado; e um meio (44, 446, 48) para a predição do sinal pré-filtrado pormeio de um filtro (44) controlado pelos coeficientes de filtro de predição.
16. Equipamento, de acordo com a reivindicação 15, caracterizado pelo fato de que o meio (36) para determinação éimplementado para estabelecer os coeficientes de filtro de predição de maneira em bloco a partir do sinal pré-filtrado.
17. Equipamento, de acordo com a reivindicação 15 ou 16, caracterizado pelo fato de que o meio (36) para determinação é implementado para representar os coeficientes defiltro de predição no domínio LSF.
18. Equipamento, de acordo com uma das reivindicações de 15 a 17, caracterizado pelo fato de que o meio (36) para determinação é implementado para estabelecer os coeficientes de filtro de predição de maneira em bloco, parasubmeter os coeficientes de filtro de predição a uma predição, e para submeter um sinal residual do coeficiente de filtro de predição resultante da predição à quantização por uma terceira função de quantização, que mapeia os valores não quantizados do sinal residual do coeficiente de filtro de predição a índices de quantização de estágios de quantização, e cujo. curso abaixo de um terceiro limite é mais inclinado que acima do terceiro limite, para a obtenção de um sinal residual do coeficiente de filtro de predição quantizado, em que o sinal de informação codificado também compreende informações sobre o sinal residual do coeficiente de filtro de predição quantizado.
19. Equipamento, de acordo com a reivindicação 18, caracterizado pelo fato de que o meio (36) para determinação é implementado de maneira que os valores não quantizados do sinalresidual do coeficiente de filtro de predição são quantizados por meio de clipagem dos índices de quantização do terceiro número de estágios de quantização pela terceira função de quantização, que mapeia os valores não quantizados do sinal residual do coeficiente de filtro de predição para quantizar os índices de um terceiro número constante e limitado de estágios de quantização.
20. Equipamento, de acordo com a reivindicação 18, caracterizado pelo fato de que o meio (36) para determinação é implementado de maneira que a predição é feita de maneiraadaptativa para trás com base nos índices de quantização do sinal residual dos coeficientes do filtro de predição quantizados para um ou vários blocos anteriores do sinal pré-filtrado.
21. Equipamento, de acordo com uma das reivindicações de 18 a 19, caracterizado pelo fato de que o meio(36) para determinação é implementado de maneira que a predição dos coeficientes de filtro de predição seja realizada usando um filtro de predição com coeficientes constantes.
22. Equipamento, de acordo com uma das reivindicações de 18 a 21, caracterizado pelo fato de que o meio(36) para determinação é ainda implementado para submeter os coeficientes de filtro de predição a uma subtração por um valor constante antes de submetê-lo à predição.
23. Equipamento, de acordo com qualquer uma das reivindicações anteriores, que é implementado para a codificaçãode um sinal de áudio ou de um sinal de vídeo como sinal de informação, caracterizado pelo fato de que o modelo perceptual é um modelo psicoacústico e o limite de psicopercepção motivada um limite psicoacusticamente motivado, ou o modelo perceptual é ummodelo psicovisual e o limite de psicopercepção motivada é um limite psicovisualmente motivado.
24. Equipamento para a decodificação de um sinal de informação codificado compreendendo informações sobre umarepresentação de um limite de psicopercepção motivada, uma representação de coeficientes de predição e um erro de predição quantizado em um sinal de informação decodificado, caracterizado pelo fato de que compreende: um meio (206) para a dequantização do erro de predição quantizado para a obtenção de um erro de predição dequantizado; um meio (208) para a determinação de um sinal previsto com base nos coeficientes de predição; um meio (210) para a reconstrução de um sinal pré-filtrado com base no sinal previsto e o erro de predição dequantizado; e um meio (212) para a filtragem do sinal pré-filtrado para reconversão de uma normalização com relação ao limite de psicopercepção motivada na obtenção do sinal de informação decodificado.
25. Equipamento, de acordo com a reivindicação-24, caracterizado pelo fato de que o meio (206) para dequantização é implementado para dequantizar o erro de predição quantizado e umnúmero limitado e constante de estágios de quantização.
26. Equipamento, de acordo com a reivindicação-25, caracterizado pelo fato de que o meio (206) para dequantização é implementado para obter a altura da etapa de quantização Δ(η) entre os estágios de quantização de maneira adaptativa para trás apartir dos índices já dequantizdos de quantização do erro de predição quantizado.
27. Equipamento, de acordo com a reivindicação 25 ou 26, caracterizado pelo fato de que o meio (260) paradequantização é implementado para obter a altura da etapa de quantização (Δ(η)) entre os estágios de quantização para a dequantização de um índice de quantização do erro de predição quantizado de maneira adaptativa para trás a partir dos dois anteriores índices de quantização ic(n-l) e ic(n-2) do erro de predição quantizado de acordo com Δ(η) = 0Δ(η-1) + δ (η) com jSe [0,0; 1,0] ,δ (η) = δ0 para |ic(n-l) + ic(n-2)| < I e δ(η) = S1 para |ic(n-l) + ic(n-2)| > I tendo parâmetros constantes δ0/ δχ, I, onde Δ(η-1) representa a altura da etapa de quantização obtida para dequantização ic(n-l).
28. Equipamento, de acordo com uma das reivindicações de 25 a 27, caracterizado pelo fato de que o número constante e limitado é menor ou igual a 32.
29. Equipamento, de acordo com uma das reivindicações de 25 a 28, caracterizado pelo fato de que o númeroconstante e limitado é 3.
30. Equipamento, de acordo com uma das reivindicações de 24 a 29, caracterizado pelo fato de que o meio (212) para filtragem compreende: um meio (230) para a determinaçãodos coeficientes de filtro de limite perceptual a partir das informações sobre a representação do limite de psicopercepção motivada de maneira em bloco para blocos de uma seqüência de blocos do sinal pré-filtrado; e um pós-filtro (232) para a filtragem do sinal pré-filtrado usando os coeficientes de filtro de limite perceptual.
31. Equipamento, de acordo com uma das reivindicações de 24 a 30, caracterizado pelo fato de que o meio (230) para determinação é implementado para obter os coeficientesde filtro de limite perceptual pela reconversão de um domínio LSF.
32. Equipamento, de acordo com uma das reivindicações de 24 a 31, caracterizado pelo fato de que o meio (230) para determinação é implementado para obter índices de quantização de um sinal residual de coeficiente de filtro quantizado a partir da representação do limite de psicopercepção motivada, para dequantizá-lo até um segundo número limitado e constante de níveis de quantização, para a obtenção de um sinal residual de coeficiente de filtro dequantizado, para predizer os coeficientes de filtro que representam o limite de psicopercepção motivada e para adicioná-lo ao sinal residual de coeficiente de filtro dequantizado e para converter um sinal residual de coeficiente de filtro reconstruído que resulta da soma pela reconversão nos coeficientes de filtro de limite perceptual.
33. Equipamento, de acordo com a reivindicação-32, caracterizado pelo fato de que o meio (230) para determinação é implementado de maneira que a predição é feita de maneira adaptativa para trás com base nos já preditos coeficientes de filtro que representam o limite de psicopercepção motivada.
34. Equipamento, de acordo com as reivindicações-32 ou 33, caracterizado pelo fato de que o meio (230) para determinação é implementado de maneira que a predição dos coeficientes de filtro que representam o limite de psicopercepção motivada é feita usando um filtro de predição com coeficientes constantes.
35. Equipamento, de acordo com uma das reivindicações de 32 a 34, caracterizado pelo fato de que o meio (230) para a determinação é ainda implementado para submeter osinal residual de coeficiente de filtro reconstruído que resulta da soma a uma soma com um valor constante antes da reconversão.
36. Equipamento, de acordo com uma das reivindicações de 24 a 37, caracterizado pelo fato de que o meio(208) para a determinação de um sinal previsto ainda compreende: um meio (224) para a determinação de coeficientes de filtro de predição a partir da representação dos coeficientes de predição compreendidos no sinal de informação codificado; e um meio (226, 228) para a predição do sinal pré-filtrado por meio de um filtro (226) controlado pelos coeficientes de filtro de predição.
37. Equipamento, de acordo com a reivindicação 36, caracterizado pelo fato de que o meio (224) para a determinação coeficientes de filtro de predição é implementado para determiná-lo de maneira em bloco para blocos de uma seqüênciade blocos do sinal pré-filtrado.
38. Equipamento, de acordo com uma das reivindicações 36 ou 37, caracterizado pelo fato de que o meio (224) para determinação é implementado para obter os coeficientes de filtro de predição pela reconversão de um domínio LSF.
39. Equipamento, de acordo com uma dasreivindicações de 36 a 38, caracterizado pelo fato de que o meio (224) para determinação é implementado para obter índices de quantização de um sinal residual do coeficiente de predição quantizado da representação dos coeficientes de predição, para dequantizá-lo até um terceiro número limitado e constante de níveis de quantização para a obtenção de um sinal residual do coeficiente de predição dequantizado, para predizer coeficientes de filtro de predição e para adicioná-los ao sinal residual docoeficiente de predição dequantizado e para converter um sinal residual do coeficiente de predição reconstruído que resulta da soma pela reconversão nos coeficientes de filtro de predição.
40. Equipamento, de acordo com a reivindicação 39, caracterizado pelo fato de que o meio (224) para determinaçãoé implementado de maneira que a predição seja feita de maneira adaptativa para trás com base nos já preditos coeficientes de predição.
41. Equipamento, de acordo com a reivindicação 39 ou 40, caracterizado pelo fato de que o meio (224) paradeterminação é implementado de maneira que a predição dos coeficientes de predição é feita usando um filtro de predição com coeficientes constantes.
42. Equipamento, de acordo com uma das reivindicações de 39 a 41, caracterizado pelo fato de que o meio(224) para a determinação é ainda implementado para submeter o sinal residual do coeficiente de predição reconstruído que resulta da soma a uma soma com o valor constante antes da reconversão.
43. Equipamento, de acordo com uma das reivindicações de 24 a 42, caracterizado pelo fato de que éimplementado para a decodificação de um sinal de áudio ou de um sinal de vídeo como sinal de informação, e caracterizado pelo fato de que o limite de psicopercepção motivada é um limite de mascaramento acústico ou um limite de mascaramento visual.
44. Método para a codificação de um sinal deinformação em um sinal de informação codificado, caracterizado pelo fato de que compreende usar um modelo de percepção, determinando uma representação de um limite de psicopercepçãomotivada que indica uma porção do sinal de informação sem relevância com relação à percepção; filtrar o sinal de informação para a normalização do sinal de informação com relação ao limite de psicopercepção motivada para a obtenção de um sinal pré-filtrado; predizer o sinal pré-filtrado de maneira adaptativa para frente para obter um sinal pré-filtrado, um erro de predição para o sinal pré-filtrado e uma representação de coeficientes de predição, baseado em que o sinal pré-filtrado possa ser reconstruído; e quantizar o erro de predição para obter um erro de predição quantizado, em que o sinal de informação codificado compreende informações sobre a representação do limite de psicopercepção motivada, da representação dos coeficientes de predição e do erro de predição quantizado.
45. Método para a decodif icação de um sinal de informação codificado, compreendendo informações sobre arepresentação de um limite de psicopercepção motivada, uma representação de coeficientes de predição e do erro de predição quantizado em um sinal de informação decodificado, caracterizado pelo fato de que compreende: dequantizar o erro de predição quantizado para obter um erro de predição dequantizado; determinar um sinal previsto com base no coeficiente de predição; reconstruir um sinal pré-filtrado com base no sinal previsto e o erro de predição dequantizado; e filtrar o sinal pré-filtrado para a conversão da normalização com relação ao limite de psicopercepção motivada para obter o sinal de informação decodificado.
46. Programa de computador com um código de programa caracterizado pelo fato de que é para a realização do método de acordo com a reivindicação 44 ou 45 quando o programa decomputador opera em um computador.
47. Codificador, caracterizado pelo fato de que compreende: uma entrada de sinal de informação (12); um determinador de limite de percepção (26) que opera de acordo com a o modelo de percepção tendo uma entrada acoplada à entrada do sinal de informação e uma saída do limite de percepção; um pré-filtro adaptativo (34) compreendendo uma entrada de filtro acoplada à entrada do sinal de informação, uma saída de filtro e uma entrada de controle de adaptação acoplada à saída do limite de percepção, um determinador de coeficiente de predição para frente (36) compreendendo uma entrada acoplada à saída do pré-filtro e uma saída do coeficiente de predição; um primeiro subtrator (42) compreendendo uma primeira entrada acoplada à saída do pré-filtro, uma segunda entrada e uma saída; um estágio de clipagem e quantização (52) compreendendo um número limitado e constante de níveis de quantização, uma entrada acoplada ao subtrator saída, uma entrada de controle de dimensão da etapa de quantização e uma saída; um ajustador de dimensão de etapa (54) compreendendo uma entrada acoplada à saída do estágio de clipagem e quantização (52) e uma saída da dimensão da etapa de quantização acoplada à entrada de controle de dimensão da etapa de quantização do estágio de clipagem e quantização (52); um estágio de dequantização (50) compreendendo uma entrada acoplada à saída do estágio de clipagem/quantização e uma saída de controle do dequantizador; um somador (48) compreendendo uma primeira entrada de somador acoplada à saída do dequantizador, uma segunda entrada de somador e uma saída de somador; um filtro de predição (44, 46) compreendendo uma entrada do filtro de predição acoplada á saídado somador, uma saída do filtro de predição acoplada à segunda entrada do subtrator, assim como à segunda entrada do somador, assim como à entrada do coeficiente de predição acoplada à saída do coeficiente de predição; um gerador de sinal de informação (24) compreendendo uma primeira entrada acoplada à saída do limite de percepção, uma segunda entrada acoplada à saída do coeficiente de predição, uma terceira entrada acoplada à saída do estágio de clipagem e quantização e uma saída representando uma saída do codificador.
48. Decodificador para a decodif icação de umsinal de informação codificada caracterizado pelo fato de que compreende informações sobre uma representação de um limite de psicopercepção motivada, coeficientes de predição e um erro de predição quantizado, em um sinal de informação decodificado, compreendendo: uma entrada de decodificador; um extrator (214) compreendendo uma entrada acoplada à entrada do decodificador, uma saída do limite de percepção, uma saída do coeficiente de predição e uma saída do erro de predição quantizado; um dequantizador (206) compreendendo um número limitado e constante de níveis de quantização, uma entrada do dequantizador acoplada à saída do erro de predição quantizado, à saída do dequantizador e à entrada de controle do limite de quantização; um ajustador do limite de adaptação para trás, compreendendo uma entrada acoplada à saída do erro de predição quantizado, e uma saída acoplada à entrada de controle do limite quantizado; um somador (222) compreendendo uma primeira entrada de somador acoplada à saída do dequantizador, a uma segunda entrada do somador e a uma saída do somador; um filtro de predição (226) compreendendo uma entrada do filtro de precisãoacoplada à saída do somador, uma saída filtro de predição acoplada à segunda entrada, e uma entrada do coeficiente filtro de predição acoplada à saída do coeficiente de predição; e um pós-filtro adaptativo (232) compreendendo uma entrada do filtro de predição acoplada à saída do somador, uma saída do filtro de predição representando uma saída do decodificador, e uma entrada de controle de adaptação acoplada à saída do limite de percepção.
BRPI0709450A 2006-05-12 2007-02-28 codificação de sinal de informação BRPI0709450B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102006022346A DE102006022346B4 (de) 2006-05-12 2006-05-12 Informationssignalcodierung
DE1020060223462 2006-05-12
PCT/EP2007/001730 WO2007131564A1 (de) 2006-05-12 2007-02-28 Informationssignalcodierung

Publications (3)

Publication Number Publication Date
BRPI0709450A2 true BRPI0709450A2 (pt) 2011-07-12
BRPI0709450A8 BRPI0709450A8 (pt) 2019-01-08
BRPI0709450B1 BRPI0709450B1 (pt) 2020-02-04

Family

ID=38080073

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0709450A BRPI0709450B1 (pt) 2006-05-12 2007-02-28 codificação de sinal de informação

Country Status (19)

Country Link
US (2) US9754601B2 (pt)
EP (1) EP2022043B1 (pt)
JP (1) JP5297373B2 (pt)
KR (1) KR100986924B1 (pt)
CN (1) CN101443842B (pt)
AT (1) ATE542217T1 (pt)
AU (1) AU2007250308B2 (pt)
BR (1) BRPI0709450B1 (pt)
CA (1) CA2651745C (pt)
DE (1) DE102006022346B4 (pt)
ES (1) ES2380591T3 (pt)
HK (1) HK1121569A1 (pt)
IL (1) IL193784A (pt)
MX (1) MX2008014222A (pt)
MY (1) MY143314A (pt)
NO (1) NO340674B1 (pt)
PL (1) PL2022043T3 (pt)
RU (1) RU2407145C2 (pt)
WO (1) WO2007131564A1 (pt)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101435411B1 (ko) * 2007-09-28 2014-08-28 삼성전자주식회사 심리 음향 모델의 마스킹 효과에 따라 적응적으로 양자화간격을 결정하는 방법과 이를 이용한 오디오 신호의부호화/복호화 방법 및 그 장치
WO2010028297A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
WO2010028292A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
WO2010028299A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
WO2010031003A1 (en) 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
US9774875B2 (en) * 2009-03-10 2017-09-26 Avago Technologies General Ip (Singapore) Pte. Ltd. Lossless and near-lossless image compression
CN101609680B (zh) * 2009-06-01 2012-01-04 华为技术有限公司 压缩编码和解码的方法、编码器和解码器以及编码装置
US8705623B2 (en) * 2009-10-02 2014-04-22 Texas Instruments Incorporated Line-based compression for digital image data
BR112012007803B1 (pt) * 2009-10-08 2022-03-15 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Decodificador de sinal de áudio multimodal, codificador de sinal de áudio multimodal e métodos usando uma configuração de ruído com base em codificação de previsão linear
EP2466580A1 (en) * 2010-12-14 2012-06-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Encoder and method for predictively encoding, decoder and method for decoding, system and method for predictively encoding and decoding and predictively encoded information signal
TWI603632B (zh) 2011-07-01 2017-10-21 杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
PL397008A1 (pl) * 2011-11-17 2013-05-27 Politechnika Poznanska Sposób kodowania obrazu
EP2791938B8 (en) * 2011-12-15 2016-05-04 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer programm for avoiding clipping artefacts
US9716901B2 (en) * 2012-05-23 2017-07-25 Google Inc. Quantization with distinct weighting of coherent and incoherent quantization error
EP2757558A1 (en) * 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
US9711156B2 (en) 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
US9620134B2 (en) 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US10614816B2 (en) 2013-10-11 2020-04-07 Qualcomm Incorporated Systems and methods of communicating redundant frame information
US9384746B2 (en) 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
US10163447B2 (en) 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
DE102014101307A1 (de) * 2014-02-03 2015-08-06 Osram Opto Semiconductors Gmbh Kodierverfahren zur Datenkompression von Leistungsspektren eines optoelektronischen Bauteils und Dekodierverfahren
EP2916319A1 (en) * 2014-03-07 2015-09-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding of information
EP2980795A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
US10756755B2 (en) 2016-05-10 2020-08-25 Immersion Networks, Inc. Adaptive audio codec system, method and article
US10699725B2 (en) 2016-05-10 2020-06-30 Immersion Networks, Inc. Adaptive audio encoder system, method and article
WO2017196833A1 (en) * 2016-05-10 2017-11-16 Immersion Services LLC Adaptive audio codec system, method, apparatus and medium
US10770088B2 (en) 2016-05-10 2020-09-08 Immersion Networks, Inc. Adaptive audio decoder system, method and article
US11281312B2 (en) 2018-01-08 2022-03-22 Immersion Networks, Inc. Methods and apparatuses for producing smooth representations of input motion in time and space
US11380343B2 (en) 2019-09-12 2022-07-05 Immersion Networks, Inc. Systems and methods for processing high frequency audio signal
CN112564713B (zh) * 2020-11-30 2023-09-19 福州大学 高效率低时延的动觉信号编解码器及编解码方法
US11935546B2 (en) * 2021-08-19 2024-03-19 Semiconductor Components Industries, Llc Transmission error robust ADPCM compressor with enhanced response
CN116193156A (zh) * 2022-12-30 2023-05-30 北京天兵科技有限公司 航天遥测码流地面传输分组压缩编码方法、装置和系统

Family Cites Families (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2481026B1 (pt) * 1980-04-21 1984-06-15 France Etat
DE3276651D1 (en) * 1982-11-26 1987-07-30 Ibm Speech signal coding method and apparatus
JPS60116000A (ja) 1983-11-28 1985-06-22 ケイディディ株式会社 音声符号化装置
GB8410044D0 (en) 1984-04-18 1984-05-31 Communications Patents Ltd Data transmission system
US4751736A (en) * 1985-01-31 1988-06-14 Communications Satellite Corporation Variable bit rate speech codec with backward-type prediction and quantization
US5125030A (en) * 1987-04-13 1992-06-23 Kokusai Denshin Denwa Co., Ltd. Speech signal coding/decoding system based on the type of speech signal
JPH02272500A (ja) * 1989-04-13 1990-11-07 Fujitsu Ltd コード駆動音声符号化方式
EP0401452B1 (en) * 1989-06-07 1994-03-23 International Business Machines Corporation Low-delay low-bit-rate speech coder
US5347478A (en) * 1991-06-09 1994-09-13 Yamaha Corporation Method of and device for compressing and reproducing waveform data
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
DK0799531T3 (da) * 1994-12-20 2000-07-10 Dolby Lab Licensing Corp Fremgangsmådeapparat til at anvende bølgeformsforudsigelse til underbånd af et kodningssystem, der vedrører sanseopfattelse
JP2842276B2 (ja) * 1995-02-24 1998-12-24 日本電気株式会社 広帯域信号符号化装置
US5699481A (en) * 1995-05-18 1997-12-16 Rockwell International Corporation Timing recovery scheme for packet speech in multiplexing environment of voice with data applications
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
US5710863A (en) * 1995-09-19 1998-01-20 Chen; Juin-Hwey Speech signal quantization using human auditory models in predictive coding systems
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5781888A (en) * 1996-01-16 1998-07-14 Lucent Technologies Inc. Perceptual noise shaping in the time domain via LPC prediction in the frequency domain
MX9708203A (es) * 1996-02-26 1997-12-31 At & T Corp Cuantificacion de señales vocales usando modelos de publico humano en sistemas de codificacion predictivas.
JP3357795B2 (ja) * 1996-08-16 2002-12-16 株式会社東芝 音声符号化方法および装置
GB2318029B (en) * 1996-10-01 2000-11-08 Nokia Mobile Phones Ltd Audio coding method and apparatus
FI114248B (fi) * 1997-03-14 2004-09-15 Nokia Corp Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen
JP3064947B2 (ja) * 1997-03-26 2000-07-12 日本電気株式会社 音声・楽音符号化及び復号化装置
JP3199020B2 (ja) * 1998-02-27 2001-08-13 日本電気株式会社 音声音楽信号の符号化装置および復号装置
GB2342829B (en) * 1998-10-13 2003-03-26 Nokia Mobile Phones Ltd Postfilter
RU2144222C1 (ru) 1998-12-30 2000-01-10 Гусихин Артур Владимирович Способ сжатия звуковой информации и система для его реализации
US6377915B1 (en) * 1999-03-17 2002-04-23 Yrp Advanced Mobile Communication Systems Research Laboratories Co., Ltd. Speech decoding using mix ratio table
TW536692B (en) 1999-04-16 2003-06-11 Dolby Lab Licensing Corp Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding
DE60035453T2 (de) * 1999-05-11 2008-03-20 Nippon Telegraph And Telephone Corp. Auswahl des Synthesefilters für eine CELP Kodierung von breitbandigen Audiosignalen
SE9903223L (sv) * 1999-09-09 2001-05-08 Ericsson Telefon Ab L M Förfarande och anordning i telekommunikationssystem
US6778953B1 (en) * 2000-06-02 2004-08-17 Agere Systems Inc. Method and apparatus for representing masked thresholds in a perceptual audio coder
US7110953B1 (en) * 2000-06-02 2006-09-19 Agere Systems Inc. Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
JP2002006895A (ja) * 2000-06-20 2002-01-11 Fujitsu Ltd ビット割当装置および方法
EP1944759B1 (en) * 2000-08-09 2010-10-20 Sony Corporation Voice data processing device and processing method
CA2418722C (en) * 2000-08-16 2012-02-07 Dolby Laboratories Licensing Corporation Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information
US7171355B1 (en) * 2000-10-25 2007-01-30 Broadcom Corporation Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
EP1339040B1 (en) * 2000-11-30 2009-01-07 Panasonic Corporation Vector quantizing device for lpc parameters
US6675148B2 (en) * 2001-01-05 2004-01-06 Digital Voice Systems, Inc. Lossless audio coder
WO2002082425A1 (en) * 2001-04-09 2002-10-17 Koninklijke Philips Electronics N.V. Adpcm speech coding system with specific step-size adaptation
US6950794B1 (en) * 2001-11-20 2005-09-27 Cirrus Logic, Inc. Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression
US7020603B2 (en) * 2002-02-07 2006-03-28 Intel Corporation Audio coding and transcoding using perceptual distortion templates
US7275036B2 (en) * 2002-04-18 2007-09-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data
WO2003102922A1 (en) * 2002-05-30 2003-12-11 Koninklijke Philips Electronics N.V. Audio coding
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
KR100480341B1 (ko) * 2003-03-13 2005-03-31 한국전자통신연구원 광대역 저전송률 음성 신호의 부호화기
CN1826634B (zh) * 2003-07-18 2010-12-01 皇家飞利浦电子股份有限公司 低比特率音频编码
CN1846253B (zh) * 2003-09-05 2010-06-16 皇家飞利浦电子股份有限公司 低比特率音频编码
CN1867969B (zh) * 2003-10-13 2010-06-16 皇家飞利浦电子股份有限公司 用于对音频信号进行编码或解码的方法和设备
US7324937B2 (en) * 2003-10-24 2008-01-29 Broadcom Corporation Method for packet loss and/or frame erasure concealment in a voice communication system
DE102004007191B3 (de) * 2004-02-13 2005-09-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
DE102004007200B3 (de) * 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
DE102004007184B3 (de) * 2004-02-13 2005-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Quantisieren eines Informationssignals
EP1758099A1 (en) * 2004-04-30 2007-02-28 Matsushita Electric Industrial Co., Ltd. Scalable decoder and expanded layer disappearance hiding method
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
KR101041895B1 (ko) * 2006-08-15 2011-06-16 브로드콤 코포레이션 패킷 손실 후 디코딩된 오디오 신호의 시간 워핑
US7756350B2 (en) * 2006-11-13 2010-07-13 Global Ip Solutions, Inc. Lossless encoding and decoding of digital data

Also Published As

Publication number Publication date
ES2380591T3 (es) 2012-05-16
ATE542217T1 (de) 2012-02-15
RU2008148961A (ru) 2010-06-20
US20180012608A1 (en) 2018-01-11
WO2007131564A1 (de) 2007-11-22
AU2007250308B2 (en) 2010-05-06
PL2022043T3 (pl) 2012-06-29
NO20084786L (no) 2008-12-11
MY143314A (en) 2011-04-15
MX2008014222A (es) 2008-11-14
HK1121569A1 (en) 2009-04-24
US20090254783A1 (en) 2009-10-08
JP5297373B2 (ja) 2013-09-25
US10446162B2 (en) 2019-10-15
KR100986924B1 (ko) 2010-10-08
IL193784A (en) 2014-01-30
DE102006022346B4 (de) 2008-02-28
DE102006022346A1 (de) 2007-11-15
KR20090007427A (ko) 2009-01-16
BRPI0709450A8 (pt) 2019-01-08
US9754601B2 (en) 2017-09-05
CA2651745C (en) 2013-12-24
BRPI0709450B1 (pt) 2020-02-04
NO340674B1 (no) 2017-05-29
CA2651745A1 (en) 2007-11-22
CN101443842B (zh) 2012-05-23
EP2022043B1 (de) 2012-01-18
CN101443842A (zh) 2009-05-27
EP2022043A1 (de) 2009-02-11
AU2007250308A1 (en) 2007-11-22
RU2407145C2 (ru) 2010-12-20
JP2009537033A (ja) 2009-10-22

Similar Documents

Publication Publication Date Title
BRPI0709450A2 (pt) codificação de sinal de informação
US9812136B2 (en) Audio processing system
KR101428487B1 (ko) 멀티 채널 부호화 및 복호화 방법 및 장치
US8290783B2 (en) Apparatus for mixing a plurality of input data streams
KR100991448B1 (ko) 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템
EP2378516B1 (en) Analysis filterbank, synthesis filterbank, encoder, decoder, mixer and conferencing system
US7693709B2 (en) Reordering coefficients for waveform coding or decoding
US7684981B2 (en) Prediction of spectral coefficients in waveform coding and decoding
NO341186B1 (no) Selektiv anvendelse ved bruk av flere entropimodeller i adaptiv koding og dekoding
KR20070098930A (ko) 근접-투명 또는 투명 멀티-채널 인코더/디코더 구성
TW201434035A (zh) 感知轉換音訊編碼中之雜訊塡充技術
KR100738109B1 (ko) 입력 신호의 양자화 및 역양자화 방법과 장치, 입력신호의부호화 및 복호화 방법과 장치
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
US20130197919A1 (en) &#34;method and device for determining a number of bits for encoding an audio signal&#34;
JPH0918348A (ja) 音響信号符号化装置及び音響信号復号装置
Li et al. Audio codingwith power spectral density preserving quantization
Virette Low Delay Transform for High Quality Low Delay Audio Coding
Abrahamsson Compression of multi channel audio at low bit rates using the AMR-WB+ codec

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B15K Others concerning applications: alteration of classification

Free format text: AS CLASSIFICACOES ANTERIORES ERAM: G10L 19/02 , G10L 19/06

Ipc: G10L 19/035 (2013.01), G10L 19/06 (2000.01)

B06T Formal requirements before examination [chapter 6.20 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 04/02/2020, OBSERVADAS AS CONDICOES LEGAIS.