BR122021008576B1 - Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo - Google Patents

Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo Download PDF

Info

Publication number
BR122021008576B1
BR122021008576B1 BR122021008576-5A BR122021008576A BR122021008576B1 BR 122021008576 B1 BR122021008576 B1 BR 122021008576B1 BR 122021008576 A BR122021008576 A BR 122021008576A BR 122021008576 B1 BR122021008576 B1 BR 122021008576B1
Authority
BR
Brazil
Prior art keywords
value
context
values
hash table
numeric
Prior art date
Application number
BR122021008576-5A
Other languages
English (en)
Inventor
Fuchs Guillaume
Multrus Markus
Rettelbach Nikolaus
Subbaraman Vignesh
Weiss Oliver
Gayer Marc
Warmbold Patrick
Griebel Christian
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V filed Critical Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V
Publication of BR122021008576B1 publication Critical patent/BR122021008576B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Error Detection And Correction (AREA)

Abstract

Um decodificador de áudio para prover uma informação de áudio decodificada com base em uma informação de áudio codificada compreende um decodificador aritmético para prover diversos valores espectrais decodificados com base em uma representação aritmeticamente codificada dos valores espectrais, e um conversor de domínio de frequência em domínio de tempo para prover uma representação de áudio de domínio de tempo utilizando os valores espectrais decodificados, para obter a informação de áudio decodificada. O decodificador aritmético é configurado para selecionar uma regra de mapeamento que descreve um mapeamento de um valor de código em um código de símbolo dependendo de um estado de contexto descrito por um valor de contexto corrente numérico.

Description

PEDIDO DIVIDIDO DO BR 11 2012 017256 5 DEPOSITADO EM 11/01/2011. CAMPO TÉCNICO
As realizações de acordo com a invenção estão relacionadas a um decodificador de áudio para prover uma informação de áudio decodificada com base em uma informação de áudio codificada, um codificador de áudio para prover uma informação de áudio codificada com base em uma informação de áudio de entrada, um método para prover uma informação de áudio decodificada com base em uma informação de áudio codificada, um método para prover uma informação de áudio codificada com base em uma informação de áudio de entrada e um programa de computador.
As realizações de acordo com a invenção estão relacionadas a uma codificação espectral sem ruído aprimorada, que pode ser utilizada em um codificador ou decodificador de áudio, como, por exemplo, um assim chamado codificador de fala e áudio unificado (USAC).
HISTÓRICO DA INVENÇÃO
A seguir, o histórico da invenção será explicado resumidamente a fim de facilitar a compreensão da invenção e suas vantagens. Durante a última década, grandes esforços foram envidados para criar a possibilidade de armazenar e distribuir digitalmente conteúdo de áudio boa eficiência da taxa de bits. Uma realização importante desta maneira é a definição da Norma Internacional ISO/IEC 14496-3. A Parte 3 desta Norma se refere a uma codificação e decodificação de conteúdo de áudio, e a subparte 4 da parte 3 se refere à codificação de áudio geral. A subparte 4 da ISO/IEC 14496 parte 3 define um conceito para codificação e decodificação de conteúdo de áudio geral. Além disso, outros aperfeiçoamentos foram propostos a fim de melhorar a qualidade e/ou reduzir a taxa de bits exigida.
De acordo com o conceito descrito na dita Norma, um sinal de áudio de domínio de tempo é convertido em uma representação de tempo-frequência. A transformação do domínio de tempo em domínio de tempo-frequência é geralmente realizada utilizando blocos de transformação, que também são denominados “quadros”, de amostras de domínio de tempo. Descobriu-se que é vantajoso utilizar quadros de sobreposição, que são mudados, por exemplo, por metade de um quadro, uma vez que a sobreposição permite evitar eficientemente (ou pelo menos reduzir) os artefatos. Ainda, descobriu-se que um janelamento deve ser realizado para evitar os artefatos originários deste processamento de quadros temporariamente limitados.
Pela transformação de uma parte em janela do sinal de áudio de entrada do domínio de tempo em domínio da frequência de tempo, uma compactação de energia é obtida em muitos casos, de modo que alguns dos valores espectrais compreendam uma magnitude significantemente maior que diversos outros valores espectrais. Assim, há, em muitos casos, um número comparavelmente pequeno de valores espectrais tendo uma magnitude, que está significantemente acima de uma magnitude média dos valores espectrais. Um exemplo típico de um domínio de tempo para transformação de domínio de frequência em domínio de tempo resultante em uma compactação de energia é chamada transformação de cosseno discreto modificado (MDCT).
Os valores espectrais são geralmente escalados e quantizados de acordo com um modelo psicoacústico, de modo que os erros de quantização sejam comparavelmente menores para valores espectrais psicoacusticamente mais importantes, e são comparavelmente maiores para valores espectrais psicoacusticamente menos importantes. Os valores espectrais escalados e quantizados são codificados para prover uma representação eficiente de taxa de bits destes.
Por exemplo, o uso da assim chamada codificação de Huffman de coeficientes espectrais quantizados é descrito no Padrão Internacional ISO/IEC 14496-3:2005(E), parte 3, subparte 4.
Entretanto, foi observado que a qualidade da codificação dos valores espectrais tem um impacto significativo na taxa de bits necessária. Ainda, foi observado que a complexidade de um decodificador de áudio, que é geralmente implementado em um dispositivo do consumidor portátil, e que deve ser então criado de forma barata e com baixo consumo de energia, é dependente da codificação utilizada na codificação dos valores espectrais.
Em vista desta situação, há uma necessidade de um conceito para codificar e decodificar um conteúdo de áudio, que provê uma mudança melhorada entre eficiência da taxa de bits e eficiência do recurso.
SUMÁRIO DA INVENÇÃO
Uma realização, de acordo com a invenção, cria um decodificador de áudio para prover uma informação de áudio decodificada com base em uma informação de áudio codificada. O decodificador de áudio compreende um decodificador aritmético para prover diversos valores espectrais decodificados com base em uma representação aritmeticamente codificada dos valores espectrais. O decodificador de áudio também compreende um conversor de domínio de frequência em domínio de tempo para prover uma representação de áudio de domínio de tempo que utiliza os valores espectrais decodificados, a fim de obter a informação de áudio decodificada. O decodificador aritmético é configurado para selecionar uma regra de mapeamento que descreve um mapeamento de um valor de código em um código de símbolo (cujo código de símbolo tipicamente descreve um valor espectral ou diversos valores espectrais ou um plano de bits mais significativo de um valor espectral ou de diversos valores espectrais) dependendo de um estado de contexto descrito por um valor de contexto corrente numérico. O decodificador aritmético é configurado para determinar o valor de contexto corrente numérico dependendo de diversos valores espectrais previamente decodificados. O decodificador aritmético é ainda configurado para avaliar a tabela hash, cujas entradas definem ambos, os valores de estado significativos entre os valores de contexto numéricos e limites de intervalos de valores de contexto numéricos, a fim de selecionar a regra de mapeamento. Um valor de índice de regra de mapeamento está individualmente associado a um valor de contexto numérico sendo um valor de estado significativo. Um valor de índice de regra de mapeamento comum está associado a diferentes valores de contexto numéricos dentro de um intervalo delimitado por limites de intervalo (em que os limites de intervalo são descritos pelas entradas da tabela hash).
Esta realização, de acordo com a invenção, tem como base a observação que uma eficiência computacional ao mapear um valor de contexto corrente numérico em um valor de índice de regra de mapeamento pode ser melhorada sobre as soluções convencionais utilizando uma única tabela hash, cujas entradas definem tanto os valores de estado significativos entre os valores numéricos de contexto e limites de intervalos dos valores de contexto numéricos. Assim, uma pesquisa de tabela através de uma única tabela é suficiente para mapear um número comparavelmente grande de possíveis valores do valor de contexto corrente numérico em um número comparavelmente pequeno de diferentes valores de índice de regra de mapeamento. Associar um significado duplo como as entradas da tabela hash, e preferivelmente a uma única entrada da tabela hash, permite manter o número pequeno de acessos á tabela, que, por sua vez, reduz os recursos computacionais necessários para a seleção da regra de mapeamento. Além disso, foi observado que o uso das entradas da tabela hash que definem tanto os valores numéricos de estado significativos entre os valores de contexto numéricos como limites de intervalos de valores dos valores de contexto numéricos é tipicamente bem adaptado a um mapeamento de contexto eficiente, pois tipicamente há intervalos de valores de contexto numéricos comparavelmente grandes, nos quais um valor de índice de regra de mapeamento comum deve ser usado, em que tais intervalos de valores de contexto numéricos são tipicamente separados pelos valores de estado significativos do valor de contexto numérico. Entretanto, foi observado que o conceito inventivo, no qual as entradas da tabela hash definem tanto os valores de estado significativos como os limites de intervalos dos valores de contexto numéricos como bem adequados nestes casos onde dois intervalos de valores de contexto numéricos, cujos diferentes valores de índice de regra de mapeamento estão associados, são diretamente adjacentes sem um valor de estado significativo entre eles.
Para resumir, o uso da tabela hash, cujas entradas definem tanto valores numéricos de estado significativos entre os valores de contexto numéricos como limites de intervalos de valores dos valores de contexto numéricos, provê uma boa troca entre a eficiência de codificação, complexidade computacional e demanda de memória.
Em uma realização preferida, o decodificador aritmético é configurado para comparar o valor de contexto corrente numérico, ou uma versão escalada do valor de contexto corrente numérico, com diversas entradas numericamente ordenadas da tabela hash para obter um valor do índice da tabela hash de uma entrada da tabela hash, de modo que o valor de contexto corrente numérico dentro de um intervalo definido pela entrada de tabela hash designada pelo valor do índice da tabela hash obtido e uma entrada da tabela hash adjacente. O decodificador aritmético é preferivelmente configurado para determinar se o valor de contexto corrente numérico compreende um valor definido por uma entrada da tabela hash designada pelo valor do índice da tabela hash obtido, e para seletivamente prover, dependendo de um resultado da determinação, um valor de índice de regra de mapeamento individualmente associado a um valor de contexto (corrente) numérico definido pela entrada da tabela hash designada pelo valor do índice da tabela hash obtido, ou um valor de índice de regra de mapeamento designada pelo valor do índice da tabela hash obtido e associado a diferentes valores de contexto (corrente) numéricos dentro de um intervalo delimitado, em um lado, por um valor de estado (também designado como o valor de contexto) definido pela entrada da tabela hash designada pelo valor do índice da tabela hash obtido. Assim, as entradas da tabela hash podem definir tanto os valores de estado significativos (também designados como valores de contexto significativos) como os intervalos do valor de contexto (corrente) numérico. Uma decisão final, se um valor de contexto corrente numérico for um valor de estado significativo ou permanecer dentro de um intervalo de valores de estado, no qual um valor de índice de regra de mapeamento comum é associado, é tomada comparando o valor de contexto corrente numérico com o valor de estado representado pela entrada da tabela hash finalmente obtida. Assim, um mecanismo eficiente é criado para fazer uso do significado duplo das entradas da tabela hash.
Em uma realização preferida, o decodificador aritmético é configurado para determinar, utilizando a tabela hash, se o valor de contexto corrente numérico for igual a um valor de estado do limite de intervalo (que é tipicamente, mas não necessariamente, um valor de estado significativo) definido por uma entrada da tabela hash, ou dentro de um intervalo definido por duas entradas da tabela hash (preferivelmente adjacentes). Assim, o decodificador aritmético é preferivelmente configurado para prover um valor de índice de regra de mapeamento associado a uma entrada da tabela hash, caso seja descoberto que o valor de contexto corrente numérico é igual a um valor de estado do limite de intervalo, e para prover um valor de índice de regra de mapeamento associado a um intervalo entre valores de estado definido por duas entradas adjacentes da tabela hash, caso seja descoberto que o valor de contexto corrente numérico permanece dentro de um intervalo entre os valores de estado limite definidos por duas entradas adjacentes da tabela hash. O decodificador aritmético é ainda configurado para selecionar a tabela de frequências cumulativas para o decodificador aritmético dependendo do valor de índice de regra de mapeamento. Assim, o decodificador aritmético é configurado para prover um valor de índice de regra de mapeamento “dedicado” para um valor de contexto corrente numérico que é igual a um valor de estado do limite de intervalo, enquanto provê um valor de índice de regra de mapeamento “relacionado ao intervalo”. Assim, é possível lidar com ambos os estados significativos e transições entre dois intervalos que utilizam um mecanismo computacionalmente comum e eficiente.
Em uma realização preferida, um valor de índice de regra de mapeamento associado à primeira entrada determinada da tabela hash é diferente de um valor de índice de regra de mapeamento associado a um primeiro intervalo de valores de contexto numéricos, cujo limite superior é definido pela primeira entrada determinada da tabela hash, e também diferente de um valor de índice de regra de mapeamento associado a um segundo intervalo dos valores de contexto numéricos, cujo limite inferior é definido pela primeira entrada determinada da tabela hash, de modo que a primeira entrada determinada da tabela hash defina, por um único valor, limites de dois intervalos de valores de contexto (corrente) numéricos e um estado significante do valor de contexto (corrente) numérico. Neste caso, o primeiro intervalo é delimitado pelo valor de estado definido pela primeira entrada determinada da tabela hash, em que o valor de estado definido pela primeira entrada determinada da tabela hash não pertence ao primeiro intervalo. De forma semelhante, o segundo intervalo é delimitado pelo valor de estado definido pela primeira entrada determinada da tabela hash, em que o valor de estado definido pela primeira entrada determinada da tabela hash não pertence ao segundo intervalo. Além disso, deve ser observado que usando este mecanismo é possível associar “individualmente” um valor da regra do índice de mapeamento “dedicado” a um único estado de contexto corrente numérico, que está numericamente entre o valor de estado mais alto (também designado como valor de contexto) do primeiro intervalo e o valor de estado mais baixo (também designado como o valor de contexto) do segundo intervalo (em que há tipicamente um número inteiro entre o valor numérico mais alto do primeiro intervalo e o valor numérico mais baixo do segundo intervalo, a saber, o número definido pela primeira entrada determinada da tabela hash. Assim, os valores de contexto corrente numérico particularmente característicos podem ser mapeados em um valor de índice de regra de mapeamento individualmente associado, enquanto outros valores de contexto corrente numérico menos característicos podem ser mapeados aos valores de índice de regra de mapeamento associados em uma base de intervalo.
Em uma realização preferida, o valor de índice de regra de mapeamento associado ao primeiro intervalo de valores de contexto é igual ao valor de índice de regra de mapeamento associado ao segundo intervalo de valores de contexto, de modo que a primeira entrada determinada da tabela hash defina um valor de estado significativo isolado dentro de um ambiente bilateral de valores de estado não-significativos. Em outras palavras, é possível mapear um valor de contexto corrente numérico particularmente característico a um valor de índice de regra de mapeamento associado, enquanto os valores de contexto corrente numérico adjacentes em ambos os lados dos ditos valores de contexto corrente numérico particularmente característicos são mapeados para um valor de índice de regra de mapeamento comum, que é diferente do valor de índice de regra de mapeamento associado ao valor de contexto corrente numérico particularmente característico.
Em uma realização preferida, um valor de índice de regra de mapeamento associado a uma segunda entrada determinada da tabela hash é idêntico a um valor de índice de regra de mapeamento associado a um terceiro intervalo de valores de contexto, cujo limite é definido pela segunda entrada determinada da tabela hash, e diferente de um valor de índice de regra de mapeamento associado a um quarto intervalo de valores de contexto, cujo limite é definido pela segunda entrada determinada da tabela hash, de modo que a segunda entrada determinada da tabela hash defina um limite entre dois intervalos dos valores de contexto corrente numérico sem definir um estado significante dos valores de contexto numéricos. Assim, o conceito, de acordo com a presente invenção, também permite definir os intervalos adjacentes de valores de contexto (corrente) numéricos, nos quais diferentes valores de índice de regra de mapeamento estão associados, sem a presença de um estado significante entre eles. Isto pode ser obtido utilizando um mecanismo relativamente simples e eficiente.
Em uma realização preferida, o decodificador aritmético é configurado para avaliar uma única tabela hash, cujas entradas numericamente ordenadas definem tanto valores numéricos de estado significativos entre os valores de contexto numéricos como limites de intervalos de valores dos valores de contexto numéricos, para obter um valor do índice da tabela hash que designa um intervalo, fora dos intervalos definidos pelas entradas da tabela hash, na qual o valor de contexto corrente numérico permanece, e para subsequentemente determinar, utilizando a entrada de tabela designada pelo valor do índice da tabela hash obtido, se o valor de contexto corrente numérico assume um valor de estado significativo ou um valor de estado não-significativo. Utilizando tal conceito, uma complexidade de cálculos que são realizados de forma iterativa pode ser mantida razoavelmente pequena, de modo que diversas entradas numericamente ordenadas da tabela hash possam ser avaliadas com baixo efeito computacional. Somente em uma etapa final, que pode ser realizada somente uma vez por valor de contexto corrente numérico, a decisão pode ser tomada se o valor de contexto corrente numérico assumir um valor de estado significativo ou um valor de estado não-significativo.
Em uma realização preferida, o decodificador aritmético é configurado para seletivamente avaliar a tabela de mapeamento, que mapeia os valores de índice de intervalo em valores de índice de regra de mapeamento, caso seja descoberto que o valor de contexto corrente numérico não assume um valor de estado significativo, para obter um valor de índice de regra de mapeamento associado a um intervalo de valores de estado não- significativos (também designados como valores de contexto não- significativos) dentro do qual o valor de contexto corrente numérico permanece. Assim, um mecanismo de forma computacional eficiente é criado para obter um valor de índice de regra de mapeamento para um intervalo de valores de contexto corrente numérico definido pelas entradas da tabela hash.
Em uma realização preferida, as entradas da tabela hash são numericamente ordenadas, e o decodificador aritmético é configurado para avaliar uma sequência de entradas da tabela hash, para obter um valor do índice da tabela hash de resultado de uma entrada da tabela hash, de modo que o valor de contexto corrente numérico dentro de um intervalo definido pela entrada da tabela hash designada pelo valor do índice da tabela hash de resultado obtido e uma entrada da tabela hash adjacente.
Neste caso, o decodificador aritmético é configurado para realizer um número predeterminado de iterações para iterativamente determinar o valor do índice da tabela hash de resultado. Cada iteração compreende somente uma única comparação entre um valor de estado representado por uma entrada corrente da tabela hash e um valor de estado representado pelo valor de contexto corrente numérico, e uma atualização seletiva de um valor corrente do índice da tabela hash dependendo de um resultado da dita comparação única. Assim, uma baixa complexidade computacional para avaliar a tabela hash e para identificar um valor de índice de regra de mapeamento é obtida.
Em uma realização preferida, o decodificador aritmético é configurado para fazer uma distinção entre um valor de contexto corrente numérico que compreende um valor de estado significativo, e um valor de contexto corrente numérico que compreende um valor de estado não-significativo, somente depois da execução do número predeterminado de iterações. Fazendo isso, a complexidade computacional é reduzida, pois a avaliação realizada em cada uma das iterações é mantida simples.
Outra realização, de acordo com a invenção, se refere a um codificador de áudio para prover informação de áudio codificada com base em uma informação de áudio de entrada. O codificador de áudio compreende um conversor de domínio de tempo em domínio de frequência com compactação de energia para prover uma representação de áudio de domínio de frequência com base em uma representação de domínio de tempo da informação de áudio de entrada, de modo que a representação de áudio de domínio de frequência compreenda um conjunto de valores espectrais. O codificador de áudio também compreende um codificador aritmético configurado para codificar um valor espectral, ou uma versão pré- processada deste, ou - equivalentemente - diversos valores espectrais ou uma versão pré-processada deste, que utiliza uma senha de comprimento variável. O codificador aritmético é configurado para mapear um valor espectral, ou um valor de um plano de bits mais significativo de um valor espectral (ou, equivalentemente, diversos valores espectrais, ou um valor de um plano de bits mais significativo de diversos valores espectrais) em um valor de código. O codificador aritmético é configurado para selecionar uma regra de mapeamento que descreve um mapeamento de um valor espectral, ou de um plano de bits mais significativo de um valor espectral, em um valor de código, dependendo de um estado de contexto descrito por um valor de contexto corrente numérico. O codificador aritmético é configurado para determinar o valor de contexto corrente numérico dependendo de diversos valores espectrais previamente codificados. O codificador aritmético é configurado para avaliar a tabela hash, cujas entradas definem tanto valores numéricos de estado significativos entre os valores de contexto numéricos como limites de intervalos de valores dos valores de contexto numéricos, em que um valor de índice de regra de mapeamento está individualmente associado a um valor de contexto (corrente) numérico sendo um valor de estado significativo, e em que um valor de índice de regra de mapeamento comum está associado a diferentes valores de contexto (corrente) numéricos dentro de um intervalo delimitado pelos limites de intervalo (em que os limites de intervalo são descritos pelas entradas da tabela hash).
Este codificador de áudio tem como base as mesmas observações que o decodificador de áudio discutido acima e pode ser suplementado pelas mesmas características e funcionalidades que o decodificador de áudio descrito acima, em que os valores espectrais codificados ficam no lugar dos valores espectrais decodificados. Em particular, o cálculo do valor de índice de regra de mapeamento pode ser feito da mesma forma que no codificador de áudio.
Uma realização, de acordo com a invenção, cria um método para prover uma informação de áudio decodificada com base em uma informação de áudio codificada. O método compreende prover diversos valores espectrais decodificados com base em uma representação aritmeticamente codificada dos valores espectrais e prover uma representação de áudio de domínio de tempo que utiliza os valores espectrais decodificados, a fim de obter a informação de áudio decodificada. Prover diversos valores espectrais decodificados compreende selecionar uma regra de mapeamento que descreve um mapeamento de um valor de código que representa um valor espectral ou um plano de bits mais significativo de um valor espectral (ou, equivalentemente, diversos valores espectrais, ou um plano de bits mais significativo de diversos valores espectrais), em uma forma codificada em um código de símbolo que representa um valor espectral, ou um plano de bits mais significativo de um valor espectral (ou, equivalentemente, diversos valores espectrais, ou um plano de bits mais significativo de diversos valores espectrais), em uma forma decodificada, dependendo de um estado de contexto descrito por um valor de contexto corrente numérico. O valor de contexto corrente numérico é determinado dependendo de diversos valores espectrais previamente decodificados. A tabela hash, cujas entradas definem tanto valores numéricos de estado significativos entre os valores de contexto numéricos como limites de intervalos de valores dos valores de contexto numéricos, é avaliada. Um valor de índice de regra de mapeamento está individualmente associado a um valor de contexto corrente numérico sendo um valor de estado significativo, e um valor de índice de regra de mapeamento comum está associado a um valor de contexto corrente numérico dentro de um intervalo delimitado por limites de intervalo (em que os limites de intervalo são descritos pelas entradas da tabela hash).
Uma realização, de acordo com a invenção, cria um método para prover uma informação de áudio codificada com base em uma informação de áudio de entrada. O método compreende a provisão de uma representação de áudio de domínio de frequência com base em uma representação de domínio de tempo da informação de áudio de entrada que utiliza uma conversão de domínio de tempo em domínio de frequência com compactação de energia, de modo que a representação do áudio de domínio de frequência compreenda um conjunto de valores espectrais. O método também compreende codificar aritmeticamente um valor espectral, ou uma versão pré-processada deste, que utiliza uma senha de comprimento variável, em que um valor espectral ou um valor de um plano de bits mais significativo de um valor espectral (ou, equivalentemente, diversos valores espectrais, ou um plano de bits mais significativo de diversos valores espectrais) é mapeado em um valor de código. Uma regra de mapeamento que descreve um mapeamento de um valor espectral ou de um plano de bits mais significativo de um valor espectral (ou, equivalentemente, diversos valores espectrais, ou um plano de bits mais significativo de diversos valores espectrais) em um valor de código é selecionada dependendo de um estado de contexto descrito por um valor de contexto corrente numérico. O valor de contexto corrente numérico é determinado dependendo de diversos valores espectrais adjacentes previamente codificados. A tabela hash, cujas entradas definem tanto valores numéricos de estado significativos entre os valores de contexto numéricos como limites de intervalos de valores dos valores de contexto numéricos, é avaliada, em que um valor de índice de regra de mapeamento está individualmente associado a um valor de contexto (corrente) numérico sendo um valor de estado significativo, e em que um valor de índice de regra de mapeamento comum está associado a diferentes valores de contexto (corrente) numéricos dentro de um intervalo delimitado por limites de intervalo.
Outra realização, de acordo com a invenção, se refere a um programa de computador para realizar um dos ditos métodos.
BREVE DESCRIÇÃO DAS FIGURAS
As realizações, de acordo com a presente invenção, serão subsequentemente descritas tendo referência às figuras anexas, nas quais:
A figura 1 mostra um diagrama em blocos esquemático de um codificador de áudio, de acordo com uma realização da invenção;
A figura 2 mostra um diagrama em blocos esquemático de um decodificador de áudio, de acordo com uma realização da invenção;
A figura 3 mostra uma representação em código do pseudo-programa de um algoritmo “values_decode()” de decodificação valores espectrais;
A figura 4 mostra uma representação esquemática de um contexto para um cálculo de estado;
A figura 5a mostra uma representação em código do pseudo-programa de um algoritmo “arith_map_context()” para mapeamento de um contexto;
A figura 5b mostra uma representação em código do pseudo-programa de outro algoritmo “arith_map_context()” para mapeamento de um contexto;
A figura 5c mostra uma representação em código do pseudo-programa de um algoritmo “arith_get_context()” para obter um valor de estado de contexto;
A figura 5d mostra uma representação em código do pseudo-programa de outro algoritmo “arith_get_context()” para obter um valor de estado de contexto;
A figura 5e mostra uma representação em código do pseudo-programa de um algoritmo “arith_get_pk()” para derivar um valor do índice da tabela de frequências cumulativas “pki” de um valor de estado (ou uma variável de estado);
A figura 5f mostra uma representação em código do pseudo-programa de outro algoritmo “arith_get_pk()” para derivar um valor do índice da tabela de frequências cumulativas “pki” de um valor de estado (ou uma variável de estado);
A figura 5g mostra uma representação em código do pseudo-programa de um algoritmo “arith_decode()” para aritmeticamente decodificar um símbolo de uma senha de comprimento variável;
A figura 5h mostra uma primeira parte de uma representação em código do pseudo-programa de outro algoritmo “arith_decode()” para aritmeticamente decodificar um símbolo de uma senha de comprimento variável;
A figura 5i mostra uma segunda parte de uma representação em código do pseudo-programa de outro algoritmo “arith_decode()” para aritmeticamente decodificar um símbolo de uma senha de comprimento variável;
A figura 5j mostra uma representação em código do pseudo-programa de um algoritmo para derivar valores absolutos a,b de valores espectrais de um valor comum m;
A figura 5k mostra uma representação em código do pseudo-programa de um algoritmo para inserir os valores decodificados a,b em uma matriz de valores espectrais decodificados;
A figura 5l mostra uma representação em código do pseudo-programa de um algoritmo “arith_update_context()” para obter um valor de sub-região de contexto com base em valores absolutos a,b de valores espectrais decodificados;
A figura 5m mostra uma representação em código do pseudo-programa de um algoritmo “arith_finish()” para preencher as entradas de uma matriz de valores espectrais decodificados e uma matriz de valores de sub-região de contexto;
A figura 5n mostra uma representação em código do pseudo-programa de outro algoritmo para derivar valores absolutos a,b de valores espectrais decodificados de um valor comum m;
A figura 5o mostra uma representação em código do pseudo-programa de um algoritmo “arith_update_context()” para atualizar uma matriz de valores espectrais decodificados e uma matriz de valores de sub-região de contexto;
A figura 5p mostra uma representação em código do pseudo-programa de um algoritmo “arith_save_context()” para preencher entradas de uma matriz de valores espectrais decodificados e entradas de uma matriz de valores de sub-região de contexto;
A figura 5q mostra uma legenda das definições;
A figura 5r mostra outra legenda das definições;
A figura 6a mostra uma representação de sintaxe de um bloco de dados brutos da codificação de áudio e voz unificada (USAC);
A figura 6b mostra uma representação de sintaxe de um único elemento de canal;
A figura 6c mostra uma representação de sintaxe de um elemento do par de canal;
A figura 6d mostra uma representação de sintaxe de uma informação de controle “ICS”;
A figura 6e mostra uma representação de sintaxe de um fluxo de canal de domínio de frequência;
A figura 6f mostra uma representação de sintaxe de dados espectrais aritmeticamente codificados;
A figura 6g mostra uma representação de sintaxe de decodificação de um conjunto de valores espectrais;
A figura 6h mostra outra representação de sintaxe de decodificação de um conjunto de valores espectrais;
A figura 6i mostra uma legenda dos elementos de dados e variáveis;
A figura 6j mostra outra legenda de elementos de dados e variáveis;
A figura 7 mostra um diagrama em blocos esquemático de um codificador de áudio, de acordo com o primeiro aspecto da invenção;
A figura 8 mostra um diagrama em blocos esquemático de um decodificador de áudio, de acordo com o primeiro aspecto da invenção;
A figura 9 mostra uma representação gráfica de um mapeamento de um valor de contexto corrente numérico em um valor de índice de regra de mapeamento, de acordo com o primeiro aspecto da invenção;
A figura 10 mostra um diagrama em blocos esquemático de um codificador de áudio, de acordo com um segundo aspecto da invenção;
A figura 11 mostra um diagrama em blocos esquemático de um decodificador de áudio, de acordo com o segundo aspecto da invenção;
A figura 12 mostra um diagrama em blocos esquemático de um codificador de áudio, de acordo com um terceiro aspecto da invenção;
A figura 13 mostra um diagrama em blocos esquemático de um decodificador de áudio, de acordo com o terceiro aspecto da invenção;
A figura 14a mostra uma representação esquemática de um contexto para um cálculo de estado, como é utilizado de acordo com o projeto de trabalho 4 do Padrão de Projeto do Padrão de Projeto USAC;
A figura 14b mostra uma visão geral das tabelas conforme utilizadas no esquema de codificação aritmético de acordo com o projeto de trabalho 4 do Padrão de Projeto USAC;
A figura 15a mostra uma representação esquemática de um contexto para um cálculo de estado, como é utilizado nas realizações de acordo com a invenção;
A figura 15b mostra uma visão geral das tabelas conforme utilizadas no esquema de codificação aritmético de acordo com a presente invenção;
A figura 16a mostra uma representação gráfica de uma demanda de memória para somente leitura para o esquema de codificação silenciosa, de acordo com a presente invenção, e de acordo com o projeto de trabalho 5 do Padrão de Projeto USAC e de acordo com a Codificação de Huffman AAC (codificação de áudio avançado);
A figura 16b mostra uma representação gráfica de uma demanda de memória para somente leitura de dados do decodificador USAC total, de acordo com a presente invenção, e de acordo com o conceito de acordo com o projeto de trabalho 5 do Padrão de Projeto USAC;
A figura 17 mostra uma representação esquemática de uma disposição para uma comparação de uma codificação silenciosa de acordo com o projeto de trabalho 3 ou projeto de trabalho 5 do Padrão de Projeto USAC com um esquema de codificação de acordo com a presente invenção;
A figura 18 mostra uma representação em tabela das taxas de bits médios produzidos por um codificador aritmético de USAC de acordo com o projeto de trabalho 3 do Padrão de Projeto USAC e de acordo com uma realização da presente invenção;
A figura 19 mostra uma representação em tabela de níveis mínimo e máximo do reservatório de bits para um decodificador aritmético de acordo com o projeto de trabalho 3 do Padrão de Projeto USAC e para um decodificador aritmético de acordo com uma realização da presente invenção;
A figura 20 mostra uma representação em tabela dos números da complexidade média de decodificação de um fluxo de bits 32-kbits de acordo com o projeto de trabalho 3 do Padrão de Projeto USAC para diferentes versões do codificador aritmético;
A figuras 21(1) e 21(2) mostram uma representação em tabela de um conteúdo da tabela “ari_lookup_m[600]”;
As figuras 22(1) a 22(4) mostram uma representação em tabela de um conteúdo da tabela “ari_hash_m[600] ”;
As figuras 23(1) a 23(7) mostram uma representação em tabela de um conteúdo da tabela “ari_cf_m[96][17]”; e
A figura 24 mostra uma representação em tabela de um conteúdo da tabela “ari_cf_r[]”.
DESCRIÇÃO DETALHADA DAS REALIZAÇÕES 1. Codificador de áudio de acordo com a figura 7
A figura 7 mostra um diagrama em blocos esquemático de um codificador de áudio, de acordo com uma realização da invenção. O codificador de áudio 700 é configurado para receber uma informação de áudio de entrada 710 e prover, com base neste, uma informação de áudio codificada 712. O codificador de áudio compreende um conversor de domínio de tempo em domínio de frequência com compactação de energia 720 que é configurado para prover uma representação de áudio de domínio de frequência 722 com base em uma representação de domínio de tempo da informação de áudio de entrada 710, de modo que a representação de áudio de domínio de frequência 722 compreenda um conjunto de valores espectrais. O codificador de áudio 700 também compreende um codificador aritmético 730 configurado para codificar um valor espectral (fora do conjunto de valores espectrais que forma a representação de áudio de domínio de frequência 722), ou uma versão pré-processada deste, que utiliza uma senha de comprimento variável a fim de obter a informação de áudio codificada 712 (que pode compreender, por exemplo, diversas senhas de comprimento variável).
O codificador aritmético 730 é configurado para mapear um valor espectral, ou um valor de um plano de bits mais significativo de um valor espectral, em um valor de código (ou seja, em uma senha de comprimento variável) dependendo de um estado de contexto. O codificador aritmético é configurado para selecionar uma regra de mapeamento que descreve um mapeamento de um valor espectral, ou de um plano de bits mais significativo de um valor espectral, em um valor de código, dependendo de um estado de contexto (corrente). O codificador aritmético é configurado para determinar o estado de contexto corrente, ou um valor de contexto corrente numérico que descreve o estado de contexto corrente, dependendo de diversos valores espectrais previamente codificados (preferivelmente, mas não necessariamente,adjacentes). Para esta finalidade, o codificador aritmético é configurado para avaliar a tabela hash, cujas entradas definem tanto valores numéricos de estado significativos entre os valores de contexto numéricos como limites de intervalos de valores de valores de contexto numéricos, em que um valor de índice de regra de mapeamento está individualmente associado a um valor de contexto (corrente) numérico sendo um valor de estado significativo, e em que um valor de índice de regra de mapeamento comum está associado a diferentes valores de contexto (corrente) numéricos encontrando-se dentro de um intervalo delimitado por limites de intervalo (em que os limites de intervalo são preferivelmente definidos pelas entradas da tabela hash).
Como pode ser visto, o mapeamento de um valor espectral (da representação de áudio de domínio de frequência 722), ou de um plano de bits mais significativo de um valor espectral, em um valor de código (da informação de áudio codificada 712), pode ser realizado por uma codificação do valor espectral 740 que utiliza uma regra de mapeamento 742. Um rastreador de estado 750 pode ser configurado para rastrear o estado de contexto. O rastreador de estado 750 provê uma informação 754 que descreve o estado de contexto corrente. A informação 754 que descreve o estado de contexto corrente pode preferivelmente tomar a forma de um valor de contexto corrente numérico. Um selecionador da regra de mapeamento 760 é configurado para selecionar uma regra de mapeamento, por exemplo, uma tabela de frequências cumulativas, que descreve um mapeamento de um valor espectral, ou de um plano de bits mais significativo de um valor espectral, em um valor de código. Assim, um selecionador da regra de mapeamento 760 provê a informação da regra de mapeamento 742 à codificação do valor espectral 740. A informação da regra de mapeamento 742 pode tomar a forma de um valor de índice de regra de mapeamento ou da tabela de frequências cumulativas selecionadas dependendo de um valor de índice de regra de mapeamento. O selecionador da regra de mapeamento 760 compreende (ou pelo menos avalia) a tabela hash 752, cujas entradas definem ambos os valores de estado significativos entre os valores de contexto numéricos e limites e intervalos de valores de contexto numéricos, em que um valor de índice de regra de mapeamento está individualmente associado a um valor de contexto numérico sendo um valor de estado significativo, e em que um valor de índice de regra de mapeamento comum está associado a diferentes valores de contexto numéricos encontrando-se dentro de um intervalo delimitado por limites de intervalo. A tabela hash 762 é avaliada a fim de selecionar a regra de mapeamento, ou seja, a fim de prover a informação da regra de mapeamento 742.
Para resumir o mencionado acima, o codificador de áudio 700 realiza uma codificação aritmética de uma representação de áudio de domínio de frequência provida pelo conversor de domínio de tempo em domínio de frequência. A codificação aritmética é dependente de contexto, de modo que uma regra de mapeamento (por exemplo, a tabela de frequências cumulativas) seja selecionada dependendo dos valores espectrais previamente codificados. Assim, os valores espectrais adjacentes em tempo e/ou frequência (ou, pelo menos, dentro de um ambiente predeterminado) um ao outro e/ou ao valor espectral atualmente codificado (ou seja, valores espectrais dentro de um ambiente predeterminado do valor espectral atualmente codificado) são considerados na codificação aritmética para ajustar a distribuição de probabilidade avaliada pela codificação aritmética. Ao selecionar uma regra de mapeamento apropriada, valores de contexto corrente numérico 754 providos por um rastreador de estado 750 são avaliados. Como tipicamente o número de diferentes regras de mapeamento é significantemente menor que o número de possíveis valores dos valores de contexto corrente numérico 754, o selecionador da regra de mapeamento 760 aloca as mesmas regras de mapeamento (descritas, por exemplo, por um valor de índice de regra de mapeamento) a um número comparavelmente grande de diferentes valores de contexto numéricos. Entretanto, há configurações espectrais tipicamente específicas (representadas por valores de contexto numéricos específicos) nos quais uma regra de mapeamento particular deve ser associada a fim de obter uma boa eficiência de codificação.
Foi observado que a seleção de uma regra de mapeamento dependendo de um valor de contexto corrente numérico pode ser realizada com alta eficiência computacional, particularmente, se as entradas de uma única tabela hash definem tanto os valores de estado significativos como os limites de intervalos de valores de contexto (corrente) numéricos. Foi observado que este mecanismo é bem adaptado às exigências da seleção da regra de mapeamento, pois há muitos casos onde um único valor de estado significativo (ou valor de contexto numérico significativo) é embutido entre um intervalo esquerdo de diversos valores de estado não-significativos (nos quais uma regra de mapeamento comum está associada) e um intervalo direito de diversos valores de estado não-significativos (nos quais uma regra de mapeamento comum está associada). Ainda, o mecanismo da utilização de uma única tabela hash, cujas entradas definem tanto os valores de estado significativos como os limites de intervalos de valores de contexto (corrente) numéricos podem eficientemente lidar com diferentes casos, onde, por exemplo, há dois intervalos de valores de estado não-significativos adjacentes (também designados como valores de contexto não-significativos numéricos) sem um valor de estado significativo entre eles. Uma eficiência computacional particularmente alta é obtida devido a um número de acessos da tabela sendo mantidos pequenos. Por exemplo, uma única pesquisa de tabela iterativa é suficiente na maioria das realizações a fim de descobrir se o valor de contexto corrente numérico é igual a qualquer um dos valores de estado significativos, ou em quais dos intervalos de valores de estado não-significativos o valor de contexto corrente numérico permanece. Consequentemente, o número de acessos da tabela que consomem tempo e energia pode ser mantido pequeno. Assim, o selecionador da regra de mapeamento 760,que utiliza a tabela hash 762, pode ser considerado como um selecionador da regra de mapeamento particularmente eficiente em termos de complexidade computacional, enquanto ainda permitem obter uma boa eficiência de codificação (em termos de taxa de bit).
Outros detalhes referentes à derivação da informação da regra de mapeamento 742 do valor de contexto corrente numérico 754 serão descritos abaixo.
2. Decodificador de áudio de acordo com a figura 8
A figura 8 mostra um diagrama em blocos esquemático de um decodificador de áudio 800. O decodificador de áudio 800 é configurado para receber uma informação de áudio codificada 810 e prover, com base neste, uma informação de áudio decodificada 812. O decodificador de áudio 800 compreende um decodificador aritmético 820 que é configurado para prover diversos valores espectrais 822 com base em uma representação aritmeticamente codificada 821 dos valores espectrais. O decodificador de áudio 800 também compreende um conversor de domínio de frequência em domínio de tempo 830 que é configurado para receber os valores espectrais decodificados 822 e prover a representação de áudio de domínio de tempo 812, que pode constituir a informação de áudio decodificada, que utiliza os valores espectrais decodificados 822, a fim de obter uma informação de áudio decodificada 812.
O decodificador aritmético 820 compreende um determinador do valor espectral 824, que é configurado para mapear um valor de código da representação aritmeticamente codificada 821 de valores espectrais em um código de símbolo que representa um ou mais dos valores espectrais decodificados, ou pelo menos uma parte (por exemplo, um plano de bits mais significativo) de um ou mais dos valores espectrais decodificados. O determinador do valor espectral 824 pode ser configurado para realizar um mapeamento dependendo de uma regra de mapeamento, que pode ser descrita por uma informação da regra de mapeamento 828a. A informação da regra de mapeamento 828a pode, por exemplo, tomar a forma de um valor de índice de regra de mapeamento, ou da tabela de frequências cumulativas selecionada (selecionada, por exemplo, dependendo de um valor de índice de regra de mapeamento).
O decodificador aritmético 820 é configurado para selecionar uma regra de mapeamento (por exemplo, a tabela de frequências cumulativas) que descreve um mapeamento de valores de código (descritos pela representação aritmeticamente codificada 821 de valores espectrais) em um código de símbolo (que descreve um ou mais valores espectrais, ou um plano de bits mais significativo deste) dependendo de um estado de contexto (que pode ser descrito pela informação do estado de contexto 826a). O decodificador aritmético 820 é configurado para determinar o estado de contexto corrente (descrito pelo valor de contexto corrente numérico) dependendo de diversos valores espectrais previamente decodificados. Para esta finalidade, um rastreador de estado 826 pode ser utilizado, que recebe uma informação que descreve os valores espectrais previamente decodificados e que provê, com base neste, um valor de contexto corrente numérico 826a que descreve o estado de contexto corrente.
O decodificador aritmético é também configurado para avaliar a tabela hash 829, cujas entradas definem tanto valores numéricos de estado significativos entre os valores de contexto numéricos como limites de intervalos de valores de contexto numéricos, a fim de selecionar a regra de mapeamento, em que um valor de índice de regra de mapeamento está individualmente associado a um valor de contexto numérico sendo um valor de estado significativo, e em que um valor de índice de regra de mapeamento comum está associado a diferentes valores de contexto numéricos encontrando-se dentro de um intervalo delimitado por limites de intervalo. A avaliação da tabela hash 829 pode, por exemplo, ser realizada utilizando um avaliador da tabela hash que pode ser parte do selecionador da regra de mapeamento 828. Assim, uma informação da regra de mapeamento 828a, por exemplo, na forma de um valor de índice de regra de mapeamento, é obtido com base no valor de contexto corrente numérico 826a que descreve o estado de contexto corrente. O selecionador da regra de mapeamento 828 pode, por exemplo, determinar o valor de índice de regra de mapeamento 828a dependendo de um resultado da avaliação da tabela hash 829. De modo alternativo, uma avaliação da tabela hash 829 pode prover diretamente o valor de índice de regra de mapeamento.
Referente à funcionalidade do decodificador de sinal de áudio 800, deve ser observado que o decodificador aritmético 820 é configurado para selecionar uma regra de mapeamento (por exemplo, a tabela de frequências cumulativas) que é, em média, bem adaptada aos valores espectrais a ser decodificados, conforme a regra de mapeamento é selecionada dependendo do estado de contexto corrente (descrito, por exemplo, pelo valor de contexto corrente numérico), que por sua vez é determinado dependendo dos diversos valores espectrais previamente decodificados. Assim, as dependências estatísticas entre os valores espectrais adjacentes a ser codificados podem ser explorados. Além disso, o decodificador aritmético 820 pode ser implementado eficientemente, com uma boa troca entre a complexidade computacional, tamanho da tabela, e eficiência da codificação, que utiliza o selecionador da regra de mapeamento 828. Pela avaliação de uma (única) tabela hash 829, nas entradas que descrevem ambos os valores de estado significativos e limites de intervalo dos intervalos de valores de estado não- significativos, uma única pesquisa de tabela iterativa pode ser suficiente a fim de derivar a informação da regra de mapeamento 828a do valor de contexto corrente numérico 826a. Assim, é possível mapear um número comparavelmente grande de diferentes possíveis valores de contexto (corrente) numéricos em um número comparavelmente pequeno de diferentes valores de índice de regra de mapeamento. Utilizando a tabela hash 829, conforme descrito acima, é possível explicar a observação que, em muitos casos, um único valor de estado significativo isolado (valor de contexto significativo) é incorporado entre um intervalo esquerdo de valores de estado não-significativos (valores de contexto não- significativos) e um intervalo direito de valores de estado não- significativos (valores de contexto não-significativos), em que um diferente valor de índice de regra de mapeamento é associado ao valor de estado significativo (valor de contexto significativo), quando comparado aos valores de estado (valores de contexto) do intervalo esquerdo e os valores de estado (valores de contexto) do intervalo direito. Entretanto, o uso da tabela hash 829 é também bem adequado para situações em que os dois intervalos de valores de estado numérico são imediatamente adjacentes, sem um valor de estado significativo entre eles.
Para concluir, o selecionador da regra de mapeamento 828, que avalia a tabela hash 829, traz consigo uma eficiência particularmente boa ao selecionar uma regra de mapeamento (ou ao prover um valor de índice de regra de mapeamento) dependendo do estado de contexto corrente (ou dependendo do valor de contexto corrente numérico que descreve o estado de contexto corrente), pois o mecanismo de hashing é bem adaptado aos típicos cenários do contexto em um decodificador de áudio.
Outros detalhes serão descritos abaixo.
3. Mecanismo de Hashing do Valor de Contexto de acordo com a figura 9
A seguir, um mecanismo de hashing de contexto será revelado, que pode ser implementado no selecionador da regra de mapeamento 760 e/ou no selecionador da regra de mapeamento 828.
A tabela hash 762 e/ou a tabela hash 829 podem ser utilizadas para implementar o dito valor de mecanismo de hashing de contexto.
Agora com referência à figura 9, que mostra um cenário de hashing do valor de contexto corrente numérico, outros detalhes serão descritos. Na representação gráfica da figura 9, uma abscissa 910 descreve valores do valor de contexto corrente numérico (ou seja, valores de contexto numéricos). Uma ordenada 912 descreve valores de índice de regra de mapeamento. As marcações 914 descrevem valores de índice de regra de mapeamento para valores de contexto não-significativos numéricos (que descrevem estados não-significativos). As marcações 916 descrevem os valores de índice de regra de mapeamento para valores de contexto significativos numéricos “individuais” (verdadeiros) que descrevem estados significativos individuais (verdadeiros). As marcações 916 descrevem valores de índice de regra de mapeamento para valores de contexto numéricos “impróprios” que descrevem estados significativos “impróprios”, em que um estado significativo “impróprio” é um estado significativo no qual o mesmo valor de índice de regra de mapeamento está associado a um dos intervalos de contexto adjacentes de contextos não- significativos numéricos.
Como pode ser visto, uma entrada da tabela hash “ari_hash_m[i1]” descreve um estado significativo individual (verdadeiro) tendo um valor de contexto numérico de c1. Como pode ser visto, o valor de índice de regra de mapeamento mriv1 está associado ao estado significativo individual (verdadeiro) tendo o valor de contexto numérico c1. Assim, o valor de contexto numérico c1 e o valor de índice de regra de mapeamento mriv1 podem ser descritos pela entrada da tabela hash “ari_hash_m[i1]”. Um intervalo 932 de valores de contexto numéricos é delimitado pelo valor de contexto numérico c1, em que o valor de contexto numérico c1 não pertence ao intervalo 932, de modo que o maior valor de contexto numérico de intervalo 932 seja igual a cl — 1. Um valor de índice de regra de mapeamento de mriv4 (que é diferente de mriv1) está associado aos valores de contexto numéricos do intervalo 932. O valor de índice de regra de mapeamento mriv4 pode, por exemplo, ser descrito pela entrada de tabela “ari_lookup_m[i1-1]” da tabela adicional “ari_lookup_m”.
Além disso, um valor de índice de regra de mapeamento mriv2 pode ser associado a valores de contexto numéricos encontrando-se dentro de um intervalo 934. Um limite inferior de intervalo 934 é determinado pelo valor de contexto numérico c1, que é um valor de contexto numérico significativo, em que o valor de contexto numérico c1 não pertence ao intervalo 932. Assim, o menor valor do intervalo 934 é igual a c1 + 1 (supondo os valores de número inteiro de contexto numérico). Outro limite do intervalo 934 é determinado pelo valor de contexto numérico c2, em que o valor de contexto numérico c2 não pertence ao intervalo 934, de modo que o maior valor do intervalo 934 seja igual a c2 - 1. O valor de contexto numérico c2 é um valor chamado valor de contexto numérico “impróprio”, que é descrito por uma entrada da tabela hash “ari_hash_m[i2]”. Por exemplo, o valor de índice de regra de mapeamento mriv2 pode ser associado ao valor de contexto numérico c2, de modo que o valor de contexto numérico associado ao valor de contexto numérico “impróprio” significativo c2 seja igual ao valor de índice de regra de mapeamento associado ao intervalo 934 delimitado pelo valor de contexto numérico c2. Além disso, um intervalo 936 de valor de contexto numérico é também delimitado pelo valor de contexto numérico c2, em que o valor de contexto numérico c2 não pertence ao intervalo 936, de modo que o menor valor de contexto numérico do intervalo 936 seja igual a c2 + 1. Um valor de índice de regra de mapeamento mriv3, que é tipicamente diferente do valor de índice de regra de mapeamento mriv2, é associado aos valores de contexto numéricos do intervalo 936.
Como pode ser visto, o valor de índice de regra de mapeamento mriv4, que está associado ao intervalo 932 de valores de contexto numéricos, pode ser descrito por uma entrada “ari_lookup_m[i1-1]” da tabela “ari_lookup_m”, o índice da regra de mapeamento mriv2, que é associado aos valores de contexto numéricos do intervalo 934, pode ser descrito por uma entrada de tabela “ari_lookup_m[i1]” da tabela “ari_lookup_m”, e o valor de índice de regra de mapeamento mriv3 pode ser descrito por uma entrada de tabela “ari_lookup_m[i2]” da tabela “ari_lookup_m”. No exemplo dado aqui, o valor do índice da tabela hash i2, pode ser maior, em 1, que o valor do índice da tabela hash i1.
Como pode ser visto da figura 9, o selecionador da regra de mapeamento 760 ou o selecionador da regra de mapeamento 828 pode receber um valor de contexto corrente numérico 764, 826a, e decidir, avaliando as entradas da tabela “ari_hash_m”, se o valor de contexto corrente numérico é um valor de estado significativo (independente se for um valor de estado significativo “individual” ou um valor de estado significativo “impróprio”), ou se o valor de contexto corrente numérico dentro de um dos intervalos 932, 934, 936, que são delimitados pelos valores de estado significativos (“individuais” ou “impróprios”) c1, c2. Tanto a verificação se o valor de contexto corrente numérico é igual a um valor de estado significativo c1, c2 quanto uma avaliação dos intervalos 932, 934, 936 na qual o valor de contexto corrente numérico permanece (no caso em que o valor de contexto corrente numérico não é igual a um valor de estado significativo) podem ser realizadas utilizando uma única pesquisa comum da tabela hash.
Além disso, uma avaliação da tabela hash “ari_hash_m” pode ser utilizada para obter um valor do índice da tabela hash (por exemplo, i1-1, i1 ou i2). Assim, o selecionador da regra de mapeamento 760, 828 pode ser configurado para obter, avaliando uma única tabela hash 762, 829 (por exemplo, a tabela hash “ari_hash_m”), um valor do índice da tabela hash (por exemplo, i1-1, i1 ou i2) designando um valor de estado significativo (por exemplo, c1 ou c2) e/ou um intervalo (por exemplo, 932,934,936) e uma informação se o valor de contexto corrente numérico for um valor de contexto significativo (também designado como valor de estado significativo) ou não.
Além disso, se for observado em uma avaliação da tabela hash 762, 829, “ari_hash_m”, que o valor de contexto corrente numérico não é um valor de contexto “significativo” (ou valor de estado “significativo”), o valor do índice da tabela hash (por exemplo, i1-1, i1 ou i2) obtido de uma avaliação da tabela hash (“ari_hash_m”) pode ser utilizado para obter um valor de índice de regra de mapeamento associado a um intervalo 932, 934, 936 de valores de contexto numéricos. Por exemplo, o valor do índice da tabela hash (por exemplo, i1-1, i1 ou i2) pode ser utilizado para designar uma entrada da tabela de mapeamento adicional (por exemplo, “ari_lookup_m”), que descreve os valores de índice de regra de mapeamento associados aos intervalos 932, 934, 936 cujo valor de contexto corrente numérico permanece.
Para mais detalhes, a referência é feita à discussão detalhada abaixo do algoritmo “arith_get_pk” (em que há diferentes opções para este algoritmo “arith_get_pk()”, exemplos dos quais são mostrados nas figuras 5e e 5f).
Além disso, deve ser observado que o tamanho dos intervalos pode diferir de um caso para outro. Em alguns casos, um intervalo de valores de contexto numéricos compreende um único valor de contexto numérico. Entretanto, em muitos casos, um intervalo pode compreender diversos valores de contexto numéricos.
4. Codificador de áudio de acordo com a figura 10
A figura 10 mostra um diagrama em blocos esquemático de um codificador de áudio 1000 de acordo com uma realização da invenção. O codificador de áudio 1000 de acordo com a figura 10 é semelhante ao codificador de áudio 700 de acordo com a figura 7, de modo que os sinais idênticos e meios sejam designados com números idênticos de referência nas figuras 7 e 10.
O codificador de áudio 1000 é configurado para receber uma informação de áudio de entrada 710 e prover, com base neste, uma informação de áudio codificada 712. O codificador de áudio 1000 compreende um conversor de domínio de tempo em domínio de frequência com compactação de energia 720, que é configurado para prover uma representação de domínio de frequência 722 com base em uma representação de domínio de tempo da informação de áudio de entrada 710, de modo que a representação de áudio de domínio de frequência 722 compreenda um conjunto de valores espectrais. O codificador de áudio 1000 também compreende um codificador aritmético 1030 configurado para codificar um valor espectral (fora do conjunto de valores espectrais formando a representação de áudio de domínio de frequência 722), ou uma versão pré-processada deste, que utiliza uma senha de comprimento variável para obter a informação de áudio codificada 712 (que pode compreender, por exemplo, diversas senhas de comprimento variável).
O codificador aritmético 1030 é configurado para mapear um valor espectral, ou diversos valores espectrais, ou um valor de um plano de bits mais significativo de um valor espectral ou de diversos valores espectrais, em um valor de código (ou seja, em uma senha de comprimento variável) dependendo de um estado de contexto. O codificador aritmético 1030 é configurado para selecionar uma regra de mapeamento que descreve um mapeamento de um valor espectral, ou de diversos valores espectrais, ou de um plano de bits mais significativo de um valor espectral ou de diversos valores espectrais, em um valor de código dependendo de um estado de contexto. O codificador aritmético é configurado para determinar o estado de contexto corrente dependendo de diversos valores espectrais previamente codificados (preferivelmente, mas não necessariamente adjacentes). Para esta finalidade, o codificador aritmético é configurado para modificar uma representação numérica de um valor de contexto prévio numérico, que descreve um estado de contexto associado a um ou mais valores espectrais previamente codificados (por exemplo, para selecionar uma regra de mapeamento correspondente), dependendo de um valor da sub-região de contexto, para obter uma representação numérica de um valor de contexto corrente numérico que descreve um estado de contexto associado a um ou mais valores espectrais a ser codificados (por exemplo, para selecionar uma regra de mapeamento correspondente).
Como pode ser visto, o mapeamento de um valor espectral, ou de diversos valores espectrais, ou de um plano de bits mais significativo de um valor espectral ou de diversos valores espectrais, em um valor de código pode ser realizado por uma codificação do valor espectral 740 que utiliza uma regra de mapeamento descrito por uma informação da regra de mapeamento 742. Um rastreador de estado 750 pode ser configurado para rastrear o estado de contexto. O rastreador de estado 750 pode ser configurado para modificar uma representação numérica de um valor de contexto prévio numérico, que descreve um estado de contexto associado a uma codificação de um ou mais valores espectrais previamente codificados, dependendo de um valor da sub-região de contexto, para obter uma representação numérica de um valor de contexto corrente numérico que descreve um estado de contexto associado a uma codificação de um ou mais valores espectrais a ser codificados. A modificação da representação numérica do valor de contexto prévio numérico pode, por exemplo, ser realizada por um modificador de representação numérica 1052, que recebe o valor de contexto prévio numérico e um ou mais valores da sub-região de contexto e provê o valor de contexto corrente numérico. Assim, o rastreador de estado 1050 provê uma informação 754 que descreve o estado de contexto corrente, por exemplo, na forma de um valor de contexto corrente numérico. Um selecionador da regra de mapeamento 1060 pode selecionar uma regra de mapeamento, por exemplo, a tabela de frequências cumulativas, que descreve um mapeamento de um valor espectral, ou de diversos valores espectrais, ou de um plano de bits mais significativo de um valor espectral ou de diversos valores espectrais, em um valor de código. Assim, o selecionador da regra de mapeamento 1060 provê a informação da regra de mapeamento 742 à codificação espectral 740.
Deve ser observado que, em algumas realizações, o rastreador de estado 1050 pode ser idêntico ao rastreador de estado 750 ou ao rastreador de estado 826. Também deve ser observado que o selecionador da regra de mapeamento 1060 pode, em algumas realizações, ser idêntico ao selecionador da regra de mapeamento 760, ou ao selecionador da regra de mapeamento 828.
Para resumir o mencionado acima, o codificador de áudio 1000 realiza uma codificação aritmética de uma representação de áudio de domínio de frequência provida pelo conversor de domínio de tempo em domínio de frequência. A codificação aritmética é dependente de contexto, de modo que uma regra de mapeamento (por exemplo, a tabela de frequências cumulativas) seja selecionada dependendo dos valores espectrais previamente codificados. Assim, os valores espectrais adjacentes em tempo e/ou em frequência (ou pelo menos dentro de um ambiente predeterminado) um ao outro e/ou ao valor espectral atualmente codificado (ou seja, valores espectrais dentro de um ambiente predeterminado do valor espectral atualmente codificado) são considerados na codificação aritmética para ajustar a distribuição de probabilidade avaliada pela codificação aritmética.
Ao determinar o valor de contexto corrente numérico, uma representação numérica de um valor de contexto prévio numérico, que descreve um estado de contexto associado a um ou mais valores espectrais previamente codificados, é modificado dependendo de um valor da sub-região de contexto, para obter uma representação numérica de um valor de contexto corrente numérico que descreve um estado de contexto associado a um ou mais valores espectrais a ser codificados. Esta abordagem permite evitar um recálculo completo do valor de contexto corrente numérico, cujo recálculo completo consome uma quantidade significante de recursos nas abordagens convencionais. Uma grande variedade de possibilidades existe para a modificação da representação numérica do valor de contexto prévio numérico, incluindo uma combinação de um redimensionamento de uma representação numérica do valor de contexto prévio numérico, uma adição de um valor da sub-região de contexto ou um valor derivado deste para a representação numérica do valor de contexto prévio numérico ou a uma representação numérica processada do valor de contexto prévio numérico, uma substituição de uma parte da representação numérica (em vez de toda a representação numérica) do valor de contexto prévio numérico dependendo do valor da sub-região de contexto, e assim por diante. Assim, tipicamente a representação numérica do valor de contexto corrente numérico é obtida com base na representação numérica do valor de contexto prévio numérico e também com base em pelo menos um valor da sub-região de contexto, em que tipicamente uma combinação de operações é realizada para combinar o valor de contexto prévio numérico com um valor da sub-região de contexto, como, por exemplo, duas ou mais operações fora de uma operação de adição, uma operação de subtração, uma operação de multiplicação, uma operação de divisão, uma operação Boolean-AND, uma operação Boolean-OR, uma operação Boolean-NAND, uma operação Boolean NOR, uma operação Boolean-negation, uma operação complementar ou uma operação de mudança. Assim, pelo menos uma parte da representação numérica do valor de contexto prévio numérico é tipicamente mantida inalterada (exceto para uma mudança opcional em uma posição diferente) ao derivar o valor de contexto corrente numérico do valor de contexto prévio numérico. Em contraste, outras partes da representação numérica do valor de contexto prévio numérico são mudadas dependendo de um ou mais valores da sub-região de contexto. Assim, o valor de contexto corrente numérico pode ser obtido com um esforço computacional comparavelmente pequeno, enquanto evita um recálculo completo do valor de contexto corrente numérico.
Assim, um valor de contexto corrente numérico significativo pode ser obtido, que é bem adequado para o uso pelo selecionador da regra de mapeamento 1060.
Consequentemente, uma codificação eficiente pode ser obtida mantendo o cálculo de contexto suficientemente simples.
5. Decodificador de áudio de acordo com a figura 11
A figura 11 mostra um diagrama em blocos esquemático de um decodificador de áudio 1100. O decodificador de áudio 1100 é semelhante ao decodificador de áudio 800 de acordo com a figura 8, de modo que os sinais idênticos, meios e funcionalidades sejam designados com números idênticos de referência.
O decodificador de áudio 1100 é configurado para receber uma informação de áudio codificada 810 e prover, com base neste, uma informação de áudio decodificada 812. O decodificador de áudio 1100 compreende um decodificador aritmético 1120 que é configurado para prover diversos valores espectrais decodificados 822 com base em uma representação aritmeticamente codificada 821 dos valores espectrais. O decodificador de áudio 1100 também compreende um conversor de domínio de frequência em domínio de tempo 830 que é configurado para receber os valores espectrais decodificados 822 e prover a representação de áudio de domínio de tempo 812, que pode constituir a informação de áudio decodificada, que utiliza os valores espectrais decodificados 822, a fim de obter uma informação de áudio decodificada 812.
O decodificador aritmético 1120 compreende um determinador do valor espectral 824, que é configurado para mapear um valor de código da representação aritmeticamente codificada 821 de valores espectrais em um código de símbolo que representa um ou mais dos valores espectrais decodificados, ou pelo menos uma parte (por exemplo, um plano de bits mais significativo) de um ou mais dos valores espectrais decodificados. O determinador do valor espectral 824 pode ser configurado para realizar o mapeamento dependendo de uma regra de mapeamento, que pode ser descrito poruma informação da regra de mapeamento 828a. A informação da regra de mapeamento 828a pode, por exemplo, compreender um valor de índice de regra de mapeamento, ou pode compreender um conjunto de entradas selecionadas da tabela de frequências cumulativas.
O decodificador aritmético 1120 é configurado para selecionar uma regra de mapeamento (por exemplo, a tabela de frequências cumulativas) que descreve um mapeamento de um valor de código (descrito pela representação aritmeticamente codificada 821 de valores espectrais) em um código de símbolo (que descreve um ou mais valores espectrais) dependendo de um estado de contexto, cujo estado de contexto pode ser descrito pela informação do estado de contexto 1126a. A informação do estado de contexto 1126a pode tomar uma forma de um valor de contexto corrente numérico. O decodificador aritmético 1120 é configurado para determinar o estado de contexto corrente dependendo de diversos valores espectrais previamente decodificados 822. Para esta finalidade, um rastreador de estado 1126 pode ser utilizado, que recebe uma informação que descreve os valores espectrais previamente decodificados. O decodificador aritmético é configurado para modificar uma representação numérica do valor de contexto prévio numérico, que descreve um estado de contexto associado a um ou mais valores espectrais previamente decodificados, dependendo de um valor da sub-região de contexto, para obter uma representação numérica de um valor de contexto corrente numérico que descreve um estado de contexto associado a um ou mais valores espectrais a ser decodificados. Uma modificação da representação numérica do valor de contexto prévio numérico pode, por exemplo, ser realizada por um modificador de representação numérica 1127, que faz parte do rastreador de estado 1126. Assim, a informação do estado de contexto corrente 1126a é obtida, por exemplo, na forma de um valor de contexto corrente numérico. A seleção da regra de mapeamento pode ser realizada por um selecionador da regra de mapeamento 1128, que deriva uma informação da regra de mapeamento 828a da informação do estado de contexto corrente 1126a, e que provê a informação da regra de mapeamento 828a ao determinador do valor espectral 824.
Referente à funcionalidade do decodificador de sinal de áudio 1100, deve ser observado que o decodificador aritmético 1120 é configurado para selecionar uma regra de mapeamento (por exemplo, a tabela de frequências cumulativas) que é, em média, bem adaptada ao valor espectral a ser decodificado, conforme a regra de mapeamento é selecionada dependendo do estado de contexto corrente, que, por sua vez, é determinada dependendo de diversos valores espectrais previamente decodificados. Assim, as dependências estatísticas entre os valores espectrais adjacentes a ser decodificados podem ser explorados.
Além disso, modificando uma representação numérica de um valor de contexto prévio numérico que descreve um estado de contexto associado a uma decodificação de um ou mais valores espectrais previamente decodificados, dependendo de um valor da sub-região de contexto, para obter uma representação numérica de um valor de contexto corrente numérico que descreve um estado de contexto associado a uma decodificação de um ou mais valores espectrais a ser decodificados, é possível obter uma informação significativa sobre o estado de contexto corrente, que é bem adequado para um mapeamento de um valor de índice de regra de mapeamento, com esforço computacional comparavelmente pequeno. Mantendo pelo menos uma parte de uma representação numérica do valor de contexto prévio numérico (possivelmente em um mudado por bit ou uma versão escalada) enquanto atualiza outra parte da representação numérica do valor de contexto prévio numérico dependendo dos valores da sub-região de contexto que não foram considerados no valor de contexto prévio numérico, mas que devem ser considerados no valor de contexto corrente numérico, um número de operações para derivar o valor de contexto corrente numérico pode ser mantido razoavelmente pequeno. Ainda, é possível explorar o fato de que os contextos utilizados para decodificar os valores espectrais adjacentes são tipicamente semelhantes ou correlacionados. Por exemplo, um contexto para uma decodificação de um primeiro valor espectral (ou de uma primeira pluralidade de valores espectrais) é dependente de um primeiro conjunto de valores espectrais previamente decodificados. Um contexto de decodificação de um segundo valor espectral (ou um segundo conjunto de valores espectrais), que é adjacente ao primeiro valor espectral (ou o primeiro conjunto de valores espectrais) pode compreender um segundo conjunto de valores espectrais previamente decodificados. Como o primeiro valor espectral e o segundo valor espectral são assumidos como adjacentes (por exemplo, com relação às frequências associadas), o primeiro conjunto de valores espectrais, que determina o contexto para a codificação do primeiro valor espectral, pode compreender certa sobreposição com o segundo conjunto de valores espectrais, que determina o contexto para a decodificação do segundo valor espectral. Assim, pode ser facilmente entendido que o estado de contexto para a decodificação do segundo valor espectral compreenda certa correlação com o estado de contexto para a decodificação do primeiro valor espectral. Uma eficiência computacional da derivação de contexto, ou seja, da derivação do valor de contexto corrente numérico, pode ser obtido explorando tais correlações. Foi observado que a correlação entre os estados de contexto para uma decodificação de valores espectrais adjacentes (por exemplo, entre o estado de contexto descrito pelo valor de contexto prévio numérico e pelo estado de contexto descrito pelo valor de contexto corrente numérico) pode ser explorada eficientemente modificando somente estas partes do valor de contexto prévio numérico que são dependentes dos valores da sub-região de contexto não considerados para a derivação do estado de contexto numérico anterior, e derivando o valor de contexto corrente numérico do valor de contexto prévio numérico.
Para concluir, os conceitos descritos aqui permitem uma eficiência computacional particularmente boa ao derivar o valor de contexto corrente numérico.
Outros detalhes serão descritos abaixo.
6. Codificador de áudio de acordo com a figura 12
A figura 12 mostra um diagrama em blocos esquemático de um codificador de áudio, de acordo com uma realização da invenção. O codificador de áudio 1200 de acordo com a figura 12 é semelhante ao codificador de áudio 700 de acordo com a figura 7, de modo que meios idênticos, sinais e funcionalidades sejam designados com números idênticos de referência.
O codificador de áudio 1200 é configurado para receber uma informação de áudio de entrada 710 e prover, com base neste, uma informação de áudio codificada 712. O codificador de áudio 1200 compreende um conversor de domínio de tempo em domínio de frequência com compactação de energia 720 que é configurado para prover uma representação de áudio de domínio de frequência 722 com base em uma representação de áudio de domínio de tempo da informação de áudio de entrada 710, de modo que a representação de áudio de domínio de frequência 722 compreenda um conjunto de valores espectrais. O codificador de áudio 1200 também compreende um codificador aritmético 1230 configurado para codificar um valor espectral (fora do conjunto de valores espectrais que formam a representação de áudio de domínio de frequência 722), ou diversos valores espectrais, ou uma versão pré-processada deste, que utiliza uma senha de comprimento variável para obter a informação de áudio codificada 712 (que pode compreender, por exemplo, diversas senhas de comprimento variável).
O codificador aritmético 1230 é configurado para mapear um valor espectral, ou diversos valores espectrais, ou um valor de um plano de bits mais significativo de um valor espectral ou de diversos valores espectrais, em um valor de código (ou seja, em uma senha de comprimento variável), dependendo de um estado de contexto. O codificador aritmético 1230 é configurado para selecionar uma regra de mapeamento que descreve um mapeamento de um valor espectral, ou de diversos valores espectrais, ou de um plano de bits mais significativo de um valor espectral ou de diversos valores espectrais, em um valor de código, dependendo do estado de contexto. O codificador aritmético é configurado para determinar o estado de contexto corrente dependendo de diversos valores espectrais previamente codificados (preferivelmente, mas não necessariamente, adjacentes). Para esta finalidade, o codificador aritmético é configurado para obter diversos valores da sub-região de contexto com base em valores espectrais previamente codificados, para armazenar os ditos valores da sub- região de contexto, e para derivar um valor de contexto corrente numérico associado a um ou mais valores espectrais a ser codificados dependendo dos valores da sub-região de contexto armazenados. Além disso, o codificador aritmético é configurado para calcular a norma de um vetor formado pelos diversos valores espectrais previamente codificados, a fim de obter um valor comum da sub-região de contexto associado a diversos valores espectrais previamente codificados.
Como pode ser visto, o mapeamento de um valor espectral, ou de diversos valores espectrais, ou de um plano de bits mais significativo de um valor espectral ou de diversos valores espectrais, em um valor de código pode ser realizado por uma codificação do valor espectral 740 que utiliza uma regra de mapeamento descrito por uma informação da regra de mapeamento 742. Um rastreador de estado 1250 pode ser configurado para rastrear o estado de contexto e pode compreender um computador do valor da sub-região de contexto 1252, para calcular a norma de um vetor formado por diversos valores espectrais previamente codificados, a fim de obter um valor comum da sub-região de contexto associado a diversos valores espectrais previamente codificados. O rastreador de estado 1250 é também preferivelmente configurado para determinar o estado de contexto corrente dependendo de um resultado do dito cálculo de um valor da sub-região de contexto realizado pelo computador do valor da sub-região de contexto 1252. Assim, o rastreador de estado 1250 provê uma informação 1254, que descreve o estado de contexto corrente. Um selecionador da regra de mapeamento 1260 pode selecionar uma regra de mapeamento, por exemplo, a tabela de frequências cumulativas, que descreve um mapeamento de um valor espectral, ou de um plano de bits mais significativo de um valor espectral, em um valor de código. Assim, o selecionador da regra de mapeamento 1260 provê a informação da regra de mapeamento 742 à codificação espectral 740.
Para resumir o mencionado acima, o codificador de áudio 1200 realiza uma codificação aritmética de uma representação de áudio de domínio de frequência provida pelo conversor de domínio de tempo em domínio de frequência 720. A codificação aritmética é dependente de contexto, de modo que uma regra de mapeamento (por exemplo, a tabela de frequências cumulativas) seja selecionada dependendo de valores espectrais previamente codificados. Assim, os valores espectrais adjacentes em tempo e/ou frequência (ou, pelo menos, dentro de um ambiente predeterminado) um ao outro e/ou ao valor espectral atualmente codificado (ou seja, valores espectrais dentro de um ambiente predeterminado do valor espectral atualmente codificado) são considerados na codificação aritmética para ajustar a distribuição de probabilidade avaliada pela codificação aritmética.
A fim de prover um valor de contexto corrente numérico, um valor da sub-região de contexto associado a diversos valores espectrais previamente codificados é obtido com base em um cálculo de uma norma de um vetor formado por diversos valores espectrais previamente codificados. O resultado da determinação do valor de contexto corrente numérico é aplicado na seleção do estado de contexto corrente, ou seja, na seleção de uma regra de mapeamento.
Calculando a norma de um vetor formado por diversos valores espectrais previamente codificados, uma informação significativa que descreve uma parte do contexto de um ou mais valores espectrais a serem codificados pode ser obtida, em que a norma de um vetor de valores espectrais previamente codificados pode tipicamente ser representada com um número comparavelmente pequeno de bits. Assim, a quantidade da informação de contexto, que precisa ser armazenada para uso futuro na derivação de um valor de contexto corrente numérico, pode ser mantida suficientemente pequena aplicando a abordagem discutida acima para o cálculo dos valores da sub-região de contexto. Foi observado que a norma de um vetor de valores espectrais previamente codificados tipicamente compreende a informação mais significativa referente ao estado do contexto. Em contraste, foi observado que o sinal dos ditos valores espectrais previamente codificados tipicamente compreende um impacto subordinado no estado do contexto, de modo que faz sentido negar o sinal dos valores espectrais previamente decodificados a fim de reduzir a quantidade de informação a ser armazenada para uso futuro. Ainda, foi observado que o cálculo de uma norma de um vetor de valores espectrais previamente codificados é uma abordagem razoável para a derivação de um valor da sub-região de contexto, como o efeito médio, que é tipicamente obtido pelo cálculo da norma, deixa a informação mais importante sobre o estado de contexto substancialmente não afetado. Para resumir, o valor da sub-região de contexto cálculo realizado pelo computador do valor da sub- região de contexto 1252 permite prover uma informação da sub- região de contexto compacto para armazenamento e reuso futuro, em que a informação mais relevante sobre o estado de contexto é preservada em vez da redução da quantidade de informação.
Assim, uma codificação eficiente da informação de áudio de entrada 710 pode ser obtida, enquanto mantém o esforço computacional e uma quantidade de dados a ser armazenado pelo codificador aritmético 1230 suficientemente pequeno.
7. Decodificador de áudio de acordo com a figura 13
A figura 13 mostra um diagrama em blocos esquemático de um decodificador de áudio 1300. Como o decodificador de áudio 1300 é semelhante ao decodificador de áudio 800 de acordo com a figura 8, e ao decodificador de áudio 1100 de acordo com a figura 11, meios idênticos, sinais e funcionalidades são designados como números idênticos.
O decodificador de áudio 1300 é configurado para receber uma informação de áudio codificada 810 e prover, com base neste, uma informação de áudio decodificada 812. O decodificador de áudio 1300 compreende um decodificador aritmético 1320 que é configurado para prover diversos valores espectrais decodificados 822 com base em uma representação aritmeticamente codificada 821 dos valores espectrais. O decodificador de áudio 1300 também compreende um conversor de domínio de frequência em domínio de tempo 830 que é configurado para receber os valores espectrais decodificados 822 e prover a representação de áudio de domínio de tempo 812, que pode constituir a informação de áudio decodificada, que utiliza os valores espectrais decodificados 822, a fim de obter uma informação de áudio decodificada 812.
O decodificador aritmético 1320 compreende um determinador do valor espectral 824 que é configurado para mapear um valor de código da representação aritmeticamente codificada 821 de valores espectrais em um código de símbolo que representa um ou mais dos valores espectrais decodificados, ou pelo menos uma parte (por exemplo, um plano de bits mais significativo) de um ou mais dos valores espectrais decodificados. O determinador do valor espectral 824 pode ser configurado para realizar um mapeamento dependendo de uma regra de mapeamento, que é descrita por uma informação da regra de mapeamento 828a. A informação da regra de mapeamento 828a pode, por exemplo, compreender um valor de índice de regra de mapeamento, ou um conjunto selecionado de entradas da tabela de frequências cumulativas.
O decodificador aritmético 1320 é configurado para selecionar uma regra de mapeamento (por exemplo, a tabela de frequências cumulativas) que descreve um mapeamento de um valor de código (descrito pela representação aritmeticamente codificada 821 de valores espectrais) em um código de símbolo (que descreve um ou mais valores espectrais) dependendo de um estado de contexto (que pode ser descrito pela informação do estado de contexto 1326a). O decodificador aritmético 1320 é configurado para determinar o estado de contexto corrente dependendo de diversos valores espectrais previamente decodificados 822. Para esta finalidade, um rastreador de estado 1326 pode ser utilizado, que recebe uma informação que descreve os valores espectrais previamente decodificados. O decodificador aritmético é também configurado para obter diversos valores da sub-região de contexto com base em valores espectrais previamente decodificados e para armazenar os ditos valores da sub-região de contexto. O decodificador aritmético é configurado para derivar um valor de contexto corrente numérico associado a um ou mais valores espectrais a serem decodificados dependendo dos valores da sub-região de contexto armazenados. O decodificador aritmético 1320 é configurado para calcular a norma de um vetor formado por diversos valores espectrais previamente decodificados, a fim de obter um valor comum da sub-região de contexto associado a diversos valores espectrais previamente decodificados.
O cálculo da norma de um vetor formado por diversos valores espectrais previamente codificados, a fim de obter um valor comum da sub-região de contexto associado a diversos valores espectrais previamente decodificados, pode, por exemplo, ser realizado pelo computador do valor da sub-região de contexto 1327, que faz parte do rastreador de estado 1326. Assim, uma informação do estado de contexto corrente 1326a é obtida com base nos valores da sub-região de contexto, em que o rastreador de estado 1326 preferivelmente provê um valor de contexto corrente numérico associado a um ou mais valores espectrais a ser decodificados dependendo dos valores da sub-região de contexto armazenados. A seleção das regras de mapeamento pode ser realizada por um selecionador da regra de mapeamento 1328, que deriva uma informação da regra de mapeamento 828a da informação do estado de contexto corrente 1326a, e que provê a informação da regra de mapeamento 828a ao determinador do valor espectral 824.
Referente à funcionalidade do decodificador de sinal de áudio 1300, deve ser observado que o decodificador aritmético 1320 é configurado para selecionar uma regra de mapeamento (por exemplo, a tabela de frequências cumulativas) que é, em média, bem adaptada ao valor espectral a ser decodificado, conforme a regra de mapeamento é selecionada dependendo do estado de contexto corrente, que, por sua vez, é determinada dependendo de diversos valores espectrais previamente decodificados. Assim, as dependências estatísticas entre valores espectrais adjacentes a ser decodificados podem ser exploradas.
Entretanto, foi observado que é eficiente, em termos de uso da memória, armazenar valores da sub-região de contexto, que têm como base o cálculo de uma norma de um vetor formado em diversos valores espectrais previamente decodificados, para uso futuro na determinação do valor de contexto numérico.
Também foi observado que tais valores da sub-região de contexto ainda compreendem a informação de contexto mais relevante. Assim, o conceito utilizado pelo rastreador de estado 1326 constitui um bom compromisso entre a eficiência da codificação, a eficiência computacional e a eficiência de armazenamento.
Outros detalhes serão descritos abaixo.
8. Codificador de áudio de acordo com a figura 1
A seguir, um codificador de áudio, de acordo com uma realização da presente invenção, será descrito. A figura 1 mostra um diagrama em blocos esquemático de tal codificador de áudio 100.
O codificador de áudio 100 é configurado para receber uma informação de áudio de entrada 110 e prover, com base neste, um fluxo de bits 112, que constitui uma informação de áudio codificada. O codificador de áudio 100 opcionalmente compreende um pré-processador 120, que é configurado para receber a informação de áudio de entrada 110 e prover, com base neste, uma informação pré-processada de áudio de entrada 110a. O codificador de áudio 100 também compreende um transformador de sinal de domínio de tempo em domínio de frequência com compactação de energia 130, que é também designado como conversor de sinal. O conversor de sinal 130 é configurado para receber a informação de áudio de entrada 110, 110a e prover, com base neste, uma informação de áudio de domínio de frequência 132, que preferivelmente toma a forma de um conjunto de valores espectrais. Por exemplo, o transformador de sinal 130 pode ser configurado para receber uma estrutura da informação de áudio de entrada 110, 110a (por exemplo, um bloco de amostras de domínio de tempo) e prover um conjunto de valores espectrais que representa o conteúdo de áudio da respectiva estrutura de áudio. Além disso, o transformador de sinal 130 pode ser configurado para receber diversas estruturas de áudio subsequentes, de sobreposição ou não sobreposição da informação de áudio de entrada 110, 110a e prover, com base neste, uma representação de áudio de domínio de frequência de tempo, que compreende uma sequência de conjuntos subsequentes de valores espectrais, um conjunto de valores espectrais associados a cada estrutura.
O transformador de sinal de domínio de tempo em domínio de frequência com compactação de energia 130 pode compreender um banco de filtros com compactação de energia, que provê valores espectrais associados a diferentes faixas de frequência, de sobreposição ou não sobreposição. Por exemplo, o transformador de sinal 130 pode compreender um transformador MDCT de janelamento 130a, que é configurado para colocar em janelas a informação de áudio de entrada 110, 110a (ou a estrutura deste) que utiliza uma janela de transformação e para realizar uma transformação de cosseno discreto modificado da informação de áudio de entrada em janela 110, 110a (ou a estrutura em janela deste). Assim, a representação de áudio de domínio de frequência 132 pode compreender um conjunto de, por exemplo, 1024 valores espectrais na forma de coeficientes MDCT associados a uma estrutura da informação de áudio de entrada.
O codificador de áudio 100 pode ainda, opcionalmente, compreender um pós-processador espectral 140, que é configurado para receber a representação de áudio de domínio de frequência 132 e prover, com base neste, uma representação de áudio de domínio de frequência pós-processada 142. O pós- processador espectral 140 pode, por exemplo, ser configurado para realizar uma forma de ruído temporale/ou uma previsão a longo prazo e/ou qualquer outro pós-processamento espectral conhecido na técnica. O codificador de áudio ainda compreende, opcionalmente, um multiplicador de frequências/quantificador 150, que é configurado para receber a representação de áudio de domínio de frequência 132 ou a versão pós-processada 142 deste e prover uma representação de áudio de domínio de frequência escalada e quantizada 152.
O codificador de áudio 100 ainda compreende, opcionalmente, um processador do modelo psicoacústico 160, que é configurado para receber a informação de áudio de entrada 110 (ou a versão pós-processada 110a deste) e prover, com base neste, uma informação de controle opcional, que pode ser utilizada para o controle do transformador de sinal de domínio de tempo em domínio de frequência com compactação de energia 130, para o controle do pós-processador espectral opcional 140 e/ou para o controle do multiplicador de frequências/quantificador opcional 150. Por exemplo, o processador do modelo psicoacústico 160 pode ser configurado para analisar a informação de áudio de entrada, para determinar quais componentes da informação de áudio de entrada 110, 110a são particularmente importantes para a percepção humana do conteúdo de áudio e quais componentes da informação de áudio de entrada 110, 110a são menos importantes para a percepção do conteúdo de áudio. Assim, o processador do modelo psicoacústico 160 pode prover informação de controle, que é utilizado pelo codificador de áudio 100 a fim de ajustar a escala da representação de áudio de domínio de frequência 132, 142 pelo multiplicador de frequências/quantificador 150 e/ou a resolução de quantização aplicada pelo multiplicador de frequências/quantificador 150. Consequentemente, faixas do fator de escala perceptualmente importantes (ou seja, grupos de valores espectrais adjacentes que são particularmente importantes para a percepção humana do conteúdo de áudio) são escaladas com um grande fator de escala e quantizadas com resolução comparavelmente alta, enquanto faixas do fator de escala perceptualmente menos importantes (ou seja, grupos de valores espectrais adjacentes) são escaladas com um fator de escala comparavelmente menor e quantizadas com uma resolução de quantização comparavelmente menor. Assim, os valores espectrais escalados de frequências perceptualmente mais importantes são tipicamente significantemente maiores que os valores espectrais de frequências perceptualmente menos importantes.
O codificador de áudio também compreende um codificador aritmético 170, que é configurado para receber a versão escalada e quantizada 152 da representação de áudio de domínio de frequência 132 (ou, de modo alternativo, a versão pós- processada 142 da representação de áudio de domínio de frequência 132, ou mesmo a própria representação de áudio de domínio de frequência 132) e prover informação da senha aritmética 172a com base neste, de modo que a informação da senha aritmética representa a representação de áudio de domínio de frequência 152.
O codificador de áudio 100 também compreende um formatador de payload do fluxo de bits 190, que é configurado para receber a informação da senha aritmética 172a. O formatador de payload do fluxo de bits 190 é também tipicamente configurado para receber informação adicional, como, por exemplo, a informação do fator de escala que descreve quais fatores de escala foram aplicados pelo multiplicador de frequências/quantificador 150. Além disso, o formatador de payload do fluxo de bits 190 pode ser configurado para receber outra informação de controle. O formatador de payload do fluxo de bits 190 é configurado para prover o fluxo de bits 112 com base na informação recebida montando o fluxo de bits de acordo com uma sintaxe do fluxo de bits desejada, que será discutida abaixo.
A seguir, detalhes referentes ao codificador aritmético 170 serão descritos. O codificador aritmético 170 é configurado para receber diversos valores espectrais pós- processados e escalados e quantizados da representação de áudio de domínio de frequência 132. O codificador aritmético compreende um extrator do plano de bits mais significante 174, ou mesmo de dois valores espectrais, que é configurado para extrair um plano de bits mais significativo m de um valor espectral. Deve ser observado aqui que o plano de bits mais significativo pode compreender um ou mais bits (por exemplo, dois ou três bits), que são os bits mais significativos do valor espectral. Assim, o extrator do plano de bits mais significativo 174 provê um valor do plano de bits mais significativo 176 de um valor espectral.
De modo alternativo, entretanto, o extrator do plano de bits mais significativo 174 pode prover um valor combinado do plano de bits mais significativo m que combina o plano de bits mais significativo de diversos valores espectrais (por exemplo, de valores espectrais a e b). O plano de bits mais significativo do valor espectral a é designado com m. De modo alternativo, o valor combinado do plano de bits mais significativo de diversos valores espectrais a,b é designado com m.
O codificador aritmético 170 também compreende um primeiro determinador de senha 180, que é configurado para determinar uma senha aritmética acod_m [pki][m] que representa o valor do plano de bits mais significativo m. Opcionalmente, o determinador de senha 180 pode também prover uma ou mais senhas de escape (também designada aqui como “ARITH_ESCAPE”) indicando, por exemplo, quantos planos de bits menos significativos estão disponíveis (e, consequentemente, indicando o peso numérico do plano de bits mais significativo). O primeiro determinador de senha 180 pode ser configurado para prover a senha associada a um valor do plano de bits mais significativo m que utiliza a tabela de frequências cumulativas selecionada tendo (ou sendo referenciada por) um índice da tabela de frequências cumulativas pki.
A fim de determinar em qual tabela de frequências cumulativas deve ser selecionado, o codificador aritmético preferivelmente compreende um rastreador de estado 182, que é configurado para rastrear o estado do codificador aritmético, por exemplo, observando quais valores espectrais foram codificados previamente. O rastreador de estado 182 consequentemente provê uma informação de estado 184, por exemplo, um valor de estado designado com “s” ou “t” ou “c”. O codificador aritmético 170 também compreende um selecionador da tabela de frequências cumulativas 186, que é configurado para receber a informação de estado 184 e prover uma informação 188 que descreve a tabela de frequências cumulativas selecionada ao determinador de senha 180. Por exemplo, o selecionador da tabela de frequências cumulativas 186 pode prover um índice da tabela de frequências cumulativas “pki” que descreve qual tabela de frequências cumulativas, fora de um conjunto de 96 tabelas de frequências cumulativas, é selecionado para uso pelo determinador de senha. De modo alternativo, o selecionador da tabela de frequências cumulativas 186 pode prover toda a tabela de frequências cumulativas selecionada ou uma sub-tabela ao determinador de senha. Assim, o determinador de senha 180 pode usar a tabela de frequências cumulativas selecionada ou sub-tabela para a provisão da senha acod_m[pki][m] do valor do plano de bits mais significativo m, de modo que a senha atual acod_m[pki][m] que codifica o valor do plano de bits mais significativo m seja dependente do valor de m e o índice da tabela de frequências cumulativas pki, e consequentemente na informação de estado corrente 184. Outros detalhes referentes ao processo de codificação e o formato de senha obtido serão descritos abaixo.
Deve ser observado, entretanto, que em algumas realizações, o rastreador de estado 182 pode ser idêntico a, ou tomar a funcionalidade, do rastreador de estado 750, do rastreador de estado 1050 ou do rastreador de estado 1250. Também deve ser observado que o selecionador da tabela de frequências cumulativas 186 pode, em algumas realizações, ser idêntico a, ou tomar a funcionalidade, do selecionador da regra de mapeamento 760, do selecionador da regra de mapeamento 1060, ou do selecionador da regra de mapeamento 1260. Além disso, o primeiro determinador de senha 180 pode, em algumas realizações, ser idêntico a, ou tomar a funcionalidade, da codificação do valor espectral 740.
O codificador aritmético 170 ainda compreende um extrator do plano de bits menos significativo 189a, que é configurado para extrair um ou mais planos de bits menos significativos da representação de áudio de domínio de frequência escalada e quantizada 152, se um ou mais dos valores espectrais a ser codificado exceder a faixa de valores que podem ser codificados utilizando o plano de bits mais significativo somente. Os planos de bits menos significativos podem compreender um ou mais bits, conforme desejado. Assim, o extrator do plano de bits menos significativo 189a provê uma informação do plano de bits menos significativo 189b. O codificador aritmético 170 também compreende um segundo determinador de senha 189c, que é configurado para receber a informação do plano de bits menos significativo 189d e prover, com base neste, 0, 1 ou mais senhas “acod_r” que representa o conteúdo de 0, 1 ou mais planos de bits menos significativos. O segundo determinador de senha 189c pode ser configurado para aplicar um algoritmo da codificação aritmética ou qualquer outro algoritmo de codificação a fim de derivar as senhas do plano de bit menos significativo “acod_r” da informação do plano de bits menos significativo 189b.
Deve ser observado aqui que o número de planos de bits menos significativos pode variar dependendo do valor dos valores espectrais escalados e quantizados 152, de modo que possa ter nenhum plano de bits menos significativo, se o valor espectral escalado e quantizado a ser codificado é comparavelmente pequeno, de modo que possa ter um plano de bits menos significativo se o valor espectral corrente escalado e quantizado a ser codificado for de uma faixa média e de modo que possa ter mais que um plano de bits menos significativo se o valor espectral escalado e quantizado a ser codificado tiver um valor comparavelmente grande.
Para resumir o mencionado acima, o codificador aritmético 170 é configurado para codificar valores espectrais escalados e quantizados, que são descritos pela informação 152, que utiliza um processo de codificação hierárquico. O plano de bits mais significativo (que compreende, por exemplo, um, dois ou três bits por valor espectral) de um ou mais valores espectrais, é codificado para obter uma senha aritmética “acod_m[pki][m]” de um valor do plano de bits mais significativo m. Um ou mais planos de bits menos significativos (cada um dos planos de bits menos significativos que compreende, por exemplo, um, dois ou três bits) de um ou mais valores espectrais são codificados para obter uma ou mais senhas “acod_r”. Ao codificar o plano de bits mais significativo, o valor m do plano de bits mais significativo é mapeado a uma senha acod_m[pki][m]. Para esta finalidade, 96 diferentes tabelas de frequências cumulativas estão disponíveis para a codificação do valor m dependendo de um estado do codificador aritmético 170, ou seja, dependendo de valores espectrais previamente codificados. Assim, a senha “acod_m[pki][m]” é obtida. Além disso, uma ou mais senhas “acod_r” são providas e incluídas no fluxo de bits se um ou mais planos de bits menos significativos estiverem presentes.
DESCRIÇÃO DE REDEFINIÇÃO
O codificador de áudio 100 pode opcionalmente ser configurado para decidir se uma melhoria na taxa de bit pode ser obtida redefinindo o contexto, por exemplo, definindo o índice de estado a um valor padrão. Assim, o codificador de áudio 100 pode ser configurado para prover uma informação de reset (por exemplo, chamada “arith_reset_flag”) indicando se o contexto para a codificação aritmética é redefinida, e também indicando se o contexto para a decodificação aritmética em um decodificador correspondente deve ser redefinido.
Detalhes referentes ao formato do fluxo de bits e às tabelas de frequência cumulativa aplicadas serão discutidos abaixo.
9. Decodificador de áudio de acordo com a figura 2
A seguir, um decodificador de áudio, de acordo com uma realização da invenção, será descrito. A figura 2 mostra um diagrama em blocos esquemático de tal decodificador de áudio 200.
O decodificador de áudio 200 é configurado para receber um fluxo de bits 210, que representa uma informação de áudio codificada e que pode ser idêntico ao fluxo de bits 112 provido pelo codificador de áudio 100. O decodificador de áudio 200 provê uma informação de áudio decodificada 212 com base no fluxo de bits 210.
O decodificador de áudio 200 compreende um deformatador de payload do fluxo de bits opcional 220, que é configurado para receber o fluxo de bits 210 e para extrair do fluxo de bits 210 uma representação codificada de áudio de domínio de frequência 222. Por exemplo, o deformatador de payload do fluxo de bits 220 pode ser configurado para extrair do fluxo de bits 210 dados espectrais aritmeticamente decodificados como, por exemplo, uma senha aritmética “acod_m [pki][m]” que representa o valor do plano de bits mais significativo m de um valor espectral a, ou de diversos valores espectrais a, b, e uma senha “acod_r” que representa um conteúdo de um plano de bits menos significativo do valor espectral a, ou de diversos valores espectrais a, b, da representação de áudio de domínio de frequência. Assim, a representação codificada de áudio de domínio de frequência 222 constitui (ou compreende) uma representação aritmeticamente codificada de valores espectrais. O deformatador de payload do fluxo de bits 220 é ainda configurado para extrair da informação adicional de controle do fluxo de bits, que não é mostrado na figura 2. Além disso, o deformatador de payload do fluxo de bits é opcionalmente configurado para extrair do fluxo de bits 210, uma informação de reset do estado 224, que é também designada como sinalizador de redefinição aritmético ou “arith_reset_flag”.
O decodificador de áudio 200 compreende um decodificador aritmético 230, que também é designado como “decodificador silencioso espectral”. O decodificador aritmético 230 é configurado para receber a representação codificada de áudio de domínio de frequência 220 e, opcionalmente, a informação de reset de estado 224. O decodificador aritmético 230 é também configurado para prover uma representação decodificada de áudio de domínio de frequência 232, que pode compreender uma representação decodificada de valores espectrais. Por exemplo, a representação decodificada de áudio de domínio de frequência 232 pode compreender uma representação decodificada de valores espectrais, que são descritos pela representação codificada de áudio de domínio de frequência 220.
O decodificador de áudio 200 também compreende um quantificador/remultiplicador de frequências inversas opcionais 240, que é configurado para receber a representação decodificada de áudio de domínio de frequência 232 e prover, com base neste, uma representação de áudio de domínio de frequência inversamente quantizada e redimensionada 242.
O decodificador de áudio 200 ainda compreende um pré-processador espectral opcional 250, que é configurado para receber a representação de áudio de domínio de frequência inversamente quantizada e redimensionada 242 e prover, com base neste, uma versão pré-processada 252 da representação de áudio de domínio de frequência inversamente quantizada e redimensionada 242. O decodificador de áudio 200 também compreende um transformador de sinal de domínio de frequência em domínio de tempo 260, que é também designado como um “conversor de sinal”. O transformador de sinal 260 é configurado para receber a versão pré-processada 252 da representação de áudio de domínio de frequência inversamente quantizada e redimensionada 242 (ou, de modo alternativo, a representação de áudio de domínio de frequência inversamente quantizada e redimensionada 242 ou a representação decodificada de áudio de domínio de frequência 232) e prover, com base neste, uma representação de domínio de tempo 262 da informação de áudio. O transformador de sinal de domínio de frequência em domínio de tempo 260 pode, por exemplo, compreender um transformador para realizar uma transformação de cosseno discreto modificado inverso (IMDCT) e um janelamento apropriado (bem como outras funcionalidades auxiliares, como, por exemplo, uma sobreposição e adição).
O decodificador de áudio 200 pode ainda compreender um pós-processador de domínio de tempo opcional 270, que é configurado para receber a representação de domínio de tempo 262 da informação de áudio e para obter a informação de áudio decodificada 212 que utiliza um pós-processamento de domínio de tempo. Entretanto, se o pós-processamento for omitido, a representação de domínio de tempo 262 pode ser idêntica à informação de áudio decodificada 212.
Deve ser observado aqui que o quantificador/remultiplicador de frequências inversas 240, o pré- processador espectral 250, o transformador de sinal de domínio de frequência em domínio de tempo 260 e o pós-processador de domínio de tempo 270 podem ser controlados dependendo da informação de controle, que é extraída do fluxo de bits 210 pelo deformatador de payload do fluxo de bits 220.
Para resumir toda a funcionalidade do decodificador de áudio 200, uma representação decodificada de áudio de domínio de frequência 232, por exemplo, um conjunto de valores espectrais associado a uma estrutura de áudio da informação de áudio codificada, pode ser obtido com base na representação codificada de domínio de frequência 222 que utiliza o decodificador aritmético 230. Subsequentemente, o conjunto de, por exemplo, 1024 valores espectrais, que pode ser de coeficientes MDCT, é inversamente quantizado, redimensionado e pré-processado. Assim, um conjunto de valores espectrais pré-processados espectralmente inversamente quantizados e redimensionados (por exemplo, 1024 coeficientes MDCT) é obtido. Posteriormente, uma representação de domínio de tempo de uma estrutura de áudio é derivada do conjunto pré-processado de forma espectral, inversamente quantizado e redimensionado de valores de domínio de frequência (por exemplo, coeficientes MDCT). Assim, uma representação de domínio de tempo de uma estrutura de áudio é obtida. A representação de domínio de tempo de uma dada estrutura de áudio pode ser combinada com as representações de domínio de tempo de estruturas de áudio prévias e/ou subsequentes. Por exemplo, uma sobreposição e adição entre as representações de domínio de tempo de estruturas de áudio subsequentes pode ser realizada a fim de suavizar as transações entre as representações de domínio de tempo das estruturas de áudio adjacentes e a fim de obter uma anulação de aliasing. Para detalhes referentes à reconstrução da informação de áudio decodificada 212 com base na representação decodificada de áudio de domínio de frequência de tempo 232, a referência é feita, por exemplo, ao Padrão Internacional ISO/IEC 14496-3, parte 3, subparte 4 onde uma discussão detalhada é dada. Entretanto, outros esquemas de sobreposição mais elaborada e anulação de aliasing podem ser utilizados.
A seguir, alguns detalhes referentes ao decodificador aritmético 230 serão descritos. O decodificador aritmético 230 compreende um determinador do plano de bits mais significativo 284, que é configurado para receber a senha aritmética acod_m [pki][m] que descreve o valor do plano de bits mais significativo m. O determinador do plano de bits mais significativo 284 pode ser configurado para utilizar a tabela de frequências cumulativas fora de um conjunto que compreende diversas 96 tabelas de frequências cumulativas para derivar o valor do plano de bits mais significativo m da senha aritmética “acod_m [pki][m]”.
O determinador do plano de bits mais significativo 284 é configurado para derivar valores 286 de um plano de bits mais significativo de um ou mais valores espectrais com base na senha acod_m. O decodificador aritmético 230 ainda compreende um determinador do plano de bits menos significativo 288, que é configurado para receber uma ou mais senhas “acod_r” que representa um ou mais planos de bits menos significativos de um valor espectral. Assim, o determinador do plano de bits menos significativo 288 é configurado para prover valores decodificados 290 de um ou mais planos de bits menos significativos. O decodificador de áudio 200 também compreende um combinador do plano de bits 292, que é configurado para receber os valores decodificados 286 do plano de bits mais significativo de um ou mais valores espectrais e os valores decodificados 290 de um ou mais planos de bits menos significativos dos valores espectrais se tais planos de bits menos significativos estão disponíveis para os valores correntes espectrais. Assim, o combinador do plano de bits 292 provê valores espectrais decodificados, que fazem parte da representação decodificada de áudio de domínio de frequência 232. Naturalmente, o decodificador aritmético 230 é tipicamente configurado para prover diversos valores espectrais a fim de obter um conjunto completo de valores espectrais decodificados associados a uma estrutura corrente do conteúdo de áudio.
O decodificador aritmético 230 ainda compreende um selecionador da tabela de frequências cumulativas 296, que é configurado para selecionar uma das 96 tabelas de frequências cumulativas dependendo de um índice de estado 298 que descreve um estado do decodificador aritmético. O decodificador aritmético 230 ainda compreende um rastreador de estado 299, que é configurado para rastrear um estado do decodificador aritmético dependendo dos valores espectrais previamente decodificados. A informação de estado pode opcionalmente ser redefinida a uma informação de estado padrão em resposta à informação de reset de estado 224. Assim, o selecionador da tabela de frequências cumulativas 296 é configurado para prover um índice (por exemplo, pki) da tabela de frequências cumulativas selecionada, ou a tabela de frequências cumulativas selecionada ou a própria sub-tabela, para aplicação na decodificação do valor do plano de bits mais significativo m dependendo da senha “acod_m”.
Para resumir a funcionalidade do decodificador de áudio 200, o decodificador de áudio 200 é configurado para receber uma representação eficientemente codificada de áudio de domínio de frequência da taxa de bits 222 e para obter uma representação decodificada de áudio de domínio de frequência com base neste. No decodificador aritmético 230, que é utilizado para obter a representação decodificada de áudio de domínio de frequência 232 com base na representação codificada de áudio de domínio de frequência 222, uma probabilidade de diferentes combinações de valores do plano de bits mais significativo de valores espectrais adjacentes é explorada utilizando um decodificador aritmético 280, que é configurado para aplicar a tabela de frequências cumulativas. Em outras palavras, as dependências estatísticas entre os valores espectrais são explorados selecionando diferentes tabelas de frequências cumulativas fora de um conjunto que compreende 96 diferentes tabelas de frequências cumulativas dependendo de um índice de estado 298, que é obtido observando os valores espectrais decodificados previamente calculados.
Deve ser observado que o rastreador de estado 299 pode ser idêntico a, ou pode tomar a funcionalidade, do rastreador de estado 826, do rastreador de estado 1126, ou do rastreador de estado 1326. O selecionador da tabela de frequências cumulativas 296 pode ser idêntico a ou pode tomar a funcionalidade, do selecionador da regra de mapeamento 828, do selecionador da regra de mapeamento 1128, ou do selecionador da regra de mapeamento 1328. O determinador do plano de bits mais significativo 284 pode ser idêntico a, ou pode tomar a funcionalidade, do determinador do valor espectral 824.
10. Visão geral da ferramenta de codificação espectral silenciosa
A seguir, detalhes referentes à codificação e decodificação do algoritmo, que é realizada, por exemplo, pelo codificador aritmético 170 e pelo decodificador aritmético 230, serão explicados.
O foco deve ser colocado na descrição da decodificação do algoritmo. Deve ser observado, entretanto, que uma codificação do algoritmo correspondente poder ser realizada de acordo com os ensinamentos da decodificação do algoritmo, em que mapeamentos entre valores espectrais codificados e decodificados são inversos, e em que o cálculo do valor de índice de regra de mapeamento é substancialmente idêntico. Em um codificador, os valores espectrais codificados assumem o lugar dos valores espectrais decodificados. Ainda, os valores espectrais a ser codificados assumem o lugar dos valores espectrais a ser decodificados.
Deve ser observado que a decodificação, que será discutida a seguir, é utilizada a fim de permitir a chamada “codificação espectral silenciosa” de valores espectrais escalados e quantizados tipicamente pós-processados. A codificação espectral silenciosa é utilizada em um conceito de codificação/decodificação de áudio (ou em qualquer outro conceito de codificação/decodificação) para ainda reduzir a redundância do espectro quantizado, que é obtido, por exemplo, por um transformador de domínio de tempo em domínio de frequência com compactação de energia. O esquema espectral de codificação silenciosa, que é utilizado nas realizações da invenção, tem como base uma codificação aritmética com um contexto dinamicamente adaptado.
Em algumas realizações, de acordo com a invenção, o esquema espectral de codificação silenciosa tem como base 2 tuplos, ou seja, dois coeficientes espectrais próximos são combinados. Cada tuplo duplo é dividido no sinal, o plano de bit a bit mais significativo, e os planos de bits menos significativos restantes. A codificação silenciosa para o plano de bit a bit mais significativo m utiliza tabelas de frequências cumulativas dependentes de contexto derivadas de quatro tuplos duplos previamente decodificados. A codificação silenciosa é alimentada pelos valores espectrais quantizados e utiliza tabelas de frequências cumulativas dependentes de contexto derivadas de quatro tuplos duplos próximos previamente decodificados. Aqui, próximo em tempo e frequência é considerado, conforme ilustrado na figura 4. As tabelas de frequências cumulativas (que serão explicadas abaixo) são então utilizadas pelo codificador aritmético para gerar um código binário de comprimento variável (e pelo decodificador aritmético para derivar valores decodificados de um código binário de comprimento variável).
Por exemplo, o codificador aritmético 170 produz um código binário para um determinado conjunto de símbolos e suas respectivas probabilidades (ou seja, dependendo das respectivas probabilidades). O código binário é gerado pelo mapeamento de um intervalo de probabilidade, onde o conjunto de símbolos fica em uma senha.
A codificação silenciosa do plano de bits menos significativo r restante utiliza uma única tabela de frequências cumulativas. As frequências cumulativas correspondem, por exemplo, a uma distribuição uniforme dos símbolos que ocorrem nos planos de bits menos significativos, ou seja, é esperado que haja a mesma probabilidade que um 0 ou um 1 ocorre nos planos de bits menos significativos.
A seguir, outra breve visão geral da ferramenta de codificação espectral silenciosa será dada. A codificação espectral silenciosa é utilizada para ainda reduzir a redundância do espectro quantizado. O esquema espectral de codificação silenciosa tem como base uma codificação aritmética, com um contexto dinamicamente adaptado. A codificação silenciosa é alimentada pelos valores espectrais quantizados e utiliza as tabelas de frequências cumulativas dependentes de contexto derivadas de, por exemplo, quatro tuplos duplos próximos previamente decodificados de valores espectrais. Aqui, próximo, em tempo e frequência, é considerado conforme ilustrado na figura 4. As tabelas de frequências cumulativas são então utilizadas pelo codificador aritmético para gerar um código binário de comprimento variável.
O codificador aritmético produz um código binário para um determinado conjunto de símbolos e suas respectivas probabilidades. O código binário é gerado pelo mapeamento de um intervalo de probabilidade, onde o conjunto de símbolos permanece, em uma senha.
11. Processo de decodificação 11.1 Visão geral do processo de decodificação
A seguir, uma visão geral do processo de codificação de um valor espectral será apresentada, tendo como referência a figura 3, que mostra uma representação do código do pseudo-programa do processo de decodificação de diversos valores espectrais.
O processo de decodificação de diversos valores espectrais compreende uma inicialização 310 de um contexto. A inicialização 310 do contexto compreende uma derivação do contexto corrente de um contexto prévio, que utiliza a função “arith_map_context(N, arith_reset_flag)”. A derivação do contexto corrente de um contexto prévio pode seletivamente compreender uma redefinição do contexto. A redefinição do contexto e a derivação do contexto corrente de um contexto prévio serão discutidas abaixo.
A decodificação de diversos valores espectrais também compreende uma iteração de uma decodificação do valor espectral 312 e uma atualização de contexto 313, cuja atualização de contexto 313 é realizada pela função “arith_update_context(i, a,b)” que é descrita abaixo. A decodificação do valor espectral 312 e a atualização de contexto 312 são repetidas lg/2 vezes, em que lg/2 indica o número de 2 tuplos de valores espectrais a ser decodificados (por exemplo, para uma estrutura de áudio), a menos que o símbolo chamado “ARITH_STOP” seja detectado. Além disso, a decodificação de um conjunto de valores espectrais lg também compreende uma decodificação de sinais 314 e uma etapa de acabamento 315.
A decodificação 312 de um tuplo de valores espectrais compreende um cálculo do valor de contexto 312a, uma decodificação do plano de bits mais significativo 312b, uma detecção do símbolo de parada aritmética 312c, uma adição do plano de bits menos significativo 312d, e uma atualização da matriz 312e.
O cálculo do valor de estado 312a compreende uma chamada da função “arith_get_context(c,i,N)” conforme mostrado, por exemplo, na figura 5c ou 5d. Assim, um valor (de estado) de contexto corrente numérico c é provido como um valor de retorno da função chamada da função “arith_get_context(c,i,N)”. Como pode ser visto, o valor de contexto prévio numérico (também designado como “c”), que serve como uma variável de entrada na função “arith_get_context(c,i,N)”, é atualizada para obter, como um valor de retorno, o valor de contexto corrente numérico c.
A decodificação do plano de bits mais significativo 312b compreende uma execução iterativa de uma decodificação de algoritmo 312ba, e uma derivação 312bb de valores a,b do valor de resultado m do algoritmo 312ba. Na preparação do algoritmo 312ba, a variável lev é inicializada a zero. O algoritmo 312ba é repetido, até que uma instrução de “interrupção” (ou condição) seja atingida. O algoritmo 312ba compreende um cálculo de um índice de estado “pki” (que também serve como um índice da tabela de frequências cumulativas) dependendo do valor de contexto corrente numérico c, e também dependendo do valor de nível “esc_nb” que utiliza a função “arith_get_pk()”, que é discutido abaixo (e realizações destas são mostradas, por exemplo, nas figuras. 5e e 5f). O algoritmo 312ba também compreende a seleção da tabela de frequências cumulativas dependendo do índice de estado “pki”, que é retornado pela chamada da função “arith_get_pk”, em que uma variável “cum_freq” pode ser definida a um endereço inicial de uma das 96 tabelas de frequências cumulativas (ou sub-tabelas) dependendo do índice de estado “pki”. Uma variável “cfl” pode também ser inicializada em um comprimento da tabela de frequências cumulativas selecionada (ou uma sub- tabela), que é, por exemplo, igual a um número de símbolos no alfabeto, ou seja, o número de diferentes valores que pode ser decodificado. O comprimento de todas as tabelas de frequências cumulativas (ou sub-tabelas) de “ari_cf_m[pki=0][17]” a “ari_cf_m[pki=95][17]” disponíveis para a decodificação do valor do plano de bits mais significativo m é 17, como 16 diferentes valores do plano de bits mais significativo e um símbolo de escape (“ARITH_ESCAPE”) podem ser decodificados.
Subsequentemente, um valor do plano de bits mais significativo m pode ser obtido executando a função “arith_decode()”, levando em consideração a tabela de frequências cumulativas selecionada (descrita pela variável “cum_freq” e a variável “cfl”). Ao derivar o valor do plano de bits mais significativo m, os bits chamados “acod_m” do fluxo de bits 210 podem ser avaliados (veja, por exemplo, a figura 6g ou a figura 6h).
O algoritmo 312ba também compreende verificar se o valor do plano de bits mais significativo m é igual a um símbolo de escape “ARITH_ESCAPE”, ou não. Se o valor do plano de bits mais significativo m não for igual ao símbolo de escape aritmético, o algoritmo 312ba é abortado (condição de “interrupção”) e as instruções restantes do algoritmo 312ba são então puladas. Assim, a execução do processo é continuada com a definição do valor b e do valor a na etapa 312bb. Em contraste, se o valor do plano de bits mais significativo decodificado m for idêntico ao símbolo de escape aritmético, ou “ARITH_ESCAPE”, o valor de nível “lev” é aumentado por um. O valor de nível “esc_nb” é definido para ser igual ao valor de nível “lev”, a menos que a variável “lev” seja maior que sete, cujo caso, a variável “esc_nb” é definida para ser igual a sete. Conforme mencionado, o algoritmo 312ba é então repetido até que o valor do plano de bits mais significativo decodificado m seja diferente do símbolo de escape aritmético, em que um contexto modificado seja utilizado (por causa do parâmetro de entrada da função “arith_get_pk()” ser adaptado dependendo do valor da variável “esc_nb”).
Logo que o plano de bits mais significativo é decodificado utilizando execução de um período ou a execução iterativa do algoritmo 312ba, ou seja, um valor do plano de bits mais significativo m diferente do símbolo de escape aritmético foi decodificado, o variável do valor espectral “b” é definido para ser igual a diversos (por exemplo, 2) bits mais significativos do valor do plano de bits mais significativo m, e a variável do valor espectral “a” é definida (por exemplo, 2) nos bits menos significativos do valor do plano de bits mais significativo m. Detalhes referentes a esta funcionalidade podem ser vistos, por exemplo, no número de referência 312bb.
Subsequentemente, é verificado na etapa 312c, se um símbolo de parada aritmética está presente. Este é o caso se o valor do plano de bits mais significativo m for igual a zero e a variável “lev” for maior que zero. Assim, uma condição de parada aritmética é sinalizada por uma condição “incomum”, na qual o valor do plano de bits mais significativo m é igual a zero, enquanto a variável “lev” indica que um peso numérico aumentado está associado ao valor do plano de bits mais significativo m. Em outras palavras, uma condição de parada aritmética é detectada se o fluxo de bits indica que um peso numérico aumentado, maior que um peso numérico mínimo, deve ser dado a um valor do plano de bits mais significativo que é igual a zero, que é uma condição que não ocorre em uma situação de codificação normal. Em outras palavras, uma condição de parada aritmética é sinalizada se um símbolo de escape aritmético codificado for seguido por um valor do plano de bits mais significativo codificado de 0.
Depois de uma avaliação se houver uma condição de parada aritmética, que é realizada na etapa 212c, os planos de bits menos significativos são obtidos, por exemplo, conforme mostrado no número de referência 212d na figura 3. Para cada plano de bits menos significativo, dois valores binários são decodificados. Um dos valores binários está associado à variável a (ou o primeiro valor espectral de um tuplo de valores espectrais) e um dos valores binários está associado à variável b (ou um segundo valor espectral de um tuplo de valores espectrais). Um número de planos de bits menos significativos é designado pela variável lev.
Na decodificação de um ou mais planos de bits menos significativos (se houver) um algoritmo 212da é realizado de forma iterativa, em que um número de execuções do algoritmo 212da é determinado pela variável “lev”. Deve ser observado aqui que a primeira iteração do algoritmo 212da é realizada com base nos valores das variáveis a, b conforme definido na etapa 212bb. Outras iterações do algoritmo 212da devem ser realizadas com base nos valores da variável atualizada da variável a, b.
No início de uma iteração, uma tabela de frequências cumulativas é selecionada. Subsequentemente, uma decodificação aritmética é realizada para obter um valor de uma variável r, em que o valor da variável r descreve diversos bits menos significativos, por exemplo, um bit menos significativo associado à variável a e um bit menos significativo associado à variável b. A função “ARITH_DECODE” é utilizada para obter o valor r, em que a tabela de frequências cumulativas “arith_cf_r” é utilizada para a decodificação aritmética.
Subsequentemente, os valores das variáveis a e b são atualizados. Para esta finalidade, a variável a é mudada à esquerda por um bit, e o bit menos significativo da variável mudada a é definido o valor definido pelo bit menos significativo do valor r. A variável b é mudada à esquerda por um bit, e o bit menos significativo da variável mudada b é definido o valor definido por bit 1 da variável r, em que o bit 1 da variável r tem um peso numérico de 2 na representação binária da variável r. O algoritmo 412ba é então repetido até que todos os bits menos significativos sejam decodificados.
Depois da decodificação dos planos de bits menos significativos, uma matriz “x_ac_dec” é atualizada em que os valores das variáveis a,b são armazenados nas entradas da dita matriz tendo índices da matriz 2*i e 2*i+1.
Subsequentemente, o estado de contexto é atualizado chamando a função “arith_update_context(i,a,b)”, detalhes que serão explicados abaixo tendo como referência a figura 5g.
Subsequente à atualização do estado de contexto, que é realizada na etapa 313, os algoritmos 312 e 313 são repetidos, até que a variável de execução i atinja o valor de lg/2 ou uma condição de parada aritmética seja detectada.
Subsequentemente, um algoritmo de acabamento “arith_finish()” é realizado, como pode ser visto no número de referência 315. Detalhes do algoritmo de acabamento “arith_finish()” serão descritos abaixo tendo como referência a figura 5m.
Subsequente ao algoritmo de acabamento 315, os sinais dos valores espectrais são decodificados utilizando o algoritmo 314. Como pode ser visto, os sinais dos valores espectrais que são diferentes de zero são individualmente codificados. No algoritmo 314, os sinais são lidos para todos os valores espectrais tendo índices i entre i=0 e i=lg-1 que não são zero. Para cada valor espectral não zero tendo um índice do valor espectral i entre i=0 e i=lg-1, um valor (tipicamente um único bit) s é lido do fluxo de bits. Se o valor de s, que é lido do fluxo de bits é igual a 1, o sinal do dito valor espectral é invertido. Para esta finalidade, o acesso é feito à matriz “x_ac_dec”, para determinar se o valor espectral tendo o índice i é igual a zero e para atualizar o sinal dos valores espectrais decodificados. Entretanto, deve ser observado que os sinais das variáveis a, b não são mudados na decodificação de sinal 314.
Realizando o algoritmo de acabamento 315 antes da decodificação de sinais 314, é possível redefinir todos os bins necessários depois de um símbolo ARITH_STOP.
Deve ser observado aqui que o conceito para obter os valores dos planos de bits menos significativos não é de relevância particular em algumas realizações de acordo com a presente invenção. Em algumas realizações, a decodificação de quaisquer planos de bits menos significativos pode ser omitida. De modo alternativo, diferentes algoritmos de decodificação podem ser utilizados para esta finalidade.
11.2 Ordem de decodificação de acordo com a figura 4
A seguir, a ordem de decodificação dos valores espectrais será descrita.
Os coeficientes espectrais quantizados “x_ac_dec[]” são silenciosamente codificados e transmitidos (por exemplo, no fluxo de bits) começando do coeficiente com frequência mais baixa e continuando até o coeficiente com frequência mais alta.
Consequentemente, os coeficientes espectrais quantizados “x_ac_dec[]” são silenciosamente codificados começando do coeficiente com frequência mais baixa e continuando ao coeficiente com frequência mais alta. Os coeficientes espectrais quantizados são decodificados por grupos de dois coeficientes sucessivos (por exemplo, adjacentes na frequência) a e b reunindo em um tuplo duplo (a,b) (também designado como {a,b}). Deve ser observado aqui que os coeficientes espectrais quantizados são às vezes designados como “qdec”.
Os coeficientes decodificados “x_ac_dec[]” para um modo de domínio de frequência (por exemplo, coeficientes decodificados para uma codificação de áudio avançado, por exemplo, obtido utilizando uma transformação de cosseno discreto modificado, conforme discutido em ISO/IEC 14496, parte 3, subparte 4) são então armazenados em uma matriz “x_ac_quant[g][win][sfb][bin]”. A ordem de transmissão das senhas de codificação silenciosa é de modo que quando elas são decodificadas na ordem recebida e armazenada na matriz, “bin” é o índice que aumenta mais rapidamente, e “g” é o índice que aumenta mais lentamente. Dentro de uma senha, a ordem da decodificação é a,b.
Os coeficientes decodificados “x_ac_dec[]” para a excitação codificada por transformação (TCX) são armazenados, por exemplo, diretamente em uma matriz “x_tcx_invquant[win][bin]”, e uma ordem da transmissão da senha de codificação silenciosa é de modo que quando elas são decodificadas na ordem recebida e armazenada na matriz “bin” é o índice que aumenta mais rapidamente, e “win” é o índice que aumenta mais lentamente. Dentro de uma senha, uma ordem da decodificação é a, b. Em outras palavras, se os valores espectrais descrevem uma excitação codificada por transformação do filtro de previsão linear de um codificador de discurso, os valores espectrais a, b são associados às frequências adjacentes e de aumento da excitação codificada por transformação. Os coeficientes espectrais associados a uma frequência inferior são tipicamente codificados e decodificados antes de um coeficiente espectral associado a uma frequência mais alta.
Notavelmente, o decodificador de áudio 200 pode ser configurado para aplicar a representação decodificada de domínio de frequência 232, que é provida pelo decodificador aritmético 230, para uma geração “direta” de uma representação do sinal de áudio de domínio de tempo que utiliza uma transformação do sinal de domínio de frequência em domínio de tempo e para uma provisão “indireta” de uma representação do sinal de áudio de domínio de tempo que utiliza um decodificador de domínio de frequência em domínio de tempo e um filtro de previsão linear excitado pela saída do transformador de sinal de domínio de frequência em domínio de tempo.
Em outras palavras, o decodificador aritmético, a funcionalidade que é discutida aqui em detalhes, é bem adequada de valores espectrais de decodificação de uma representação de domínio de frequência de tempo de um conteúdo de áudio codificado no domínio de frequência, e para a provisão de uma representação de domínio de frequência de tempo de um sinal de estímulo para um filtro de previsão linear adaptado para decodificar (ou sintetizar) um sinal de discurso codificado no domínio de previsão linear. Assim, o decodificador aritmético é bem adequado para uso em um decodificador de áudio que pode lidar com o conteúdo de áudio codificado de domínio de frequência e conteúdo de áudio codificado de domínio de frequência previsivo linear (modo de excitação codificada por transformação-domínio de previsão linear).
11.3 Inicialização de contexto de acordo com as figuras 5a e 5b
A seguir, a inicialização de contexto (também designada como um “mapeamento de contexto”), que é realizada em uma etapa 310, será descrita.
A inicialização de contexto compreende um mapeamento entre um contexto anterior e um contexto corrente de acordo com o algoritmo “arith_map_context()”, um primeiro exemplo do que é mostrado na figura 5a e um segundo exemplo do que é mostrado na figura 5b.
Como pode ser visto, o contexto corrente é armazenado em uma variável global “q[2][n_context]” que toma a forma de uma matriz tendo uma primeira dimensão de 2 e uma segunda dimensão de “n_context”. Um contexto anterior pode opcionalmente (mas não necessariamente) ser armazenado em uma variável “qs[n_context]” que toma a forma da tabela tendo uma dimensão de “n context” (se for utilizado).
Tendo como referência o algoritmo de exemplo “arith_map_context” na figura 5a, a variável de entrada N descreve um comprimento de uma janela corrente e a variável de entrada “arith_reset_flag” indica se o contexto deve ser redefinido. Além disso, a variável global “previous_N” descreve um comprimento de uma janela prévia. Deve ser observado aqui que tipicamente um número de valores espectrais associado a uma janela é, pelo menos aproximadamente, igual à metade de um comprimento da dita janela em termos de amostras de domínio de tempo. Além disso, deve ser observado que um número de 2 tuplos de valores espectrais é, consequentemente, pelo menos aproximadamente igual a um quarto de um comprimento da dita janela em termos de amostras de domínio de tempo.
Tendo como referência o exemplo da figura 5a, o mapeamento do contexto pode ser realizado de acordo com o algoritmo “arith_map_context()”. Deve ser observado aqui que a função “arith_map_context()” define as entradas “q[0][j]” da matriz de contexto corrente q a zero para j=0 aj=N/4-1, se o indicador “arith_reset_flag” estiver ativo e consequentemente indica que o contexto deve ser redefinido. Caso contrário, ou seja, se o indicador “arith_reset_flag” estiver inativo, as entradas “q[0][j]” da matriz de contexto corrente q são derivadas das entradas “q[1][k]” da matriz de contexto corrente q. Deve ser observado que a função “arith_map_context()” de acordo com a figura 5a define as entradas “q[0][j]” da matriz de contexto corrente q aos valores “q[1][k]” da matriz de contexto corrente q, se o número de valores espectrais associado à corrente (por exemplo, codificado pelo domínio de frequência) a estrutura de áudio for idêntico ao número de valores espectrais associado à estrutura de áudio anterior para j=k=0 a j=k=N/4-1.
Um mapeamento mais complicado é realizado se o número de valores espectrais que está associado à estrutura corrente de áudio for diferente do número de valores espectrais que está associado à estrutura de áudio anterior. Entretanto, detalhes referentes ao mapeamento neste caso não são particularmente relevantes para esta ideia principal da presente invenção, de modo que a referência é feita ao código do pseudo- programa da figura 5a para detalhes.
Além disso, um valor de inicialização para o valor de contexto corrente numérico c é retornado pela função “arith_map_context()”. Este valor de inicialização é, por exemplo, igual ao valor da entrada “q[0][0]” mudada à esquerda em 12 bits. Assim, o valor de contexto (corrente) numérico c é apropriadamente inicializado para uma atualização iterativa.
Além disso, a figura 5b mostra outro exemplo de um algoritmo “arith_map_context()” que pode de modo alternativo ser utilizado. Para detalhes, a referência é feita ao código do pseudo-programa na figura 5b.
Para resumir o mencionado acima, o indicador “arith_reset_flag” determina se o contexto deve ser redefinido. Se o indicador for verdadeiro, um sub-algoritmo de redefinição 500a do algoritmo “arith_map_context()” é chamado. De modo alternativo, entretanto, se o indicador “arith_reset_flag” estiver inativo (que indica que nenhuma redefinição do contexto deve ser realizada), o processo de decodificação começa com uma fase de inicialização onde o vetor do elemento de contexto (ou matriz) q é atualizado copiando e mapeando os elementos de contexto da estrutura prévia armazenados em q[1][] em q[0][]. Os elementos de contexto dentro de q são armazenados em 4 bits por 2 tuplos. A cópia e/ou mapeamento do elemento de contexto são realizados em um sub- algoritmo 500b.
No exemplo da figura 5b, o processo de decodificação começa com uma fase de inicialização onde um mapeamento é feito entre o contexto anterior salvo armazenado em qs e o contexto da estrutura corrente q. O contexto anterior qs é armazenado em 2 bits por linha de frequência.
11.4 Cálculo do valor de estado de acordo com as figuras 5c e 5d
A seguir, o cálculo do valor de estado 312a será descrito em mais detalhes.
Um primeiro algoritmo de exemplo será descrito tendo como referência a figura 5c e um segundo algoritmo de exemplo será descrito tendo como referência a figura 5d.
Deve ser observado que o valor de contexto corrente numérico c (conforme mostrado na figura 3) pode ser obtido como um valor de retorno da função “arith_get_context(c,i,N)”, uma representação do código do pseudo- programa que é mostrada na figura 5c. De modo alternativo, entretanto, o valor de contexto corrente numérico c pode ser obtido como um valor de retorno da função “arith_get_context(c,i)”, uma representação do código do pseudo- programa que é mostrada na figura 5d.
Referente ao cálculo do valor de estado, a referência é também feita à figura 4, que mostra o contexto utilizado para uma avaliação de estado, ou seja, para o cálculo de um valor de contexto corrente numérico c. A figura 4 mostra uma representação bidimensional de valores espectrais, sobre o tempo e frequência. Uma abscissa 410 descreve o tempo, e uma ordenada 412 descreve a frequência. Como pode ser visto na figura 4, um tuplo 420 de valores espectrais para decodificar (preferivelmente que utiliza o valor de contexto corrente numérico), é associado a um índice de tempo t0 e um índice de frequência i. Como pode ser visto, para o índice de tempo t0, os tuplos tendo índices de frequência i-1, i-2, e i-3 já são decodificados no tempo cujos valores espectrais do tuplo 120, tendo o índice de frequência i, devem ser decodificados. Como pode ser visto da figura 4, um valor espectral 430 tendo um índice de tempo t0 e um índice de frequência i-1 já é decodificado antes de o tuplo 420 de valores espectrais serem decodificados, e o tuplo 430 de valores espectrais é considerado para o contexto que é utilizado para a decodificação do tuplo 420 de valores espectrais. De forma semelhante, um tuplo 440 de valores espectrais tendo um índice de tempo t0-1 e um índice de frequência de i-1, um tuplo 450 de valores espectrais tendo um índice de tempo t0-1 e um índice de frequência de i, e um tuplo 460 de valores espectrais tendo um índice de tempo t0-1 e um índice de frequência de i+1, já é decodificado antes de o tuplo 420 de valores espectrais ser decodificado, e são considerados para a determinação do contexto, que é utilizado para decodificar o tuplo 420 de valores espectrais. Os valores espectrais (coeficientes) já decodificados no tempo quando os valores espectrais do tuplo 420 são decodificados e considerados para o contexto são mostrados por um quadrado sombreado. Em contraste, alguns outros valores espectrais já decodificados (no tempo quando os valores espectrais do tuplo 420 são decodificados), mas não considerados para o contexto (para a decodificação dos valores espectrais do tuplo 420) são representados por quadrados tendo linhas tracejadas, e outros valores espectrais (que ainda não são decodificados no tempo quando os valores espectrais do tuplo 420 são decodificados) são mostrados por círculos tendo linhas tracejadas. Os tuplos representados por quadrados tendo linhas tracejadas e os tuplos representados por círculos tendo linhas tracejadas não são utilizados para determinar o contexto de decodificação dos valores espectrais do tuplo 420.
Entretanto, deve ser observado que alguns destes valores espectrais, que não são utilizados para o cálculo “regular” ou “normal” do contexto de decodificação dos valores espectrais do tuplo 420 podem, entretanto, ser avaliados para a detecção de diversos valores espectrais adjacentes previamente decodificados que cumprem, individualmente ou juntos, uma condição predeterminada referente às suas magnitudes. Detalhes referentes a esta questão serão discutidos abaixo.
Agora com referência à figura 5c, detalhes do algoritmo “arith_get_context(c,i,N)” serão descritos. A figura 5c mostra a funcionalidade da dita função “arith_get_context(c,i,N)” na forma de um código do pseudo-programa, que utiliza as convenções da linguagem C e/ou linguagem C++ bem conhecidas. Assim, outros detalhes referentes ao cálculo do valor de contexto corrente numérico “c” que é realizado pela função “arith_get_context(c,i,N)” serão descritos.
Deve ser observado que a função “arith_get_context(c,i,N)” recebe, como variáveis de entrada, um “contexto de estado antigo”, que pode ser descrito por um valor de contexto prévio numérico c. A função “arith_get_context(c,i,N)” também recebe, como uma variável de entrada, um índice i de um tuplo duplo de valores espectrais para decodificar. O índice i é tipicamente um índice de frequência. Uma variável de entrada N descreve um comprimento da janela de uma janela, na qual os valores espectrais são decodificados.
A função “arith_get_context(c,i,N)” provê, como um valor de saída, uma versão atualizada da variável de entrada c, que descreve um contexto de estado atualizado, e que pode ser considerado como um valor de contexto corrente numérico. Para resumir, a função “arith_get_context(c,i,N)” recebe um valor de contexto prévio numérico c como uma variável de entrada e provê uma versão atualizada deste, que é considerada como um valor de contexto corrente numérico. Além disso, a função “arith_get_context” considera as variáveis i, N, e também avalia a matriz “global” q[][].
Referente aos detalhes da função “arith_get_context(c,i,N)”, deve ser observado que a variável c, que inicialmente representa o valor de contexto prévio numérico em uma forma binária, é mudada à direita em 4 bits em uma etapa 504a. Assim, os quatro bits menos significativos do valor de contexto prévio numérico (representado pela variável de entrada c) são descartados. Ainda, os pesos numéricos de outros bits dos valores de contexto prévios numéricos são reduzidos, por exemplo, um fator de 16.
Além disso, se o índice i do tuplo duplo for menor que N/4-1, ou seja, não assume um valor máximo, o valor de contexto corrente numérico é modificado em que o valor da entrada q[0][i+1] é adicionado aos bits 12 a 15 (ou seja, aos bits tendo um peso numérico de 212, 213, 214, e 215) do valor de contexto mudado que é obtido na etapa 504a. Para esta finalidade, a entrada q[0][i+1] da matriz q[][] (ou, mais precisamente, uma representação binária do valor representado pela dita entrada) é mudada à esquerda em 12 bits. A versão mudada do valor representado pela entrada q[0][i+1] é então adicionada ao valor de contexto c, que é derivado na etapa 504a, ou seja, a representação numérica do valor de contexto prévio numérico um mudado por bit (mudado à direita em 4 bits). Deve ser observado aqui que a entrada q [0][i+1] da matriz q[][] representa um valor da sub- região associado a uma parte prévia do conteúdo de áudio (por exemplo, uma parte do conteúdo de áudio tendo índice de tempo t0- 1, conforme definido com referência à figura 4), e com uma frequência mais alta (por exemplo, uma frequência tendo um índice de frequência i+1, conforme definido com referência à figura 4) que o tuplo de valores espectrais a ser atualmente decodificado (que utiliza o valor de contexto corrente numérico c emitido pela função “arith_get_context(c,i,N)”). Em outras palavras, se o tuplo 420 de valores espectrais deve ser decodificado utilizando o valor de contexto corrente numérico, a entrada q[0][i+1] pode ter como base o tuplo 460 de valores espectrais previamente decodificados.
Uma adição seletiva da entrada q[0][i+1] da matriz q[][] (mudada à esquerda em 12 bits) é mostrada no número de referência 504b. Como pode ser visto, a adição do valor representado pela entrada q[0][i+1] é naturalmente realizada somente se o índice de frequência i não designar um tuplo de valores espectrais tendo o índice de frequência mais alta i=N/4-1.
Subsequentemente, em uma etapa 504c, uma operação Boolean AND- é realizada, na qual o valor da variável c é AND- combinado com um valor hexadecimal de 0xFFF0 para obter um valor atualizado da variável c. Realizando tal operação AND, os quatro bits menos significativos da variável c são efetivamente definidos a zero.
Em uma etapa 504d, o valor da entrada q[1][i-1] é adicionado ao valor da variável c, que é obtido pela etapa 504c, para então atualizar o valor da variável c. Entretanto, a dita atualização da variável c na etapa 504d é somente realizada se o índice de frequência i do tuplo duplo para decodificar for maior que zero. Deve ser observado que a entrada q[1][i-1] é um valor da sub-região de contexto com base em um tuplo de valores espectrais previamente decodificados da parte corrente do conteúdo de áudio para frequências menores que as frequências dos valores espectrais a ser decodificados que utilizam o valor de contexto corrente numérico. Por exemplo, a entrada q[1][i-1] da matriz q[][] pode ser associada ao tuplo 430 tendo o índice de tempo t0 e o índice de frequência i-1, se for assumido que o tuplo 420 de valores espectrais deve ser decodificado utilizando o valor de contexto corrente numérico retornado pela presente execução da função “arith_get_context(c,i,N)”.
Para resumir, os bits 0, 1, 2, e 3 (ou seja, uma parte de quatro bits menos significativos) do valor de contexto prévio numérico são descartados na etapa 504a alternando-os da representação numérica binária do valor de contexto prévio numérico. Além disso, os bits 12, 13, 14, e 15 da variável mudada c (ou seja, do valor de contexto mudado prévio numérico) são definidos para ter valores definidos pelo valor da sub-região de contexto q[0][i+1] na etapa 504b. Os bits 0, 1, 2, e 3 do valor de contexto mudado prévio numérico (ou seja, bits 4, 5, 6, e 7 do valor de contexto prévio numérico original) são sobrescritos pelo valor da sub-região de contexto q[1][i-1] nas etapas 504c e 504d.
Consequentemente, pode ser dito que os bits 0 a 3 do valor de contexto prévio numérico representam o valor da sub- região de contexto associado ao tuplo 432 de valores espectrais, os bits 4 a 7 do valor de contexto prévio numérico representam o valor da sub-região de contexto associado a um tuplo 434 de valores espectrais previamente decodificados, os bits 8 a 11 do valor de contexto prévio numérico representam o valor da sub- região de contexto associado ao tuplo 440 dos valores espectrais previamente decodificados e os bits 12 a 15 do valor de contexto prévio numérico representam um valor da sub-região de contexto associado ao tuplo 450 de valores espectrais previamente decodificados. O valor de contexto prévio numérico, que é inserido na função “arith_get_context(c,i,N)”, é associado a uma decodificação do tuplo 430 de valores espectrais.
O valor de contexto corrente numérico, que é obtido como uma variável de saída da função “arith_get_context(c,i,N)”, é associado a uma decodificação do tuplo 420 de valores espectrais. Assim, os bits 0 a 3 dos valores de contexto corrente numérico descrevem o valor da sub-região de contexto associado ao tuplo 430 dos valores espectrais, os bits 4 a 7 do valor de contexto corrente numérico descrevem o valor da sub-região de contexto associado ao tuplo 440 de valores espectrais, os bits 8 a 11 do valor de contexto corrente numérico descrevem o valor numérico da sub-região associado ao tuplo 450 de valor espectral e os bits 12 a 15 do valor de contexto corrente numérico descreveu o valor da sub-região de contexto associado ao tuplo 460 de valores espectrais. Assim, pode ser visto que uma parte do valor de contexto prévio numérico, a saber, os bits 8 a15 do valor de contexto prévio numérico, são também incluídos no valor de contexto corrente numérico, como os bits 4 a 11 do valor de contexto corrente numérico. Em contraste, os bits 0 a 7 do valor de contexto corrente prévio numérico são descartados ao derivar a representação numérica do valor de contexto corrente numérico da representação numérica do valor de contexto prévio numérico.
Em uma etapa 504e, a variável c que representa o valor de contexto corrente numérico é seletivamente atualizada se o índice de frequência i do tuplo duplo para decodificar for maior que um número predeterminado de, por exemplo, 3. Neste caso, ou seja, se i for maior que 3, é determinado se a soma dos valores da sub-região de contexto q[1][i-3], q[1][i-2], e q[1][i-1] for menor que (ou igual a) um valor predeterminado de, por exemplo, 5. Caso seja descoberto que a soma dos ditos valores da sub-região de contexto for menor que o dito valor predeterminado, um valor hexadecimal de, por exemplo, 0x10000, é adicionado à variável c. Assim, a variável c é definida de modo que a variável c indica se há uma condição na qual os valores da sub-região de contexto q[1][i-3], q[1][i-2], e q[1][i-1] compreendem um valor de soma particularmente pequeno. Por exemplo, o bit 16 do valor de contexto corrente numérico pode agir como um indicador para indicar tal condição.
Para concluir, o valor de retorno da função “arith_get_context(c,i,N)” é determinado pelas etapas 504a, 504b, 504c, 504d, e 504e, onde o valor de contexto corrente numérico é derivado do valor de contexto prévio numérico nas etapas 504a, 504b, 504c, e 504d, e em que um indicador indicando um ambiente de valores espectrais previamente decodificados tendo, em média, valores absolutos particularmente pequenos, é derivado na etapa 504e e adicionado à variável c. Assim, o valor da variável c obtido nas etapas 504a, 504b, 504c, 504d é retornado, em uma etapa 504f, como um valor de retorno da função “arith_get_context(c,i,N)”, se uma condição avaliada na etapa 504e não for cumprida. Em contraste, o valor da variável c, que é derivado nas etapas 504a, 504b, 504c, e 504d, é aumentado pelo valor hexadecimal de 0x10000 e o resultado desta operação de aumento é retornado, na etapa 504e, se a condição avaliada na etapa 540e for cumprida.
Para resumir o mencionado acima, deve ser observado que o decodificador silencioso emite 2 tuplos de coeficientes espectrais quantizados não assinados (conforme será descrito em mais detalhes abaixo). Primeiramente, o estado c do contexto é calculado com base nos coeficientes espectrais previamente decodificados “ao redor” do tuplo duplo para decodificar. Em uma realização preferida, o estado (que é, por exemplo, representado por um valor de contexto numérico) é adicionalmente atualizado utilizando o estado de contexto do último tuplo duplo decodificado (que é designado como um valor de contexto prévio numérico), considerando somente dois novos tuplos duplos (por exemplo, 2 tuplos 430 e 460). O estado é codificado nos 17 bits (por exemplo, utilizando uma representação numérica de um valor de contexto corrente numérico) e é retornado pela função “arith_get_context()”. Para detalhes, a referência é feita à representação do código do programa da figura 5c.
Além disso, deve ser observado que um código do pseudo-programa de uma realização alternativa da função “arith_get_context()” é mostrado na figura 5d. A função “arith_get_context(c,i)” de acordo com a figura 5d é semelhante à função “arith_get_context(c,i,N)” de acordo com a figura 5c. Entretanto, a função “arith_get_context(c,i)” de acordo com a figura 5d não compreende um manuseio especial ou decodificação de tuplos de valores espectrais que compreendem um índice mínimo de frequência de i=0 ou um índice máximo de frequência de i=N/4-1.
11.5 Seleção da regra de mapeamento
A seguir, a seleção de uma regra de mapeamento, por exemplo, a tabela de frequências cumulativas que descreve um mapeamento de um valor de senha em um código de símbolo, será descrita. A seleção da regra de mapeamento é feita dependendo de um estado de contexto, que é descrito pelo valor de contexto corrente numérico c.
11.5.1 Seleção da regra de mapeamento utilizando o algoritmo de acordo com a figura 5e
A seguir, a seleção de uma regra de mapeamento utilizando a função “arith_get_pk(c)” será descrita. Deve ser observado que a função “arith_get_pk()” é chamada no início do sub-algoritmo 312ba ao decodificar um valor de código “acod_m” para prover um tuplo de valores espectrais. Deve ser observado que a função “arith_get_pk(c)” é chamada com diferentes argumentos em diferentes iterações do algoritmo 312b. Por exemplo, em uma primeira iteração do algoritmo 312b, a função “arith_get_pk(c)” é chamada com um argumento que é igual ao valor de contexto corrente numérico c, provido pela prévia execução da função “arith_get_context(c,i,N)” na etapa 312a. Em contraste, em outras iterações do sub-algoritmo 312ba, a função “arith_get_pk(c)” é chamada com um argumento que é uma soma do valor de contexto corrente numérico c provida pela função “arith_get_context(c,i,N)” na etapa 312a, e uma versão de bit mudado do valor da variável “esc_nb”, em que o valor da variável “esc_nb” é mudado à esquerda em 17 bits. Assim, o valor de contexto corrente numérico c provido pela função “arith_get_context(c,i,N)” é utilizado como um valor de entrada da função “arith_get_pk()” na primeira iteração do algoritmo 312ba, ou seja, na decodificação de valores espectrais comparavelmente pequenos. Em contraste, ao decodificar valores espectrais comparavelmente maiores, a variável de entrada da função “arith_get_pk()” é modificada onde o valor da variável “esc_nb”, é levado em consideração, conforme é mostrado na figura 3.
Agora com referência à figura 5e, que mostra uma representação do código do pseudo-programa de uma primeira realização da função “arith_get_pk(c)”, deve ser observado que a função “arith_get_pk()” recebe a variável c como um valor de entrada, em que a variável c descreve o estado do contexto, e em que a variável de entrada c da função “arith_get_pk()” é igual ao valor de contexto corrente numérico provido como uma variável de retorno da função “arith_get_context()” pelo menos em algumas situações. Além disso, deve ser observado que a função “arith_get_pk()” provê, como uma variável de saída, a variável “pki”, que descreve um índice de um modelo de probabilidade e que pode ser considerado como um valor de índice de regra de mapeamento.
Tendo como referência a figura 5e, pode ser visto que a função “arith_get_pk()” compreende uma inicialização da variável 506a, em que a variável “i_min” é inicializada para ter o valor de -1. De forma semelhante, a variável i é definida para ser igual à variável “i_min”, de modo que a variável i é também inicializada a um valor de -1. A variável “i_max” é inicializada para assumir um valor que é menor, em 1, que o número de entradas da tabela “ari_lookup_m[]” (detalhes que serão descritos tendo como referência as figuras 21(1) e 21(2)). Assim, as variáveis “i_min” e “i_max” definem um intervalo.
Subsequentemente, uma pesquisa 506b é realizada para identificar um valor de índice que designa uma entrada da tabela “ari_hash_m”, de modo que o valor da variável de entrada c da função “arith_get_pk()” dentro de um intervalo definido pela dita entrada e uma entrada adjacente.
Na pesquisa 506b, um sub-algoritmo 506ba é repetido, enquanto uma diferença entre as variáveis “i_max” e “i_min” for maior que 1. No sub-algoritmo 506ba, a variável i é definida para ser igual a um meio aritmético dos valores das variáveis “i_min” e “i_max”. Consequentemente, a variável i designa uma entrada da tabela “ari_hash_m[]” em um meio de um intervalo da tabela definido pelos valores das variáveis “i_min” e “i_max”. Subsequentemente, a variável j é definida para ser igual ao valor da entrada “ari_hash_m[i]” da tabela “ari_hash_m[]”. Assim, a variável j assume um valor definido por uma entrada da tabela “ari_hash_m[]”, cuja entrada permanece no meio de um intervalo da tabela definido pelas variáveis “i_min” e “i_max”.
Subsequentemente, o intervalo definido pelas variáveis “i_min” e “i_max” é atualizado se o valor da variável de entrada c da função “arith_get_pk()” for diferente de um valor de estado definido pelos bits superiores da entrada de tabela “j=ari_hash_m[i]” da tabela “ari_hash_m[]”. Por exemplo, os “bits superiores” (bits 8 e acima) das entradas da tabela “ari_hash_m[]”descrevem valores de estado significativos. Assim, o valor “j>>8” descreve um valor de estado significativo representado pela entrada “j=ari_hash_m[i]” da tabela “ari_hash_m[]” designada pela tabela hash-valor de índice i. Assim, se o valor da variável c for menor que o valor “j>>8”, isto significa que o valor de estado descrito pela variável c é menor que um valor de estado significativo descrito pela entrada “ari_hash_m[i]” da tabela “ari_hash_m[]”. Neste caso, o valor da variável “i_max” é definido para ser igual ao valor da variável i, que por sua vez tem o efeito que um tamanho do intervalo definido por “i_min” e “i_max” é reduzido, em que o novo intervalo é aproximadamente igual à metade inferior do intervalo prévio. Se for observado que a variável de entrada c da função “arith_get_pk()” é maior que o valor “j>>8”, que significa que o valor de contexto descrito pela variável c é maior que um valor de estado significativo descrito pela entrada “ari_hash_m[i]” da matriz “ari_hash_m[]”, o valor da variável “i_min” é definido para ser igual ao valor da variável i. Assim, o tamanho do intervalo definido pelos valores das variáveis “i_min” e “i_max” é reduzido aproximadamente metade do tamanho do intervalo prévio, definido pelos valores prévios das variáveis “i_min” e “i_max”. Para ser mais preciso, o intervalo definido pelo valor atualizado da variável “i_min” e pelo valor prévio da variável (não mudado) “i_max” é aproximadamente igual à metade superior do intervalo prévio no caso em que o valor da variável c é maior que o valor de estado significativo definido pela entrada “ari_hash_m[i]”.
Se, entretanto, for observado que o valor de contexto descrito pela variável de entrada c do algoritmo “arith_get_pk()” é igual ao valor de estado significativo definido pela entrada “ari_hash_m[i]” (ou seja, c==(j>>8)), um valor de índice de regra de mapeamento definido pelos 8 bits mais inferiores da entrada “ari_hash_m[i]” é retornado como o valor de retorno da função “arith_get_pk()” (instrução “return (j&0xFF)”).
Para resumir o mencionado acima, uma entrada “ari_hash_m[i]”, os bits superiores (bits 8 e acima) dos quais descrevem um valor de estado significativo, é avaliada em cada iteração 506ba, e o valor de contexto (ou valor de contexto corrente numérico) descrito pela variável de entrada c da função “arith_get_pk()” é comparado com o valor de estado significativo descrito pela dita entrada de tabela “ari_hash_m[i]”. Se o valor de contexto representado pela variável de entrada c for menor que o valor de estado significativo representado pela entrada de tabela “ari_hash_m[i]”, o limite superior (descrito pelo valor “i_max”) do intervalo da tabela é reduzido, e se o valor de contexto descrito pela variável de entrada c é maior que o valor de estado significativo descrito pela entrada de tabela “ari_hash_m[i]”, o limite inferior (que é descrito pelo valor da variável “i_min”) do intervalo da tabela é aumentado. Em ambos os ditos casos, o sub-algoritmo 506ba é repetido, a menos que o tamanho do intervalo (definido pela diferença entre “i_max” e “i_min”) seja menor que, ou igual a, 1. Se, em contraste, o valor de contexto descrito pela variável c for igual ao valor de estado significativo descrito pela entrada de tabela “ari_hash_m[i]”, a função “arith_get_pk()” é abortada, em que o valor de retorno é definido pelos 8 bits mais inferiores da entrada de tabela “ari_hash_m[i]”.
Se, entretanto, a pesquisa 506b for finalizada por causa do tamanho do intervalo atingir seu valor mínimo (“i_max” - “i_min” é menor que, ou igual a, 1), o valor de retorno da função “arith_get_pk()” é determinado por uma entrada “ari_lookup_m[i_max]” da tabela “ari_lookup_m[]”, que pode ser vista no número de referência 506c. Assim, as entradas da tabela “ari_hash_m[]” definem tanto os valores de estado significativos como os limites de intervalos. No sub-algoritmo 506ba, os limites de intervalo da pesquisa “i_min” e “i_max” são adaptados de forma iterativa, de modo que a entrada “ari_hash_m[i]” da tabela “ari_hash_m[]”, um índice da tabela hash i do qual permanece, pelo menos aproximadamente, no centro do intervalo da pesquisa definido pelos valores de limite de intervalo “i_min” e “i_max”, pelo menos aproxima um valor de contexto descrito pela variável de entrada c. É então atingido que o valor de contexto descrito pela variável de entrada c dentro de um intervalo definido por “ari_hash_m[i_min]” e “ari_hash_m[i_max]” depois da conclusão das iterações do sub- algoritmo 506ba, a menos que o valor de contexto descrito pela variável de entrada c seja igual a um valor de estado significativo descrito por uma entrada da tabela “ari_hash_m[]”.
Se, entretanto, a repetição iterativa do sub- algoritmo 506ba for terminada por causa do tamanho do intervalo (definido por “i_max” - i_min”) ela atinge ou excede seu valor mínimo, é assumido que o valor de contexto descrito pela variável de entrada c não é um valor de estado significativo. Neste caso, o índice “i_max”, que designa um limite superior do intervalo, é, entretanto utilizado. O valor superior “i_max” do intervalo, que é atingido na última iteração do sub-algoritmo 506ba, é reutilizado como um valor de índice da tabela para um acesso à tabela “ari_lookup_m”. A tabela “ari_lookup_m[]” descreve valores de índice de regra de mapeamento associado aos intervalos de diversos valores de contexto numéricos adjacentes. Os intervalos, nos quais os valores de índice de regra de mapeamento descritos pelas entradas da tabela “ari_lookup_m[]” estão associados, são definidos pelos valores de estado significativos descritos pelas entradas da tabela “ari_hash_m[]”. As entradas da tabela “ari_hash_m” definem ambos os valores de estado significativos e os limites de intervalos de valores de contexto numéricos adjacentes. Na execução do algoritmo 506b, é determinado se o valor de contexto numérico descrito pela variável de entrada c é igual a um valor de estado significativo, e se este não for o caso, cujo intervalo de valores de contexto numéricos (dos diversos intervalos, limites dos quais são definidos pelos valores de estado significativo) o valor de contexto descrito pela variável de entrada c permanece. Assim, o algoritmo 506b cumpre uma funcionalidade dupla para determinar se a variável de entrada c descreve um valor de estado significativo e, se não for o caso, para identificar um intervalo, delimitado por valores de estado significativos, no qual o valor de contexto representado pela variável de entrada c permanece. Assim, o algoritmo 506e é particularmente eficiente e requer somente um número comparavelmente pequeno de acessos da tabela.
Para resumir o mencionado acima, o estado de contexto c determina a tabela de frequências cumulativas utilizada para decodificar o plano de bit a bit mais significativo m. O mapeamento de c ao índice da tabela de frequências cumulativas “pki” correspondente conforme realizado pela função “arith_get_pk()”. Uma representação do código do pseudo-programa da dita função “arith_get_pk()” foi explicado tendo como referência a figura 5e.
Para resumir o mencionado acima, o valor m é decodificado utilizando a função “arith_decode()” (que é descrita em mais detalhes abaixo) chamada com a tabela de frequências cumulativas “arith_cf_m[pki][]”, onde “pki” corresponde ao índice (também designado como valor de índice de regra de mapeamento) retornado pela função “arith_get_pk()”, que é descrita com referência à figura 5e.
11.5.2 Seleção da regra de mapeamento utilizando o algoritmo de acordo com a figura 5f
A seguir, outra realização de uma seleção do algoritmo da regra de mapeamento “arith_get_pk()” será descrito com referência à figura 5f que mostra uma representação do código do pseudo-programa de tal algoritmo, que pode ser utilizado na decodificação de um tuplo de valores espectrais. O algoritmo de acordo com a figura 5f pode ser considerado como uma versão otimizada (por exemplo, versão otimizada de velocidade) do algoritmo, “get_pk()” ou do algoritmo “arith_get_pk()”.
O algoritmo “arith_get_pk()” de acordo com a figura 5f recebe, como uma variável de entrada, uma variável c que descreve o estado do contexto. A variável de entrada c pode, por exemplo, representar um valor de contexto corrente numérico.
O algoritmo “arith_get_pk()” provê, como uma variável de saída, uma variável “pki”, que descreve o índice de uma distribuição de probabilidade (ou modelo de probabilidade) associado a um estado do contexto descrito pela variável de entrada c. A variável “pki” pode, por exemplo, ser um valor de índice de regra de mapeamento.
O algoritmo de acordo com a figura 5f compreende uma definição dos conteúdos da matriz “i_diff[]”. Como pode ser visto, uma primeira entrada da matriz “i_diff[]” (tendo um índice da matriz 0) é igual a 299 e outras entradas da matriz (tendo índices da matriz 1 a 8) tomam os valores de 149, 74, 37, 18, 9, 4, 2, e 1. Assim, o tamanho da etapa para a seleção de um valor do índice da tabela hash “i_min” é reduzido com cada iteração, como as entradas das matrizes “i_diff[]” definem os ditos tamanhos das etapas. Para detalhes, a referência é feita à discussão abaixo.
Entretanto, diferentes tamanhos das etapas, por exemplo, diferentes conteúdos da matriz “i_diff[]” podem geralmente ser escolhidos, em que os conteúdos da matriz “i_diff[]” podem naturalmente ser adaptados ao tamanho da tabela hash “ari_hash_m[i]”.
Deve ser observado que a variável “i_min” é inicializada para assumir um valor de 0 correto no início do algoritmo “arith_get_pk()”.
Em uma etapa de inicialização 508a, uma variável s é inicializada dependendo da variável de entrada c, em que uma representação numérica da variável c é mudada à esquerda em 8 bits a fim de obter a representação numérica da variável s.
Subsequentemente, uma pesquisa de tabela 508b é realizada, a fim de identificar um valor de índice da tabela hash “i_min” de uma entrada da tabela hash “ari_hash_m[]”, de modo que o valor de contexto descrito pelo valor de contexto c dentro de um intervalo que é delimitado pelo valor de contexto descrito pela entrada da tabela hash “ari_hash_m[i_min]” e um valor de contexto descrito por outra entrada da tabela hash “ari_hash_m” cuja outra entrada “ari_hash_m” seja adjacente (em termos de seu valor do índice da tabela hash) à entrada da tabela hash “ari_hash_m[i_min]”. Assim, o algoritmo 508b permite determinar um valor de índice da tabela hash “i_min” designando uma entrada “j=ari_hash_m[i_min]” da tabela hash “ari_hash_m[]”, de modo que a entrada da tabela hash “ari_hash_m[i_min]” pelo menos aproxime o valor de contexto descrito pela variável de entrada c.
A pesquisa de tabela 508b compreende uma execução iterativa de um sub-algoritmo 508ba, em que o sub-algoritmo 508ba é executado para um número predeterminado de, por exemplo, nove iterações. Na primeira etapa do sub-algoritmo 508ba, a variável i é definida a um valor que é igual a uma soma de um valor de uma variável “i_min” e um valor de uma entrada de tabela “i_diff[k]”. Deve ser observado aqui que k é uma variável de execução, que é aumentada, começando de um valor inicial de k=0, com cada iteração do sub-algoritmo 508ba. A matriz “i_diff[]” define predeterminar os valores de aumento, em que os valores de aumento diminuem com o aumento do índice da tabela k, ou seja, com aumento dos números de iterações.
Em uma segunda etapa do sub-algoritmo 508ba, um valor de uma entrada de tabela “ari_hash_m[]” é copiado em uma variável j. Preferivelmente, os bits superiores das entradas da tabela “ari_hash_m[]” descrevem valores de estado significativos de um valor de contexto numérico, e os bits mais inferiores (bits 0 a 7) das entradas da tabela “ari_hash_m[]”descrevem valores de índice de regra de mapeamento associado aos respectivos valores de estado significativos.
Em uma terceira etapa do sub-algoritmo 508ba, o valor da variável S é comparado com o valor da variável j, e a variável “i_min” é seletivamente definida ao valor “i+1” se o valor da variável s for maior que o valor da variável j. Subsequentemente, a primeira etapa, a segunda etapa, e a terceira etapa do sub-algoritmo 508ba são repetidas para um número predeterminado de vezes, por exemplo, nove vezes. Assim, em cada execução do sub-algoritmo 508ba, o valor da variável “i_min” é aumentado por i_diff[]+1, se, e somente se, o valor de contexto descrito pelo índice da tabela hash atualmente válido i_min + i_diff[] for menor que o valor de contexto descrito pela variável de entrada c. Assim, o valor de índice da tabela hash “i_min” é (de forma iterativa) aumentado em cada execução do sub-algoritmo 508ba se (e somente se) o valor de contexto descrito pela variável de entrada c e, consequentemente, pela variável s, for maior que o valor de contexto descrito pela entrada “ari_hash_m[i=i_min + diff[k]]”.
Além disso, deve ser observado que somente uma única comparação, a saber, a comparação como se o valor da variável s fosse maior que o valor da variável j, é realizada em cada execução do sub-algoritmo 508ba. Assim, o algoritmo 508ba é computacionalmente particularmente eficiente. Além disso, deve ser observado que há diferentes possíveis resultados com relação ao valor final da variável “i_min”. Por exemplo, é possível que o valor da variável “i_min” depois da última execução do sub- algoritmo 512ba seja de modo que o valor de contexto descrito pela entrada de tabela “ari_hash_m[i_min]” seja menor que o valor de contexto descrito pela variável de entrada c, e que o valor de contexto descrito pela entrada de tabela “ari_hash_m[i_min +1]” seja maior que o valor de contexto descrito pela variável de entrada c. De modo alternativo, pode acontecer que depois da última execução do sub-algoritmo 508ba, o valor de contexto descrito pela entrada da tabela hash “ari_hash_m[i_min -1]” seja menor que o valor de contexto descrito pela variável de entrada c, e que o valor de contexto descrito pela entrada “ari_hash_m[i_min]” seja maior que o valor de contexto descrito pela variável de entrada c. De modo alternativo, entretanto, pode acontecer que o valor de contexto descrito pela entrada da tabela hash “ari_hash_m[i_min]” seja idêntico ao valor de contexto descrito pela variável de entrada c.
Por esta razão, uma provisão do valor de retorno com base na decisão 508c é realizada. A variável j é definida para ter o valor da entrada da tabela hash “ari_hash_m[i_min]”. Subsequentemente, é determinado se o valor de contexto descrito pela variável de entrada c (e também pela variável s) é maior que o valor de contexto descrito pela entrada “ari_hash_m[i_min]” (primeiro caso definido por uma condição “s>j”), ou se o valor de contexto descrito pela variável de entrada c for menor que o valor de contexto descrito pela entrada da tabela hash caso definido por uma condição contexto descrito pela variável de de contexto descrito pela entrada “ari_hash_m[i_min]” (terceiro caso).
No primeiro caso, (s>j), uma entrada “ari_lookup_m[i_min +1]” da tabela “ari_lookup_m[]” designada pelo valor de índice da tabela “i_min+1” é retornada como o valor de saída da função “arith_get_pk()”. No segundo caso (c<(j>>8)), uma entrada “ari_lookup_m[i_min]” da tabela “ari_lookup_m[]” designada pelo valor de índice da tabela “i_min” é retornado como o valor de retorno da função “arith_get_pk()”. No terceiro caso (ou seja, se o valor de contexto descrito pela variável de entrada c for igual ao valor de estado significativo descrito pela entrada de tabela “ari_hash_m[i_min]”), um valor de índice de regra de mapeamento descrito pelos 8 bits mais inferiores da entrada da tabela hash “ari_hash_m[i_min]” é retornado como o valor de retorno da função “arith_get_pk()”.
Para resumir o mencionado acima, uma pesquisa de tabela particularmente simples é realizada na etapa 508b, em que a pesquisa de tabela provê um valor da variável de uma variável “i_min” sem distinguir se o valor de contexto descrito pela variável de entrada c é igual a um valor de estado significativo definido por uma das entradas da tabela de estado “ari_hash_m[]” ou não. Na etapa 508c, que é realizada subsequente à pesquisa de tabela 508b, uma relação de magnitude entre o valor de contexto descrito pela variável de entrada c e um valor de estado significativo descrito pela entrada da tabela hash “ari_hash_m[i_min]” é avaliada, e o valor de retorno da função “arith_get_pk()” é selecionado dependendo de um resultado da dita avaliação, em que o valor da variável “i_min”, que é determinado na avaliação da tabela 508b, é considerado para selecionar um valor de índice de regra de mapeamento mesmo se o valor de contexto descrito pela variável de entrada c for diferente do valor de estado significativo descrito pela entrada da tabela hash “ari_hash_m[i_min]” .
Ainda deve ser observado que a comparação no algoritmo deve preferivelmente (ou de modo alternativo) ser feita entre o índice de contexto (valor de contexto numérico) c e j=ari_hash_m[i]>>8. Ainda, cada entrada da tabela “ari_hash_m[]” representa um índice de contexto, codificado além do 8° bit, e seu modelo de probabilidade correspondente codificado nos primeiros 8 bits (bits menos significativos). Na implementação corrente, estamos interessados principalmente no conhecimento se o presente contexto c é maior que ari_hash_m[i]>>8, que é equivalente à detecção se s=c<<8 for também maior que ari_hash_m[i].
Para resumir o mencionado acima, visto que o estado de contexto é calculado (que pode, por exemplo, ser obtido utilizando o algoritmo “arith_get_context(c,i,N)” de acordo com a figura 5c, ou o algoritmo “arith_get_context(c,i)” de acordo com a figura 5d, o plano de bit a bit mais significativo é decodificado utilizando o algoritmo “arith_decode” (que será descrito abaixo) chamado com a tabela de frequências cumulativas apropriada correspondente ao modelo de probabilidade correspondente ao estado de contexto. A correspondência é feita pela função “arith_get_pk()”, por exemplo, a função “arith_get_pk()” que foi discutida com referência à figura 5f.
11.6 Decodificação aritmética 11.6.1 Decodificação aritmética utilizando o algoritmo de acordo com a figura 5g
A seguir, a funcionalidade da função “arith_decode()” será discutida em detalhes com referência à figura 5g.
Deve ser observado que a função “arith_decode()” utiliza a função de ajuda “arith_first_symbol (void)”, que retorna VERDADEIRA, se for o primeiro símbolo da sequência e FALSA caso contrário. A função “arith_decode()” também utiliza a função de ajuda “arith_get_next_bit(void)”, que obtém e provê o próximo bit do fluxo de bits.
Além disso, a função “arith_decode()” utiliza as variáveis globais “low” [baixa], “high” [alta] e “value” [valor]. Ainda, a função “arith_decode()” recebe, como uma variável de entrada, a variável “cum_freq[]”, que aponta em direção a uma primeira entrada ou elemento (tendo o índice de elemento ou índice de entrada 0) da tabela de frequências cumulativas selecionada ou sub-tabela de frequências cumulativas. Ainda, a função “arith_decode()” utiliza a variável de entrada “cfl”, que indica o comprimento da tabela de frequências cumulativas selecionada ou sub-tabela de frequências cumulativas designada pela variável “cum_freq[]”.
A função “arith_decode()” compreende, como uma primeira etapa, uma inicialização da variável 570a, que é realizada se a função de ajuda “arith_first_symbol()” indicar que o primeiro símbolo de uma sequência de símbolos está sendo decodificado. A inicialização do valor 550a inicializa a variável “value” dependendo de diversos, por exemplo, 16 bits, que são obtidos do fluxo de bits utilizando a função de ajuda “arith_get_next_bit”, de modo que a variável “value” tenha o valor representado pelos ditos bits. Ainda, a variável “low” é inicializada para ter o valor de 0, e a variável “high” é inicializada para ter o valor de 65535.
Em uma segunda etapa 570b, a variável “range” [faixa] é definida a um valor, que é maior, em 1, que a diferença entre os valores das variáveis “high” e “low”. A variável “cum” é definida a um valor que representa uma posição relativa do valor da variável “value” entre o valor da variável “low” e o valor da variável “high”. Assim, a variável “cum” tem, por exemplo, um valor entre 0 e 216 dependendo do valor da variável “value”.
O apontador p é inicializado a um valor que é menor, em 1, que o endereço inicial da tabela de frequências cumulativas selecionada.
O algoritmo “arith_decode()” também compreende uma pesquisa iterativa da tabela de frequências cumulativas 570c. A pesquisa iterativa da tabela de frequências cumulativas é repetida até que a variável cfl seja menor que ou igual a 1. Na pesquisa iterativa da tabela de frequências cumulativas 570c, a variável do apontador q é definida a um valor, que é igual a uma soma do valor corrente da variável do apontador p e metade do valor da variável “cfl”. Se o valor da entrada *q da tabela de frequências cumulativas selecionada, cuja entrada é direcionada pela variável do apontador q, for maior que o valor da variável “cum”, a variável do apontador p é definida ao valor da variável do apontador q, e a variável “cfl” é aumentada. Finalmente, a variável “cfl” é mudada à direita por um bit, assim divide efetivamente o valor da variável “cfl” por 2 e ignora a parte do módulo.
Assim, a pesquisa iterativa da tabela de frequências cumulativas 570c efetivamente compara o valor da variável “cum” com diversas entradas da tabela de frequências cumulativas selecionada, a fim de identificar um intervalo dentro da tabela de frequências cumulativas selecionada, que é delimitado pelas entradas da tabela de frequências cumulativas, obtendo a soma do valor dentro do intervalo identificado. Assim, as entradas da tabela de frequências cumulativas selecionada definem os intervalos, em que um respectivo valor do símbolo está associado a cada um dos intervalos da tabela de frequências cumulativas selecionada. Ainda, as larguras dos intervalos entre dois valores adjacentes da tabela de frequências cumulativas definem as probabilidades dos símbolos associados aos ditos intervalos, de modo que a tabela de frequências cumulativas selecionada em sua totalidade defina uma distribuição de probabilidade de diferentes símbolos (ou valores de símbolos). Detalhes referentes às tabelas de frequências cumulativas disponíveis serão discutidos abaixo tendo como referência a figura 23.
Tendo como referência novamente a figura 5g, o valor do símbolo é derivado do valor da variável do apontador p, em que o valor do símbolo é derivado conforme mostrado no número de referência 570d. Assim, a diferença entre o valor da variável do apontador p e do endereço inicial “cum_freq” é avaliada a fim de obter o valor do símbolo, que é representado pela variável “symbol” [símbolo].
O algoritmo “arith_decode” também compreende uma adaptação 570e das variáveis “high” e “low”. Se o valor do símbolo representado pela variável “symbol” for diferente de 0, a variável “high” é atualizada, conforme mostrado no número de referência 570e. Ainda, o valor da variável “low” é atualizado, conforme mostrado no número de referência 570e. A variável “high” é definida a um valor que é determinado pelo valor da variável “low”, a variável “range” e a entrada tendo o índice “symbol -1” da tabela de frequências cumulativas selecionada. A variável “low” é aumentada, em que a magnitude do aumento é determinada pela variável “range” e a entrada da tabela de frequências cumulativas selecionada tendo o índice “symbol”. Assim, a diferença entre os valores das variáveis “low” e “high” é ajustada dependendo da diferença numérica entre as duas entradas adjacentes da tabela de frequências cumulativas selecionada.
Assim, se um valor do símbolo tendo uma baixa probabilidade for detectado, o intervalo entre os valores das variáveis “low” e “high” é reduzido à largura estreita. Em contraste, se o valor do símbolo detectado compreende uma probabilidade relativamente grande, a largura do intervalo entre os valores das variáveis “low” e “high” é ajustada ao valor comparavelmente grande. Novamente, a largura do intervalo entre os valores da variável “low” e “high” é dependente do símbolo detectado e as entradas da tabela de frequências cumulativas correspondentes.
O algoritmo “arith_decode()” também compreende uma renormalização do intervalo 570f, na qual o intervalo determinado na etapa 570e é de forma iterativa mudado e escalado até que a condição de “interrupção” seja atingida. Na renormalização do intervalo 570f, uma operação de mudança para baixo seletiva 570fa é realizada. Se a variável “high” for menor que 32768, nada é feito, e a renormalização do intervalo continua com uma operação de aumento do tamanho do intervalo 570fb. Se, entretanto, a variável “high” não for menor que 32768 e a variável “low” for maior ou igual a 32768, as variáveis “values”, “low” e “high” são todas reduzidas a 32768, de modo que um intervalo definido pelas variáveis “low” e “high” seja mudado para baixo, e de modo que o valor da variável “value” também seja mudado para baixo. Se, entretanto, for observado que o valor da variável “high” não é menor que 32768, e que a variável “low” não é maior ou igual a 32768, e que a variável “low” é maior ou igual a 16384 e que a variável “high” é menor que 49152, as variáveis “value”, “low” e “high” são todas reduzidas a 16384, assim reduzindo o intervalo entre os valores das variáveis “high” e “low” e também o valor da variável “value”. Se, entretanto, nenhuma das condições acima for cumprida, a renormalização do intervalo é abortada.
Se, entretanto, qualquer uma das condições mencionadas acima, que são avaliadas na etapa 570fa, for cumprida, a operação de aumento do intervalo 570fb é executada. Na operação de aumento do intervalo 570fb, o valor da variável “low” é dobrado. Ainda, o valor da variável “high” é dobrado, e o resultado da operação de dobrar é aumentado em 1. Ainda, o valor da variável “value” é dobrado (mudada à esquerda por um bit), e um bit do fluxo de bits, que é obtido pela função de ajuda “arith_get_next_bit” é utilizado como o bit menos significativo. Assim, o tamanho do intervalo entre os valores das variáveis “low” e “high” é aproximadamente dobrado, e a precisão da variável “value” é aumentada utilizando um novo bit do fluxo de bits. Conforme mencionado acima, as etapas 570fa e 570fb são repetidas até que a condição de “interrupção” seja atingida, ou seja, até que o intervalo entre os valores das variáveis “low” e “high” seja grande suficiente.
Com referência à funcionalidade do algoritmo “arith_decode()”, deve ser observado que o intervalo entre os valores das variáveis “low” e “high” é reduzido na etapa 570e dependendo de duas entradas adjacentes da tabela de frequências cumulativas referenciadas pela variável “cum_freq”. Se um intervalo entre dois valores adjacentes da tabela de frequências cumulativas selecionada for pequeno, ou seja, se os valores adjacentes são comparavelmente juntos, o intervalo entre os valores das variáveis “low” e “high”, que é obtido na etapa 570e, será comparavelmente pequeno. Em contraste, se duas entradas adjacentes da tabela de frequências cumulativas são mais espaçadas, o intervalo entre os valores das variáveis “low” e “high”, que é obtido na etapa 570e, será comparavelmente grande.
Consequentemente, se o intervalo entre os valores das variáveis “low” e “high”, que é obtido na etapa 570e, for comparavelmente pequeno, um grande número de renormalização das etapas de intervalo será executado para redimensionar o intervalo ao tamanho “suficiente” (de modo que nenhuma das condições de uma avaliação de condição 570fa seja cumprida). Assim, um número comparavelmente grande de bits do fluxo de bits será utilizado a fim de aumentar a precisão da variável “value”. Se, em contraste, o tamanho do intervalo obtido na etapa 570e for comparavelmente grande, somente um número menor de repetições das etapas de normalização do intervalo 570fa e 570fb será necessário a fim de renormalizar o intervalo entre os valores das variáveis “low” e “high” ao tamanho “suficiente”. Assim, somente um número comparavelmente pequeno de bits do fluxo de bits será utilizado para aumentar a precisão da variável “value” e para preparar uma decodificação do próximo símbolo.
Para resumir o mencionado acima, se um símbolo é decodificado, que compreende uma probabilidade comparavelmente alta, e no qual um grande intervalo é associado pelas entradas da tabela de frequências cumulativas selecionada, somente um número comparavelmente pequeno de bits será lido do fluxo de bits a fim de permitir uma decodificação de um símbolo subsequente. Em contraste, se um símbolo é decodificado, que compreende uma probabilidade comparavelmente pequena e no qual um pequeno intervalo é associado pelas entradas da tabela de frequências cumulativas selecionada, um número comparavelmente grande de bits será considerado do fluxo de bits a fim de preparar uma decodificação do próximo símbolo.
Assim, as entradas das tabelas de frequências cumulativas refletem as probabilidades dos diferentes símbolos e também refletem um número de bits necessários para a decodificação de uma sequência de símbolos. Pela variação da tabela de frequências cumulativas dependendo de um contexto, ou seja, dependendo dos símbolos previamente decodificados (ou valores espectrais), por exemplo, selecionando diferentes tabelas de frequências cumulativas dependendo do contexto, as dependências estocásticas entre os diferentes símbolos podem ser exploradas, que permitem uma codificação eficiente da taxa de bits particular dos símbolos subsequentes (ou adjacentes).
Para resumir o mencionado acima, a função “arith_decode()”, que foi descrita com referência à figura 5g, é chamada com a tabela de frequências cumulativas “arith_cf_m[pki][]”, correspondente ao índice “pki” retornado por uma função “arith_get_pk()” para determinar o valor do plano de bits mais significativo m (que pode ser definido ao valor do símbolo representado pela variável “symbol” de retorno).
Para resumir o mencionado acima, o decodificador aritmético é uma implementação de número inteiro utilizando o método da geração de identificação com escala. Para detalhes, a referência é feita ao livro “Introduction to Data Compression” de K. Sayood, Terceira Edição, 2006, Elsevier Inc.
O código do programa de computador de acordo com a figura 5g descreve o algoritmo utilizado de acordo com uma realização da invenção.
11.6.2 Decodificação aritmética utilizando o algoritmo de acordo com as figuras 5h e 5i
As figuras 5h e 5i mostram uma representação do código do pseudo-programa de outra realização do algoritmo “arith_decode()”, que pode ser utilizado como uma alternativa para o algoritmo “arith_decode” descrito com referência à figura 5g.
Deve ser observado que os algoritmos de acordo com a figura 5g e as figuras 5h e 5i podem ser utilizados no algoritmo “values_decode()” de acordo com a figura 3.
Para resumir, o valor m é decodificado utilizando a função “arith_decode()” chamada com a tabela de frequências cumulativas “arith_cf_m[pki][]” em que “pki” corresponde ao índice retornado pela função “arith_get_pk()”. O codificador (ou decodificador) aritmético é uma implementação de número inteiro utilizando o método de geração de identificação com escala. Para detalhes, a referência é feita ao livro “Introduction to Data Compression” de K. Sayood, Terceira Edição, 2006, Elsevier Inc. O código do programa de computador de acordo com a figura 5h e 5i descreve o algoritmo utilizado.
11.7 Mecanismo de escape
A seguir, o mecanismo de escape, que é utilizado na decodificação do algoritmo “values_decode()” de acordo com a figura 3, será brevemente discutido.
Quando o valor decodificado m (que é provido como um valor de retorno da função “arith_decode()”) for o símbolo de escape “ARITH_ESCAPE”, as variáveis “lev” e “esc_nb” são aumentadas em 1, e o outro valor m é decodificado. Neste caso, a função “arith_get_pk()” é chamada mais uma vez com o valor “c+ esc_nb<<17” como argumento de entrada, onde a variável “esc_nb” descreve o número de símbolos de escape previamente decodificados para o mesmo tuplo duplo e delimitado a 7.
Para resumir, se um símbolo de escape for identificado, assume-se que o valor do plano de bits mais significativo m compreende um peso numérico aumentado. Além disso, a decodificação numérica corrente é repetida, em que um valor de contexto corrente numérico modificado “c+ esc_nb<<17” é utilizado como uma variável de entrada à função “arith_get_pk()”. Assim, um valor de índice de regra de mapeamento diferente “pki” é tipicamente obtido nas diferentes iterações do sub-algoritmo 312ba.
11.8 Mecanismo de parada aritmética
A seguir, o mecanismo de parada aritmética será descrito. O mecanismo de parada aritmética permite a redução do número de bits necessários no caso em que a parte da frequência superior é completamente quantizada a 0 em um codificador de áudio.
Em uma realização, um mecanismo de parada aritmética pode ser implementado como segue: visto que o valor m não é o símbolo de escape, “ARITH_ESCAPE”, o decodificador verifica se o m sucessivo forma um símbolo “ARITH_ESCAPE”. Se uma condição “esc_nb >0&&m==0” for verdadeira, o símbolo “ARITH_STOP” é detectado e o processo de decodificação é finalizado. Neste caso, o decodificador vai diretamente para a função “arith_finish()” que será descrita abaixo. A condição significa que o restante da estrutura é composto por valores 0.
11.9 Decodificação do plano de bits menos significativo
A seguir, a decodificação de um ou mais planos de bits menos significativos será descrita. A decodificação do plano de bits menos significativo, é realizada, por exemplo, na etapa 312d mostrada na figura 3. De modo alternativo, entretanto, os algoritmos conforme mostrados nas figuras 5j e 5n podem ser utilizados.
11.9.1 Decodificação do plano de bits menos significativo de acordo com a figura 5j
Agora com referência à figura 5j, pode ser visto que os valores das variáveis a e b são derivados do valor m. Por exemplo, a representação numérica do valor m é mudada à direita em 2 bits para obter a representação numérica da variável b. Além disso, o valor da variável a é obtido subtraindo uma versão mudada do bit do valor da variável b, mudado por bit à esquerda em 2 bits, do valor da variável m.
Subsequentemente, uma decodificação aritmética dos valores do plano de bits menos significativo r é repetida, em que o número de repetições é determinado pelo valor da variável “lev”. Um valor do plano de bits menos significativo r é obtido utilizando a função “arith_decode”, em que a tabela de frequências cumulativas adaptada à decodificação do plano de bit menos significativo é utilizada (tabela de frequências cumulativas “arith_cf_r”). Um bit menos significativo (tendo um peso numérico de 1) da variável r descreve um plano de bits menos significativo do valor espectral representado pela variável a, e um bit tendo um peso numérico de 2 da variável r descreve um bit menos significativo do valor espectral representado pela variável b. Assim, a variável a é atualizada mudando a variável a para a esquerda em 1 bit e adicionando o bit tendo o peso numérico de 1 da variável r como o bit menos significativo. De forma semelhante, a variável b é atualizada mudando a variável b à esquerda por um bit e adicionando o bit tendo o peso numérico de 2 da variável r.
Assim, os dois bits que carregam informação mais significativa das variáveis a,b são determinados pelo valor do plano de bits mais significativo m, e um ou mais bits menos significativos (se houver) dos valores a e b são determinados por um ou mais valores do plano de bits menos significativo r.
Para resumir o mencionado acima, se o símbolo “ARITH_STOP” não for encontrado, os planos de bits restantes são então decodificados, se houver algum, para o tuplo duplo presente. Os planos de bits restantes são decodificados do nível mais significativo ao menos significativo chamando a função “arith_decode()” lev várias vezes com a tabela de frequências cumulativas “arith_cf_r[]”. Os planos de bits decodificados r permitem a refinação do valor previamente decodificado m de acordo com o algoritmo, um código do pseudo-programa que é mostrado na figura 5j.
11.9.2 Decodificação da faixa de bit menos significativo de acordo com a figura 5n
De modo alternativo, entretanto, o algoritmo de uma representação do código do pseudo-programa que é mostrada na figura 5n pode também ser utilizado para a decodificação do plano de bits menos significativo. Neste caso, se o símbolo “ARITH_STOP” não for encontrado, os planos de bits restantes são então decodificados, se houver algum, para o presente tuplo duplo. Os planos de bits restantes são decodificados do nível mais significativo ao menos significativo chamando “lev” vezes “arith_decode()” com a tabela de frequências cumulativas “arith_cf_r()”. Os planos de bits decodificados r permitem a refinação do valor previamente decodificado m de acordo com o algoritmo mostrado na figura 5n.
11.10 Atualização de contexto 11.10.1 Atualização de contexto de acordo com a figura 5k, 5l, e 5m
A seguir, as operações utilizadas para concluir a decodificação do tuplo de valores espectrais serão descritas, tendo como referência as figuras 5k e 5l. Além disso, uma operação será descrita que é utilizada para concluir uma decodificação de um conjunto de tuplos de valores espectrais associados a uma parte corrente (por exemplo, uma estrutura corrente) de um conteúdo de áudio.
Agora com referência à figura 5k, pode ser visto que a entrada tendo o índice de entrada 2*i da matriz “x_ac_dec[]” é definida para ser igual a a, e que a entrada tendo o índice de entrada “2*i+1” da matriz “x_ac_dec[]” é definida para ser igual a b depois da decodificação de bit menos significativo 312d. Em outras palavras, no ponto depois da decodificação de bit menos significativo 312d, o valor não sinalizado do tuplo duplo (a,b), é completamente decodificado. É salvo no elemento (por exemplo, a matriz “x_ac_dec[]”) que mantém os coeficientes espectrais de acordo com o algoritmo mostrado na figura 5k.
Subsequentemente, o contexto “q” também é atualizado para o próximo tuplo duplo. Deve ser observado que esta atualização de contexto também deve ser realizada para o último tuplo duplo. Esta atualização de contexto é realizada pela função “arith_update_context()”, uma representação do código do pseudo- programa do qual é mostrado na figura 5l.
Agora com referência à figura 5l, pode ser visto que a função “arith_update_context(i,a,b)” recebe, como variáveis de entrada, coeficientes espectrais quantizados decodificados não sinalizados (ou valores espectrais) a, b do tuplo duplo. Além disso, a função “arith_update_context” também recebe, como uma variável de entrada, um índice i (por exemplo, um índice de frequência) do coeficiente espectral quantizado para decodificar.
Em outras palavras, a variável de entrada i pode, por exemplo, ser um índice do tuplo de valores espectrais, valores absolutos que são definidos pelas variáveis de entrada a, b. Como pode ser visto, a entrada “q[1][i]” da matriz “q[][]” pode ser definida a um valor que é igual a a+b+1. Além disso, o valor da entrada “q[1][i]” da matriz “q[][]” pode ser limitado ao valor hexadecimal de “0xF”. Assim, a entrada “q[1][i]” da matriz “q[][]” é obtida calculando uma soma de valores absolutos do tuplo atualmente decodificados {a,b} de valores espectrais tendo o índice de frequência i, e adicionando 1 ao resultado da dita soma.
Deve ser observado aqui que a entrada “q[1][i]” da matriz “q[][]” pode ser considerada como um valor da sub-região de contexto, pois descreve uma sub-região do contexto que é utilizado para uma decodificação subsequente de valores espectrais adicionais (ou tuplos de valores espectrais).
Deve ser observado aqui que a soma dos valores absolutos a e b dos dois valores espectrais atualmente decodificados (versões assinadas que são armazenadas nas entradas “x_ac_dec[2*i]” e “x_ac_dec[2*i+1]” da matriz “x_ac_dec[]”), pode ser considerada como o cálculo de uma norma (por exemplo, uma norma L1) dos valores espectrais decodificados.
Foi observado que os valores da sub-região de contexto (ou seja, entradas da matriz “q[][]”), que descrevem uma norma de um vetor formado por diversos valores espectrais previamente decodificados são particularmente significativos e com memória eficiente. Foi observado que tal norma, que é calculada com base em diversos valores espectrais previamente decodificados, compreende informação significativa de contexto em uma forma compacta. Foi observado que o sinal dos valores espectrais não é tipicamente particularmente relevante para a escolha do contexto. Também foi observado que a formação de uma norma através dos diversos valores espectrais previamente decodificados tipicamente mantém a informação mais importante, embora alguns detalhes sejam descartados. Além disso, foi observado que uma limitação do valor de contexto corrente numérico ao valor máximo tipicamente não resulta em uma perda grave de informação. Preferivelmente, foi observado que é mais eficiente utilizar o mesmo estado de contexto para valores espectrais significativos que são maiores que um valor limite predeterminado. Assim, a limitação dos valores da sub-região de contexto traz consigo mais melhoria da eficiência da memória. Além disso, foi observado que a limitação dos valores da sub-região de contexto a certo valor máximo permite uma atualização eficiente computacional e particularmente simples do valor de contexto corrente numérico, que foi descrito, por exemplo, com referência às figuras 5c e 5d. Limitando os valores da sub-região de contexto ao valor comparavelmente pequeno (por exemplo, a um valor de 15), um estado de contexto que tem como base diversos valores da sub-região de contexto pode ser representado na forma eficiente, que foi discutida tendo como referência as figuras 5c e 5d.
Além disso, foi observado que uma limitação dos valores da sub-região de contexto dos valores entre 1 e 15, traz consigo um compromisso particularmente bom entre precisão e eficiência da memória, pois 4 bits são suficientes a fim de armazenar tal valor da sub-região de contexto.
Entretanto, deve ser observado que em outras realizações, um valor da sub-região de contexto pode ter como base um único valor decodificado espectral somente. Neste caso, a formação de uma norma pode opcionalmente ser omitida.
O próximo tuplo duplo da estrutura é decodificado depois da conclusão da função “arith_update_context” aumentando i em 1 e refazendo o mesmo processo conforme descrito acima, começando pela função “arith_get_context()”.
Quando os 2 tuplos lg/2 são decodificados dentro da estrutura, ou com o símbolo de parada de acordo com “ARITH_ESCAPE” ocorre, o processo de decodificação da amplitude espectral termina e a decodificação dos sinais começa.
Detalhes referentes à decodificação dos sinais foram discutidos com referência à figura 3, em que a decodificação dos sinais é mostrada em número de referência 314.
Visto que todos os coeficientes espectrais quantizados não sinalizados são decodificados, o sinal de acordo é adicionado. Para cada valor quantizado não nulo de “x_ac_dec”, um bit é lido. Se o valor de bit de leitura for igual a 0, o valor quantizado é positivo, nada é feito e o valor sinalizado é igual ao valor não sinalizado previamente decodificado. Caso contrário (ou seja, se o valor de bit de leitura é igual a 1), o coeficiente decodificado (ou valor espectral) é negativo e o complemento de dois é considerado do valor não sinalizado. Os bits do sinal são lidos das frequências baixa a mais alta. Para detalhes, a referência é feita às figuras 3 e as explicações referentes à decodificação de sinais 314.
A decodificação é finalizada chamando a função “arith_finish()”. Os coeficientes espectrais restantes são definidos a 0. Os respectivos estados de contexto são atualizados correspondentemente.
Para detalhes, a referência é feita à figura 5m, que mostra uma representação do código do pseudo-programa da função “arith_finish()”. Como pode ser visto, a função “arith_finish()” recebe uma variável de entrada lg que descreve os coeficientes espectrais quantizados decodificados. Preferivelmente, a variável de entrada lg da função “arith_finish” descreve um número de coeficientes espectrais atualmente decodificados, deixando os coeficientes espectrais desconsiderados, onde um valor 0 foi alocado em resposta à detecção de um símbolo “ARITH_STOP”. Uma variável de entrada N da função “arith_finish” descreve um comprimento da janela de uma janela corrente (ou seja, uma janela associada à parte corrente do conteúdo de áudio). Tipicamente, um número de valores espectrais associado a uma janela de comprimento N é igual a N/2 e um número de 2 tuplos de valores espectrais associado a uma janela de comprimento da janela N é igual a N/4.
A função “arith_finish” também recebe, como um valor de entrada, um vetor “x_ac_dec” de valores espectrais decodificados, ou pelo menos uma referência a tal vetor de coeficientes decodificados espectrais.
A função “arith_finish” é configurada para definir as entradas da matriz (ou vetor) “x_ac_dec”, para as quais nenhum valor espectral foi decodificado devido à presença de uma condição de parada aritmética, a 0. Além disso, a função “arith_finish” define valores da sub-região de contexto “q[1][i]”, que são associados a um valor espectral para qual nenhum valor foi decodificado devido à presença de uma condição de parada aritmética, ao valor predeterminado de 1. O valor predeterminado de 1 corresponde ao tuplo dos valores espectrais em que ambos os valores espectrais são iguais a 0.
Assim, a função “arith_finish()” permite atualizar toda a matriz (ou vetor) “x_ac_dec[]” de valores espectrais e também toda a matriz de valores da sub-região de contexto “q[1][i]”, mesmo em uma presença de uma condição de parada aritmética.
11.10.2 Atualização de contexto de acordo com as figuras 5o e 5p
A seguir, outra realização da atualização de contexto será descrita tendo como referência as figuras 5o e 5p. No ponto em que o valor não sinalizado do tuplo duplo (a,b) for completamente decodificado, o contexto q é então atualizado para o próximo tuplo duplo. A atualização também é realizada se o tuplo duplo presente for o último tuplo duplo. Ambas as atualizações são feitas pela função “arith_update_context()”, a representação do código do pseudo-programa que é mostrada na figura 5o.
O próximo tuplo duplo da estrutura é então decodificado aumentando i em 1 e chamando a função arith_decode(). Se os 2 tuplos lg/2 já foram decodificados com a estrutura, ou se o símbolo de parada “ARITH_STOP” ocorreu, a função “arith_finish()” é chamada. O contexto é salvo e armazenado na matriz (ou vetor) “qs” para a próxima estrutura. Um código do pseudo-programa da função “arith_save_context()” é mostrado na figura 5p.
Visto que todos os coeficientes espectrais quantizados não sinalizados são decodificados, o sinal é então adicional. Para cada valor não quantizado de “qdec”, um bit é lido. Se o valor de bit de leitura for igual a 0, o valor quantizado é positivo, nada é feito e o valor sinalizado é igual ao valor não sinalizado previamente decodificado. Caso contrário, o coeficiente decodificado é negativo e o complemento de dois é considerado do valor não sinalizado. Os bits sinalizados são lidos das frequências baixas às altas.
11.11 Sumário do processo de decodificação
A seguir, o processo de decodificação será brevemente resumido. Para detalhes, a referência é feita à discussão acima e também às figuras 3, 4, 5a, 5c, 5e, 5g, 5j, 5k,51, e 5m. Os coeficientes espectrais quantizados “x_ac_dec[]” são silenciosamente decodificados começando do coeficiente com frequência mais baixa e continuando ao coeficiente com frequência mais alta. Eles são decodificados por grupos de dois coeficientes sucessivos a,b reunindo um tuplo duplo (a,b).
Os coeficientes decodificados “x_ac_dec[]” para o domínio de frequência (ou seja, para um modo de domínio de frequência) são então armazenados na matriz “x_ac_quant[g][win][sfb][bin]”. Uma ordem de transmissão das senhas de codificação silenciosa é de modo que quando elas são decodificadas na ordem recebida e armazenada na matriz, “bin” é o índice que aumenta mais rapidamente e “g” é o índice que aumenta mais lentamente. Dentro de uma senha, uma ordem de decodificação é a, depois b. Os coeficientes decodificados “x_ac_dec[]” para “TCX” (ou seja, para uma decodificação de áudio que utiliza uma excitação codificada por transformação) são armazenados (por exemplo, diretamente) na matriz “x_tcx_invquant[win][bin]” e uma ordem da transmissão das senhas de codificação silenciosa é de modo que quando eles são decodificados na ordem recebida e armazenada na matriz, “bin” é o índice que aumenta mais rapidamente e “win” é o índice que aumenta mais lentamente. Dentro de uma senha, a ordem de decodificação é a, depois b.
Primeiro, o indicador “arith_reset_flag” determina se o contexto deve ser redefinido. Se o indicador for verdadeiro, isto é considerado na função “arith_map_context”.
O processo de decodificação começa com uma fase de inicialização onde o vetor do elemento de contexto “q” é atualizado copiando e mapeando os elementos de contexto da estrutura prévia armazenada em “q[1][]” em “q[0][]”. Os elementos de contexto dentro de “q” são armazenados em um 4 bits por 2 tuplos. Para detalhes, a referência é feita ao código do pseudo- programa da figura 5a.
O decodificador silencioso emite 2 tuplos de coeficientes espectrais quantizados não sinalizados. Primeiramente, o estado c do contexto é calculado com base nos coeficientes espectrais previamente decodificados ao redor do tuplo duplo para decodificar. Desta forma, o estado é adicionalmente atualizado utilizando o estado de contexto do último tuplo duplo decodificado considerando somente dois novos tuplos duplos. O estado é decodificado em 17 bits e é retornado pela função “arith_get_context”. Uma representação do código do pseudo-programa da função “arith_get_context” é mostrada na figura 5c.
O estado de contexto c determina a tabela de frequências cumulativas utilizada para decodificar o plano de bit a bit mais significativo m. O mapeamento de c ao índice da tabela de frequências cumulativas correspondente “pki” é realizado por uma função “arith_get_pk()”. Uma representação do código do pseudo-programa da função “arith_get_pk()” é mostrada na figura 5e.
O valor m é decodificado utilizando a função “arith_decode()” chamada com a tabela de frequências cumulativas, “arith_cf_m[pki][]”, onde “pki” corresponde ao índice retornado por “arith_get_pk()”. O codificador (e decodificador) aritmético é uma implementação do número inteiro utilizando um método de geração de identificação com escala. O código do pseudo-programa de acordo com a figura 5g descreve o algoritmo utilizado.
Quando o valor decodificado m for o símbolo de escape “ARITH_ESCAPE”, as variáveis “lev” e “esc_nb” são aumentadas em 1 e outro valor m é decodificado. Neste caso, a função “get_pk()” é chamada mais uma vez com o valor “c+ esc_nb<<17” como argumento de entrada, onde “esc_nb” é o número de símbolos de escape previamente decodificados para o mesmo tuplo duplo e delimitado a 7.
Visto que o valor m não é o símbolo de escape “ARITH_ESCAPE”, o decodificador verifica se o m sucessivo forma um símbolo “ARITH_STOP”. Se a condição “(esc_nb>0&&m==0)” for verdadeira, o símbolo “ARITH_STOP” é detectado e o processo de decodificação é finalizado. O decodificador vai diretamente para a decodificação do sinal descrita posteriormente. A condição significa que o restante da estrutura é composto por 0 valores.
Se o símbolo “ARITH_STOP” não for encontrado, os planos de bits restantes são então decodificados, se houver algum, para o presente tuplo duplo. Os planos de bits restantes são decodificados do nível mais significativo ao menos significativo, chamando “arith_decode()” lev várias vezes com a tabela de frequências cumulativas “arith_cf_r[]”. Os planos de bits decodificados r permitem a refinação do valor previamente decodificado m, de acordo com o algoritmo de um código do pseudo- programa que é mostrado na figura 5j. Neste ponto, o valor não sinalizado do tuplo duplo (a,b) é completamente decodificado. É salvo no elemento que mantém os coeficientes espectrais de acordo com o algoritmo, uma representação do código do pseudo-programa que é mostrada na figura 5k.
O contexto “q” é também atualizado para o próximo tuplo duplo. Deve ser observado que esta atualização de contexto também deve ser realizada para o último tuplo duplo. Esta atualização de contexto é realizada pela função “arith_update_context()”, uma representação do código do pseudo- programa que é mostrada na figura 5l.
O próximo tuplo duplo da estrutura é então decodificado aumentando i em 1 e refazendo o mesmo processo conforme descrito acima, começando pela função “arith_get_context()”. Quando os 2 tuplos lg/2 são decodificados dentro da estrutura, ou quando o símbolo de parada “ARITH_STOP” ocorre, o processo de decodificação da amplitude espectral termina e a decodificação dos sinais começa.
A decodificação é finalizada chamando uma função “arith_finish()”. Os coeficientes espectrais restantes são definidos a 0. Os respectivos estados de contexto são atualizados correspondentemente. Uma representação do código do pseudo- programa da função “arith_finish” é mostrada na figura 5m.
Visto que todos os coeficientes espectrais quantizados não sinalizados são decodificados, o sinal de acordo é adicionado. Para cada valor quantizado não nulo de “x_ac_dec”, um bit é lido. Se o valor de bit de leitura for igual a 0, o valor quantizado é positivo, e nada é feito, e o valor sinalizado é igual ao valor não sinalizado previamente decodificado. Caso contrário, o coeficiente decodificado é negativo e o complemento de dois é considerado do valor não sinalizado. Os bits sinalizados são lidos das frequências baixas às altas.
11.12 Legendas
A figura 5q mostra uma legenda das definições que está relacionada aos algoritmos de acordo com as figuras 5a, 5c, 5e, 5f, 5g, 5j, 5k, 5l, e 5m.
A figura 5r mostra uma legenda das definições que está relacionada aos algoritmos de acordo com as figuras 5b, 5d, 5f, 5h, 5i, 5n, 5o, e 5p.
12. Tabelas de mapeamento
Em uma realização, de acordo com a invenção, particularmente tabelas vantajosas “ari_lookup_m”, “ari_hash_m”, e “ari_cf_m” são utilizadas para a execução da função “arith_get_pk()” de acordo com a figura 5e ou a figura 5f, e para a execução da função “arith_decode()” conforme discutido com referência às figuras 5g, 5h e 5i. Entretanto, deve ser observado que diferentes tabelas podem ser utilizadas em algumas realizações de acordo com a invenção.
12.1 Tabela “ari hash m[600]” de acordo com a figura 22
Um conteúdo de uma implementação particularmente vantajosa da tabela “ari_hash_m”, que é utilizado pela função “arith_get_pk”, uma primeira realização que foi descrita com referência à figura 5e, e uma segunda realização que foi descrita com referência à figura 5f, é mostrada na tabela da figura 22. Deve ser observado que a tabela da figura 22 lista as 600 entradas da tabela (ou matriz) “ari_hash_m[600]”. Também deve ser observado que a representação em tabela da figura 22 mostra os elementos em uma ordem do índice de elementos, de modo que o primeiro valor “0x000000100UL” corresponda à entrada de tabela “ari_hash_m[0]” tendo um índice de elemento (ou índice da tabela) 0, e de modo que o último valor “0x7ffffffff4fUL” corresponda à entrada de tabela “ari_hash_m[599]” tendo o índice de elemento ou índice da tabela 599. Ainda deve ser observado aqui que “0x” indica que as entradas de tabela da tabela “ari_hash_m[]” são representadas em um formato hexadecimal. Além disso, deve ser observado aqui que o sufixo “UL” indica que as entradas de tabela da tabela “ari_hash_m[]” são representadas como valores de número inteiro “longos” não sinalizados (tendo uma precisão de 32 bits).
Além disso, deve ser observado que as entradas de tabela da tabela “ari_hash_m[]” de acordo com a figura 22 são dispostas em uma ordem numérica, a fim de permitir a execução da pesquisa da tabela 506b, 508b, 510b da função “arith_get_pk()”.
Ainda deve ser observado que os 24 bits mais significativos das entradas de tabela da tabela “ari_hash_m” representam certos valores de estado significativos, enquanto os 8 bits menos significativos representam valores de índice de regra de mapeamento “pki”. Assim, as entradas da tabela “ari_hash_m[]” descrevem um mapeamento de “impacto direto” de um valor de contexto em um valor de índice de regra de mapeamento “pki”.
Entretanto, os 24 bits mais altos das entradas da tabela “ari_hash_m[]” representam, ao mesmo tempo, limites de intervalos de valores de contexto numéricos, no quais o mesmo valor de índice de regra de mapeamento está associado. Detalhes referentes a este conceito já foram discutidos acima.
12.2 Tabela “ari lookup m” de acordo com a figura 21
Um conteúdo de uma realização particularmente vantajosa da tabela “ari_lookup_m” é mostrado na tabela da figura 21. Deve ser observado aqui que a tabela da figura 21 lista as entradas da tabela “ari_lookup_m”. As entradas são referenciadas por um índice de entrada do tipo número inteiro unidimensional (também designado como “índice de elemento” ou “índice da matriz” ou “índice da tabela”) que é, por exemplo, designado como “i_max” ou “i_min”. Deve ser observado que a tabela “ari_lookup_m”, que compreende um total de 600 entradas, é bem adequada para uso pela função “arith_get_pk” de acordo com a figura 5e ou a figura 5f. Também deve ser observado que a tabela “ari_lookup_m” de acordo com a figura 21 é adaptada para cooperar com a tabela “ari_hash_m” de acordo com a figura 22.
Deve ser observado que as entradas da tabela “ari_lookup_m[600]” são listadas em ordem crescente do índice da tabela “i” (por exemplo, “i_min” ou “i_max”) entre 0 e 599. O termo “0x” indica que as entradas da tabela são descritas em um formato hexadecimal. Assim, a primeira entrada de tabela “0x02” corresponde à entrada de tabela “ari_lookup_m[0]” tendo o índice da tabela 0 e a última entrada de tabela “0x5E” corresponde à entrada de tabela “ari_lookup_m[599]” tendo o índice da tabela 599.
Também deve ser observado que as entradas da tabela “ari_lookup_m[]” são associadas aos intervalos definidos pelas entradas adjacentes da tabela “arith_hash_m[]”. Assim, as entradas da tabela “ari_lookup_m” descrevem valores de índice de regra de mapeamento associados aos intervalos de valores de contexto numéricos, em que os intervalos são definidos pelas entradas da tabela “arith_hash_m”.
12.3 . Tabela “ari cf m[96][17]” de acordo com a figura 23
A figura 23 mostra um conjunto de 96 tabelas de frequências cumulativas (ou sub-tabelas) “ari_cf_m[pki][17]”, uma que é selecionada pelo codificador de áudio 100, 700 ou um decodificador de áudio 200, 800, por exemplo, para a execução da função “arith_decode()”, ou seja, para uma decodificação do valor do plano de bits mais significativo. A selecionada das 96 tabelas de frequências cumulativas (ou sub-tabelas) mostradas na figura 23 considera uma função da tabela “cum_freq[]” na execução da função “arith_decode()”.
Como pode ser visto da figura 23, cada sub-bloco representa a tabela de frequências cumulativas tendo 17 entradas. Por exemplo, um primeiro sub-bloco 2310 representa as 17 entradas da tabela de frequências cumulativas para “pki=0”. Um segundo sub- bloco 2312 representa as 17 entradas da tabela de frequências cumulativas para “pki=1”. Finalmente, um 96° sub-bloco 2396 representa as 17 entradas da tabela de frequências cumulativas para “pki=95”. Assim, a figura 23 efetivamente representa 96 diferentes tabelas de frequências cumulativas (ou sub-tabelas) de “pki=0” para “pki=95”, em que cada uma das 96 tabelas de frequências cumulativas é representada por um sub-bloco (envolvido por suportes enrolados), e em que cada uma das ditas tabelas de frequências cumulativas compreende 17 entradas.
Dentro de um sub-bloco (por exemplo, um sub-bloco 2310 ou 2312, ou um sub-bloco 2396), um primeiro valor descreve uma primeira entrada da tabela de frequências cumulativas (tendo um índice da matriz ou índice da tabela de 0), e um último valor descreve uma última entrada da tabela de frequências cumulativas (tendo um índice da matriz ou índice da tabela de 16).
Assim, cada sub-bloco 2310, 2312, 2396 da representação da tabela da figura 23 representa as entradas da tabela de frequências cumulativas para uso pela função “arith_decode” de acordo com a figura 5g, ou de acordo com as figuras 5h e 5i. A variável de entrada “cum_freq[]” da função “arith_decode” descreve qual das 96 tabelas de frequências cumulativas (representadas pelos sub-blocos individuais de 17 entradas da tabela “arith_cf_m”) deve ser utilizada para a decodificação dos coeficientes espectrais correntes.
12.4 Tabela “ari cf r[]” de acordo com a figura 24
A figura 24 mostra um conteúdo da tabela “ari_cf_r[]”.
As quatro entradas da dita tabela são mostradas na figura 24. Entretanto, deve ser observado que a tabela “ari_cf_r” pode eventualmente ser diferente em outras realizações.
13. Avaliação de desempenho e vantagens
As realizações, de acordo com a invenção, utilizam as funções atualizadas (ou algoritmos) e um conjunto de tabelas atualizadas, conforme discutido acima, a fim de obter uma desvantagem melhorada entre a complexidade computacional, exigência de memória, e eficiência da codificação.
Falando de forma geral, as realizações, de acordo com a invenção, criam uma codificação espectral silenciosa melhorada. As realizações, de acordo com a presente invenção, descrevem uma melhoria da codificação espectral silenciosa em USAC (codificação de áudio e voz unificada).
As realizações, de acordo com a invenção, criam uma proposta atualizada para CE na codificação espectral silenciosa melhorada de coeficientes espectrais, com base nos esquemas conforme apresentado nos papéis de entrada MPEG m16912 e m17002. Ambas as propostas foram avaliadas, resultados potenciais eliminados e as forças combinadas.
Como em m16912 e m17002, a proposta resultante tem como base o contexto original com base no esquema de codificação aritmético como o projeto de trabalho 5 USAC (o padrão de projeto na codificação de áudio e voz unificada), mas pode significantemente reduzir as exigências de memória (memória de acesso aleatório (RAM) e memória para somente leitura (ROM)) sem aumentar a complexidade computacional, enquanto mantém a eficiência da codificação. Além disso, foi provado ser possível uma transcodificação sem perdas de fluxos de bits de acordo com o projeto de trabalho 3 do Padrão de Projeto USAC e de acordo com o projeto de trabalho 5 do Padrão de Projeto USAC. As realizações, de acordo com a invenção, têm o objetivo de substituir o esquema espectral de codificação silenciosa conforme utilizado no projeto de trabalho 5 do Padrão de Projeto USAC.
O esquema de codificação aritmético descrito aqui tem como base o esquema como no modelo de referência 0 (RM0) ou o projeto de trabalho 5 (WD) do Padrão de Projeto USAC. Os coeficientes espectrais na frequência ou em tempo modelam um contexto. Este contexto é utilizado para a seleção de tabelas de frequências cumulativas para o codificador aritmético. Comparado ao projeto de trabalho 5 (WD), o modelamento de contexto é ainda melhorado e as tabelas que mantém as probabilidades do símbolo foram treinadas novamente. O número de diferentes modelos de probabilidade foi elevado de 32 a 96.
As realizações, de acordo com a invenção, reduzem o tamanho das tabelas (demanda da ROM de dados) a 1518 palavras de 32 bits de comprimento ou 6072-bytes (WD 5: 16.894,5 palavras ou 67.578-bytes). A demanda de RAM estática é reduzida de 666 palavras (2.664 bytes) para 72 palavras (288 bytes) por canal do codificador de núcleo. Ao mesmo tempo, preserva completamente o desempenho da codificação e pode ainda atingir um ganho de aproximadamente 1,29 a 1,95% comparado a taxa de dados total sobre todos os 9 pontos operacionais. Todos os fluxos de bits do projeto de trabalho 3 e do projeto de trabalho 5 podem ser transcodificados sem perdas, sem afetar as restrições do reservatório de bit.
A seguir, uma breve descrição dos conceitos de codificação de acordo com o projeto de trabalho 5 do Padrão de Projeto USAC será provida para facilitar a compreensão das vantagens do conceito descrito aqui. Subsequentemente, algumas realizações preferidas, de acordo com a invenção, serão descritas.
No projeto de trabalho 5 USAC, um contexto com base no esquema de codificação aritmético é utilizado para a codificação silenciosa de coeficientes espectrais quantizados. Como o contexto, os coeficientes decodificados espectrais são utilizados, que são prévios na frequência e tempo. No projeto de trabalho 5, um número máximo de 16 coeficientes espectrais é utilizado como contexto, 12 deles sendo prévios em tempo. Ainda, os coeficientes espectrais utilizados para o contexto e ser decodificados, são agrupados como conjuntos de 4 tuplos (ou seja, 4 coeficientes espectrais próximos na frequência, ver a figura 14a). O contexto é reduzido e mapeado em uma tabela de frequências cumulativas, que é então utilizado para decodificar o próximo conjunto de 4 tuplos de coeficientes espectrais.
Para o esquema de codificação silenciosa completa do projeto de trabalho 5, uma demanda de memória (memória para somente leitura (ROM)) de 16894,5 palavras (67578 byte) é necessária. Adicionalmente, 666 palavras (2664 byte) da RAM estática por canal do codificador de núcleo são necessárias para armazenar os estados para a próxima estrutura. A representação em tabela da figura 14b descreve as tabelas conforme utilizadas no esquema de codificação aritmética USAC WD4.
Deve ser observado aqui que com relação à codificação silenciosa, os projetos de trabalho 4 e 5 do padrão de projeto USAC são os mesmos. Ambos usam o mesmo codificador silencioso.
Uma demanda de memória total de um decodificador completo USAC WD5 é estimada a 37000 palavras (148000-byte) para ROM de dados sem código do programa e 10000 a 17000 palavras para a RAM estática. Pode ser claramente visto que as tabelas do codificador silencioso consomem aproximadamente 45% da demanda total da ROM de dados. A maior tabela individual já consome 4096 palavras (16384-byte).
Foi observado que, o tamanho da combinação de todas as tabelas e as grandes tabelas individuais excedem os tamanhos de cache típicos conforme providos por processadores de ponto fixo utilizados nos dispositivos portáteis do consumidor, que está em uma faixa típica de 8 a 32 Kbytes (por exemplo, ARM9e, TI C64XX etc.). Isto significa que o conjunto de tabelas pode provavelmente não ser armazenado na RAM de dados rápidos, que permite um acesso aleatório rápido aos dados. Isto faz com que todo o processo de decodificação fique lento.
Além disso, foi observado que a tecnologia atual da codificação de áudio com sucesso como HE-AAC foi aprovada para ser implementada na maioria dos dispositivos móveis. HE-AAC utiliza um esquema de codificação de Huffman de entropia com um tamanho da tabela de 995 palavras. Para detalhes, a referência é feita a ISO/IEC JTC1/SC29/WG11 N2005, MPEG98, Fevereiro 1998, San Jose, “Revised Report on Complexity of MPEG-2 AAC2”.
No 90o Encontro MPEG, em papéis de entrada de MPEG m16912 e m17002, duas propostas foram apresentados cujo objetivo é reduzir as exigências de memória e melhorar a eficiência da codificação do esquema de codificação silenciosa. Analisando ambas as propostas, as conclusões a seguir poderiam ser consideradas. • Uma redução significativa da demanda de memória é possível reduzindo a dimensão da senha. Conforme mostrado no documento de entrada de MPEG m17002, reduzindo a dimensão dos conjuntos de 4 tuplos para conjuntos de 1 tuplo, a demanda de memória poderia ser reduzida de 16984,5 para 900 palavras sem infringir na eficiência da codificação; e • A redundância adicional poderia ser removida aplicando um livro de código da distribuição de probabilidade não uniforme para a codificação LSB, em vez de utilizar a distribuição de probabilidade uniforme.
No curso destas avaliações, foi identificado que o movimento a partir de um esquema de codificação de um conjunto de 4 tuplos para um conjunto de 1 tuplo, teve um impacto significativo na complexidade computacional: uma redução da dimensão da codificação aumenta pelo mesmo fator que o número de símbolos a codificar. Isto significa que para a redução dos conjuntos de 4 tuplos para conjuntos de 1 tuplo, as operações necessárias para determinar o contexto, acessar as tabelas hash e decodificar o símbolo devem ser realizadas com quatro vezes mais frequência que antes. Com um algoritmo mais sofisticado para determinado contexto, isto leva a um aumento na complexidade computacional por um fator de 2,5 ou x.xxPCU.
A seguir, o novo esquema proposto, de acordo com as realizações da presente invenção, será brevemente descrito.
Para superar a questão de consumo de memória e a complexidade computacional, um esquema de codificação silenciosa melhorado é proposto para substituir o esquema como no projeto de trabalho 5 (WD5). O foco principal no desenvolvimento foi colocado na redução da demanda de memória, enquanto mantém a eficiência de compressão e não aumenta a complexidade computacional. Mais especificamente, a meta era atingir uma boa troca (ou a melhor) no espaço de complexidade multi-dimensão do desempenho de compressão, complexidade e exigências de memória.
A proposta do novo esquema de codificação empresta a característica principal do codificador silencioso WD5, a saber, a adaptação do contexto. O contexto é derivado utilizando coeficientes espectrais previamente decodificados, tão próximo quanto em WD5 da estrutura passada e presente (em que uma estrutura pode ser considerada como uma parte do conteúdo de áudio). Entretanto, os coeficientes espectrais são agora codificados combinando dois coeficientes juntos para formar um tuplo duplo. Outra diferença permanece no fato de que os coeficientes espectrais são agora divididos em três partes, o sinal, os bits mais significativos ou o bit mais significativo (MSBs) e os bits menos significativos ou o bit menos significativo (LSBs). O sinal é codificado independentemente da magnitude que é ainda dividida em duas partes, os bits mais significativos (ou bits mais significativos) e o restante dos bits (ou bits menos significativos), se existirem. Os 2 tuplos nos quais a magnitude dos dois elementos é inferior ou igual a 3 são codificados diretamente pela codificação de MSBs. Caso contrário, uma senha de escape é transmitida primeiramente para sinalizar qualquer plano de bits adicional. Na versão base, a informação ausente, os LSBs e o sinal, são ambos codificados utilizando a distribuição uniforme de probabilidade. De modo alternativo, uma diferente distribuição de probabilidade pode ser utilizada.
A redução do tamanho da tabela é ainda possível, visto que: • somente probabilidades para 17 símbolos precisam ser armazenadas: símbolo {[0;+3], [0;+3]}+ESC; • não há necessidade em armazenar uma tabela de agrupamento (egrupos, dgrupos, dgvetores); • o tamanho da tabela hash pode ser reduzido com um treinamento realizado.
A seguir, alguns detalhes referentes à codificação de MSBs serão descritos. Conforme já mencionado, uma das principais diferenças entre WD5 do Padrão de Projeto USAC, uma proposta submetida no 90o Encontro de MPEG e a proposta atual é a dimensão dos símbolos. Em WD5 do Padrão de Projeto USAC, conjuntos de 4 tuplos foram considerados para a geração de contexto e a codificação silenciosa. Em uma proposta submetida no 90o Encontro de MPEG, os conjuntos de 1 tuplo foram utilizados em vez de reduzir as exigências da ROM. Durante o desenvolvimento, os 2 tuplos foram os mais comprometidos para reduzir as exigências da ROM, sem aumentar a complexidade computacional. Em vez de considerar quatro conjuntos de 4 tuplos para a inovação do contexto, agora quatro tuplos duplos são considerados. Conforme mostrado na figura 15a, três tuplos duplos surgem da estrutura passada (também designada como uma parte prévia do conteúdo de áudio) e outra surge da estrutura presente (também designada como a parte corrente do conteúdo de áudio).
A redução no tamanho da tabela é feita devido a três fatores principais. Primeiro, somente probabilidades para 17 símbolos precisam ser armazenadas (ou seja, símbolo {[0;+3], [0;+3]} + ESC). As tabelas de agrupamento (ou seja, egrupos, dgrupos, e dgvetores) não são mais necessárias. Finalmente, o tamanho da tabela hash foi reduzido realizando um treinamento apropriado.
Embora a dimensão fosse reduzida de quatro para dois, a complexidade foi mantida na faixa em WD5 do Padrão de Projeto USAC. Foi obtido simplificando tanto a geração de contexto como o acesso da tabela hash.
As diferentes simplificações e otimizações foram feitas de forma que o desempenho da codificação não foi afetado, e mais levemente melhorado. Foi obtido principalmente aumentando o número de modelos de probabilidade de 32 para 96.
A seguir, alguns detalhes referentes à codificação LSBs serão descritos. As LSBs são codificadas com uma distribuição uniforme de probabilidade em algumas realizações. Comparado ao WD5 do Padrão de Projeto USAC, as LSBs são agora consideradas dentro dos 2 tuplos em vez dos conjuntos de 4 tuplos.
A seguir alguns detalhes referentes à codificação do sinal serão explicados. O sinal é codificado sem utilizar o codificador de núcleo aritmético para redução de complexidade. O sinal é transmitido em 1 bit somente quando a magnitude correspondente é não nula. 0 significa um valor positivo e 1 significa um valor negativo.
A seguir, alguns detalhes referentes à demanda de memória serão explicados. O novo esquema proposto exibe uma demanda de ROM total de no máximo 1522.5 novas palavras (6090- bytes). Para detalhes, a referência é feita à tabela da figura 15b, que descreve as tabelas conforme utilizadas no esquema de codificação proposto. Comparado à demanda de ROM do esquema de codificação silenciosa em WD5 do Padrão de Projeto USAC, a demanda de ROM é reduzida a pelo menos 15462 palavras (61848 bytes). Agora finaliza na mesma ordem de magnitude que a exigência de memória necessária para o decodificador de Huffman AAC em HE-AAC (995 palavras ou 3980-bytes). Para detalhes, a referência é feita à ISO/IEC JTC1/SC29/WG11 N2005, MPEG98, Fevereiro 1998, San Jose, “Revised Report on Complexity of MPEG-2 AAC2”, e também à figura 16a. Isto reduz toda a demanda de ROM do codificador silencioso para mais que 92% e um decodificador completo de USAC de aproximadamente 37000 palavras a aproximadamente 21500 palavras, ou para mais que 41%. Para detalhes, a referência é novamente feita às figuras 16a e 16b, em que a figura 16a mostra uma demanda de ROM de um esquema de codificação silenciosa conforme proposto, e de um esquema de codificação silenciosa de acordo com WD4 do Padrão de Projeto USAC, e em que a figura 16b mostra uma demanda de dados total da ROM do decodificador USAC de acordo com o esquema proposto e de acordo com WD4 do Padrão de Projeto USAC.
Ainda, uma quantidade de informação necessária para a derivação de contexto na próxima estrutura (ROM estática) é também reduzida. Em WD5 do Padrão de Projeto USAC, o conjunto completo de coeficientes (um máximo de 1152 coeficientes) com uma resolução de tipicamente 16 bits adicionais a um índice de grupo por conjunto de 4 tuplos de uma resolução de 10 bits necessária para ser armazenada, que soma até 666 palavras (2664-bytes) por canal do codificador de núcleo (decodificador WD4 completo USAC: aproximadamente 10000 a 17000 palavras). O novo esquema reduz a informação persistente para somente 2 bits por coeficiente espectral, que soma até 72 palavras (288-byte) no total por canal do codificador de núcleo. A demanda da memória estática pode ser reduzida a 594 palavras (2376-byte).
A seguir, alguns detalhes referentes ao possível aumento de eficiência da codificação serão descritos. A eficiência da decodificação das realizações, de acordo com a nova proposta, foi comparada com os fluxos de bits da qualidade de referência de acordo com o projeto de trabalho 3 (WD3) e WD5 do Padrão de Projeto USAC. A comparação foi realizada por meio de um transcodificador, com base em um decodificador do software de referência. Para detalhes referentes à dita comparação da codificação silenciosa de acordo com WD3 ou WD5 do Padrão de Projeto USAC e o esquema de codificação proposto, a referência é feita à figura 17, que mostra uma representação esquemática de uma disposição do teste para uma comparação da codificação silenciosa WD3/5 com o esquema de codificação proposto.
Ainda, a demanda de memória nas realizações, de acordo com a invenção, foi comparada às realizações de acordo com WD3 (ou WD5) do Padrão de Projeto USAC.
A eficiência da codificação não é somente mantida, mas levemente aumentada. Para detalhes, a referência é feita à tabela da figura 18, que mostra uma representação em tabela de taxas de bits médios produzidos pelo codificador aritmético WD3 (ou um codificador de áudio USAC utilizando um codificador aritmético WD3), e um codificador de áudio (por exemplo, USAC codificador de áudio) de acordo com uma realização da invenção.
Detalhes sobre as taxas de bits médios por modo operacional podem ser encontrados na tabela da figura 18.
Além disso, a figura 19 mostra uma representação em tabela de níveis mínimo e máximo do reservatório de bits para o codificador aritmético WD3 (ou um codificador de áudio utilizando o codificador aritmético WD3) e um codificador de áudio de acordo com uma realização da presente invenção.
A seguir, alguns detalhes referentes à complexidade computacional serão descritos. A redução da dimensionalidade da codificação aritmética geralmente leva a um aumento da complexidade computacional. De fato, a redução da dimensão por um fator de dois realizará as rotinas do codificador aritmético duas vezes.
Entretanto, foi observado que este aumento de complexidade pode ser limitado por várias otimizações introduzidas no novo esquema de codificação proposto de acordo com as realizações da presente invenção. A geração de contexto foi muito simplificada em algumas realizações de acordo com a invenção. Para cada tuplo duplo, o contexto pode ser muito atualizado a partir do último contexto gerado. As probabilidades são armazenadas agora em 14 bits em vez de 16 bits, o que evita as operações de 64 bits durante o processo de decodificação. Além disso, o mapeamento do modelo de probabilidade foi muito otimizado em algumas realizações de acordo com a invenção. O pior caso foi drasticamente reduzido e limitado a 10 iterações em vez de 95.
Como um resultado, a complexidade computacional do esquema de codificação silenciosa proposto foi mantida na mesma faixa que em WD5. Uma estimativa de “caneta e papel” foi realizada por diferentes versões da codificação silenciosa e é registrada na tabela da figura 20. Isto mostra que o novo esquema de codificação é apenas aproximadamente 13% menos complexo que um codificador aritmético WD5.
Para resumir o mencionado acima, pode ser visto que realizações, de acordo com a presente invenção, provêm uma boa troca entre complexidade computacional, exigências de memória e eficiência da codificação.
14. Sintaxe do fluxo de bits 14.1 Payloads do Codificador espectral silencioso
A seguir, alguns detalhes referentes aos payloads do codificador espectral silencioso serão descritos. Em algumas realizações, há diversos modos diferentes de codificação como, por exemplo, o modo de codificação de “domínio de previsão linear” e o modo de codificação de “domínio de frequência”. No modo de codificação de domínio de previsão linear, uma forma de ruído é realizada com base em uma análise de previsão linear do sinal de áudio, e um sinal em forma de ruído é codificado no domínio de frequência. No modo de codificação de domínio de frequência, uma forma de ruído é realizada com base em uma análise psicoacústica e uma versão em forma de ruído do conteúdo de áudio é codificada no domínio de frequência.
Coeficientes espectrais do sinal codificado do “domínio de previsão linear” e do sinal codificado do “domínio de frequência” são quantizados por escala e então silenciosamente codificados por uma codificação aritmética dependente de contexto de forma adaptativa. Os coeficientes quantizados são unidos em 2 tuplos antes de serem transmitidos da frequência mais baixa para a frequência mais alta. Cada tuplo duplo é dividido em um sinal s, o plano de bit a bit mais significativo m, e um ou mais planos de bits menos significativos r restantes (se houver). O valor m é codificado de acordo com um contexto definido pelos coeficientes espectrais próximos. Em outras palavras, m é codificado de acordo com os coeficientes próximos. Os planos de bits menos significativos restantes r são codificados por entropia sem considerar o contexto. Por meios de m e r, a amplitude destes coeficientes espectrais pode ser reconstruída no lado do decodificador. Para todos os símbolos não nulos, os sinais s são codificados fora do codificador aritmético utilizando 1 bit. Em outras palavras, os valores m e r formam os símbolos do codificador aritmético. Finalmente, os sinais s, são codificados fora do codificador aritmético utilizando 1 bit por coeficiente quantizado não nulo.
Um procedimento detalhado da codificação aritmética será descrito aqui.
14.2 Elementos de sintaxe
A seguir, a sintaxe do fluxo de bits de um fluxo de bits que carrega a informação espectral aritmeticamente codificada será descrita tendo como referência as figuras 6a a 6j.
A figura 6a mostra uma representação de sintaxe do bloco de dados brutos USAC (“usac_raw_data_block()”).
O bloco de dados brutos USAC compreende um ou mais elementos de canal único (“single_channel_element()”) e/ou um ou mais elementos do par de canal (“channel_pair_element()”).
Agora com referência à figura 6b, a sintaxe de um elemento de canal único é descrita. Os elementos de canal único compreendem um fluxo de canal do domínio de previsão linear (“lpd_channel_stream ()”) ou um fluxo de canal de domínio de frequência (“fd_channel_stream ()”) dependendo do modo de núcleo.
A figura 6c mostra uma representação de sintaxe de um elemento do par de canal. Um elemento do par de canal compreende informação do modo de código (“core_mode0”,“core_mode1”). Além disso, o elemento do par de canal pode compreender uma informação de configuração “ics_info()”. Adicionalmente, dependendo da informação do modo de código, o elemento do par de canal compreende um fluxo de canal do domínio de previsão linear ou um fluxo de canal de domínio de frequência associado a um primeiro dos canais, e o elemento do par de canal também compreende um fluxo de canal do domínio de previsão linear ou um fluxo de canal de domínio de frequência associado a um segundo dos canais.
A informação de configuração “ics_info()”, uma representação de sintaxe que é mostrada na figura 6d, compreende diversos itens diferentes de informação de configuração, que não são de relevância particular para a presente invenção.
Um fluxo de canal de domínio de frequência (“fd_channel_stream ()”), uma representação de sintaxe que é mostrada na figura 6e, compreende uma informação de ganho (“global_gain”) e uma informação de configuração (“ics_info ()”). Além disso, o fluxo de canal de domínio de frequência compreende dados do fator de escala (“scale_factor_data ()”), que descrevem fatores de escala utilizados para a escala de valores espectrais de diferentes faixas de fator de escala, e que é aplicado, por exemplo, pelo multiplicador de frequências 150 e pelo remultiplicador de frequências 240. O fluxo de canal de domínio de frequência também compreende dados espectrais aritmeticamente codificados (“ac_spectral_data ()”), que representam valores espectrais aritmeticamente codificados.
Os dados espectrais aritmeticamente codificados (“ac_spectral_data()”), uma representação de sintaxe que é mostrada na figura 6f, compreendem um sinalizador de redefinição aritmético opcional (“arith_reset_flag”), que é utilizado para seletivamente redefinir o contexto, conforme descrito acima. Além disso, os dados espectrais aritmeticamente decodificados compreendem diversos blocos de dados aritméticos (“arith_data”), que carregam os valores espectrais aritmeticamente codificados. A estrutura dos blocos de dados aritmeticamente codificados depende do número das faixas de frequência (representado pela variável “num_bands”) e também do estado do sinalizador de redefinição aritmético, conforme serão discutidos a seguir.
A seguir, a estrutura do bloco de dados aritmeticamente codificado será descrita tendo como referência a figura 6g, que mostra uma representação de sintaxe dos ditos blocos de dados aritmeticamente codificados. A representação de dados dentro do bloco de dados aritmeticamente codificados depende do número lg de valores espectrais a ser codificado, do status do sinalizador de redefinição aritmético e também do contexto, ou seja, os valores espectrais previamente codificados.
O contexto para a codificação do conjunto corrente (por exemplo, 2 tuplos) de valores espectrais é determinado de acordo com o algoritmo de determinação de contexto mostrado no número de referência 660. Detalhes com relação ao algoritmo de determinação de contexto foram explicados acima, tendo como referência as figuras 5a e 5b. O bloco de dados aritmeticamente codificados compreende lg/2 para definição das senhas, cada conjunto de senhas que representa diversos (por exemplo, um tuplo duplo) valores espectrais. Um conjunto de senhas compreende uma senha aritmética “acod_m[pki][m]” que representa um valor do plano de bits mais significativo m do tuplo de valores espectrais utilizando entre 1 e 20 bits. Além disso, o conjunto de senhas compreende uma ou mais senhas “acod_r[r]” se o tuplo de valores espectrais requerer mais planos de bits que o plano de bits mais significativo para uma representação correta. A senha “acod_r[r]” representa um plano de bits menos significativo utilizando entre 1 e 14 bits.
Se, entretanto, um ou mais planos de bits menos significativos são necessários (além do plano de bits mais significativo) para uma representação correta dos valores espectrais, isto é sinalizado utilizando uma ou mais senhas aritméticas de escape (“ARITH_ESCAPE”). Assim, pode ser geralmente dito que para um valor espectral, é determinado quantos planos de bits (o plano de bits mais significativo e, possivelmente, um ou mais planos de bits menos significativos adicionais) são necessários. Se um ou mais planos de bits menos significativos são necessários, isto é sinalizado por uma ou mais senhas aritméticas de escape “acod_m[pki][ARITH_ESCAPE]”, que são codificadas de acordo com uma tabela de frequências cumulativas atualmente selecionada, um índice da tabela de frequências cumulativas que é dado pela variável “pki”. Além disso, o contexto é adaptado, como pode ser visto nos números de referência 664, 662, se uma ou mais senhas aritméticas de escape estiverem incluídas no fluxo de bits. Seguindo uma ou mais senhas aritméticas de escape, uma senha aritmética “acod_m[pki][m]” está incluída no fluxo de bits, conforme mostrado no número de referência 663, em que “pki” designa o índice atualmente válido do modelo de probabilidade (considerando a adaptação do contexto causada pela inclusão das senhas aritméticas de escape em consideração) e em que m designa o valor do plano de bits mais significativo do valor espectral a ser codificado ou decodificado (em que m é diferente da senha “ARITH_ESCAPE”).
Conforme discutido acima, a presença de qualquer plano de bits menos significativo resulta em uma presença de uma ou mais senhas “acod_r[r]”, cada uma representa 1 bit de um plano de bits menos significativo de um primeiro valor espectral e cada um que também representa 1 bit de um plano de bits menos significativo de um segundo valor espectral. Uma ou mais senhas “acod_r[r]” são codificadas de acordo com uma tabela de frequências cumulativas correspondente, que pode, por exemplo, ser constante e independente de contexto. Entretanto, diferentes mecanismos para a seleção da tabela de frequências cumulativas para uma decodificação de uma ou mais senhas “acod_r[r]” são possíveis.
Além disso, deve ser observado que o contexto é atualizado depois da codificação de cada tuplo de valores espectrais, conforme mostrado no número de referência 668, de modo que o contexto seja tipicamente diferente da codificação e decodificação de dois tuplos de valores espectrais subsequente.
A figura 6i mostra uma legenda de definições e elementos de ajuda que definem a sintaxe do bloco de dados aritmeticamente codificado.
Além disso, uma sintaxe alternativa dos dados aritméticos “arith_data()” é mostrada na figura 6h, com uma legenda correspondente de definições e elementos de ajuda mostrada na figura 6j.
Para resumir o mencionado acima, um formato do fluxo de bits foi descrito, que pode ser provido pelo codificador de áudio 100 e que pode ser avaliado pelo decodificador de áudio 200. O fluxo de bits dos valores espectrais aritmeticamente codificados é codificado de modo que se encaixe no algoritmo de decodificação discutido acima.
Além disso, geralmente deve ser observado que a codificação é a operação inversa da decodificação, de modo que possa geralmente ser assumido que o codificador realiza uma consulta de tabela utilizando as tabelas mencionadas acima, que é aproximadamente inversa à consulta de tabela realizada pelo decodificador. Geralmente, pode ser dito que um técnico no assunto que conhece o algoritmo de decodificação e/ou a sintaxe do fluxo de bits desejada poderá facilmente desenhar um codificador aritmético, que provê os dados definidos na sintaxe do fluxo de bits e necessários por um decodificador aritmético.
Além disso, deve ser observado que os mecanismos para determinar o valor de contexto corrente numérico e para derivar um valor de índice de regra de mapeamento podem ser idênticos em um codificador de áudio e um decodificador de áudio, pois é tipicamente desejado que o decodificador de áudio utilize o mesmo contexto ao codificador de áudio, de modo que a decodificação seja adaptada à codificação.
15. Alternativas de implementação
Embora alguns aspectos foram descritos no contexto de um aparelho, é claro que estes aspectos também representam uma descrição do método correspondente, onde um bloco ou dispositivo corresponde a uma etapa do método ou uma característica de uma etapa do método. De forma equivalente, os aspectos descritos no contexto de uma etapa do método também representam uma descrição de um bloco ou item ou característica correspondente de um aparelho correspondente. Algumas ou todas as etapas do método podem ser executadas por (ou utilizando) um aparelho de hardware como, por exemplo, um microprocessador, um computador programável ou um circuito eletrônico. Em algumas realizações, uma ou mais das etapas mais importantes do método podem ser executadas por tal aparelho.
O sinal de áudio codificado inventivo pode ser armazenado em um meio de armazenamento digital ou pode ser transmitido em um meio de transmissão como um meio de transmissão sem fio ou um meio de transmissão com fio como a Internet.
Dependendo de certas exigências de implementação, as realizações da invenção podem ser implementadas em hardware ou em software. A implementação pode ser realizada utilizando um meio de armazenamento digital, por exemplo, um disquete, um DVD, um Blue-Ray, um CD, uma ROM, uma PROM, uma EPROM, uma EEPROM ou uma memória FLASH, tendo sinais de controle eletricamente legíveis armazenados nele, que coopera (ou são capazes de cooperar) com um sistema de computador programável de modo que o respectivo método seja realizado. Desta forma, o meio de armazenamento digital pode ser legível por computador.
Algumas realizações, de acordo com a invenção, compreendem um carregador de dados tendo sinais de controle eletricamente legíveis, que podem cooperar com um sistema de computador programável, de modo que um dos métodos descritos aqui seja realizado.
Geralmente, as realizações da presente invenção podem ser implementadas como um produto de programa de computador com um código do programa, o código do programa sendo operativo para realizar um dos métodos quando o produto de programa de computador opera em um computador. O código do programa pode, por exemplo, ser armazenado em um carregador legível por máquina.
Outras realizações compreendem o programa de computador para realizar um dos métodos descritos aqui, armazenados em um carregador legível por máquina.
Em outras palavras, uma realização do método inventivo é, desta forma, um programa de computador tendo um código do programa para realizar um dos métodos descritos aqui, quando o programa de computador opera em um computador.
Outra realização do método inventivo é, desta forma, um carregador de dados (ou um meio de armazenamento digital, ou um meio legível por computador) que compreende, registrado nele, o programa de computador para realizar um dos métodos descritos aqui. O carregador de dados, o meio de armazenamento digital ou o meio registrado são tipicamente tangíveis e/ou não transitórios.
Outra realização do método inventivo é, desta forma, um fluxo de dados ou uma sequência de sinais que representa o programa de computador para realizar um dos métodos descritos aqui. O fluxo de dados ou a sequência de sinais pode, por exemplo, ser configurado para ser transferido através de uma conexão de comunicação de dados, por exemplo, através da Internet.
Outra realização compreende um meio de processamento, por exemplo, um computador, ou um dispositivo lógico programável, configurado ou adaptado para realizar um dos métodos descritos aqui.
Outra realização compreende um computador tendo o programa de computador instalado nele para realizar um dos métodos descritos aqui.
Outra realização, de acordo com a invenção, compreende um aparelho ou um sistema configurado para transferir (por exemplo, eletronicamente ou opticamente) um programa de computador para realizar um dos métodos descritos aqui a um receptor. O receptor pode, por exemplo, ser um computador, um dispositivo móvel, um dispositivo de memória ou semelhantes. O aparelho ou sistema pode, por exemplo, compreender um servidor de arquivo para transferir o programa de computador ao receptor.
Em algumas realizações, um dispositivo lógico programável (por exemplo, uma matriz de portas programáveis em campo) pode ser utilizado para realizar algumas ou todas as funcionalidades dos métodos descritos aqui. Em algumas realizações, uma matriz de portas programáveis em campo pode cooperar com um microprocessador a fim de realizar um dos métodos descritos aqui. Geralmente, os métodos são preferivelmente realizados por qualquer aparelho de hardware.
As realizações descritas acima são meramente ilustrativas para os princípios da presente invenção. É entendido que as modificações e variações das disposições e os detalhes descritos aqui serão evidentes a outros técnicos no assunto. É o objetivo, desta forma, ser limitado somente pelo escopo das reivindicações da patente iminente e não pelos detalhes específicos apresentados em forma de descrição e explicação das realizações aqui.
16. Conclusões
Para concluir, as realizações, de acordo com a invenção, compreendem um ou mais dos aspectos a seguir, em que os aspectos podem ser utilizados individualmente ou em combinação.a) Estado de mecanismo de contexto de hashing
De acordo com um aspecto da invenção, os estados na tabela hash são considerados como estados significativos e limites de grupo. Isto permite reduzir significantemente o tamanho das tabelas necessárias.b) Atualização adicional de contexto
De acordo com um aspecto, algumas realizações, de acordo com a invenção, compreendem uma forma computacionalmente eficiente para atualizar o contexto. Algumas realizações utilizam uma atualização adicional de contexto na qual um valor de contexto corrente numérico é derivado de um valor de contexto prévio numérico.c) Derivação de contexto
De acordo com um aspecto da invenção, utilizando uma soma de dois valores absolutos espectrais está a associação de um truncamento. É um tipo de quantização do vetor de ganho dos coeficientes espectrais (como a oposição à quantização do vetor de ganho convencional). Objetiva limitar a ordem do contexto, enquanto transporta a informação mais significativa do próximo.
Outras tecnologias, que são aplicadas nas realizações, de acordo com a invenção, são descritas nos pedidos de patente não pré-publicados PCT EP2101/065725, PCT EP2010/065726, e PCT EP 2010/065727. Além disso, em algumas realizações, de acordo com a invenção, um símbolo de parada é utilizado. Além disso, em algumas realizações, somente os valores não sinalizados são considerados para o contexto.
Entretanto, os pedidos de patente Internacional não pré-publicados revelam os aspectos que estão ainda em algumas realizações de acordo com a invenção.
Por exemplo, uma identificação de região zero é utilizada em algumas realizações da invenção. Assim, o chamado “indicador de pequeno valor” é definido (por exemplo, bit 16 do valor de contexto corrente numérico c).
Em algumas realizações, o cálculo de contexto dependente da região pode ser utilizado. Entretanto, em outras realizações, um cálculo de contexto dependente da região pode ser omitido a fim de manter a complexidade e o tamanho das tabelas razoavelmente pequenas.
Além disso, o contexto de hashing utilizando uma função hash é um aspecto importante da invenção. O contexto de hashing pode ter como base o conceito de duas tabelas que é descrito nos pedidos de patente Internacional não pré-publicados referenciados acima. Entretanto, adaptações específicas do contexto de hashing podem ser utilizadas em algumas realizações a fim de aumentar a eficiência computacional. Entretanto, em outras realizações, de acordo com a invenção, o contexto de hashing que é descrito nos pedidos de patente Internacional não pré-publicados referenciados acima pode ser utilizado.
Além disso, deve ser observado que o contexto hashing adicional é bastante simples e computacionalmente eficiente. Ainda, a independência de contexto dos sinais de valores, que é utilizada em algumas realizações da invenção, ajuda a simplificar o contexto, assim mantendo as exigências de memória razoavelmente baixas.
Em algumas realizações da invenção, uma derivação de contexto utilizando uma soma de dois valores espectrais e uma limitação de contexto é utilizada. Estes dois aspectos podem ser combinados. Ambos objetivam limitar a ordem de contexto transportando a informação mais significativa do próximo.
Em algumas realizações, um indicador de pequeno valor é utilizado que pode ser semelhante a uma identificação de um grupo de diversos valores zero.
Em algumas realizações, de acordo com a invenção, um mecanismo de parada aritmética é utilizado. O conceito é semelhante ao uso de um símbolo “fim do bloco” em JPEG, que tem uma função comparável. Entretanto, em algumas realizações da invenção, o símbolo (“ARITH_STOP”) não é incluído explicitamente no codificador de entropia. Ainda, uma combinação de símbolos já existentes, que não poderia ocorrer previamente, é utilizada, ou seja, “ESC+0”. Em outras palavras, o decodificador de áudio é configurado para detectar uma combinação de símbolos existentes, que não são normalmente utilizados para representar um valor numérico, e para interpretar a ocorrência de tal combinação de símbolos já existentes como uma condição de parada aritmética.
Uma realização, de acordo com a invenção, utiliza um mecanismo de hashing de contexto de duas tabelas.
Para resumir, algumas realizações, de acordo com a invenção, podem compreender um ou mais dos quarto aspectos principais. • contexto estendido para detector tanto regiões zero quanto regiões de pequena amplitude no próximo; • contexto de hashing; • geração do estado de contexto: atualização adicional do estado de contexto; e • derivação de contexto: quantização específica dos valores de contexto incluindo a soma das amplitudes e limitação.
Para concluir, um aspecto das realizações, de acordo com a presente invenção, permanece em uma atualização adicional de contexto. As realizações, de acordo com a invenção, compreendem um conceito eficiente para a atualização do contexto, que evita os cálculos extensivos do projeto de trabalho (por exemplo, do projeto de trabalho 5). Ainda, as operações simples de mudança e operações lógicas são utilizadas em algumas realizações.
A atualização simples de contexto facilita o cálculo do contexto significantemente.
Em algumas realizações, o contexto é independente do sinal dos valores (por exemplo, os valores espectrais decodificados). Esta independência do contexto a partir do sinal dos valores traz consigo uma complexidade reduzida do contexto variável. Este conceito tem como base a observação que uma negação do sinal no contexto não traz consigo uma degradação severa da eficiência da codificação.
De acordo com um aspecto da invenção, o contexto é derivado utilizando a soma de dois valores espectrais. Assim, as exigências de memória para armazenamento do contexto são significantemente reduzidas. Assim, o uso de um valor de contexto, que representa a soma de dois valores espectrais, pode ser considerado como vantajoso em alguns casos.
Ainda, a limitação do contexto traz consigo uma melhoria significativa em alguns casos. Além da derivação do contexto utilizando a soma de dois valores espectrais, a matriz das entradas do contexto “q” estão limitadas ao valor máximo de “0xF” em algumas realizações, que por sua vez resulta em uma limitação das exigências de memória. Esta limitação da matriz dos valores do contexto matriz “q” traz consigo algumas vantagens.
Em algumas realizações, o chamado “indicador de pequeno valor” é utilizado. Ao obter o contexto variável c (que é também designado como um valor de contexto corrente numérico), um indicador é definido se os valores de algumas entradas “q[1][i-3]” a “q[1][i-1]” forem muito pequenos. Assim, o cálculo do contexto pode ser realizado com alta eficiência. Valores de contexto particularmente significativos (por exemplo, valor de contexto corrente numérico) podem ser obtidos.
Em algumas realizações, um mecanismo de parada aritmética é utilizado. O mecanismo “ARITH_STOP” permite uma parada eficiente da codificação aritmética ou decodificação se há somente zeros valores deixados. Assim, a eficiência da codificação pode ser melhorada a custos moderados em termos de complexidade.
De acordo com um aspecto da invenção, um mecanismo de contexto de hashing de duas tabelas é utilizado. O mapeamento do contexto é realizado utilizando um algoritmo de divisão de intervalo que avalia a tabela “ari_hash_m” em combinação com uma avaliação da tabela de consulta subsequente da tabela “ari_lookup_m”. Este algoritmo é mais eficiente que o algoritmo WD3.
A seguir, alguns detalhes adicionais serão discutidos.
Deve ser observado aqui que as tabelas “arith_hash_m[600]” e “arith_lookup_m[600]” são duas tabelas distintas. A primeira é utilizada para mapear um único índice de contexto (por exemplo, valor de contexto numérico) no índice do modelo de probabilidade (por exemplo, valor de índice de regra de mapeamento) e a segunda é utilizada para mapear um grupo de contextos consecutivos, delimitados pelos índices de contexto em “arith_hash_m[]”, no único modelo de probabilidade.
Ainda deve ser observado que a tabela “arith_cf_msb[96][16]” pode ser utilizada como uma alternativa à tabela “ari_cf_m[96][17]”, embora as dimensões sejam levemente diferentes. “ari_cf_m[][]” e “ari_cf_msb[][]” podem se referir à mesma tabela, pois os 17o coeficientes do modelo de probabilidades são sempre zero. Às vezes não é levado em consideração ao contar o espaço necessário para armazenar as tabelas.
Para resumir o mencionado acima, algumas realizações, de acordo com a invenção, provêm uma nova codificação silenciosa proposta (codificação ou decodificação), que geram modificações no projeto de trabalho USAC MPEG (por exemplo, no projeto de trabalho USAC MPEG 5). As ditas modificações podem ser vistas nas figures anexas e também na descrição relacionada.
Como um marco de conclusão, deve ser observado que o prefixo “ari” e o prefixo “arith” nos nomes das variáveis, matrizes, funções, e assim por diante, são utilizados de forma permutável.

Claims (15)

1. DECODIFICADOR DE ÁUDIO (200; 800) para prover uma informação de áudio decodificada (212; 812) com base em uma informação de áudio codificada (210; 810), o decodificador de áudio sendo caracterizado por compreender: um desformatador de carga útil de fluxo de bits (220), que é configurado para receber um fluxo de bits e extrair do fluxo de bits uma representação de áudio de domínio de frequência codificado; um decodificador aritmético (230; 820) para prover diversos valores espectrais decodificados (232; 822) com base em uma representação aritmeticamente codificada (222; 821) dos valores espectrais constantes na informação de áudio codificada (210; 810); e um conversor de domínio de frequência em domínio de tempo (260; 830) para prover uma representação de áudio de domínio de tempo (262; 812) utilizando os valores espectrais decodificados (232; 822), para obter a informação de áudio decodificada (212; 812); em que o decodificador aritmético (230; 820) é configurado para selecionar uma regra de mapeamento (297; cum_freq[]) que descreve um mapeamento de um valor de código (value) da representação aritmeticamente codificada (821) de valores espectrais em um código de símbolo (symbol) representando um ou mais dos valores espectrais decodificados ou pelo menos uma parte de um ou mais dos valores espectrais decodificados dependendo de um estado de contexto (s) descrito por um valor de contexto corrente numérico (c); em que o decodificador aritmético (230; 820) é configurado para determinar o valor de contexto corrente numérico (c) dependendo de diversos valores espectrais previamente decodificados; em que o decodificador aritmético é configurado para avaliar a tabela hash (ari_hash_m[]), cujas entradas definem tanto valores de estado significativos entre os valores de contexto numérico como limites de intervalos de valores de estado não-significativos entre os valores de contexto numérico, para selecionar a regra de mapeamento, em que um valor de índice de regra de mapeamento está individualmente associado a um valor de contexto numérico sendo um valor de estado significativo, e em que um valor de índice de regra de mapeamento comum está associado a diferentes valores de contexto numérico dentro de um dos ditos intervalos delimitados pelos ditos limites de intervalo.
2. DECODIFICADOR DE SINAL DE ÁUDIO, de acordo com a reivindicação 1, caracterizado por o decodificador aritmético ser configurado para comparar o valor de contexto corrente numérico (c), ou uma versão escalada (s) do valor de contexto corrente numérico, com diversas entradas numericamente ordenadas (j) da tabela hash (ari_hash_m[]), para obter um valor de índice de tabela hash (i_min) de uma entrada de tabela hash (ari_hash_m[i_min]), de modo que o valor de contexto corrente numérico permaneça dentro de um intervalo definido pela entrada de tabela hash (ari_hash_m[i_min]) designada pelo valor de índice de tabela hash (i_min) obtido e uma entrada de tabela hash adjacente (ari hash m[i min - 1], ari hash m[i min + 1]); e em que o decodificador aritmético é configurado para determinar se o valor de contexto corrente numérico equivale a um valor definido por uma entrada da tabela hash designada pelo valor de índice de tabela hash (i_min) obtido, e para seletivamente prover, dependendo de um resultado da determinação, um valor de índice de regra de mapeamento individualmente associado a um valor de contexto corrente numérico definido pela entrada da tabela hash designada pelo valor de índice de tabela hash obtido, ou um valor de índice de regra de mapeamento designado pelo valor de índice de tabela hash obtido e associado a diferentes valores de contexto corrente numéricos dentro de um intervalo delimitado, em um lado, por um valor de estado definido pela entrada da tabela hash designada pelo valor de índice de tabela hash obtido.
3. DECODIFICADOR DE ÁUDIO, de acordo com a reivindicação 1 ou com a reivindicação 2, caracterizado por o decodificador aritmético é configurado para determinar, utilizando a tabela hash, se o valor de contexto corrente numérico é igual a um valor de estado de limite de intervalo definido por uma entrada da tabela hash, ou permanece dentro de um intervalo definido por duas entradas da tabela hash; em que o decodificador aritmético é configurado para prover um valor de índice de regra de mapeamento associado a uma entrada da tabela hash, caso seja descoberto que o valor de contexto corrente numérico é igual a um valor de estado de limite de intervalo, e para prover um valor de índice de regra de mapeamento associado a um intervalo entre valores de estado definidos por duas entradas adjacentes da tabela hash, caso seja descoberto que o valor de contexto corrente numérico permanece dentro de um intervalo entre valores de estado definidos por duas entradas adjacentes da tabela hash; e em que o decodificador aritmético é configurado para selecionar uma tabela de frequências cumulativas para o decodificador aritmético dependendo do valor de índice de regra de mapeamento.
4. DECODIFICADOR DE ÁUDIO, de acordo com uma das reivindicações 1 a 3, caracterizado por um valor de índice de regra de mapeamento associado a uma primeira determinada entrada da tabela hash é diferente de um valor de índice de regra de mapeamento associado a um primeiro intervalo de valores de contexto, cujo limite superior é definido pela primeira determinada entrada da tabela hash, e também diferente de um valor de índice de regra de mapeamento associado a um segundo intervalo de valores de contexto, cujo limite inferior é definido pela primeira determinada entrada da tabela hash, de modo que a primeira determinada entrada da tabela hashs defina, por um valor único, limites de dois intervalos do valor de contexto corrente numérico e um valor de estado significativo do valor de contexto corrente numérico.
5. DECODIFICADOR DE ÁUDIO, de acordo com a reivindicação 4, caracterizado por o valor de índice de regra de mapeamento associado ao primeiro intervalo de valores de contexto é igual ao valor de índice de regra de mapeamento associado ao segundo intervalo de valores de contexto, de modo que a primeira determinada entrada da tabela hash defina um estado significativo isolado dentro de um ambiente bilateral de valores de estado não-significativos.
6. DECODIFICADOR DE ÁUDIO, de acordo com a reivindicação 4 ou com a reivindicação 5, caracterizado por um valor de índice de regra de mapeamento associado a uma segunda determinada entrada da tabela hash é idêntico a um valor de índice de regra de mapeamento associado a um terceiro intervalo de valores de contexto, cujo limite é definido pela segunda determinada entrada da tabela hash, e diferente de um valor de índice de regra de mapeamento associado a um quarto intervalo de valores de contexto, cujo limite é definido pela segunda determinada entrada da tabela hash, de modo que a segunda determinada entrada da tabela hash defina um limite entre dois intervalos do valor de contexto corrente numérico sem definir um valor de estado significativo do valor de contexto corrente numérico.
7. DECODIFICADOR DE ÁUDIO, de acordo com uma das reivindicações 1 a 6, caracterizado por o decodificador aritmético é configurado para avaliar uma única tabela hash, cujas entradas numericamente ordenadas definem tanto valores de estado significativos do valor de contexto corrente numérico como limites de intervalos do valor de contexto corrente numérico, para obter um valor de índice de tabela hash (i_min) que designa um intervalo, fora dos intervalos definidos pelas entradas da tabela hash, no qual o valor de contexto corrente numérico permanece, e para subsequentemente determinar, utilizando a entrada de tabela designada pelo valor de índice de tabela hash obtido, se o valor de contexto corrente numérico assume um valor de estado significativo ou um valor de estado não-significativo.
8. DECODIFICADOR DE ÁUDIO, de acordo com uma das reivindicações 1 a 7, caracterizado por o decodificador aritmético é configurado para seletivamente avaliar uma tabela de mapeamento (ari_lookup_m), que mapeia os valores de índice de intervalo (i_min) em valores de índice de regra de mapeamento (pki), caso seja descoberto que o valor de contexto corrente numérico não assume um valor de estado significativo, para obter um valor de índice de regra de mapeamento (pki) associado a um intervalo de valores de estado não-significativos dentro do qual o valor de contexto corrente numérico permenece.
9. DECODIFICADOR DE ÁUDIO, de acordo com uma das reivindicações 1 a 8, caracterizado por as entradas da tabela hash são numericamente ordenadas, em que o decodificador aritmético é configurado para avaliar uma sequência de entradas da tabela hash, para obter um valor de índice de tabela hash de resultado (i_min) de uma entrada de tabela hash, de modo que o valor de contexto corrente numérico (c) permaneça dentro de um intervalo definido pela entrada de tabela hash designada pelo valor de índice de tabela hash de resultado obtido e por uma entrada de tabela hash adjacente; em que o decodificador aritmético é configurado para realizar um número predeterminado de iterações para iterativamente determinar o valor de índice de tabela hash de resultado (i_min); em que cada iteração compreende somente uma única comparação entre um valor de estado representado por uma entrada corrente (ari_hash_m[i]) da tabela hash e um valor de estado representado pelo valor de contexto corrente numérico, e uma atualização seletiva de um valor de índice de tabela hash corrente (i) dependendo de um resultado da dita comparação única.
10. DECODIFICADOR DE ÁUDIO, de acordo com a reivindicação 9, caracterizado por o decodificador aritmético é configurado para fazer distinção entre um valor de contexto corrente numérico que compreende um valor de estado significativo e um valor de contexto corrente numérico que compreende um valor de estado não-significativo somente depois da execução do número predeterminado de iterações.
11. DECODIFICADOR DE ÁUDIO, de acordo com uma das reivindicações 1 a 10, caracterizado por o decodificador aritmético é configurado para avaliar a tabela hash utilizando o algoritmo: for (k=0;k<kmax;k++) { i=i_min+i_diff[k]; j=ari_hash_m[i]; if (s>j) { i_min=i+1; } } em que k é uma variável de execução; em que kmax designa um número predeterminado de iterações; em que i é uma variável que descreve um valor de índice de tabela hash corrente; em que i_min é uma variável inicializada para designar um valor de índice de tabela hash de uma primeira entrada da tabela hash e seletivamente atualizada dependendo de uma comparação entre s e j; em que ari_hash_m designa a tabela hash; em que ari_hash_m[i] designa uma entrada da tabela hash tendo valor de índice de tabela hash i; em que s designa uma variável representando o valor de contexto corrente numérico ou uma versão escalada deste; e em que i_diff[k] designa um tamanho de etapa para uma adaptação do valor de índice de tabela hash corrente em uma iteração k-th.
12. DECODIFICADOR DE ÁUDIO, de acordo com a reivindicação 11, caracterizado por o decodificador aritmético é ainda configurado para obter o valor de índice de regra de mapeamento como um valor de retorno de acordo com: j=ari_hash_m[i_min]; if (s>j) return (ari_lookup_m[i_min+1]; else if (c<(j>>8)) return (ari_lookup_m[i_min]); else return (j&0xFF); em que i_min é obtido como resultado da avaliação da tabela hash; em que ari_lookup_m é uma tabela que descreve valores de índice de regra de mapeamento (pki) associados a diferentes intervalos do valor de contexto corrente numérico para valores não-significativos do valor de contexto corrente numérico; em que ari_lookup_m[i_min + 1] designa uma entrada da tabela “ari_lookup_m” tendo um índice de entrada i_min + 1; em que ari_lookup_m[i_ min] designa uma entrada da tabela “ari_lookup_m” tendo um índice de entrada i_min; em que a condição “s > j” define que um valor de estado descrito pela variável s é maior que um valor de estado descrito pela entrada de tabela ari_hash_m[i_min]; em que a condição “c < (j >> 8)” define que um valor de estado descrito pela variável s é menor que um valor de estado descrito pela entrada de tabela ari_hash_m[i_min]; e em que “j&0xFF” descreve um valor de índice de regra de mapeamento descrito pela entrada de tabela ari_hash_m[i_min].
13. DECODIFICADOR DE ÁUDIO, de acordo com uma das reivindicações 1 a 10, caracterizado por o decodificador aritmético é configurado para avaliar a tabela hash utilizando o algoritmo: while ((i_max-i_min)>1) { i = i_min+((i_max-i_min)/2); j = ari_hash_m[i]; if (c<(j>>8)) i_max = i; else if (c>(j>>8)) i_min=i; else return(j&0xFF); } return ari_lookup_m[i_max]; em que c é uma variável que descreve o valor de contexto corrente numérico; em que i_min é uma variável inicializada para assumir um valor que é menor, por 1, que um valor de índice de tabela hash de uma primeira entrada da tabela hash e seletivamente atualizada dependendo de uma comparação entre c e um valor de estado j>>8 descrito por uma entrada de tabela hash j=ari_hash_m[i]; em que i_max é uma variável inicializada para designar um valor de índice de tabela hash de uma última entrada da tabela hash e seletivamente atualizada dependendo de uma comparação entre c e um valor de estado j>>8 descrito por uma entrada de tabela hash j=ari_hash_m[i]; em que i é uma variável que descreve um valor de índice de tabela hash corrente; em que ari_hash_m designa a tabela hash; em que ari_hash_m[i] designa uma entrada da tabela hash tendo valor de índice de tabela hash i; em que a condição “c < (j >> 8)” define que um valor de estado descrito pela variável c é menor que um valor de estado descrito pela entrada de tabela j=ari_hash_m[i]; em que a condição “c > (j >> 8)” define que um valor de estado descrito pela variável c é maior que um valor de estado descrito pela entrada de tabela j=ari_hash_m[i]; e em que “j&0xFF” descreve um valor de índice de regra de mapeamento descrito pela entrada de tabela j=ari_hash_m[i].
14. MÉTODO PARA PROVER UMA INFORMAÇÃO DE ÁUDIO DECODIFICADA (212;812) COM BASE EM UMA INFORMAÇÃO DE ÁUDIO CODIFICADA, o método sendo caracterizado por compreender: extrair de um fluxo de bits uma representação de áudio de domínio de frequência codificado; provisão de diversos valores espectrais decodificados (232,822) com base em uma representação aritmeticamente codificada (222,821) dos valores espectrais constantes na informação de áudio codificada (210,810); e provisão de uma representação de áudio de domínio de tempo (262,812) utilizando os valores espectrais decodificados (232,822), para obter a informação de áudio decodificada; em que a provisão dos diversos valores espectrais decodificados compreende a seleção de uma regra de mapeamento (297,cum_freq[]) que descreve um mapeamento de um valor de código (acod_m; value) da representação aritmeticamente codificada (821) de valores espectrais em um código de símbolo (symbol) representando um ou mais dos valores espectrais decodificados, ou um plano de bits mais significativo de um ou mais valores espectrais decodificados dependendo de um estado de contexto (s) descrito por um valor de contexto corrente numérico (c); e em que o valor de contexto corrente numérico (c) é determinado dependendo de diversos valores espectrais previamente decodificados; em que uma tabela hash (ari_hash_m[]), cujas entradas definem tanto valores de estado significativos entre os valores de contexto numérico como limites de intervalos de valores de estado não-significativos entre os valores de contexto numérico, é avaliada, em que um valor de índice de regra de mapeamento está individualmente associado a um valor de contexto numérico sendo um valor de estado significativo, e em que um valor de índice de regra de mapeamento comum está associado a diferentes valores de contexto numérico dentro de um dos ditos intervalos delimitados pelos ditos limites de intervalo.
15. Mídia de armazenamento não transitória tendo gravada instruções lida por um computador caracterizada por compreender instruções que quando executadas realizam o método da reivindicação 14.
BR122021008576-5A 2010-01-12 2011-01-11 Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo BR122021008576B1 (pt)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US29435710P 2010-01-12 2010-01-12
US61/294,357 2010-01-12
BR112012017256-5A BR112012017256B1 (pt) 2010-01-12 2011-01-11 Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo
PCT/EP2011/050272 WO2011086065A1 (en) 2010-01-12 2011-01-11 Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a hash table describing both significant state values and interval boundaries

Publications (1)

Publication Number Publication Date
BR122021008576B1 true BR122021008576B1 (pt) 2022-04-12

Family

ID=43617872

Family Applications (6)

Application Number Title Priority Date Filing Date
BR122021008581-1A BR122021008581B1 (pt) 2010-01-12 2011-01-11 Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo
BR112012017256-5A BR112012017256B1 (pt) 2010-01-12 2011-01-11 Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo
BR122021008576-5A BR122021008576B1 (pt) 2010-01-12 2011-01-11 Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo
BR122021008583-8A BR122021008583B1 (pt) 2010-01-12 2011-01-11 Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo
BR112012017257A BR112012017257A2 (pt) 2010-01-12 2011-01-11 "codificador de áudio, codificados de áudio, método de codificação de uma informação de audio método de codificação de uma informação de áudio de programa de computador que utiliza uma modificação de uma representção numérica de um valor de contexto prévio numérico"
BR112012017258-1A BR112012017258B1 (pt) 2010-01-12 2011-01-11 codificador de áudio, decodificador de áudio, método de codificação e decodificação de uma informação de áudio, para obtenção de um valor de sub-região de contexto com base em uma norma de valores espectrais previamente decodificados

Family Applications Before (2)

Application Number Title Priority Date Filing Date
BR122021008581-1A BR122021008581B1 (pt) 2010-01-12 2011-01-11 Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo
BR112012017256-5A BR112012017256B1 (pt) 2010-01-12 2011-01-11 Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo

Family Applications After (3)

Application Number Title Priority Date Filing Date
BR122021008583-8A BR122021008583B1 (pt) 2010-01-12 2011-01-11 Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo
BR112012017257A BR112012017257A2 (pt) 2010-01-12 2011-01-11 "codificador de áudio, codificados de áudio, método de codificação de uma informação de audio método de codificação de uma informação de áudio de programa de computador que utiliza uma modificação de uma representção numérica de um valor de contexto prévio numérico"
BR112012017258-1A BR112012017258B1 (pt) 2010-01-12 2011-01-11 codificador de áudio, decodificador de áudio, método de codificação e decodificação de uma informação de áudio, para obtenção de um valor de sub-região de contexto com base em uma norma de valores espectrais previamente decodificados

Country Status (20)

Country Link
US (4) US8898068B2 (pt)
EP (3) EP2524372B1 (pt)
JP (3) JP5624159B2 (pt)
KR (3) KR101336051B1 (pt)
CN (3) CN102792370B (pt)
AR (3) AR079886A1 (pt)
AU (3) AU2011206676B2 (pt)
BR (6) BR122021008581B1 (pt)
CA (3) CA2786944C (pt)
ES (3) ES2615891T3 (pt)
HK (2) HK1178306A1 (pt)
MX (3) MX2012008077A (pt)
MY (3) MY159982A (pt)
PL (3) PL2517200T3 (pt)
PT (1) PT2524371T (pt)
RU (2) RU2644141C2 (pt)
SG (3) SG182467A1 (pt)
TW (3) TWI476757B (pt)
WO (3) WO2011086067A1 (pt)
ZA (3) ZA201205939B (pt)

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY181231A (en) * 2008-07-11 2020-12-21 Fraunhofer Ges Zur Forderung Der Angenwandten Forschung E V Audio encoder and decoder for encoding and decoding audio samples
MY160260A (en) 2008-07-11 2017-02-28 Fraunhofer Ges Forschung Audio encoder and audio decoder
EP2315358A1 (en) 2009-10-09 2011-04-27 Thomson Licensing Method and device for arithmetic encoding or arithmetic decoding
PL2491553T3 (pl) 2009-10-20 2017-05-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio, dekoder audio, sposób kodowania informacji audio, sposób dekodowania informacji audio i program komputerowy wykorzystujący iteracyjne zmniejszania rozmiaru przedziału
JP5624159B2 (ja) 2010-01-12 2014-11-12 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. オーディオ符号化器、オーディオ復号器、オーディオ情報を符号化および復号するための方法、ならびに以前に復号されたスペクトル値のノルムに基づいてコンテキストサブ領域値を取得するコンピュータプログラム
KR20120084639A (ko) * 2011-01-20 2012-07-30 한국전자통신연구원 엔트로피 부호화를 위한 적응적 정렬 테이블
KR101362696B1 (ko) * 2011-10-19 2014-02-17 전북대학교산학협력단 하이브리드 아키텍쳐가 적용된 신호 변환 장치, 신호 변환 방법 및 기록매체
US8880412B2 (en) * 2011-12-13 2014-11-04 Futurewei Technologies, Inc. Method to select active channels in audio mixing for multi-party teleconferencing
CN110706715B (zh) * 2012-03-29 2022-05-24 华为技术有限公司 信号编码和解码的方法和设备
TWI508569B (zh) * 2012-09-14 2015-11-11 Realtek Semiconductor Corp 行動高畫質連結資料轉換器以及行動高畫質連結資料轉換方法
JP6248186B2 (ja) 2013-05-24 2017-12-13 ドルビー・インターナショナル・アーベー オーディオ・エンコードおよびデコード方法、対応するコンピュータ可読媒体ならびに対応するオーディオ・エンコーダおよびデコーダ
AU2014283256B2 (en) 2013-06-21 2017-09-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time scaler, audio decoder, method and a computer program using a quality control
KR101953613B1 (ko) 2013-06-21 2019-03-04 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 지터 버퍼 제어부, 오디오 디코더, 방법 및 컴퓨터 프로그램
US20150113027A1 (en) * 2013-10-22 2015-04-23 National Tsing Hua University Method for determining a logarithmic functional unit
JP2015206874A (ja) * 2014-04-18 2015-11-19 富士通株式会社 信号処理装置、信号処理方法、及び、プログラム
US9640376B1 (en) 2014-06-16 2017-05-02 Protein Metrics Inc. Interactive analysis of mass spectrometry data
JP6509916B2 (ja) * 2014-06-29 2019-05-08 エルジー エレクトロニクス インコーポレイティド 連結されたrom−ramテーブルに基づいて算術コーディングを遂行する方法及び装置
EP2996269A1 (en) * 2014-09-09 2016-03-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio splicing concept
US9385751B2 (en) * 2014-10-07 2016-07-05 Protein Metrics Inc. Enhanced data compression for sparse multidimensional ordered series data
US10062762B2 (en) * 2014-12-23 2018-08-28 Stmicroelectronics, Inc. Semiconductor devices having low contact resistance and low current leakage
US10354421B2 (en) 2015-03-10 2019-07-16 Protein Metrics Inc. Apparatuses and methods for annotated peptide mapping
CN104872268B (zh) * 2015-06-02 2018-06-12 应关雄 一种低温除氧剂
MX2020011754A (es) 2015-10-08 2022-05-19 Dolby Int Ab Codificacion en capas para representaciones de sonido o campo de sonido comprimidas.
IL302588B1 (en) 2015-10-08 2024-10-01 Dolby Int Ab Layered coding and data structure for compressed high-order sound or surround sound field representations
WO2017142967A1 (en) * 2016-02-16 2017-08-24 Djo Consumer, Llc Fitting system and method for customizable footwear
CN109328382B (zh) * 2016-06-22 2023-06-16 杜比国际公司 用于将数字音频信号从第一频域变换到第二频域的音频解码器及方法
US20180089309A1 (en) * 2016-09-28 2018-03-29 Linkedln Corporation Term set expansion using textual segments
US10319573B2 (en) 2017-01-26 2019-06-11 Protein Metrics Inc. Methods and apparatuses for determining the intact mass of large molecules from mass spectrographic data
US10797723B2 (en) 2017-03-14 2020-10-06 International Business Machines Corporation Building a context model ensemble in a context mixing compressor
US10361712B2 (en) 2017-03-14 2019-07-23 International Business Machines Corporation Non-binary context mixing compressor/decompressor
US11626274B2 (en) 2017-08-01 2023-04-11 Protein Metrics, Llc Interactive analysis of mass spectrometry data including peak selection and dynamic labeling
US10546736B2 (en) 2017-08-01 2020-01-28 Protein Metrics Inc. Interactive analysis of mass spectrometry data including peak selection and dynamic labeling
US10705809B2 (en) * 2017-09-08 2020-07-07 Devfactory Innovations Fz-Llc Pruning engine
US10510521B2 (en) 2017-09-29 2019-12-17 Protein Metrics Inc. Interactive analysis of mass spectrometry data
WO2019091576A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
CN111386566A (zh) * 2017-12-15 2020-07-07 海尔优家智能科技(北京)有限公司 设备控制方法、云端设备、智能设备、计算机介质及设备
US11044495B1 (en) 2018-02-13 2021-06-22 Cyborg Inc. Systems and methods for variable length codeword based data encoding and decoding using dynamic memory allocation
US10929607B2 (en) * 2018-02-22 2021-02-23 Salesforce.Com, Inc. Dialogue state tracking using a global-local encoder
US10915341B2 (en) * 2018-03-28 2021-02-09 Bank Of America Corporation Computer architecture for processing correlithm objects using a selective context input
KR20200000649A (ko) 2018-06-25 2020-01-03 네이버 주식회사 오디오 병렬 트랜스코딩을 위한 방법 및 시스템
TWI765164B (zh) 2018-07-06 2022-05-21 弗勞恩霍夫爾協會 算術編碼器、算術解碼器、視訊編碼器、視訊解碼器、編碼方法、解碼方法及電腦程式
CN110535497B (zh) * 2018-08-10 2022-07-19 中兴通讯股份有限公司 Csi发送、接收方法及其装置、通信节点及存储介质
US11640901B2 (en) 2018-09-05 2023-05-02 Protein Metrics, Llc Methods and apparatuses for deconvolution of mass spectrometry data
US11144286B2 (en) 2019-01-14 2021-10-12 Microsoft Technology Licensing, Llc Generating synchronous digital circuits from source code constructs that map to circuit implementations
US11093682B2 (en) 2019-01-14 2021-08-17 Microsoft Technology Licensing, Llc Language and compiler that generate synchronous digital circuits that maintain thread execution order
US11275568B2 (en) 2019-01-14 2022-03-15 Microsoft Technology Licensing, Llc Generating a synchronous digital circuit from a source code construct defining a function call
US11113176B2 (en) 2019-01-14 2021-09-07 Microsoft Technology Licensing, Llc Generating a debugging network for a synchronous digital circuit during compilation of program source code
US11106437B2 (en) * 2019-01-14 2021-08-31 Microsoft Technology Licensing, Llc Lookup table optimization for programming languages that target synchronous digital circuits
US10491240B1 (en) 2019-01-17 2019-11-26 Cyborg Inc. Systems and methods for variable length codeword based, hybrid data encoding and decoding using dynamic memory allocation
US11346844B2 (en) 2019-04-26 2022-05-31 Protein Metrics Inc. Intact mass reconstruction from peptide level data and facilitated comparison with experimental intact observation
CN111862953B (zh) * 2019-12-05 2023-08-22 北京嘀嘀无限科技发展有限公司 语音识别模型的训练方法、语音识别方法及装置
US11276204B1 (en) 2020-08-31 2022-03-15 Protein Metrics Inc. Data compression for multidimensional time series data
EP4229631A2 (en) * 2020-10-13 2023-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding a plurality of audio objects and apparatus and method for decoding using two or more relevant audio objects

Family Cites Families (134)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5388181A (en) * 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
US5878273A (en) 1993-06-24 1999-03-02 Discovision Associates System for microprogrammable state machine in video parser disabling portion of processing stages responsive to sequence-- end token generating by token generator responsive to received data
US5659659A (en) * 1993-07-26 1997-08-19 Alaris, Inc. Speech compressor using trellis encoding and linear prediction
ZA947317B (en) * 1993-09-24 1995-05-10 Qualcomm Inc Multirate serial viterbi decoder for code division multiple access system applications
EP0880235A1 (en) 1996-02-08 1998-11-25 Matsushita Electric Industrial Co., Ltd. Wide band audio signal encoder, wide band audio signal decoder, wide band audio signal encoder/decoder and wide band audio signal recording medium
JP3305190B2 (ja) 1996-03-11 2002-07-22 富士通株式会社 データ圧縮装置及びデータ復元装置
US5721745A (en) * 1996-04-19 1998-02-24 General Electric Company Parallel concatenated tail-biting convolutional code and decoder therefor
US6269338B1 (en) 1996-10-10 2001-07-31 U.S. Philips Corporation Data compression and expansion of an audio signal
JP3367370B2 (ja) 1997-03-14 2003-01-14 三菱電機株式会社 適応符号化方法
DE19730130C2 (de) 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
KR100335609B1 (ko) 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
KR100335611B1 (ko) 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
US6029126A (en) * 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
CA2246532A1 (en) 1998-09-04 2000-03-04 Northern Telecom Limited Perceptual audio coding
DE19840835C2 (de) * 1998-09-07 2003-01-09 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Entropiecodieren von Informationswörtern und Vorrichtung und Verfahren zum Decodieren von Entropie-codierten Informationswörtern
CA2323561C (en) 1999-01-13 2013-03-26 Koninklijke Philips Electronics N.V. Embedding supplemental data in an encoded signal
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US7260523B2 (en) * 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
US20020016161A1 (en) 2000-02-10 2002-02-07 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for compression of speech encoded parameters
JP2001318698A (ja) * 2000-05-10 2001-11-16 Nec Corp 音声符号化装置及び音声復号化装置
US6677869B2 (en) 2001-02-22 2004-01-13 Panasonic Communications Co., Ltd. Arithmetic coding apparatus and image processing apparatus
US6538583B1 (en) 2001-03-16 2003-03-25 Analog Devices, Inc. Method and apparatus for context modeling
CN1235192C (zh) * 2001-06-28 2006-01-04 皇家菲利浦电子有限公司 传输系统以及用于接收窄带音频信号的接收机和方法
US20030093451A1 (en) 2001-09-21 2003-05-15 International Business Machines Corporation Reversible arithmetic coding for quantum data compression
JP2003255999A (ja) * 2002-03-06 2003-09-10 Toshiba Corp 符号化デジタルオーディオ信号の変速再生装置
JP4090862B2 (ja) 2002-04-26 2008-05-28 松下電器産業株式会社 可変長符号化方法および可変長復号化方法
US7242713B2 (en) 2002-05-02 2007-07-10 Microsoft Corporation 2-D transforms for image and video coding
PT1467491E (pt) 2002-05-02 2007-03-30 Fraunhofer Ges Forschung Codificação aritmética de coeficientes de transformação
GB2388502A (en) 2002-05-10 2003-11-12 Chris Dunn Compression of frequency domain audio signals
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
DE60327039D1 (de) 2002-07-19 2009-05-20 Nec Corp Audiodekodierungseinrichtung, dekodierungsverfahren und programm
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7328150B2 (en) 2002-09-04 2008-02-05 Microsoft Corporation Innovations in pure lossless audio compression
ES2297083T3 (es) 2002-09-04 2008-05-01 Microsoft Corporation Codificacion entropica por adaptacion de la codificacion entre modos por longitud de ejecucion y por nivel.
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
EP1604528A2 (en) 2002-09-17 2005-12-14 Ceperkovic, Vladimir Fast codec with high compression ratio and minimum required resources
FR2846179B1 (fr) 2002-10-21 2005-02-04 Medialive Embrouillage adaptatif et progressif de flux audio
US6646578B1 (en) 2002-11-22 2003-11-11 Ub Video Inc. Context adaptive variable length decoding system and method
AU2003208517A1 (en) 2003-03-11 2004-09-30 Nokia Corporation Switching between coding schemes
US6900748B2 (en) * 2003-07-17 2005-05-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for binarization and arithmetic coding of a data value
US7562145B2 (en) 2003-08-28 2009-07-14 International Business Machines Corporation Application instance level workload distribution affinities
JP2005130099A (ja) 2003-10-22 2005-05-19 Matsushita Electric Ind Co Ltd 算術復号装置、算術符号化装置、算術符号化・復号装置、携帯端末装置、動画像撮影装置、及び、動画像記録・再生装置
JP2005184232A (ja) 2003-12-17 2005-07-07 Sony Corp 符号化装置、プログラム、およびデータ処理方法
JP4241417B2 (ja) * 2004-02-04 2009-03-18 日本ビクター株式会社 算術復号化装置、および算術復号化プログラム
DE102004007200B3 (de) * 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7516064B2 (en) 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
KR20050087956A (ko) * 2004-02-27 2005-09-01 삼성전자주식회사 무손실 오디오 부호화/복호화 방법 및 장치
ATE527654T1 (de) * 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
KR100561869B1 (ko) 2004-03-10 2006-03-17 삼성전자주식회사 무손실 오디오 부호화/복호화 방법 및 장치
US7577844B2 (en) 2004-03-17 2009-08-18 Microsoft Corporation Systems and methods for encoding randomly distributed features in an object
MX2007000459A (es) 2004-07-14 2007-07-25 Agency Science Tech & Res Codificacion y descodificacion de senales, basadas en contexto.
KR100624432B1 (ko) 2004-08-05 2006-09-19 삼성전자주식회사 내용 기반 적응적 이진 산술 복호화 방법 및 장치
US20060047704A1 (en) 2004-08-31 2006-03-02 Kumar Chitra Gopalakrishnan Method and system for providing information services relevant to visual imagery
JP4977471B2 (ja) 2004-11-05 2012-07-18 パナソニック株式会社 符号化装置及び符号化方法
US7903824B2 (en) 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
KR100829558B1 (ko) 2005-01-12 2008-05-14 삼성전자주식회사 스케일러블 오디오 데이터 산술 복호화 방법 및 장치와스케일러블 오디오 비트스트림 절단 방법
EP1836858A1 (en) 2005-01-14 2007-09-26 Sungkyunkwan University Methods of and apparatuses for adaptive entropy encoding and adaptive entropy decoding for scalable video encoding
JP5129117B2 (ja) * 2005-04-01 2013-01-23 クゥアルコム・インコーポレイテッド 音声信号の高帯域部分を符号化及び復号する方法及び装置
KR100694098B1 (ko) * 2005-04-04 2007-03-12 한국과학기술원 산술 복호 방법 및 그 장치
US7991610B2 (en) * 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
KR100703773B1 (ko) 2005-04-13 2007-04-06 삼성전자주식회사 향상된 코딩 효율을 갖는 엔트로피 코딩 및 디코딩 방법과이를 위한 장치, 이를 포함하는 비디오 코딩 및 디코딩방법과 이를 위한 장치
US7196641B2 (en) * 2005-04-26 2007-03-27 Gen Dow Huang System and method for audio data compression and decompression using discrete wavelet transform (DWT)
US7546240B2 (en) * 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US20070036228A1 (en) 2005-08-12 2007-02-15 Via Technologies Inc. Method and apparatus for audio encoding and decoding
JP2009510962A (ja) 2005-10-03 2009-03-12 ノキア コーポレイション 独立変数のための適応性可変長コード
US20070094035A1 (en) * 2005-10-21 2007-04-26 Nokia Corporation Audio coding
KR100803206B1 (ko) 2005-11-11 2008-02-14 삼성전자주식회사 오디오 지문 생성과 오디오 데이터 검색 장치 및 방법
CN101167368B (zh) 2005-12-05 2012-03-28 华为技术有限公司 一种实现算术编解码的方法及装置
KR101237413B1 (ko) 2005-12-07 2013-02-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치
CN101133649B (zh) 2005-12-07 2010-08-25 索尼株式会社 编码装置、编码方法以及解码装置、解码方法
US7283073B2 (en) 2005-12-19 2007-10-16 Primax Electronics Ltd. System for speeding up the arithmetic coding processing and method thereof
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
WO2007080225A1 (en) 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
KR100774585B1 (ko) 2006-02-10 2007-11-09 삼성전자주식회사 변조 스펙트럼을 이용한 음악 정보 검색 방법 및 그 장치
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
US7948409B2 (en) * 2006-06-05 2011-05-24 Mediatek Inc. Automatic power control system for optical disc drive and method thereof
EP1883067A1 (en) 2006-07-24 2008-01-30 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
US8706507B2 (en) * 2006-08-15 2014-04-22 Dolby Laboratories Licensing Corporation Arbitrary shaping of temporal noise envelope without side-information utilizing unchanged quantization
US7554468B2 (en) 2006-08-25 2009-06-30 Sony Computer Entertainment Inc, Entropy decoding methods and apparatus using most probable and least probable signal cases
JP4785706B2 (ja) 2006-11-01 2011-10-05 キヤノン株式会社 復号装置及び復号方法
US20080243518A1 (en) * 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
DE102007017254B4 (de) * 2006-11-16 2009-06-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung zum Kodieren und Dekodieren
KR100868763B1 (ko) * 2006-12-04 2008-11-13 삼성전자주식회사 오디오 신호의 중요 주파수 성분 추출 방법 및 장치와 이를이용한 오디오 신호의 부호화/복호화 방법 및 장치
US7365659B1 (en) * 2006-12-06 2008-04-29 Silicon Image Gmbh Method of context adaptive binary arithmetic coding and coding apparatus using the same
CN101231850B (zh) 2007-01-23 2012-02-29 华为技术有限公司 编解码方法及装置
KR101365989B1 (ko) 2007-03-08 2014-02-25 삼성전자주식회사 트리 구조를 기반으로 한 엔트로피 부호화 및 복호화 장치및 방법
JP2008289125A (ja) 2007-04-20 2008-11-27 Panasonic Corp 算術復号化装置及びその方法
ES2452348T3 (es) * 2007-04-26 2014-04-01 Dolby International Ab Aparato y procedimiento para sintetizar una señal de salida
US7813567B2 (en) 2007-04-26 2010-10-12 Texas Instruments Incorporated Method of CABAC significance MAP decoding suitable for use on VLIW data processors
JP4748113B2 (ja) 2007-06-04 2011-08-17 ソニー株式会社 学習装置および学習方法、並びにプログラムおよび記録媒体
EP2278582B1 (en) 2007-06-08 2016-08-10 LG Electronics Inc. A method and an apparatus for processing an audio signal
CN101743586B (zh) 2007-06-11 2012-10-17 弗劳恩霍夫应用研究促进协会 音频编码器、编码方法、解码器、解码方法
US8521540B2 (en) * 2007-08-17 2013-08-27 Qualcomm Incorporated Encoding and/or decoding digital signals using a permutation value
EP2183851A1 (fr) 2007-08-24 2010-05-12 France Telecom Codage/decodage par plans de symboles, avec calcul dynamique de tables de probabilites
US7839311B2 (en) 2007-08-31 2010-11-23 Qualcomm Incorporated Architecture for multi-stage decoding of a CABAC bitstream
US7777654B2 (en) * 2007-10-16 2010-08-17 Industrial Technology Research Institute System and method for context-based adaptive binary arithematic encoding and decoding
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
US7714753B2 (en) 2007-12-11 2010-05-11 Intel Corporation Scalable context adaptive binary arithmetic coding
US8631060B2 (en) * 2007-12-13 2014-01-14 Qualcomm Incorporated Fast algorithms for computation of 5-point DCT-II, DCT-IV, and DST-IV, and architectures
EP2077550B8 (en) 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
US8483854B2 (en) * 2008-01-28 2013-07-09 Qualcomm Incorporated Systems, methods, and apparatus for context processing using multiple microphones
JP4893657B2 (ja) 2008-02-29 2012-03-07 ソニー株式会社 算術復号装置
JP5266341B2 (ja) * 2008-03-03 2013-08-21 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
KR101230479B1 (ko) 2008-03-10 2013-02-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 이벤트를 갖는 오디오 신호를 조작하기 위한 장치 및 방법
US8340451B2 (en) 2008-04-28 2012-12-25 Osaka Prefecture University Public Corporation Method for constructing image database for object recognition, processing apparatus and processing program
US7864083B2 (en) 2008-05-21 2011-01-04 Ocarina Networks, Inc. Efficient data compression and decompression of numeric sequences
CA2871268C (en) * 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
MY160260A (en) * 2008-07-11 2017-02-28 Fraunhofer Ges Forschung Audio encoder and audio decoder
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
US7714754B2 (en) 2008-07-14 2010-05-11 Vixs Systems, Inc. Entropy decoder with pipelined processing and methods for use therewith
ES2592416T3 (es) 2008-07-17 2016-11-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Esquema de codificación/decodificación de audio que tiene una derivación conmutable
US20110137661A1 (en) 2008-08-08 2011-06-09 Panasonic Corporation Quantizing device, encoding device, quantizing method, and encoding method
US20100088090A1 (en) 2008-10-08 2010-04-08 Motorola, Inc. Arithmetic encoding for celp speech encoders
US7932843B2 (en) 2008-10-17 2011-04-26 Texas Instruments Incorporated Parallel CABAC decoding for video decompression
US7982641B1 (en) 2008-11-06 2011-07-19 Marvell International Ltd. Context-based adaptive binary arithmetic coding engine
GB2466666B (en) 2009-01-06 2013-01-23 Skype Speech coding
KR101622950B1 (ko) 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
KR20100136890A (ko) * 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
EP3764356A1 (en) 2009-06-23 2021-01-13 VoiceAge Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
CA2777073C (en) 2009-10-08 2015-11-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping
EP2315358A1 (en) * 2009-10-09 2011-04-27 Thomson Licensing Method and device for arithmetic encoding or arithmetic decoding
PL2491553T3 (pl) 2009-10-20 2017-05-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio, dekoder audio, sposób kodowania informacji audio, sposób dekodowania informacji audio i program komputerowy wykorzystujący iteracyjne zmniejszania rozmiaru przedziału
US8149144B2 (en) 2009-12-31 2012-04-03 Motorola Mobility, Inc. Hybrid arithmetic-combinatorial encoder
JP5624159B2 (ja) 2010-01-12 2014-11-12 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. オーディオ符号化器、オーディオ復号器、オーディオ情報を符号化および復号するための方法、ならびに以前に復号されたスペクトル値のノルムに基づいてコンテキストサブ領域値を取得するコンピュータプログラム
CN102131081A (zh) 2010-01-13 2011-07-20 华为技术有限公司 混合维度编解码方法和装置
CN103282958B (zh) * 2010-10-15 2016-03-30 华为技术有限公司 信号分析器、信号分析方法、信号合成器、信号合成方法、变换器和反向变换器
US20120207400A1 (en) 2011-02-10 2012-08-16 Hisao Sasai Image coding method, image coding apparatus, image decoding method, image decoding apparatus, and image coding and decoding apparatus
US8170333B2 (en) 2011-10-13 2012-05-01 University Of Dayton Image processing systems employing image compression

Also Published As

Publication number Publication date
CN102859583A (zh) 2013-01-02
AU2011206676B2 (en) 2014-07-17
BR112012017256A2 (pt) 2020-08-25
AU2011206675A1 (en) 2012-08-09
MX2012008075A (es) 2013-12-16
JP5622865B2 (ja) 2014-11-12
AU2011206677B2 (en) 2014-07-10
EP2524371A1 (en) 2012-11-21
AU2011206677B8 (en) 2014-12-11
TWI476757B (zh) 2015-03-11
TW201145260A (en) 2011-12-16
MX2012008077A (es) 2012-12-05
ES2615891T3 (es) 2017-06-08
EP2524372A1 (en) 2012-11-21
TW201145261A (en) 2011-12-16
ZA201205938B (en) 2013-05-29
ZA201205939B (en) 2013-05-29
KR20120128127A (ko) 2012-11-26
EP2524372B1 (en) 2015-01-14
MY160067A (en) 2017-02-15
TWI466104B (zh) 2014-12-21
BR112012017258A2 (pt) 2017-10-03
KR101339058B1 (ko) 2013-12-10
US20130013322A1 (en) 2013-01-10
US20130013301A1 (en) 2013-01-10
US8645145B2 (en) 2014-02-04
AR079886A1 (es) 2012-02-29
TWI466103B (zh) 2014-12-21
MY153845A (en) 2015-03-31
PL2524371T3 (pl) 2017-06-30
CN102844809A (zh) 2012-12-26
CA2786945A1 (en) 2011-07-21
RU2012141243A (ru) 2015-08-10
MX2012008076A (es) 2013-01-29
AU2011206677A1 (en) 2012-08-09
WO2011086065A1 (en) 2011-07-21
BR122021008583B1 (pt) 2022-03-22
US20130013323A1 (en) 2013-01-10
CN102844809B (zh) 2015-02-18
EP2517200B1 (en) 2015-04-15
ZA201205936B (en) 2013-05-29
BR122021008581B1 (pt) 2022-08-16
WO2011086066A1 (en) 2011-07-21
SG182466A1 (en) 2012-08-30
KR101339057B1 (ko) 2013-12-10
AU2011206676A1 (en) 2012-08-09
PL2517200T3 (pl) 2015-10-30
AR079887A1 (es) 2012-02-29
JP2013517521A (ja) 2013-05-16
EP2524371B1 (en) 2016-12-07
JP2013517519A (ja) 2013-05-16
RU2628162C2 (ru) 2017-08-15
EP2517200A1 (en) 2012-10-31
AU2011206675C1 (en) 2016-04-28
BR112012017257A2 (pt) 2017-10-03
CN102792370B (zh) 2014-08-06
AR079888A1 (es) 2012-02-29
HK1178306A1 (en) 2013-09-06
JP5624159B2 (ja) 2014-11-12
RU2644141C2 (ru) 2018-02-07
ES2532203T3 (es) 2015-03-25
PL2524372T3 (pl) 2015-08-31
JP5773502B2 (ja) 2015-09-02
CA2786945C (en) 2016-03-29
CN102859583B (zh) 2014-09-10
SG182467A1 (en) 2012-08-30
BR112012017256B1 (pt) 2021-08-31
KR20120109621A (ko) 2012-10-08
RU2012141241A (ru) 2015-03-27
PT2524371T (pt) 2017-03-15
US8898068B2 (en) 2014-11-25
AU2011206675B2 (en) 2014-07-10
BR112012017258B1 (pt) 2020-12-29
MY159982A (en) 2017-02-15
ES2536957T3 (es) 2015-06-01
US9633664B2 (en) 2017-04-25
JP2013517520A (ja) 2013-05-16
KR20120109616A (ko) 2012-10-08
RU2012141242A (ru) 2014-05-27
HK1177649A1 (en) 2013-08-23
AU2011206677B9 (en) 2014-12-11
CA2786946A1 (en) 2011-07-21
SG182464A1 (en) 2012-08-30
CN102792370A (zh) 2012-11-21
CA2786944C (en) 2016-03-15
KR101336051B1 (ko) 2013-12-04
WO2011086067A1 (en) 2011-07-21
US20150081312A1 (en) 2015-03-19
CA2786946C (en) 2016-03-22
CA2786944A1 (en) 2011-07-21
TW201145262A (en) 2011-12-16
US8682681B2 (en) 2014-03-25

Similar Documents

Publication Publication Date Title
BR122021008576B1 (pt) Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo
ES2937066T3 (es) Decodificador de audio, procedimiento y programa informático para decodificación de audio
BR112012009445B1 (pt) Codificador de áudio, decodificador de áudio, método para codificar uma informação de áudio, método para decodificar uma informação de áudio que utiliza uma detecção de um grupo de valores espectrais previamente decodificados
BR122024007444A2 (pt) Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, método de decodificação de uma informação de áudio
BR122021003390B1 (pt) Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, método de decodificação de uma informação de áudio
BR122021003398A2 (pt) Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, método de decodificação de uma informação de áudio e programa de computador que utiliza uma tabela hash otimizada
BR122021003390A2 (pt) Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, método de decodificação de uma informação de áudio e programa de computador que utiliza uma tabela hash otimizada
BR122024007449A2 (pt) Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, método de decodificação de uma informação de áudio
BR122024007446A2 (pt) Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, método de decodificação de uma informação de áudio
BR122024007438A2 (pt) Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio e método de decodificação de uma informação de áudio.

Legal Events

Date Code Title Description
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B350 Update of information on the portal [chapter 15.35 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 11/01/2011, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF, QUE DETERMINA A ALTERACAO DO PRAZO DE CONCESSAO.