BRPI0506623B1 - codificação de áudio - Google Patents

codificação de áudio Download PDF

Info

Publication number
BRPI0506623B1
BRPI0506623B1 BRPI0506623A BRPI0506623A BRPI0506623B1 BR PI0506623 B1 BRPI0506623 B1 BR PI0506623B1 BR PI0506623 A BRPI0506623 A BR PI0506623A BR PI0506623 A BRPI0506623 A BR PI0506623A BR PI0506623 B1 BRPI0506623 B1 BR PI0506623B1
Authority
BR
Brazil
Prior art keywords
audio
parameterization
noise power
limit
version
Prior art date
Application number
BRPI0506623A
Other languages
English (en)
Inventor
Schuller Gerald
Gayer Marc
Wabnik Stefan
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of BRPI0506623A publication Critical patent/BRPI0506623A/pt
Publication of BRPI0506623B1 publication Critical patent/BRPI0506623B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Cereal-Derived Products (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

codificação de áudio a idéia central da presente invenção é que, a técnica anterior, a saber, a interpolação relativa dos coeficientes de filtro e do valor de amplificação, para a obtenção de valores interpolados dos valores de áudio intermediários iniciando a partir dos nodos deve ser descartada. pode ser obtida uma codificação contendo menos problemas audíveis com a não interpolação do valor de amplificação, mas ao invés disso, tomando o limite de potênciaderivado do limite de mascaramento, de preferência como a área abaixo do quadrado da magnitude do limite de mascaramento, para cada nodo, isto é, para cada parametrização a ser transferida, e então realizae a interpolação entre esses limites de potência dos nodos vizinhos, como, por exemplo, uma interpolação linear. tanto no lado do codificador como no lado do decodificador, poderá então ser calculado um valor de amplificação a partir do limite de potência intermediário determinado de maneira que o ruído de quantização provocado pela quantização que tem uma freüência constante antes da pós-filtragem no lado decodificador, está abaixo do limite de potência ou corresponde a este após a pós-filtragem.

Description

CODIFICAÇÃO DE ÁUDIO
Descrição
A presente codificação de áudio em geral e, em particular, a codificação de áudio que permite que sinais de áudio sejam codificados com um pequeno retardo de tempo.
método de compressão de áudio mais conhecido no presente é o MPEG-1 Layer III. Com esse método de compressão, amostra ou valores de áudio de um sinal de áudio são codificados
Figure BRPI0506623B1_D0001
em um sinal codificado com perdas.
Colocado de forma diferente, a irrelevância e a redundância do sinal de áudio original são reduzidas ou removidas idealmente quando da compressão. De maneira a atingir esse fim, os mascaramentos simultâneos e temporais são reconhecidos temporalmente dependendo do tons de uma humano. Por por um modelo é calculado ou sinal de áudio, psico-acústico, isto é, variando determinado o limite de mascaramento indicando a partir de qual volume os determinada frequência são percebidos pelo ouvido sua vez, essas informações são usadas para codificação do sinal pela quantificação dos valores espectrais do sinal de áudio, de maneira mais precisa ou menos precisa ou de maneira nenhuma, dependendo do limite de mascaramento, integrando este no sinal codificado.
Os métodos de compressão exemplo, o formato MP3, têm um limite em quando dados de áudio são transferidos por transmissão com taxa de áudio como, por suas meio de bits limitada por uma, de aplicabilidades de um canal de um lado, maneira comprimida, mas por outro lado, com o menor tempo de retardo possível. Em algumas aplicações, o tempo de retardo não desempenha um papel, como por exemplo,
Entretanto, são necessários retardo, que são por vezes coders, no entanto quando de tempo critico, como por falantes ou microfones sem artigo de Schuller G.
Figure BRPI0506623B1_D0002
• · • · • * • · ao arquivar codificadores denominados ·«· · ·« ·· · ··· • ··« · «· · • · ···« ·· « · ······* « · ···*·*··· ·· • * · «*··· informações de áudio.
de áudio de ultra de pequeno low devem ser transmitidos sinais de exemplo, em teleconferências, nos fio.
et al.
Adaptive Pre- and Post-filtros
Transactions on
September 2002, quando a redução são feitas com transformadas em delay áudio altoPara esses campos de aplicação, o
Perceptual Audio Coding using and Lossless Compres siorí', ΙΕΕΞ
Speech and Audio Processing, vol. 10, no. 6, pp. 379
390, sugere a codificação de áudio da irrelevância e a redução da redundância não base em uma única transformada, mas em duas separado.
to principio será discutido subsequentemente com referência às Figs. 12 e 13. A codificação inicia com um sinal de que assim já esteja áudio 902 que já tenha sido amostrado, e
presente como uma seqüência 904 dos valores
- 906, caracterizado pelo fato de que a ordem
de áudio 906 são indicados por uma flecha
20 limite de audição por meio de um modelo
de áudio ou temporal dos psico-acústico para
908. É calculado um amostra valores sucessivos blocos de valores de áudio 906 caracterizados por uma numeração ascendente por bloco#. A Fig. 13, por exemplo, mostra um diagrama onde, com relação à frequência f, o gráfico a plota o espectro de um bloco de sinais de 128 valores de áudio 906 e b 25 plota o limite de mascaramento, e foram calculados por um modelo psico-acústico, em unidades logarítmicas. O limite de mascaramento indica, como já mencionado, até quais as frequências de intensidade permanecem inaudíveis para o ouvido humano, a saber
ÚL todos os tons abaixo do limite de mascaramento b. Com base nos limites de audição calculados para cada bloco, é alcançada uma redução de irrelevância controlando um filtro parametrizável, seguido por um quantizador. Para o filtro parametrizável, é 5 calculada uma parametrização de maneira que sua resposta de freqüência corresponda ao inverso da magnitude do limite de mascaramento. Essa parametrização está indicada na Fig. 12 por x#(i) .
Figure BRPI0506623B1_D0003
Após a filtragem dos valores de áudio 906, ocorre a quantização com dimensão de etapas constante, como por exemplo, como uma operação de arredondamento até o número inteiro mais próximo. Esse ruído de quantização é o ruido branco. No lado do decodificador, o sinal filtrado é retransformado novamente por um filtro parametrizável, cuja função de transferência é ajustada para a magnitude do próprio limite de mascaramento. Não somente o sinal filtrado é novamente decodificado assim, mas o ruído de quantização no lado do decodificador é também ajustado para forma ou o formato do limite de mascaramento. Para que o ruído de quantização corresponda ao limite de mascaramento da maneira mais precisa possível, é calculado um valor de amplificação a# aplicado ao sinal filtrado antes da quantização cada parâmetro ajustado ou para cada amplificação va codificador como dados principais quantizados 912.
do lado do codificador para parametrização. Para que a decodificador, o valor de e a parametrização x são transferidas para o informações colaterais 910, reais, isto é, os valores de
Para a redução da redundância separadamente dos áudio filtrados e
914, esses dados, isto é, as informações colaterais 910 e os dados principais 912, são submetidos a entrópica, que é
128 valores da
Figure BRPI0506623B1_D0004
Figure BRPI0506623B1_D0005
• ♦ · • · * · ♦ · • * • · « · • « • · * · • · • · • · • · • · • * « · * ·« · * · · • · · • · · · ·· · uma compressão sem perdas, saber, codificação como o sinal codificado é obtido.
artigo supramencionado sugere amostra 906 como uma dimensão permite um retardo relativamente curto de 8 ms uma de dimensão de bloco. Isto com a taxa da amostragem de 32 kHz. Com referência á implementação detalhada, artigo também declara que, para aumentar a eficiência da codificação das informações colaterais, as informações colaterais, a saber, os coeficientes x# e a#, somente houver alterações suficientes comparadas parâmetros transferido anteriormente, excederem um determinado valor limite.
a implementação é feita de preferência isto
Além serão transferidos se com é, se disso, um ajuste de as alterações descrito que de maneira que um parâmetro corrente estabelecido não seja diretamente aplicado valores das amostras que pertencem ao seja usada uma interpolação linear para evitar problemas audíveis.
linear dos coeficientes de filtro, estrutura treliçada instabilidades.
com taxa de multiplicação ou dos
Para
Para bits a todos os respectivo bloco, mas que coeficientes de filtro x# interpolação é sugerida para o filtro uma para que o filtro evite a ocorrência de o caso de ser desej ado controlada, o artigo a atenuação seletiva do sinal um sinal codificado também filtrado sugere a e graduado com o fator de amplificação diferente de 1, de maneira mas a taxa de bits possa ser dependente do tempo a por um fator que ocorram interferências audíveis, reduzida nos locais em que os sinais de áudio têm codificação complicada.
Apesar do esquema de codificação de áudio descrito no artigo supramencionado já reduzir o tempo de retardo
Figure BRPI0506623B1_D0006
• · ·· •· ··· · • · <· • # ··
Figure BRPI0506623B1_D0007
• · de muitas aplicações a um grau adequado, o problema do esquema acima é que, devido ao requisito de ter que transferir o limite de mascaramento ou a função de transferência do filtro do lado codificador, denominado subsequentemente de pré-filtro, o canal de 5 transferência é carregado a um grau relativamente alto, mesmo apesar de que os coeficientes de filtro só serão transferidos quando for ultrapassado um limite predeterminado.
Outra desvantagem do esquema de codificação acima é que, devido ao fato de que o limite de mascaramento ou seu 10 inverso deva estar disponível no lado do decodificador pelo conjunto de parâmetro x# a ser transferido, deve ser feito um compromisso entre a menor taxa de bits possível ou uma alta razão de compressão, de um lado, e a aproximação mais exata possível ou parametrízação do limite de mascaramento, ou seu inverso, por 15 outro lado. Assim, é inevitável que o ruído de quantização ajustado para o limite de mascaramento pelo esquema de codificação de áudio acima ultrapasse o limite de mascaramento em algumas faixas de frequência e assim resultar em audíveis interferências de áudio para o ouvinte. A Fig. 13, por exemplo, mostra a resposta 20 de frequência parametrizada do filtro parametrizável do lado do decodificador pelo gráfico c. Como pode ser visto, existem regiões em que a função de transferência do filtro do lado do decodificador, subsequentemente denominado de pós-filtro, ultrapassa o limite de mascaramento b. O problema é agravado 25 pelo fato de que a parametrização é somente transferida de maneira intermitente com uma alteração suficiente entre parametrizações e aí interpolada. Uma interpolação dos coeficientes de filtro x#, como sugerida no artigo, resulta individualmente em interferências audíveis quando o valor da amplificação a# é mantido constante a partir de nodo a nodo ou de nova parametrização para nova parametrização. Mesmo que a interpolação sugerida no artigo seja também aplicada como valor de informações colaterais a#, isto é, o 5 valor da amplificação transferida, podem permanecer problemas audíveis de áudio no sinal de áudio que chega no lado do decodificador.
Outro problema com o esquema de codificação de áudio de acordo com as Figs. 12 e 13, é que o sinal filtrado pode,
Figure BRPI0506623B1_D0008
devido à filtragem com seleção de frequência, tomar uma forma não prevista onde, particularmente devido a uma superposição randômica de muitas ondas harmônicas individuais, um ou vários valores individuais de áudio de sinal codificado se somam a valores muito altos que, por sua vez, resultam em uma menor taxa de compressão na redução da redundância subsequente devido às suas raras ocorrências.
É o objeto da presente invenção prover um esquema de codificação de áudio que permita uma codificação com menos problemas audíveis.
Esse objeto é alcançado por um método de acordo com a reivindicação 13 ou 15 e um dispositivo de acordo com a reivindicação 1 ou 14.
A codificação inventiva de um sinal de áudio de uma seqüência de valores de áudio em um sinal codificado inclui a determinação de um primeiro limite de audição para um primeiro bloco de valores de áudio da seqüência de valores de áudio e um segundo limite de audição para um segundo bloco de valores de áudio da seqüência de valores de áudio; calcular uma versão de uma £6
Figure BRPI0506623B1_D0009
• * primeira parametrização de um filtro parametrizável, de maneira que sua função de transferência corresponda aproximadamente ao inverso da magnitude do primeiro limite de audição e uma versão de uma segunda parametrização do filtro parametrizável, de maneira 5 que sua função de transferência corresponda aproximadamente ao inverso da magnitude do segundo limite de audição; determinar um primeiro limite de potência de ruido dependendo do primeiro limite de mascaramento e um segundo limite de potência de ruido dependendo do segundo limite de mascaramento; filtrar de forma •10 parametrizável e graduar ou amplificar um bloco predeterminado de valores de áudio bloco de ao bloco seguintes valores da seqüência de valores de áudio para obter um de áudio graduados e filtrados que correspondam predeterminado, essa última etapa compreendendo as sub-etapas: interpolação entre a versão da parametrização versão de uma predeterminado primeira e a versão da segunda parametrização para parametrização interpolada para um valor no interpolar entre o segundo limite potência de predeterminado;
de obter uma de áudio bloco predeterminado primeiro limite de de valores potência de potência de ruido para obter um ruido interpolado para determinar um valor de o valor de áudio;
ruido e o limite de de áudio graduação intermediário dependendo do limite de potência de ruido interpolado; e aplicar o filtro parametrizável com a versão da parametrização interpolada e o valor de graduação intermediária para o valor de áudio predeterminado obter um dos valores de áudio graduados e filtrados. Finalmente, ocorre a quantização dos valores de áudio graduados e filtrados para obter um bloco de valores de áudio quantizados, graduados e filtrados; e integrar as informações no sinal codificado, a partir de onde pode se derivar o bloco de valores de áudio graduados e filtrados, a versão da primeira parametrização, a versão da segunda parametrização, o primeiro limite de potência de ruído e o segundo limite de potência de ruído.
A idéia central da presente invenção é que deve ser abandonado o procedimento anterior, a saber, a interpolação relativa dos coeficientes de filtro e o valor da amplificação, para a obtenção dos valores interpolados dos valores de áudio • 10 intermediários partindo nos nodos. Pode ser obtida uma codificação contendo menos problemas auditivos não interpolando o valor da amplificação, mas ao invés disso, tomando o limite de potência derivado do liniiLe de mascaramento, preferivelmente como a área abaixo do quadrado da magnitude e do limite de mascaramento, para cada nodo, isto é, para cada parametrização a ser transferida, e depois realizando a interpolação entre esses limites de potência dos nodos vizinhos, tal como, por exemplo, uma interpolação linear. Tanto no lado do codificador como no lado do decodificador, pode então ser calculado um valor de amplificação do limite de potência intermediário determinado de forma que, o ruído de quantização causado pela quantização, que tem uma freqüência constante antes da pós-filtragem no lado do decodificador, está abaixo do limite de potência ou este após a filtragem.
Serão detalhadas subsequentemente as configurações preferidas da presente invenção com referência aos desenhos anexos, onde:
Fig. 1 mostra um diagrama de circuito de « *« ·« ·
1-Ύ blocos de um codificador de áudio de acordo com uma configuração da presente invenção;
Fig. 2 mostra um fluxograma da ilustração do
modo de funcionamento do codificador de áudio da Fig . 1 na entrada
5 de dados;
Fig. 3 mostra um fluxograma da ilustração do
modo de funcionamento do codificador de áudio da Fig. 1 com
Figure BRPI0506623B1_D0010
referência à avaliação do sinal de áudio de entrada por um modelo psico-acústico;
Fig. 4 mostra um fluxograma da ilustração do modo de funcionamento do codificador de áudio da Fig. 1 com referência à aplicação dos parâmetros obtidos pelo modelo psicoacústico no sinal de áudio de entrada;
Fig. 5 a mostra um diagrama esquemático da ilustração do sinal de áudio de entrada, a seqüência dos valores de áudio de que consiste, e as etapas operacionais da Fig. 4 com relação aos valores de áudio;
Fig. 5b mostra um diagrama esquemático da
Figure BRPI0506623B1_D0011
ilustração do estabelecimento do sinal codificado;
Fig. 6 mostra um fluxograma da ilustração do modo de funcionamento do codificador de áudio da Fig. 1 com relação ao processamento final até o sinal codificado;
Fig. 7a mostra um diagrama em que consta uma configuração da função da etapa de quantização;
Fig. 7b mostra um diagrama em que consta uma outra configuração da função da etapa de quantização;
Fig. 8 mostra um diagrama de circuito de blocos de um codificador de áudio capaz de decodificar um sinal de • · « · ♦ «· áudio codificado pelo codificador de áudio da Fig. 1 de acordo com uma configuração da presente invenção;
Fig. 9 mostra um fluxograma da ilustração do
modo de funcionamento do decodificador da Fig. 8 na entrada de
5 dados Γ
Fig. 10 mostra um fluxograma da ilustração do
modo de funcionamento do decodificador da Fig. 8 com relação ao
armazenamento no buffer dos dados de áudio pré-decodifiçados quantizados e filtrados e o processamento dos blocos de áudio sem 10 as correspondentes informações colaterais;
Fig. 11 mostra um fluxograma da ilustração do
modo de funcionamento do decodificador da Fig. 8 com relação à
real filtragem reversa;
Fig. 12 mostra um diagrama esquemático da
ilustração de um esquema convencional de codificação de áudio com curto retardo de tempo; e
Fig. 13 mostra um diagrama onde, exemplarmente, estão mostrados um espectro de um sinal de áudio, seu limite de
Figure BRPI0506623B1_D0012
audição e a função de transferência do pós-filtro no decodificador.
mostra um codificador de áudio de acordo com uma configuração da presente invenção. O codificador de áudio, que é geralmente indicado por 10, inclui uma entrada de dados 12 onde recebe o sinal de áudio a ser codificado, que, como será explicado em maiores detalhes posteriormente com referência à Fig.
5a, consiste de uma seqüência de valores de áudio ou valores de amostra, e uma saída de dados, de onde sai o sinal codificado, cujo teor de informações será discutido em maiores detalhes com ·· ·· · ···
11 • « · · • * · ♦· « · • · · • · ·· * • · · · • ·· · · « · · · • · · · Λ • · • ·· • · • · • • · · · ·· · · • · · · • · · · · • · ·· · 1£>
referência à Fig. . 5b.
0 codificador de áudio 10 da Fig. 1 em uma parte
de redução de irrelevância 16 e uma parte de redução de
redundância 18. A parte de redução de irrelevância 16 inclui o meio 2 0 para a determinação de um limite de audição, meio 22 para o cálculo de um valor de amplificação, meio 24 para o cálculo da parametrização, meio de comparação de nodo 26, um quantizador 28 e um pré-filtro parametrizável 30 e um buffer
FIFO de entrada(first in first out) 32, buffer ou memória 38 e um multiplicador ou meio
Figure BRPI0506623B1_D0013
de multiplicação 40. A parte de redução de redundância 18 inclui um de compressor 34 e um controlador de
A parte de redução taxa de bits 36.
de irrelevância 16 e a parte redução de redundância entre a entrada de dados 12 a entrada de dados 12 está são ligadas em série nessa ordem e a saída de dados 14.
Em particular, ligada a uma entrada de dados do meio para a determinação de um limite de audição e a uma entrada de dados do buffer de entrada 32. Uma saída de dados do meio 20 para a determinação do limite de audição está ligada a uma entrada do
Figure BRPI0506623B1_D0014
meio 2 4 para o cálculo de uma parametrização e à uma entrada de dados do meio 22 para o cálculo de um valor de amplificação para indicar um limite de audição determinado para este. Os meios 22 e calculam uma parametrização ou valor de amplificação baseado no limite de audição e estão ligados ao meio de comparação de nodos para indicar esses resultados a este. Dependendo do resultado da comparação, o meio de comparação de nodos 26, como será discutido posteriormente, indica os resultados calculados pelos meios 22 e 24 como parâmetro de entrada ou de parametrização para o pré-filtro parametrizável 30. O pré-filtro parametrizável 30
Figure BRPI0506623B1_D0015
······ ······ está ligado entre uma saída de dados do buffer de entrada 32 e uma entrada de dados do buffer 38. 0 multiplicador 40 está conectado entre uma saída de dados do buffer 38 e o quantizador 28. O quantizador 28 indica os valores de áudio filtrados que podem ser multiplicados ou graduados, mas sempre quantizados, para a parte de redução de redundância 18, mais precisamente a uma entrada de dados do compressor 34. 0 meio de comparação de nodos 26 indica as informações a partir das quais os parâmetros de entrada indicados para o pré-filtro parametrizável 30 podem ser derivados para a 10 parte de redução de redundância 18, mais precisamente para outra entrada de dados do compressor 34. O controlador de taxa de bits está conectado com uma entrada de controle do multiplicador 40 por meio de uma conexão de controle para prover valores de áudio quantizados e filtrados, como recebidos do pré-filtro 30, para 15 serem multiplicados pelo multiplicador 40 por um multiplicando adequado, como será discutido em maiores detalhes abaixo. O controlador de taxa de bits 36 está ligado entre a saída de dados do compressor 34 e a saída de dados 14 do codificador de áudio 10 para determinar o multiplicando para o multiplicador 40 de maneira 20 adequada. Quando cada valor de áudio passa pelo quantizador 4 0 pela primeira vez, o multiplicando é primeiramente ajustado em um fator de graduação adequado como, por exemplo, 1. O buffer 38, entretanto, continua armazenando todos os valores de áudio filtrados para dar ao controlador de taxa de bits 36, como será 25 descrito subsequentemente, . uma possibilidade de alteração do multiplicando para uma outra passagem de um bloco de valores de áudio. Se tal alteração não for indicada pelo controlador de taxa de bits 36, o buffer 38 pode liberar a memória retida por este • · • · • · • · • · • · • · • · • · bloco .
ter sido acima descrito, seu modo subsequentemente descrito com referência
Como pode ser visto na
ao ter atingido a en trada de
amostragem de sinal de áudio 50
áudio. A amostragem de sinal de
áudio a partir de da amostragem predeterminada, de de áudio da Fig. 1 funcionamento será às Figs.
a 7b.
Fig.
12,
2, já o sinal de áudio, foi obtido pela um sinal análogo de áudio é feita com uma freqüência que está normalmente entre 32 e
Figure BRPI0506623B1_D0016
kHz. Como conseqüência, na entrada de dados 12 existe um sinal de áudio que consiste de uma seqüência de áudio. Apesar da codificação do sinal forma de blocos, como se tornará óbvio seguir, os valores de áudio na primeiramente combinados para formar
A combinação para formar blocos de valores da amostra ou de áudio a partir entrada de blocos áudio propósito de determinar o limite de audição, a partir da descrição a seguir, e ocorre em de não ocorrer de da descrição a dados 12 são de áudio na etapa 52.
ocorre somente com o como se tornará óbvio um estágio de entrada
Figure BRPI0506623B1_D0017
do meio 20 para a determinação do limite de audição. Na presente configuração, é suposto como exemplo que 128 sucessivos valores de áudio são combinados para combinação ocorre de maneira de áudio não se sobrepõem e, formar blocos de áudio e que a que, por um lado, sucessivos por outro lado, são vizinhos blocos diretos entre si. Isto será brevemente discutido como exemplo referindo-se à Fig. 5a.
A Fig. 5a em 54 indica a seqüência de valores da amostra, cada valor da amostra sendo ilustrado por um retângulo
56. Os valores da amostra são numerados para fins de ilustração, • · • · ·
Figure BRPI0506623B1_D0018
caracterizados pelo fato de que, por razões de clareza, somente alguns valores da amostra da seqüência 54 são mostrados. Como indicado pelas junções acima da seqüência 54, 128 sucessivos valores da amostra são combinados para formar um bloco de acordo 5 com a presente configuração, caracterizado pelo fato de que os 128 valores da amostra diretamente sucessivos formam o próximo bloco.
Somente como medida de precaução, deve ser indicado que a combinação para formar blocos também poderia ser feita de maneira diferente, como por exemplo, superpondo blocos ou blocos espaçados
Figure BRPI0506623B1_D0019
entre si e blocos tendo outra dimensão de bloco, apesar da dimensão de bloco de 128 ser preferida, já que provê uma boa vantagem entre alta qualidade de áudio por um lado e o menor retardo possível de tempo pelo outro lado.
Considerando que os blocos de áudio combinados no meio 20 na etapa 52 são processados no meio 20 para determinar um limite de audição bloco a bloco, os valores de audio de entrada serão armazenados em buffer 54 no buffer de entrada 32 até que o pré-filtro parametrizável 30 tenha obtido parâmetros de entrada a partir do meio de comparação de nodos 2 6 para realizar a pré20 filtragem, como será descrito subseqüentemente.
Como pode ser visto na Fig. 3, o meio 20 para a determinação de um limite de diretamente depois que tiverem suficientes na entrada de dados 25 ou para formar o próximo bloco por uma inspeção na etapa 60. processado completo, o meio 20 áudio completo a ser processado, audição inicia seu processamento sido recebidos valores de áudio 12 para formar um bloco de áudio de áudio, que o meio 2 0 monitora Se não houver um bloco de áudio aguardará. Se houver um bloco de o meio 20 para a determinação do • * • · • · ♦ · • · • · limite de audição calculará um limite de audição na etapa 62, com base em um modelo psico-acústico adequado na etapa 62. Para a ilustração do limite de audição, é feita novamente referência à
Fig. 12 e, em particular, ao gráfico b que foi obtido com base em um modelo psico-acústico, exemplarmente com relação a um bloco de áudio corrente com espectro a. 0 limite de mascaramento determinado na etapa 62 é uma função dependente da freqüência, que pode variar para sucessivos blocos de áudio e que também pode variar consideravelmente de sinal de áudio para sinal de áudio, • 10 como, por exemplo, de uma música de rock para uma música clássica.
limite de audição indica, para cada frequência, abaixo do qual o ouvido
Em uma calculam a partir indicando a frequência) um valor limite humano não percebe interferências.
etapa subsequente 64, o meio 24 e o meio do limite um valor de parâmetros de N parâmetros x(i) de audição M (f) calculado (f de amplificação a ou conjunto (i = 1, N) . A parametrização x(i) que o meio 24 calcula na etapa 64 é provida para o pré-filtro parametrizável 30 que é, por exemplo, configurado em uma estrutura de filtro adaptável, como usada na codificação LPC (LPC = linear predictive coding) .
Por exemplo, s (η), n = 0,
127, sendo os 128 valores de áudio do bloco de áudio corrente e s' (n) sendo os 128 valores de áudio resultantes filtrados, então filtro é configurado exemplarmente de maneira a se aplicar a seguinte equação:
κ s'(n) = s(n) - £ aks(nk) · k = l
K sendo a ordem do filtro e a£, k sendo os coeficientes de filtro, e o indice t sendo para ilustrar • · ·
Figure BRPI0506623B1_D0020
que os coeficientes de filtro se alteram nos sucessivos blocos de áudio. O meio 24 então calcula a parametrização , de maneira que a função de transferência H(f) do pré-filtro parametrizável 30 é aproximadamente igual ao inverso da magnitude do limite de
Figure BRPI0506623B1_D0021
5 mascaramento M (f) , isto é, de maneira a se aplicar a seguinte
equação:
H(f, t) 1 ~ |M(f, q
onde a dependência de t, por sua vez, é para
ilustrar que o limite de mascaramento M(f) se altera para os
diferentes blocos de áudio. Ao implementar o pré-filtro 30 como o filtro adaptável acima mencionado, os coeficientes de filtro a* serão obtidos como segue: a transformada discreta inversa de
Fourier de |M(f, t)|? na freqüência para o bloco no instante t resulta em uma função alvo de autocorrelação r^m(i). Então, aj: é obtido
- 15 solucionando o sistema de equação linear:
Σ rí(k “ Φ* = rí (i + !)- 0 < i < K .
k = 0
Figure BRPI0506623B1_D0022
Para não surgirem instabilidades entre as parametrizações na interpolação linear descrita abaixo em maiores detalhes, é preferivelmente usada uma estrutura em treliça para o 20 filtro 30, caracterizada pelo fato de que os coeficientes de filtro para a estrutura em treliça são re-parametrizáveis para formar coeficientes de reflexão. Com relação a maiores detalhes do projeto do pré-filtro, o cálculo dos coeficientes e a reparametrização, é feita referência ao artigo de Schuller etc. 25 mencionado na introdução para descrição e, em particular, na página 381, divisão III, incorporada ao presente como referência.
Considerando que, como consequência o meio 24 calcula a parametrização para o pré-filtro parametrizável 30, de maneira que sua função de transferência é igual ao inverso do 5 limite de mascaramento, o meio 22 calcula um limite de potência de ruído com base no limite de audição, a quanta potência de ruido o quantizador saber, um limite que indica pode introduzir no sinal de áudio filtrado pelo pré-filtro para que o ruído de quantização no lado do decodificador fique abaixo do limite de •'10 audição M (f) ou o iguale exatamente após a pós-filtragem ou filtragem reversa.
ruído como a área audição M, isto amplificação a da potência de meio abaixo é, como do limite ruído da potência de ruido.
quantizador 28. O descrito abaixo, calcula do quadrado esse limite de potência da
Σ |M(f)|2. O meio de potência de de
O ruído magnitude do limite calcula o valor de de ruido calculando a raiz quantização dividida pelo limite de de quantização é o ruido causado pelo ruído causado pelo quantizador é, como será o ruído branco e, portanto, independente da frequência. A potência de ruído de quantização é a potência do ruído de quantização.
Como fica evidente a partir da descrição acima, o meio 22 também calcula o limite de potência de ruido separado do valor de amplificação a. Apesar de ser possível para o meio de comparação de nodos 26 calcular novamente o limite de potência de 25 ruído a partir do valor de amplificação a obtido do meio 22, é também possível para o meio 22 transmitir o limite de potência de ruido determinado para o meio de comparação de nodos 26, independente do valor de amplificação a.
Após calcular ο valor de amplificação e a parametrização, o meio de comparação de nodos 26 verifica na etapa se a parametrização recém-calculada difere além do limite predeterminado da corrente última parametrização indicada para o pré-filtro parametrizável. Se a verificação na etapa 66 indicar que a parametrização recém-calculada difere da corrente além do limite predeterminado, os coeficientes de filtro recém-calculados e o valor da amplificação recém-calculada e o limite de potência de ruido são armazenados em buffer no meio de comparação de nodos 26 para que seja discutida uma interpolação e o meio de comparação de nodos 26 entrega para o pré-filtro 30 os coeficientes de filtro recém-calculados na etapa 68 e o valor da amplificação recémcalculada na etapa 70. Se, entretanto, não for esse o caso e a parametrização recém-calculada não diferir da corrente além do limite predeterminado, o meio de comparação de nodos (26) entregará ao pré-filtro 30 na etapa 72, ao invés da parametrização recém-calculada, somente a corrente parametrização de nodo, isto é, a parametrização resultou por último em um resultado positivo na etapa 66, isto é, diferiu de uma parametrização de nodo anterior além do limite predeterminado. Após as etapas 70 e 72, o processo da Fig. 3 retorna ao processamento do próximo bloco de áudio, isto é, à pergunta 60.
No caso em que a parametrização recém-calculada não difere da corrente parametrização de nodo e consequentemente o pré-filtro 30 na etapa 72 obtém novamente a parametrização de nodo já obtida pelo menos no último bloco de áudio, o pré-filtro 30 aplicará essa parametrização de nodo a todos os valores da amostra desse bloco de áudio no FIFO 32, como será descrito abaixo em maiores
FIFO 32 valores
Figure BRPI0506623B1_D0023
Figure BRPI0506623B1_D0024
·· ··· · ··· „ „ · · ····
19·· ·***** ·· · ··♦ • · · · ·· detalhes, que é como esse bloco corrente é e o quantizador 28 recebe de áudio pré-filtrados.
A Fig. 4 ilustra coletado no um bloco de áudio resultante dos o modo de funcionamento do préfiltro parametrizável 30 recém-calculada e o valor diferem maiores existe no da caso em que recebe a parametrização amplificação recém-calculado, porque suficientemente detalhes. Como processamento de da corrente parametrização descrito com referência à acordo com a Fig. 4 para de
Fig.
cada nodo em
3, um não dos sucessivos blocos de áudio, mas somente para os blocos de áudio onde a parametrização como foi descrito, parametrização de respectivo corrente áudio.
Na verifica se calculados ocorreu respectiva diferiu suficientemente da de nodo. Os demais blocos de áudio são, pré-filtrados aplicando a respectiva nodo corrente e a todos os valores o valor da amostra de amplificação desses blocos de etapa 80, o pré-filtro parametrizável 30 o handover dos coeficientes de filtro do meio de parametrizações de nodo verificação 80 até ocorrer
Logo que parametrizável 30 inicia recémcomparação de nodos 26, anteriores. O pré-filtro o handover.
ocorre esse handover, o o processamento do bloco ou de faz a pré-filtro de áudio corrente dos valores de áudio no buffer 32, isto é, aquele para o qual a parametrização foi calculada. Na Fig
5a, está, por exemplo ilustrado que todos os valores de áudio 56 na frente do valor de áudio com o número 0 já foram processados e assim já passaram pela memória 32. Foi disparado o processamento do bloco de valores de ls áudio na frente do valor de áudio com número 0 porque a parametrização calculada para o bloco de áudio na frente do bloco
0, a saber, x0(i), diferiu da parametrização de nodo indicada antes ao pré-filtro 30 além do limite predeterminado. A parametrização x0 (i) é, portanto, uma parametrização de nodo, como descrita na presente invenção. 0 processamento dos valores de áudio no bloco de áudio na frente do valor de áudio 0 foi feito com base no conjunto de parâmetros a0, x0(i).
É suposto na Fig. 5a que a parametrização foi
Figure BRPI0506623B1_D0025
calculada para o bloco 0 com os valores de áudio 0 - 127 diferindo menos que o limite predeterminado da parametrização x0 (i) que se referiu ao bloco em frente. Esse bloco 0 foi assim também tirado do FIFO 32 pelo pré-filtro 30, igualmente processado com relação a todos os seus valores da amostra 0 a 127 por meio da 15 parametrização x0 (i) fornecida na etapa 72, como indicada pela flecha 81 descrita por aplicação direta, e depois passada para o quantizador 28.
Entretanto, a parametrização calculada para o
Figure BRPI0506623B1_D0026
bloco 1 ainda localizada no FIFO 32, em contraste diferiu, de acordo com o exemplo ilustrativo da Fig. 5a, em mais do que o limite predeterminado da parametrização Xq(í) e foi assim passado na etapa 68 para o pré-filtro 30 como uma parametrização Xi (i) , juntamente com o valor de amplificação ai (etapa 70) e, se aplicável, limite de potência de ruído adequado, caracterizado 25 pelo fato de que os índices de a e x na Fig. 5 devem ser um índice para os nodos, como usados na interpolação a ser discutida abaixo, que foi feita em relação aos valores da amostra 12 8 a 2 55 no bloco 1, simbolizado por uma flecha 82 e realizados pelas « · · · ·
21;.: :
• * • ··· etapas seguintes á etapa 80 na Fig. 4. O
Figure BRPI0506623B1_D0027
·· ·· •· ♦ ·· · « · *· * » ·· • ·· processamento na etapa 80 iniciaria assim, com a ocorrência do bloco de áudio com o número
1.
No momento em que o conjunto de parâmetros ai, Xi é passado, somente os valores de áudio 128 a 255, isto é, o bloco de áudio corrente após pré-filtro 30, estão handover dos parâmetros determina o limite de valor de amplificação de comparação de nodos ou pelo pré-filtro 30 o último bloco de áudio 0 processado pelo na memória 32. Depois de determinar de nodo Xi(i) na etapa 80, c pré-filtro potência de ruído qi que corresponde ao ai na etapa 84. Isto pode ocorrer pelo meio passando esse valor para o pré-filtro 30 novamente calculando esse valor, como acima descrito com referência à etapa 64.
da amostra da amostra amostra do exemplo da
Depois, que permanece de na inicializado um índice j para um maneira memória bloco de áudio corrente
Fig. 5, o valor a indicar
FIFO 32 ou bloco 1, o mais antigo valor o primeiro valor da isto é, no presente valor da amostra 128. Na etapa 88, o pré-
Figure BRPI0506623B1_D0028
filtro parametrizável faz uma interpolação entre os coeficientes de filtro x0 e xi, caracterizado pelo fato de que aqui a parametrização x0 atua como um nodo no nodo que tem o número de valor de áudio
127 do bloco anterior e a parametrização Xj. atua como um nodo no nodo que tem o número de valor de áudio 255 do bloco corrente 1. Essas posições de valor de áudio 127 e 255 serão subsequentemente indicadas como nodo e nodo 1, onde as parametrizações de nodo referentes aos nodos da Fig.
5a são indicadas pelas flechas 90 e 92.
Na etapa 88, o pré-filtro parametrizável 30 faz a * · ♦ • · • ·· • · * > · ·> · »· ♦ ··· • * · * ·« · · * * ♦ · • · · · · • · ·· * interpolação dos coeficientes de filtro x0, xi entre os dois nodos, sob a forma de interpolação linear para obter os coeficientes de filtro interpolados na posição da amostra j, isto é, x (tj) (i), i
... N.
Depois disso, a saber, na etapa
90, o pré-filtro parametrizável 30 faz uma interpolação entre o limite de potência de ruído qi e q0 para obter um limite de potência de ruído interpolado na mesma posição da amostra j, isto
Na etapa
92, o pré-filtro parametrizável • 10 subsequentemente calcula o valor de amplificação da posição da amostra j com base no potência de ruído de coeficientes de filtro onde são feitas limite de potência de ruído interpolado quantização, interpolados,
Dependendo da raiz e preferivelmente também a saber, por exemplo de os potência de ruído de quantização explicações para essa referência na etapa da
Fig. 3.
Na etapa 94, o pré-filtro parametrizável 30 então aplica o valor de amplificação calculado e os coeficientes de filtro interpolados ao valor da amostra na posição da amostra j para obter um valor da amostra filtrado para essa posição da amostra, a saber, s' (tj) .
Na etapa
96, o pré-filtro parametrizável 30 então verifica se a posição da amostra j atingiu o nodo corrente, isto é, o nodo 1, no caso da Fig. 5a a posição da amostra 255, isto é, o valor da amostra para o qual a parametrização transferida para o pré-filtro parametrizável mais o valor de amplificação deve ser diretamente válida, isto é, sem interpolação. Se este não for o
Figure BRPI0506623B1_D0029
Figure BRPI0506623B1_D0030
caso, o pré-filtro parametrizável 30 aumentará ou incrementará o índice j de 1, onde as etapas 8 8 a 96 serão repetidas. Se a verificação na etapa 96, entretanto, for positiva, o pré-filtro parametrizável aplica, na etapa 100, o último valor de amplificação transmitido do meio de comparação de nodos 26 e os últimos coeficientes de filtro transmitidos do meio de comparação de nodos 26 diretamente sem interpolação ao valor da amostra no novo nodo, onde o bloco corrente, isto é, no caso corrente o bloco
1, foi processado, sendo o processo novamente feito na etapa 80 relativo ao bloco subsequente a ser processado que, dependendo se a parametrização do próximo bloco de áudio, o bloco 2, difere o suficiente da parametri zação Xi (i), pode ser esse próximo bloco de áudio, bloco 2, ou um próximo bloco de áudio.
Antes de qualquer outro procedimento para o processamento dos valores da amostra filtrada s' serem descritos com relação à Fig. 5, serão descritos abaixo o propósito e o histórico do procedimento das Figs. 3 e 4. O propósito da filtragem, é filtrar o sinal de áudio na entrada 12 com um filtro adaptável, cuja função de transferência é continuamente ajustada 20 para o inverso do limite de audição até o melhor grau possível, que também se altera no tempo. A razão para isto é que, no lado do decodificador, a filtragem reversa, cuja função de transferência é ajustada contínua e correspondentemente para o limite de audição, conforma o ruído branco de quantização introduzido pela 25 quantização do sinal de áudio filtrado, isto é, o ruído de quantização de frequência constante, por um filtro adaptável, ou seja, que o ajusta à forma do limite de audição.
A aplicação do valor de amplificação nas etapas • 4 e 100 no pré-filtro 30 é uma multiplicação do sinal de áudio ou do sinal de áudio filtrado, isto é, os valores da amostra s ou os valores da amostra filtrados s', pelo fator de amplificação. O objetivo é assim estabelecer o ruído de quantização introduzido no 5 sinal de áudio filtrado pela quantização descrita abaixo em maiores detalhes, e que é ajustado pela filtragem reversa no lado do decodificador à forma do limite de audição, o mais alto possível sem ultrapassar o limite de audição. Isto pode ser exemplificado pela fórmula de Parsevals, de acordo com a qual o
Figure BRPI0506623B1_D0031
quadrado da magnitude de uma função é igual ao quadrado da magnitude da transformada de Fourier. Quando no lado do decodificador, a multiplicação do sinal de áudio no pré-filtro pelo valor de amplificação é novamente revertida pela divisão do sinal de áudio filtrado pelo valor de amplificação, a potência de ruído de quantização é também reduzida, a saber, pelo fator a 2, a sendo o valor de amplificação. Como consequência, a potência de ruído de quantização pode ser estabelecida em um grau idealmente alto aplicando o valor de amplificação no pré-filtro
30, que é sinônimo da dimensão da etapa quantizadora sendo aumentada, reduzindo assim o número de etapas quantizadoras a serem codificadas, o que por sua vez aumenta a compressão na parte subsequente de redução de redundância.
Colocado de forma diferente, o efeito do préfiltro pode ser considerado como uma normalização do sinal em seu limite de mascaramento, de maneira que o nível de interferências de quantização ou do ruído de quantização pode ser mantido constante, tanto no tempo como na freqüência. Como o sinal de áudio está no domínio do tempo, a quantização pode assim ser feita •· · ·· · · · * ;:
·· · ·· • Λ ·· a *··* ··· « ·· • · ·· ·· ·· • 1 • · ··· passo a passo, com uma quantização uniforme constante, como será descrito subseqüentemente.
Assim, teoricamente qualquer irrelevância possível é removida do sinal de áudio, podendo ser usado um esquema de compressão sem perdas para também remover redundância remanescente no sinal de áudio pré-filtrado quantizado, como será descrito abaixo.
Com referência à Fig. 5a, deve ser novamente explicitamente indicado que, evidentemente, os coeficientes de filtro e os valores de amplificação a0, ai, x0,
Xi usados devem
Figure BRPI0506623B1_D0032
estar disponíveis no lado do decodificador como informações colaterais, que a complexidade de transferência disto, entretanto, é reduzida valores de não somente usando novos coeficientes de amplificação para cada uma verificação do valor limite parametrizações como informações mudança de parametrização e para, filtro e novos bloco. Ao invés para somente colaterais com de outra forma, disso, ocorre transferir as uma suficiente não transferir as informações colaterais ou parametrizações
Ocorre uma interpolação da antiga para a nova parametrização nos blocos de
Figure BRPI0506623B1_D0033
áudio para onde as parametrizações foram transferidas. A interpolação dos coeficientes de filtro ocorre da maneira acima descrita com referência à etapa 88. A interpolação com referência à amplificação ocorre por um atalho, a saber, via uma interpolação linear 90 do limite de potência de ruído q0, qi. Comparada com uma interpolação direta por meio do valor de amplificação, a 25 interpolação linear resulta em uma melhor audição ou em menos problemas audíveis com relação ao limite de potência de ruído.
Subseqüentemente, a continuação do processamento do sinal pré-filtrado será descrita com referência à Fig. 6, que *» basicamente inclui redução de quantização e redundância. Primeiro, a salda dos valores da amostra filtrados pelo pré-filtro parametrizável 30 são armazenados no buffer 38 e ao mesmo tempo deixados passar do buffer 38 para o multiplicador 40 onde são, já que se trata da primeira passagem, primeiramente passados inalterados, a saber, com um fator de graduação de um, pelo multiplicador 40 para o quantizador 28. Aí, são cortados os valores de áudio filtrados acima de um limite superior na etapa
110 e depois quantizados na etapa 112. As duas etapas 110 e 112 •10 são realizadas pelo quantizador
28. Em particular, as duas etapas
110 uma uma e 112 etapa, função filtrados flutuante são preferivelmente pela quantização dos de s' em realizadas pelo quantizador valores de áudio filtrados s' por etapa quantizadora que mapeia os valores da amostra exemplarmente presentes em uma ilustração de ponto uma pluralidade de valores ou índices de etapa quantizadora de números inteiros e que tem um curso nivelado para os valores da amostra filtrada a partir de um determinado valor limite, de maiores do maneira que que o valor os valores da amostra filtrada que limite, são quantizados para a mesma de quantização. Um exemplo dessa função de etapa forem etapa de quantização está ilustrado na Fig. 7a.
Os valores da amostra filtrada e quantizada são denominados por preferivelmente de etapa que é σ' uma na Fig. 7a. A função da etapa quantizadora é função de etapa quantizadora com uma dimensão constante abaixo do valor limite, isto é, o pulo para a próxima etapa de quantização sempre ocorrerá após um intervalo constante juntamente com os valores de entrada S' . Na implementação, a dimensão da etapa para o valor limite é ajustada
« · • • • · · • • • • • · · • ··· *· ·** : : ’· · ·*· • · · · ·· · ··· • · · · ·· · • · · . 1 • · · · · • · · · ·
de maneira que o número de etapas de quantização corresponda de
preferência a uma potência de 2. Comparado com a ilustração de
ponto flutuante dos valores da amostra filtrada de entrada s', o
valor limite é menor, de maneira que o valor máximo da região 5 ilustrada na ilustração de ponto flutuante ultrapassa o valor limite.
A razão para este valor limite é que foi observado que a saída do sinal de áudio filtrado pelo pré-filtro compreende ocasionalmente valores de áudio que se somam a
Figure BRPI0506623B1_D0034
valores muito grandes devido a um acúmulo desfavorável de ondas harmônicas. Além disso, foi observado que o corte desses valores, como feito pela função da etapa quantizadora mostrada na Fig. 7a, resulta em uma grande redução de dados, mas somente com pequeno prejuízo na qualidade de áudio. Assim, esses locais ocasionais no sinal de áudio filtrado são formados artificialmente por uma filtragem seletiva de frequência no filtro parametrizável 30, de maneira pequeno função que cortá-los prejudica a qualidade de áudio somente em grau.
da arredonda
Um exemplo de etapa quantizadora todos os valores das seguir até o valor certa mostrada amostras limite, todos os valores quantizadora, tal na Fig. 7a.
das amostras forma mais específico na Fig.
filtrados e daí em da
7a seria a que s' para o número diante quantiza filtrados acima para a maior etapa como, por exemplo, 256. Esse caso está ilustrado
Outro exemplo de uma possível função de etapa quantizadora seria o mostrado na Fig. 7b. Até o valor limite, a função da etapa quantizadora da Fig. 7b corresponde à da Fig. 7a.
Entretanto, ao invés de ter um curso valores das amostras quantizadora continua na região abaixo do • · · • · · • · ·· • · nivelado ' acima do valor limite, • · · • · ·· ·· • · · «··· *· • · •· •· abruptamente para função da etapa com uma inclinação menor do que a inclinação valor limite. Colocado de outra forma, a dimensão da etapa quantizadora é maior acima do valor limite. Por isso, é alcançado um efeito similar como pela função de quantização da Fig. 7a, mas, por um lado, com maior complexidade devido às diferentes dimensões de etapas da função da etapa quantizadora acima e abaixo do valor limite e, por outro lado, uma φιο melhor qualidade de áudio, já que valores de áudio com filtragem muito grande s' não são cortados completamente, mas somente quantizados com uma maior dimensão da etapa quantizadora.
Como já descrito anteriormente, no lado do decodificador não somente os valores de áudio quantizados filtrados σ' devem estar disponíveis, mas também os parâmetros de entrada para o pré-filtro 30 sendo a base da filtragem desses valores, a saber, a parametrização do nodo incluindo uma sugestão para o valor de amplificação pertinente. Na etapa 114, o compressor 34 realiza assim um primeiro experimento de compressão e assim comprime as informações colaterais que contêm o valor das amplificações a0 e ai nos nodos, como por exemplo, 127 e 255, e os coeficientes de filtro x0 e Xi nos nodos e os valores das amostras quantizados e filtrados σ' para um sinal filtrado temporalmente. O compressor 34 é assim um codificador de operação sem perdas, como 25 por exemplo, um codificador Huf fman ou aritmético, com ou sem predição e/ou adaptação.
A memória 38 que por onde os valores de áudio amostrados σ' passam, serve como um buffer para uma dimensão de bloco adequada com • · * · • · * · • · • · ·· · • · • · · a qual o compressor 34 processa os valores de áudio quantizados, filtrados e também graduados σ' como descritos anteriormente, que saem do quantizador 28. A dimensão de bloco pode diferir da dimensão de bloco dos blocos de áudio como usadas pelo meio 20.
Como já mencionado, o controlador de taxa de bits 36 controla o multiplexador 40 por um multiplicando de 1 para o primeiro experimento de compressão, de maneira que os valores de áudio filtrados ficam inalterados a partir do pré-filtro 30 para o quantizador 28 e daí como valores de áudio quantizados e filtrados para o compressor 34. O compressor 34 monitora, na etapa 116, se uma determinada dimensão de bloco de compressão, isto é, um determinado número de valores de áudio amostrados quantizados, foram codificados no sinal codificado temporário, ou se outros valores de áudio quantizados e filtrados σ' devem ser codificados no sinal codificado temporário corrente. Se a dimensão de bloco de compressão não foi alcançada, o compressor 34 continuará realizando a compressão corrente 114. Entretanto, se a dimensão de bloco de compressão tiver sido alcançada, o controlador de taxa de bits 36 verificará na etapa 118 se a quantidade necessária de bits para a compressão é maior do que a quantidade de bits indicada por uma taxa de bits desejada. Se este não for o caso, o controlador de taxa de bits 36 verificará na etapa 12 0 se a quantidade necessária de bits for menor do que a quantidade indicada por uma taxa de bits desejada. Se este for o caso, o controlador de taxa de bits 36 preencherá o sinal codificado na etapa 122 com filler bits até que a quantidade indicada pela taxa de bits desejada tenha sido alcançada. Subsequentemente, o sinal codificado sai na tf • · • · * · • · ·· e • · • · • · • · • · · • · etapa 124. Como alternativa à etapa 122, bits 36 podería mover o bloco filtrados σ' ainda armazenados compressão se baseou, sob multiplicando maior do que quantizador 28, para novamente a quantidade de sido alcançada, bits como indicada indicado ο controlador de taxa de de compressão dos valores na memória 38, nos quais uma forma multiplicada pelo multiplicador 40 mover as etapas 110 a 118, de áudio a última por um para o até que pela taxa de bits desejada tenha na etapa 125 ilustrada em linhas pontilhadas.
Se, entretanto, a verificação da etapa 118 resultar em que a quantidade requerida de bits seja maior do que a indicada pela taxa de bits desejada, o controlador de taxa de bits
6 mudará o multiplicando para o multiplicador 4 0 para um fator entre 0 e 1 exclusivo. Isto é feito na etapa 12 6. Após a etapa
Figure BRPI0506623B1_D0035
6, o controlador de taxa de bits 36 faz a memória 38 novamente produzir o último bloco de compressão de valores de áudio filtrados σ' nos quais a compressão se baseou, caracterizado pelo fato de que são subsequentemente multiplicados pelo fator estabelecido na etapa 126 e novamente fornecido ao quantizador 28, quando as etapas 110 a 118 são novamente realizadas e até quando o sinal codificado temporariamente é descartado.
Deve ser ressaltado que, ao realizar as etapas
110 a 116 novamente na etapa 114, evidentemente o fator usado na etapa 126 (ou etapa 125) é também integrado ao sinal codificado.
O propósito do procedimento após a etapa 12 6 é aumentar a dimensão da etapa efetiva do quantizador 28 pelo fator.
Isto significa que o ruído de quantização resultante está uniformemente acima do limite de mascaramento, que resulta em interferências audíveis ou ruído taxa de b.i ts reduzida. Se, após
116, for novamente determinado
4« • · audível,
44 • 4
4
4
4
4 mas que ♦·· ·
3b resulta em uma passar novamente as etapas 110 a na etapa 118 que a quantidade necessária de bits é maior do que aquela indicada pela taxa de bits desejada, o fator será novamente reduzido na etapa 126, etc.
Se os dados forem finalmente produzidos na etapa
124 como um sinal codificado, o próximo bloco de compressão será feito a partir dos valores de áudio quantizados e filtrados subsequentes σ' .
Deve também ser ressaltado que outro valor pré-
inicializado diferente de 1 podería ser usado como fator de
multiplicação, a saber, por exemplo, 1. Depois, a graduação
ocorrería primeiramente em qualquer caso, , isto é, na parte
superior da Fig. 6.
A Fig. 5b novamente ilustra o sinal codificado resultante, que é geralmente indicado por 130. O sinal codificado inclui informações colaterais e dados principais no intermédio. As informações colaterais incluem, como já mencionado, as informações a partir das quais para blocos de áudio especiais, a saber, blocos de áudio onde uma alteração significativa dos coeficientes de filtro resultou em uma seqüência de blocos de áudio, o valor da amplificação e o valor dos coeficientes de filtro podem ser derivados. Se necessário, as informações colaterais incluirão outras informações relativas ao valor de amplificação usado para o controlador de bits. Devido à dependência mútua do valor de amplificação e o limite de potência de ruido q, as informações colaterais podem opcionalmente, independente do valor de amplificação a# para um nodo #, também incluir o limite de
Figure BRPI0506623B1_D0036
potência de ruído q#, ou somente o último. As informações colaterais sâo preferencialmente dispostas dentro do sinal codificado, de maneira que as informações colaterais para os coeficientes de filtro e o valor de amplificação referente ou o limite de potência de ruído referente são dispostas na frente dos dados principais para o bloco de áudio dos valores de áudio quantizados e filtrados σ' , a partir dos quais esses coeficientes de filtro com valores de amplificação referentes ou limite de potência de ruído referente se derivaram, isto é, as informações colaterais a0, x0 (i) após o bloco -1 e as informações colaterais ai, Xi(i) após o bloco 1. Colocado de forma diferente, os dados principais, isto é, os valores de áudio quantizados e filtrados σ', iniciando de, excluindo, um bloco de áudio do tipo em que uma significativa alteração na seqüência dos blocos de áudio tenha resultado nos coeficientes de filtro, até e inclusive, o próximo bloco de áudio desse tipo, na Fig. 5, por exemplo, os valores de áudio σ' (t0) - σ' (t255> / sempre estarão dispostos entre o bloco de informações colaterais 132 até o primeiro desses dois blocos de áudio (bloco -1) e o outro bloco de informações colaterais 134 até o segundo dos dois blocos de áudio (bloco 1) . Os valores de áudio σ' (t0) ~ σ' (ti27> são decodificáveis ou foram, como mencionado anteriormente com referência à Fig. 5a, obtidos somente por meio das informações colaterais 132, considerando que os valores de áudio σ' (ti2s) - σ' (t25s) foram obtidos por interpolação por meio das informações colaterais 132 como valores de suporte no nodo com o número do valor da amostra 127 e por meio das informações colaterais 134 como valores de suporte no nodo com o número de valor da amostra 255 sendo assim somente decodificáveis por meio • ·«
Figure BRPI0506623B1_D0037
de ambas as informações colaterais.
Além disso, as informações colaterais referentes ao valor de amplificação ou ao limite de potência de ruído e os coeficientes de filtro em cada bloco de informações colaterais 132 5 e 134 não estão sempre integradas independentes entre si. Ao invés disso, essas informações colaterais são transferidas em diferenças para o bloco anterior de informações colaterais. Na Fig. 5b por exemplo, o bloco de informações colaterais 132 contém o valor de amplificação a0 e coeficientes de filtro x0 com relação ao nodo no momento t_i. No bloco de informações colaterais 132, esses valores podem se derivar do próprio bloco. A partir do bloco de informações colaterais 134, entretanto, as informações colaterais referentes ao nodo no momento t255 não podem mais se derivar exclusivamente deste bloco. Ao invés disso, o bloco de informações colaterais 134 somente inclui informações sobre diferenças do valor de amplificação ai do nodo no momento t255 e o valor de * amplificação do nodo no momento t0 e as diferenças dos coeficientes de filtro Xi e os coeficientes de filtro x0
O bloco
Figure BRPI0506623B1_D0038
de informações colaterais
134 como consequência somente contém as informações sobre ai a0 e Xi(i) - xo(i)· Em momentos intermitentes, entretanto os coeficientes de filtro e o valor de amplificação ou o limite de potência de ruído devem ser totalmente transferidos e não somente como uma diferença para o nodo anterior, como, por exemplo, cada segundo permitindo que um 25 receptor ou decodificador bloqueie em um fluxo de operação de dados de codificação, como será discutido abaixo.
Esse tipo de integração das informações colaterais nos blocos das informações colaterais 132 e 134 oferece
Figure BRPI0506623B1_D0039
a vantagem da possibilidade de uma maior taxa de compressão. A razão para isso é que, apesar das informações colaterais somente serem, se possivel, somente transferidas se tiver havido uma alteração suficiente dos coeficientes de filtro para os coeficientes de filtro de um nodo anterior, a complexidade para calcular a diferença no lado do codificador ou para calcular a soma no lado do decodif icador compensa, já que as diferenças resultantes são pequenas, apesar da questão da etapa 66 para assim i permitir vantagens na codificação de entropia.
Depois que a configuração de um codificador de áudio foi anteriormente descrita, será descrita subsequentemente uma configuração de um decodificador de áudio adequado para a decodificação do sinal codificado gerado pelo codificador de áudio 10 da Fig. 1 para um sinal de áudio decodificado reproduzivel ou processável.
estabelecimento desse decodificador está mostrado na Fig. 8. 0 decodificador geralmente indicado por 210 inclui um descompressor 212, uma memória FIFO 214, um multiplicador 216 e um pós-filtro parametrizável 218. O descompressor 212, a memória FIFO 214, o multiplicador 216 e o pós-filtro parametrizável 218 estão conectados nessa ordem entre uma entrada de dados 220 e uma saida de dados 222 do decodificador 210, caracterizado pelo fato de que o sinal codificado é recebido na entrada de dados 220 e o sinal de áudio decodificado somente 25 diferindo do sinal de áudio original na entrada de dados 12 do codificador de áudio 10 pelo ruido de quantização gerado pelo quantizador 28 no codificador de áudio 10 na saida de dados 222. O descompressor 212 está conectado a uma entrada de controle do ♦
• · ·
Figure BRPI0506623B1_D0040
multiplicador 216 em outra saída de dados para passar um multiplicando para este, e para uma entrada de parametrização do pós-filtro parametrizável 218 por outra saída de dados.
Como mostrado na Fig. 9, o descompressor 212 primeiramente descomprime na etapa 224 o sinal comprimido na entrada de dados 220 para obter os dados de áudio quantizados e filtrados, a saber, os valores das amostras σ', e as informações colaterais referentes nos blocos das informações colaterais 132, 134, que, como se sabe, indicam os coeficientes de filtro e o 10 valor das amplificações ou, ao invés dos valores das amplificações, o limite de potência de ruídos nos nodos.
Como mostrado na Fig. 10, o descompressor 212 verifica o sinal descomprimido na ordem de aparecimento na etapa
226 se as informações colaterais com coeficientes de filtro estão aí contidas, de forma autocontida sem uma referência de diferença em relação a um bloco anterior de informações colaterais. Colocado de forma diferente, o descompressor 212 procura o primeiro bloco de informações colaterais 132. Logo que o descompressor 212 encontrar alguma coisa, os valores de áudio quantizados e filtrados σ' são armazenados em buffer na memória FIFO 214 na etapa 22 8. Se um bloco de áudio completo, com valores de áudio quantizados e filtrados σ' tiver sido armazenado na etapa 228 sem um bloco de informações colaterais diretamente a seguir, será primeiramente pós-filtrado na etapa 228 por meio das informações contidas nas informações colaterais recebidas na etapa 226 no valor da parametrização e da amplificação em um pós-filtro e amplificado no multiplicador 216, forma com a qual é decodificado, e assim o bloco de áudio decodificado referente é obtido.
• · ·
Figure BRPI0506623B1_D0041
Na etapa 230, o descompressor 212 monitora o sinal descomprimido quanto à ocorrência de qualquer tipo de bloco de informações colaterais, a saber, com coeficientes de filtro absolutos ou diferenças de coeficientes de filtro com relação a um 5 bloco de informações colaterais anterior. No exemplo da Fig. 5b, o descompressor 212 reconhecería, por exemplo, a ocorrência do bloco de informações colaterais 134 na etapa 230 quando do reconhecimento do bloco de informações colaterais 132 na etapa 226. Assim, o bloco de valores de áudio quantizados e filtrados σ' (to) - σ' (ti27) teria sido decodificado na etapa 228, usando as informações colaterais 132. Enquanto o bloco de informações colaterais 134 no sinal descomprimido ainda não tiver ocorrido, o efeito de buffer e, talvez, a decodificação de blocos prossiga na etapa 228 por meio das informações colaterais da etapa 226, como 15 descrito anteriormente.
Logo que o bloco de informações colaterais 132 ocorrer, o descompressor 212 calculará os valores dos parâmetros no nodo 1, isto é, ai, xi (i) , na etapa 232 somando os valores da
Figure BRPI0506623B1_D0042
diferença no bloco de informações colaterais 134 e os valores dos parâmetros no bloco de informações colaterais 132. A etapa 232 é, evidentemente, omitida se o bloco de informações colaterais corrente for um bloco de informações colaterais autocontido, sem
diferenças, que, como descrito anteriormente, pode ocorrer
exemplarmente a cada segundo. Para que o tempo de espera do
25 decodificador 210 não seja muito grande, os blocos de informações
colaterais 132, de onde os valores do parâmetro podem ser
derivados com certeza, isto é, sem relação com outro bloco de informações colaterais, são dispostos a distâncias suficientemente
Figure BRPI0506623B1_D0043
pequenas, para que o tempo para ligar ou o tempo para desligar ao acionar o codificador de áudio 210 no caso de, por exemplo, uma transmissão de rádio ou uma transmissão de difusão, não seja muito grande. De preferência, o número de blocos de informações colaterais 132 dispostos no intermédio, com os valores de diferença é disposto em um número predeterminado fixo entre os blocos de informações colaterais 132, de maneira que o decodificador saiba quando um bloco de informações colaterais do tipo 132 deve ser novamente esperado no sinal codificado.
Figure BRPI0506623B1_D0044
Alternativamente os diferentes tipos de blocos de informações colaterais estão indicados pelos flags correspondentes.
Como mostrado na Fig. 11 após ter sido alcançado um bloco de informações colaterais para um novo nodo, em particular após a etapa 226 ou 232, um índice de valor da amostra j é primeiramente inicializado em 0 na etapa 234. Esse valor corresponde à posição da amostra do primeiro valor da amostra no bloco de áudio correntemente remanescente no FIFO 214, ao qual se referem as atuais informações colaterais. A etapa 234 é realizada
Figure BRPI0506623B1_D0045
pelo pós-filtro parametrizável 218. 0 pós-filtro 218 então calcula o limite de potência de ruído no novo nodo na etapa 236, caracterizado pelo fato de que esta etapa corresponde à etapa 84 da Fig. 4 e pode ser omitida quando, por exemplo, o limite de potência de ruído nos nodos é transmitido, além dos valores de amplificação. Nas etapas subsequentes 238 e 240, o pós-filtro 218 realiza interpolações com relação aos coeficientes de filtro e o limite de potência de ruído que correspondem às interpolações 88 e da Fig. 4. O cálculo subsequente do valor de amplificação para a posição da amostra j com base no limite de potência de ruído »<*
Figure BRPI0506623B1_D0046
♦ · ·· • * « * « · · · interpolado e os coeficientes de filtro interpolados das etapas 238 e 240 na etapa 242, correspondem à etapa 92 da Fig. 4. Na etapa 244, o pós-filtro 218 aplica o valor de amplificação calculado na etapa 242 e os coeficientes de filtro interpolados ao valor da amostra na posição da amostra j . Essa etapa difere da etapa 94 da Fig. 4 pelo fato de que os coeficientes de filtro interpolados são aplicados aos valores das amostras σ' quantizados e filtrados, de maneira que a função de transferência do pósfiltro parametrizável não corresponde ao inverso do limite de audição, mas ao próprio limite de audição. Além disso, o pósfiltro não faz uma multiplicação pelo valor de amplificação, mas uma divisão pelo valor de amplificação nos valores das amostras σ' quantizados e filtrados ou o valor da amostra filtrado e quantizado, já com filtragem reversa na posição j.
Se o pós-filtro 218 ainda não tiver alcançado o nodo corrente com a posição da amostra j, que a verifica na etapa 246, incrementará o índice de posição da amostra j na etapa 248 e iniciará as etapas 238 a 246 novamente. Somente quando o nodo tiver sido alcançado, aplicará o valor de amplificação e os coeficientes de filtro do novo nodo ao valor da amostra no nodo, a saber, na etapa 250. A aplicação, por sua vez inclui, como na etapa 218, uma divisão por meio do valor de amplificação e filtragem com uma função de transferência que iguala o limite de audição e não o inverso deste último, ao invés de uma multiplicação. Após a etapa 250, o bloco de áudio corrente é decodificado por uma interpolação entre duas parametrizações de nodo.
Como já mencionado, o ruído introduzido pela quantização durante a codificação na etapa 110 tanto na forma como na filtragem e a aplicação e 224.
« *« • · « · ou ·· ·
• · • ·
112 ajustado magnitude para o limite de audição pela de um valor de amplificação nas etapas 218
Também deve ser ressaltado que, no caso em que os valores de áudio quantizados e filtrados tiverem sido submetidos a uma outra multiplicação na etapa 126 devido ao controlador de taxa de bits antes de serem codificados em sinal codificado, este fator também pode ser considerado nas etapas 218 e 224.
Figure BRPI0506623B1_D0047
Alternativamente, os valores de áudio obtidos pelo processo da
Fig. 11 podem, evidentemente, serem submetidos a uma outra multiplicação para amplificar novamente, de forma correspondente, os valores de áudio enfraquecidos por uma
Com relação às Figs.
3, menor taxa
4, 6 e 9 de bits .
11, deve-se ressaltar que mostram fluxogramas ilustrando modo de funcionamento do codificador, da Fig. 1 ou o decodificador da Fig.
e que cada uma das etapas ilustradas no fluxograma por um bloco, como descrito, é implementada pelos meios correspondentes, como descrito anteriormente. A implementação das etapas individuais pode ser feita em hardware, como parte do circuito ASIC, ou em software, como sub-rotinas. Em particular, as explanações escritas nos blocos nessas figuras indicam aproximadamente a qual processo a etapa respectiva que corresponde ao bloco considerando que as flechas entre os blocos etapas ao operar, respectivamente, o respectivo se refere, ilustram a ordem das codificador e o decodificador.
Com referência à descrição anterior, deve-se novamente ressaltar que o esquema de codificação ilustrado acima
Figure BRPI0506623B1_D0048
4¾ «<» 4o*.
·· pode variar em muitos aspectos. Como exemplo não é necessário para uma parametrização e um valor de amplificação ou um limite de potência de ruído, como indicado para um determinado bloco de áudio, ser considerado como diretamente válido para um determinado valor de áudio, como na configuração anterior o último respectivo valor de áudio de cada bloco de áudio, isto é, ο 12 82 valor neste bloco de áudio, de maneira que a interpolação desse valor de áudio possa ser omitida. Ao invés disso, é possível relacionar esses valores de parâmetros de nodo com um nodo que está temporariamente entre os tempos das amostras tn, n = 0, ..., 12 7, dos valores de áudio desse bloco de áudio, de maneira que fosse necessária uma interpolação para cada valor de áudio. Em particular, a parametrização determinada para um bloco de áudio ou o valor de amplificação determinado para este bloco de áudio também pode ser aplicado indiretamente a outro valor, como, por exemplo, o valor de áudio na metade do bloco de áudio, como, por exemplo, o 642 valor de áudio no caso da dimensão de bloco acima de 128 valores de áudio.
Além disso, deve-se ressaltar que a configuração acima se refere a um esquema de codificação de áudio projetado
para gerar um sinal codificado com taxa de bits controlada.
Entretanto, 0 controle da taxa de bits, não é necessário para
todos os casos da aplicação. Esta é a razão das etapas
correspondentes 116 a 122 e 126 ou 125 também poderem ser
omitidas.
Com referência ao esquema de compressão
mencionado, referindo-se à etapa 114, por razões de integralidade, é feita referência ao documento de Schuller et al. descrito na introdução à descrição e, em particular, à divisão IV, cujo teor, com relação à redução de redundância por meio de codificação sem perdas, está aqui incorporado como referência.
• · ·
Figure BRPI0506623B1_D0049
Também, o seguinte deve ser indicado com referência à configuração anterior. Apesar de ter sido descrito anteriormente que o valor limite sempre permanece constante na quantização ou mesmo uma função da etapa quantizadora sempre permanece constante, isto é, os problemas gerados no sinal de áudio filtrado são sempre quantizados ou cortados por uma
Figure BRPI0506623B1_D0050
quantização mais grosseira, que pode comprometer a qualidade de áudio até uma faixa audível é também possível somente usar essas medidas se a complexidade do sinal de áudio o requerer, a saber, se a taxa de bits requerida para a codificação ultrapassar uma taxa de bits desejada. Nesse caso, além das funções das etapas quantizadoras mostradas nas Figs. 7a e 7b, por exemplo, uma com dimensão da etapa quantizadora constante em toda a faixa de valores possíveis na saída do pré-filtro poderia ser usada e o quantizador respondería, por exemplo, a um sinal para usar seja a
Figure BRPI0506623B1_D0051
função da etapa quantizadora com uma sempre constante dimensão da etapa quantizadora ou uma das funções das etapas quantizadoras de acordo com as Figs. 7a ou 7b, de maneira que o quantizador poderia ser informado pelo sinal para realizar, com pequeno comprometimento de qualidade de áudio, a redução da etapa quantizadora acima do valor limite ou o corte acima do valor 25 limite. Alternativamente, o valor limite poderia ser gradualmente reduzido. Nesse caso, poderia ser feita a redução do valor limite, ao invés da redução de fator da etapa 12 6. Após um primeiro experimento de compressão sem a etapa 110, o sinal temporariamente • · · · • ·· • ·♦ •9 drj comprimido podería somente ser submetido a uma quantização de valor limite seletiva em uma etapa modificada 12 6 se a taxa de bits ainda estivesse muito' alta (118). Em outra passagem, os valores de áudio filtrados seriam então quantizados com uma função da etapa quantizadora tendo um curso mais nivelado acima do limite de áudio. Poderíam ser feitas outras reduções de taxa de bits nessa etapa modificada 126 reduzindo o valor limite e assim por outra modificação da função da etapa de quantização.
Além disso, ressalta-se que a integração dos parâmetros a e x no bloco de informações colaterais descrito anteriormente, também pode ocorrer de maneira que não sej am calculadas diferenças, mas que os parâmetros correspondentes possam sc derivar de cada bloco de informações colaterais individualmente. Também, não é necessário fazer a quantização de maneira que, como explicado com referência à etapa
110, a dimensão da etapa quantizadora seja alterada a partir de um determinado limite superior em diante para ser maior do que abaixo do limite superior. Ao invés disso, também são possíveis outras regras de quantização, além das mostradas nas Figs. 7a e 7b.
Em resumo, as configurações acima usaram o recurso de cross-fading de coeficientes com relação a um esquema de codificação de áudio com um tempo de retardo muito pequeno. Ao codificar, as informações colaterais são transmitidas em intervalos determinados. Os coeficientes foram interpolados entre os tempos de transmissão. Foi usado para a interpolação um coeficiente que indica a possível potência ou área de ruído abaixo do limite de mascaramento, ou um valor a partir do qual possa se derivar e, preferivelmente, também transmitido, porque tinha ··· · ·· ♦ • · · · · ·· ···· ·· ······ »······ • · · * características favoráveis na interpolação.
Portanto, por um lado, as informações colaterais do pré-filtro, cujos coeficientes devem ser transferidos de maneira que o pós-filtro no decodificador tenha a função de transferência inversa para que o sinal de áudio possa ser novamente ser reconstruído de maneira apropriada no decodificador pudesse ser transferido com baixa taxa de bits, por exemplo, somente transferindo as informações em determinados intervalos e, por outro lado, a qualidade de áudio pudesse ser mantida em um grau relativamente bom, já que a interpolação da
Figure BRPI0506623B1_D0052
possível potência de ruído como a área abaixo do limite de mascaramento é uma boa aproximação para os tempos entre os nodos.
Em particular, deve ser ressaltado que, de codificação de áudio esquema dependendo das circunstâncias, o
do invento pode ser também implementado em software. A
15 implementação pode ser no meio de armazenamento digital, em
particular em disco ou em CD que possua sinais de controle que
que possam interagir um com possam ser lidos eletronicamente, sistema de computador programável, de maneira que o método
Figure BRPI0506623B1_D0053
correspondente seja realizado. Em geral, a invenção também está em um produto de programa de computador, que tem um código de programa armazenado em um portador com leitura por máquina para realizar o método da invenção quando o produto de programa de computador opera em um computador. Colocado de forma diferente, a invenção também pode ser realizada como um programa de computador 25 que tem um código de programa para realizar o método quando o programa de computador opera em um computador.
Em particular, as etapas do método acima nos blocos do fluxograma podem ser implementadas individualmente ou em grupos de várias em conjunto em rotinas de sub-programas. De maneira alternativa, a implementação de um dispositivo da invenção sob a forma de circuito integrado é, evidentemente, também possível quando esses blocos forem, por exemplo, implementados como peças de circuito individual de um ASIC.
Em particular, deve ser ressaltado que,
Figure BRPI0506623B1_D0054
dependendo das circunstâncias o esquema de codificação de áudio
do invento pode ser também implementado em software. A
implementação pode ser no meio de armazenamento digital, em
particular em disco ou em CD que possua sinais de controle que
possam ser lidos eletronicamente, que possam interagir com um sistema de computador programável, de maneira que o método correspondente seja realizado. Em geral um produto de programa de computador, a invenção também está em que tem um código de programa armazenado em um portador com leitura por máquina para realizar o método da invenção quando o produto de programa de computador opera em um computador. Colocado de forma diferente, a invenção também pode ser realizada como um programa de computador
Figure BRPI0506623B1_D0055
que tem um código de programa para realizar o método quando o programa de computador opera em um computador.

Claims (15)

  1. REIVINDICAÇÕES
    1. Dispositivo para a codificação de um sinal de áudio de uma sequência (54) de valores de áudio (56) em um sinal codificado (130), caracterizado pelo fato de que compreende: meio (20) para a determinação de um primeiro limite de audição para um primeiro bloco de valores de áudio da sequência (54) de valores de áudio (56) e um segundo limite de audição para um segundo bloco de valores de áudio da sequência (54) de valores de áudio (56); meio (24) para o cálculo de uma versão de uma primeira parametrização de um filtro parametrizável (30) de maneira que sua função de transferência corresponda ao inverso da magnitude do primeiro limite de audição e uma versão de uma segunda parametrização do filtro parametrizável, de maneira que sua função de transferência corresponda ao inverso da magnitude do segundo limite de audição; meio (22) para a determinação de um primeiro limite de potência de ruído dependendo do primeiro limite de mascaramento e um segundo limite de potência de ruído dependendo do segundo limite de mascaramento; meio (30) para filtrar e graduar de forma parametrizável um predeterminado bloco de valores de áudio da sequência (54) de valores de áudio (56) para obter um bloco de valores de áudio filtrados e graduados correspondendo ao bloco predeterminado, compreendendo: meio (88) para interpolação entre a versão da primeira parametrização e a versão da
    Petição 870180127621, de 06/09/2018, pág. 7/15
  2. 2/9 segunda parametrização para obter uma versão de uma parametrização interpolada para um valor de áudio predeterminado no bloco predeterminado de valores de áudio; meio (90) para interpolação entre o primeiro limite de potência de ruido e o segundo limite de potência de ruido para obter um limite de potência de ruido interpolado para o valor de áudio predeterminado; meio (92) para determinar um valor de graduação intermediário, dependendo do limite de potência de ruido interpolado; e meio (94) para a aplicação de um filtro parametrizável com a versão da parametrização interpolada e o valor de graduação intermediário para valores de áudio predeterminados para obter um dos valores de áudio graduados e filtrados; meio (28) para a quantização dos valores de áudio graduados e filtrados de acordo com a regra de quantização, para obter um bloco de valores de áudio quantizados, graduados e filtrados; e meio (18) para a integração de informações no sinal codificado de onde possam se derivar o bloco de valores de áudio quantizados, graduados e filtrados, a versão da primeira parametrização, a versão da segunda parametrização, o primeiro limite de potência de ruido e o segundo limite de potência de ruido.
    2. Dispositivo de acordo com a reivindicação 1, caracterizado pelo fato de que o meio (84) para a determinação do primeiro e do segundo limites de potência de ruídos é formado para determinar o primeiro
    Petição 870180127621, de 06/09/2018, pág. 8/15
  3. 3/9 limite de potência de ruído como uma área abaixo do quadrado da magnitude do primeiro limite de audição e o segundo limite de potência de ruído como uma área abaixo do quadrado da magnitude do segundo limite de audição.
    3. Dispositivo de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de ser formado o meio (92) para a determinação de um valor de graduação intermediário para realizar a determinação, além de depender da potência de ruído de quantização causada por uma determinada regra de quantização.
  4. 4. Dispositivo de acordo com qualquer uma das reivindicações anteriores, compreendendo ainda o meio (84) para a determinação de um segundo valor de graduação, dependendo da potência de ruído de quantização e um segundo limite de potência de ruído, caracterizado pelo fato de que o meio para filtragem e graduação ainda inclui o meio (94) para a aplicação do filtro parametrizável com a versão da segunda parametrização e o segundo valor de graduação para um valor de áudio associado ao bloco predeterminado para obter um dos valores de áudio graduados e filtrados.
  5. 5. Dispositivo de acordo com a reivindicação 4, caracterizado pelo fato de que o meio (84) para a determinação do primeiro e do segundo valores de graduação compreende um meio para o cálculo da raiz do quociente do ruído de quantização dividido pelo primeiro limite de potência de ruído e a raiz do quociente do ruído
    Petição 870180127621, de 06/09/2018, pág. 9/15
    4/3 de quantização dividido pelo segundo limite de potência de ruido.
  6. 6. Dispositivo de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o meio (92) para a determinação do valor de graduação intermediário compreende um meio para calcular a raiz do quociente da potência de ruido de quantização dividido pelo limite de potência de ruido interpolado.
  7. 7. Dispositivo de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o meio (88) para a interpolação entre a versão da primeira parametrização e a versão da segunda parametrização é formado para realizar uma interpolação linear.
  8. 8. Dispositivo de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o meio (90) para a interpolação entre o primeiro limite de potência de ruido e o segundo limite de potência de ruido é formado para realizar uma interpolação linear.
  9. 9. Dispositivo de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o meio (28) para quantização é formado para realizar a quantização com base na função da etapa de quantização, compreendendo uma dimensão da etapa quantizadora constante até um valor limite.
  10. 10. Dispositivo de acordo com qualquer uma
    Petição 870180127621, de 06/09/2018, pág. 10/15
    5/9 das reivindicações anteriores, caracterizado pelo fato de que o meio (18) para integração inclui um codificador de entropia.
  11. 11. Dispositivo de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o meio (18) para integração é formado de maneira que as informações representam o primeiro ou segundo limite de potência de ruído ou o primeiro ou segundo valor de graduação.
  12. 12. Dispositivo de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de qur compreende ainda: meio (66) para verificar as parametrizações após a primeira parametrização pelo meio, para calcular uma após a outra como se diferissem da primeira parametrização de mais de um grau predeterminado, e para selecionar somente aquela entre as parametrizações como a segunda parametrização, quando este for o caso pela primeira vez.
  13. 13. Método para a codificação de um sinal de áudio de uma sequência (54) de valores de áudio (56) em um sinal codificado (130), caracterizado pelo fato de que compreende as etapas de: determinar um primeiro limite de audição para um primeiro bloco de valores de áudio da sequência (54) de valores de áudio (56) e um segundo limite de audição para um segundo bloco de valores de áudio da sequência (54) de valores de áudio (56); calcular uma
    Petição 870180127621, de 06/09/2018, pág. 11/15
    6/9 versão de uma primeira parametrização de um filtro parametrizável (30) de maneira que sua função de transferência corresponda ao inverso da magnitude do primeiro limite de audição e uma versão de uma segunda parametrização do filtro parametrizável de maneira que sua função de transferência corresponda ao inverso da magnitude do segundo limite de audição; determinar um primeiro limite de potência de ruído dependendo do primeiro limite de mascaramento e um segundo limite de potência de ruído dependendo do segundo limite de mascaramento; filtrar e graduar de maneira parametrizável um bloco predeterminado de valores de áudio da sequência (54) de valores de áudio (56) para obter um bloco de valores de áudio filtrados e graduados correspondendo ao bloco predeterminado, compreendendo as seguintes sub-etapas: interpolar entre a versão da primeira parametrização e a versão da segunda parametrização para obter uma versão de uma parametrização interpolada para um valor de áudio predeterminado no bloco predeterminado de valores de áudio; interpolar entre o primeiro limite de potência de ruído e o segundo limite de potência de ruído para obter um limite de potência de ruído interpolado para o valor de áudio predeterminado; determinar um valor de graduação intermediário dependendo do limite de potência de ruído interpolado; e aplicar o filtro parametrizável com a versão da parametrização interpolada e o valor de graduação intermediário ao valor
    Petição 870180127621, de 06/09/2018, pág. 12/15
    7/9 de áudio predeterminado para obter um dos valores de áudio filtrados e graduados; quantizar valores de áudio filtrados e graduados para obter um bloco de valores de áudio filtrados, graduados e quantizados; e integrar as informações no sinal codificado de onde podem se derivar o bloco de valores de áudio filtrados, graduados e quantizados, a versão da primeira parametrização, a versão da segunda parametrização, o primeiro limite de potência de ruído e o segundo limite de potência de ruído.
  14. 14. Dispositivo para a decodificação de um sinal codificado (130) em um sinal de áudio decodificado, caracterizado pelo fato de que o sinal codificado (130) contém informações a partir das quais podem se derivar um bloco predeterminado de bloco de valores de áudio filtrados, graduados e quantizados, uma versão de uma primeira parametrização, uma versão de uma segunda parametrização, um primeiro limite de potência de ruído e um segundo limite de potência de ruído, compreendendo: meio (212) para derivar o bloco de valores de áudio quantizados, graduados e filtrados predeterminados, a versão da primeira parametrização, a versão da segunda parametrização, o primeiro limite de potência de ruído e o segundo limite de potência de ruído do sinal codificado (130); meio (30) para filtrar e graduar de forma parametrizável o bloco predeterminado de valores de áudio quantizados, graduados e filtrados para obter um bloco correspondente de valores de
    Petição 870180127621, de 06/09/2018, pág. 13/15
    8/9 áudio decodificados, compreendendo: meio (88) para interpolar entre a versão da primeira parametrização e a versão da segunda parametrização para obter uma versão de uma parametrização interpolada para um valor de áudio predeterminado no bloco de valores de áudio quantizados, graduados e filtrados; meio (90) para interpolar entre o primeiro limite de potência de ruído e o segundo limite de potência de ruído para obter um limite de potência de ruído interpolado para o valor de áudio predeterminado; meio (92) para determinar um valor de graduação intermediário dependendo do limite de potência de ruído interpolado; e meio (94) para aplicar o filtro parametrizável com a versão da parametrização interpolada e o valor de graduação intermediário para o valor de áudio predeterminado de maneira a obter um dos valores de áudio decodificados.
  15. 15. Método para decodificar um sinal codificado (130) em um sinal de áudio decodificado, caracterizado pelo fato de que o sinal codificado (130) contém as informações a partir das quais podem se derivar um bloco predeterminado de valores de áudio quantizados, graduados e filtrados, uma versão de uma primeira parametrização, uma versão de uma segunda parametrização, um primeiro limite de potência de ruído e um segundo limite de potência de ruído, compreendendo as etapas de: derivar o bloco predeterminado de valores de áudio quantizados, graduados e filtrados, uma versão da primeira
    Petição 870180127621, de 06/09/2018, pág. 14/15
    9/9 parametrização, uma versão da segunda parametrização, o primeiro limite de potência de ruido e o segundo limite de potência de ruido do sinal codificado (130); filtrar e graduar de maneira parametrizável o bloco predeterminado de valores de áudio quantizados, graduados e filtrados para obter um bloco correspondente de valores de áudio decodificados, compreendendo as seguintes sub-etapas: interpolar entre a versão da primeira parametrização e a versão da segunda parametrização para obter a versão de uma parametrização interpolada para um valor de áudio predeterminado no bloco de valores de áudio quantizados, graduados e filtrados; interpolar entre o primeiro limite de potência de ruido e o segundo limite de potência de ruido para obter um limite de potência de ruido interpolado para o valor de áudio predeterminado; determinar um valor de graduação intermediário dependendo do limite de potência de ruido interpolado; e aplicar o filtro parametrizável com a versão da parametrização interpolada e o valor de graduação intermediário para o valor de áudio predeterminado para obter um dos valores de áudio decodificados.
BRPI0506623A 2004-02-13 2005-02-10 codificação de áudio BRPI0506623B1 (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102004007200A DE102004007200B3 (de) 2004-02-13 2004-02-13 Audiocodierung
PCT/EP2005/001350 WO2005078704A1 (de) 2004-02-13 2005-02-10 Audiocodierung

Publications (2)

Publication Number Publication Date
BRPI0506623A BRPI0506623A (pt) 2007-05-02
BRPI0506623B1 true BRPI0506623B1 (pt) 2018-12-18

Family

ID=34745238

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0506623A BRPI0506623B1 (pt) 2004-02-13 2005-02-10 codificação de áudio

Country Status (15)

Country Link
US (1) US7729903B2 (pt)
EP (1) EP1687808B1 (pt)
JP (1) JP4444296B2 (pt)
KR (1) KR100814673B1 (pt)
CN (1) CN1918632B (pt)
AT (1) ATE383641T1 (pt)
AU (1) AU2005213768B2 (pt)
BR (1) BRPI0506623B1 (pt)
CA (1) CA2556099C (pt)
DE (2) DE102004007200B3 (pt)
ES (1) ES2300975T3 (pt)
IL (1) IL176857A0 (pt)
NO (1) NO338918B1 (pt)
RU (1) RU2335809C2 (pt)
WO (1) WO2005078704A1 (pt)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004009955B3 (de) * 2004-03-01 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite
DE102006022346B4 (de) 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
KR101346771B1 (ko) * 2007-08-16 2013-12-31 삼성전자주식회사 심리 음향 모델에 따른 마스킹 값보다 작은 정현파 신호를효율적으로 인코딩하는 방법 및 장치, 그리고 인코딩된오디오 신호를 디코딩하는 방법 및 장치
EP4372744A1 (en) 2008-07-11 2024-05-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
DK3573056T3 (da) 2008-07-11 2022-10-03 Fraunhofer Ges Forschung Audiokoder og audioafkoder
RU2605677C2 (ru) 2009-10-20 2016-12-27 Франхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Аудио кодер, аудио декодер, способ кодирования аудио информации, способ декодирования аудио информации и компьютерная программа, использующая итеративное уменьшение размера интервала
PL2524372T3 (pl) 2010-01-12 2015-08-31 Fraunhofer Ges Forschung Koder audio. dekoder audio, sposób kodowania i dekodowania informacji audio i program komputerowy uzyskujący wartość podobszaru kontekstu w oparciu o normę uprzednio zdekodowanych wartości widmowych
ES2529025T3 (es) 2011-02-14 2015-02-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para procesar una señal de audio decodificada en un dominio espectral
JP5712288B2 (ja) * 2011-02-14 2015-05-07 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 重複変換を使用した情報信号表記
MX2013009346A (es) 2011-02-14 2013-10-01 Fraunhofer Ges Forschung Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral.
CA2827266C (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
PL2661745T3 (pl) 2011-02-14 2015-09-30 Fraunhofer Ges Forschung Urządzenie i sposób do ukrywania błędów w zunifikowanym kodowaniu mowy i audio
MX2013009345A (es) 2011-02-14 2013-10-01 Fraunhofer Ges Forschung Codificacion y decodificacion de posiciones de los pulsos de las pistas de una señal de audio.
EP2951820B1 (en) 2013-01-29 2016-12-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for selecting one of a first audio encoding algorithm and a second audio encoding algorithm
US9060223B2 (en) 2013-03-07 2015-06-16 Aphex, Llc Method and circuitry for processing audio signals
CN110265047B (zh) 2013-04-05 2021-05-18 杜比国际公司 音频信号的解码方法和解码器、介质以及编码方法
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US9277421B1 (en) * 2013-12-03 2016-03-01 Marvell International Ltd. System and method for estimating noise in a wireless signal using order statistics in the time domain
CN106409303B (zh) 2014-04-29 2019-09-20 华为技术有限公司 处理信号的方法及设备
CN114023341A (zh) 2014-07-25 2022-02-08 弗朗霍弗应用研究促进协会 音响信号编码装置和解码装置以及编码方法和解码方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3820038A1 (de) 1988-06-13 1989-12-14 Ant Nachrichtentech Verfahren zur aufbereitung und uebertragung einer bildsequenz
DE3820037A1 (de) 1988-06-13 1989-12-14 Ant Nachrichtentech Bildcodierverfahren und einrichtung
US5581653A (en) * 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
KR970005131B1 (ko) * 1994-01-18 1997-04-12 대우전자 주식회사 인간의 청각특성에 적응적인 디지탈 오디오 부호화장치
DE19549621B4 (de) * 1995-10-06 2004-07-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung zum Codieren von Audiosignalen
US5819215A (en) * 1995-10-13 1998-10-06 Dobson; Kurt Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data
GB2307833B (en) * 1995-12-01 2000-06-07 Geco As A data compression method and apparatus for seismic data
EP0950238B1 (en) 1996-07-05 2003-09-10 The Victoria University Of Manchester Speech coding and decoding system
US6370477B1 (en) * 1996-11-22 2002-04-09 Schlumberger Technology Corporation Compression method and apparatus for seismic data
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
JP4843142B2 (ja) 1999-04-16 2011-12-21 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 音声符号化のための利得−適応性量子化及び不均一符号長の使用
WO2001033718A1 (en) 1999-10-30 2001-05-10 Stmicroelectronics Asia Pacific Pte Ltd. A method of encoding frequency coefficients in an ac-3 encoder
US7110953B1 (en) * 2000-06-02 2006-09-19 Agere Systems Inc. Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
CN1266673C (zh) * 2002-03-12 2006-07-26 诺基亚有限公司 可伸缩音频编码的有效改进
DE10217297A1 (de) * 2002-04-18 2003-11-06 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
US7620545B2 (en) * 2003-07-08 2009-11-17 Industrial Technology Research Institute Scale factor based bit shifting in fine granularity scalability audio coding
KR100636145B1 (ko) * 2004-06-04 2006-10-18 삼성전자주식회사 확장된 고해상도 오디오 신호 부호화 및 복호화 장치
JP2007099007A (ja) * 2005-09-30 2007-04-19 Auto Network Gijutsu Kenkyusho:Kk ワイヤハーネスの配索構造

Also Published As

Publication number Publication date
NO338918B1 (no) 2016-10-31
BRPI0506623A (pt) 2007-05-02
DE502005002489D1 (de) 2008-02-21
JP4444296B2 (ja) 2010-03-31
IL176857A0 (en) 2006-10-31
RU2335809C2 (ru) 2008-10-10
AU2005213768B2 (en) 2009-11-19
US7729903B2 (en) 2010-06-01
DE102004007200B3 (de) 2005-08-11
US20070016403A1 (en) 2007-01-18
EP1687808A1 (de) 2006-08-09
NO20064093L (no) 2006-10-26
CN1918632A (zh) 2007-02-21
CA2556099C (en) 2010-06-01
KR100814673B1 (ko) 2008-03-18
CN1918632B (zh) 2010-05-05
RU2006132734A (ru) 2008-03-20
EP1687808B1 (de) 2008-01-09
CA2556099A1 (en) 2005-08-25
ATE383641T1 (de) 2008-01-15
WO2005078704A1 (de) 2005-08-25
JP2007522510A (ja) 2007-08-09
KR20060113998A (ko) 2006-11-03
AU2005213768A1 (en) 2005-08-25
ES2300975T3 (es) 2008-06-16

Similar Documents

Publication Publication Date Title
BRPI0506623B1 (pt) codificação de áudio
USRE49511E1 (en) Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
KR101942913B1 (ko) 메타데이터 구동된 동적 범위 제어
US7383180B2 (en) Constant bitrate media encoding techniques
BRPI0506627B1 (pt) método e dispositivo para quantizar um sinal de informações
US9306524B2 (en) Audio signal loudness determination and modification in the frequency domain
BRPI0506628B1 (pt) codificação de áudio
CA2899078C (en) Apparatus and method for generating a frequency enhanced signal using temporal smoothing of subbands
JP2021502591A (ja) エンコーダおよび/またはデコーダの帯域幅の制御

Legal Events

Date Code Title Description
B15K Others concerning applications: alteration of classification

Ipc: G10L 19/032 (2013.01), G10L 19/26 (2013.01)

B06T Formal requirements before examination [chapter 6.20 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 18/12/2018, OBSERVADAS AS CONDICOES LEGAIS.