BRPI0507229B1 - Equipamento e método para a determinação da dimensão da etapa de quantização - Google Patents

Equipamento e método para a determinação da dimensão da etapa de quantização Download PDF

Info

Publication number
BRPI0507229B1
BRPI0507229B1 BRPI0507229B1 BR PI0507229 B1 BRPI0507229 B1 BR PI0507229B1 BR PI0507229 B1 BRPI0507229 B1 BR PI0507229B1
Authority
BR
Brazil
Prior art keywords
dimension
interference
quantizer
limit
quantizing
Prior art date
Application number
Other languages
English (en)
Publication date

Links

Description

(54) Título: EQUIPAMENTO E MÉTODO PARA A DETERMINAÇÃO DA DIMENSÃO DA ETAPA DE
QUANTIZAÇÃO (51) lnt.CI.: G10L 19/02 (30) Prioridade Unionista: 01/03/2004 DE 10 2004 009 955.3 (73) Titular(es): FRAUNHOFER-GESELLSCHAFT ZUR FÕRDERUNG DER ANGEWANDTEN FORSCHUNG E.V.
(72) Inventor(es): BERNHARD GRILL; MICHAEL SCHUG; BODO TEICHMANN; NIKOLAUS RETTELBACH (85) Data do Início da Fase Nacional: 24/08/2006
Figure BRPI0507229B1_D0001
EQUIPAMENTO ·· ·
E MÉTODO ·
PARA ’ · Í UETEÉÍfflJÂVJÃÒ’ DA
DIMENSÃO DA ETAPA DE QUANTIZAÇÃO
Descrição
A presente invenção se refere a codificadores de 5 áudio, e particularmente a codificadores de áudio que são baseados em transformação, isto ê, caracterizados pelo fato de ser realizada uma conversão de uma representação temporal em uma representação espectral no início do pipeline do codificador.
É apresentado um codificador de áudio da técnica 10 anterior baseado em transformação na Fig. 3. O codificador mostrado na Fig. 3 está representado no padrão internacional ISO/IEC 14496-3: 2001 (Ε), subparte 4, página 4, sendo também conhecido na técnica como codificador AAC.
O codificador de áudio da técnica anterior será 15 apresentado abaixo. É enviado um sinal de áudio a ser codificado para uma entrada 1000 . Este sinal de áudio é inicialmente enviado a uma etapa de graduação 1002, caracterizada pelo fato de que o controle de ganho do referido AAC é feito para estabelecer o nível do sinal de áudio. As informações colaterais da graduação são
0 fornecidas a um formatador de bit stream 1004, como representado pela seta localizada entre o bloco 1002 e o bloco 1004. O sinal graduado de áudio é então enviado a um banco de filtros MDCT 1006.
Com o codificador AAC, o banco de filtros implementa uma transformação co-seno discreta modificada com janelas de sobreposição 50%, com o comprimento da janela sendo determinado por um bloco 1008.
De modo geral, o bloco 1008 existe com o objetivo de janelar sinais transientes com janelas relativamente curtas, e fl • ·· ···· ·· ···· · • ·· · ! · • ····· « · • · · · · • · · · · · ·· · · • · · · • · · ······· ·· de janelar sinais que tendem a sér éêtáciõnários com janelas relativamente grandes. Isto serve para atingir um nível mais alto de tempo de resolução (às custas de resolução de freqüência) para sinais transientes, devido âs janelas relativamente curtas, caracterizado pelo fato de que para sinais que tendem a ser estacionários, é alcançada uma resolução de maior freqüência (âs custas da resolução de tempo), devido a janelas mais longas, existindo uma tendência pela preferência de janelas mais longas, já que elas resultam em um maior ganho de codificação. Na saída do banco de filtros 1006, existem blocos de valores espectrais - os blocos sendo sucessivos no tempo - que podem ser coeficientes MDCT, coeficientes de Fourier ou sinais de sub-banda, dependendo da implementação do banco de filtros, cada sinal de sub-banda tendo uma largura limitada específica de banda pelo canal respectivo de sub-banda no banco de filtros 1006, e cada sinal de sub-banda tendo um número específico de amostras de sub-bandas.
Segue-se uma apresentação, por meio de exemplo, do caso em que o banco de filtros fornece blocos temporalmente sucessivos de coeficientes espectrais MDCT que, geralmente falando, representam espectros sucessivos de curto-prazo de sinais de áudio a serem codificados na entrada 1000. É então enviado um bloco de valores espectrais MDCT para um bloco de processamento
TNS 1010 (TNS = modulação temporal do ruído) , onde é realizada a modulação temporal do ruído. A técnica TNS é usada para conformar a forma temporal do ruído de quantização dentro de cada janela da transformação. Isto é feito aplicando um processo de filtração às peças dos dados espectrais de cada canal. A codificação é feita em uma base de j anelas. Em particular, as etapas a seguir são
Figure BRPI0507229B1_D0002
- 3 :::: ::.. : . · ·
... ·· j·j : : * * a a realizadas para aplicar a ferramenta. TNS? *á úftia**janela* *cLe dados espectrais, isto é, a um bloco de valores espectrais.
Inicialmente, é selecionada uma faixa de freqüências para a ferramenta TNS. Uma seleção adequada compreende cobrir uma faixa de frequências de 1,5 kHz com um filtro, até a maior banda possível de fator de escala. Será ressaltado que essa faixa de frequências depende da taxa de amostragem, como especificada no padrão AAC (ISO/IEC 14496-3: 2001 (E) ) .
Depois, é feito um calculo LPC (LPC= codificação preditiva linear), precisamente usando os coeficientes MDCT espectrais existentes na faixa selecionada de freqüências alvo. Para maior estabilidade, os coeficientes que correspondem a frequências abaixo de 2,5 kHz são excluídos deste processo. Podem ser usados os procedimentos LPC comuns como conhecidos no processo de fala para o cálculo LPC, por exemplo, o conhecido algoritmo Levinson-Durbin. O cálculo é feito para a máxima ordem admissível de filtro de modulação de ruído.
Como resultado do cálculo LPC, é obtido o esperado PG de ganho de predição. Além disso, são obtidos os coeficientes de reflexão, ou coeficientes Parcor.
Se o ganho de predição não ultrapassar um limite específico, a ferramenta TNS não se aplica. Nesse caso, é escrita uma peça das informações de controle no bit stream, de maneira que o decodificador sabe que não foi feito nenhum processamento TNS.
Entretanto, se o ganho de predição exceder um limite, aplica-se o processamento TNS.
Na próxima etapa, os coeficientes de reflexão são quantizados. A ordem do filtro de modulação de ruído usado é t
Figure BRPI0507229B1_D0003
: : :-.: : f / .· *·· • * · * · · · · · * ****** determinada removendo todos os ccfefiíVerttes’ cie *rêíYêxao que tiverem um valor absoluto inferior a um limite a partir da cauda do conjunto de coeficientes de reflexão. O número de coeficientes de reflexão remanescentes é da ordem de magnitude do filtro de modulação de ruídos. Um limite adequado é de 0,1.
Os coeficientes de reflexão remanescentes são tipicamente convertidos em coeficientes de predição linear, sendo essa técnica também conhecida como o procedimento de step-up.
Os coeficientes LPC calculados são então usados como coeficientes de codificação de filtro de modulação de ruídos, isto é, como coeficientes de filtro de predição. Esse filtro FIR é usado para a filtragem na faixa especificada de freqüência alvo. É usado na decodificação um filtro auto-regressivo, caracterizado pelo fato de que o referido filtro médio de movimentação é utilizado na codificação. Eventualmente, as informações colaterais para a ferramenta TNS são fornecidas ao formatador de bit stream, como representadas pela seta mostrada entre o bloco processador TNS 1010 e o formatador de bit stream 1004 na Fig.3.
Depois, são percorridas várias ferramentas opcionais que não estão mostradas na Fig. 3, como uma ferramenta de predição de longo prazo, uma ferramenta de intensidade/acoplamento, uma ferramenta de predição, uma ferramenta de substituição de ruído, até se alcançar eventualmente um codificador central/lateral 1012. O codificador central/lateral 1012 estará ativo quando o sinal de áudio a ser codificado for um sinal multi-canais, isto é, um sinal estéreo dotado de um canal esquerdo e um canal direito. Até o presente, isto é, a montante do bloco 1012 da Fig. 3, foram processados os canais estéreo esquerdo
V ·· «««· ·· ···· ·· ·· • · · · · * · : · :: : • ·*··· · · · · · · • · · · * · a· · ♦ · · ·· • *·· e direito, isto é, graduados, transfcffcmadòb *£eíõ Banco *ãe*Filtros, submetidos ou não ao processamento TNS, etc., separadamente entre
No codificador central/lateral, é feita inicialmente uma verificação sobre se uma codificação central/lateral faz sentido, isto é, se irã proporcionar um ganho de codificação. A codificação central/lateral produzirá um ganho de codificação se os canais esquerdo e direito tenderem a ser similares, já que nesse caso, o canal médio, isto é, a soma dos canais esquerdo e direito for quase igual ao canal esquerdo ou ao canal direito, independente da graduação por um fator de 1/2, caracterizado pelo fato de que o canal lateral possui somente valores muito pequenos, já que é igual à diferença entre os canais esquerdo e direito. Como conseqüência, pode-se ver que, quando os canais esquerdo e direito forem aproximadamente o mesmo, a diferença será aproximadamente zero, ou inclui somente valores muito pequenos que - e esta é a esperança - serão quantizados para zero em um quantizador subseqüente 1014, e assim poderão ser transmitidos de maneira muito eficiente, já que um codificador de entropia 1016 está conectado a jusante do quantizador 1014.
quantizador 1014 proporciona uma interferência admissível por banda de fator de escala por um modelo psicoacústico 1020. O quantizador opera de maneira iterativa, isto é, é chamando inicialmente um circuito externo de iteração, que depois chamará um circuito interno de iteração. De modo geral, iniciando a partir de valores de partida escalonados, é realizada inicialmente na entrada do quantizador 1014 uma quantização de um bloco de valores. Em particular, o circuito interno quantifica os « » « · · ·* · * * · · » « ·· · · * · * ’ _ coeficientes MDCT, sendo consumido Hô ** processo *üm°*numero específico de bits. O circuito externo calcula a distorção e a energia modificada dos coeficientes que usam o fator de escala , de maneira a chamar novamente um circuito interno. Esse processo é iterado por um determinado tempo até que seja alcançada uma cláusula condicional específica. Para cada iteração no circuito de iteração externo, o sinal é reconstruído de maneira a calcular a interferência introduzida pela quantização, e compará-la com a interferência admissível fornecida pelo modelo psico-acústico
1020. Além disso, os fatores de escala dessas bandas de freqüência, que após essa comparação ainda são considerados como interferidos, são aumentados por um ou mais estágios de iteração para iteração, para ser exato, para cada iteração do circuito de iteração externo.
Uma vez sendo alcançada uma situação em que a interferência de quantização introduzida pela quantização seja inferior à interferência admissível determinada pelo modelo psicoacústico, e se ao mesmo tempo forem obedecidos os requisitos de bits, estado em que, para ser exato, uma taxa máxima de bits não seja ultrapassada, a iteração, isto é, o método de análise por síntese seja completado, e os fatores de escala obtidos sejam codificados como ilustrado no bloco 1014, sendo fornecidos em forma codificada a um formatador de bit streatn 1004 como marcado pela seta existente entre o bloco 1014 e o bloco 1004. Os valores
5 quantizados são então enviados ao codificador de entropia 1016, que tipicamente realiza a codificação de entropia para várias bandas de fator de escala usando várias tabelas de código de
Huffman, de maneira a traduzir os valores quantizados em um
V • ·· 4 *
a » ··· »4 ···· **·** ·*'.. *, * ·« · * . ! !ϊ * . ··« · · * · * · *· · · * .
- * 4 4 · · * Φ * 4 ’ 9 »·*·*?·<
formato binário. Como é conhecido, a •codíK.dãçãõ âê entropia sob a forma de codificação Huffman envolve o retorno a tabelas de codificação que são criadas com base em estatísticas de sinal esperado, e onde os valores que ocorrem com freqüência recebem 5 palavras de código mais curtas que as dos valores que ocorrem frequentemente. São fornecidos então os valores com codificação de entropia como informações principais reais ao formatador de bit stream 1004, que então produz o sinal codificado de áudio no lado de saída, de acordo com uma sintaxe específica de bit stream.
Como já ilustrado, é usada uma dimensão de etapa quantizadora mais fina nessa quantização iterativa, na eventualidade de a interferência introduzida por uma dimensão de etapa quantizada ser maior do que a de limite, isto sendo feito na esperança de que conduza a uma redução do ruído de quantização devido ao fato da quantização realizada ser mais fina.
Esse conceito é desvantajoso devido a que, com a dimensão da etapa quantizadora mais fina, a quantidade de dados a ser transmitida aumenta naturalmente, e assim, o ganho de compressão decresce.
É objeto da presente invenção prover um conceito para determinar uma dimensão de etapa quantizadora que, por um lado introduz interferência de baixa quantização e provê, por outro lado, um alto ganho de compressão.
Este obj eto ê alcançado por meio de um equipamento para determinar uma dimensão de etapa quantizadora como na reivindicação 1 da patente, por um método de determinação de dimensão de etapa quantizadora como na reivindicação 8 da patente ou por um programa de computador como na reivindicação 9
Ο
Figure BRPI0507229B1_D0004
da patente.
A presente invenção se baseia nas descobertas de que uma redução adicional na potência de interferência, por um lado, e ao mesmo tempo um aumento, ou pelo menos a preservação do ganho de codificação podem ser alcançados quando pelo menos várias dimensões de etapas quantizadas mais grosseiras forem tentadas, mesmo quando a interferência introduzida for maior do que um limite, ao invés de realizar uma quantização mais fina, como foi feito na técnica anterior. Acontece que mesmo com dimensões de etapas quantizadoras mais grosseiras, podem ser obtidas reduções na interferência introduzidas pela quantização, para ser exato naqueles casos em que a dimensão da etapa quantizadora mais grosseira impacta o valor a ser quantizado melhor que a dimensão da etapa quantizadora mais fina. Esse efeito se baseia no fato de que o erro de quantização depende não somente da dimensão da etapa quantizadora, mas naturalmente também dos valores a serem quantizados. Se os valores a serem quantizados estiverem bem próximos às dimensões de etapa da dimensão da etapa quantizadora mais grosseira, será obtida uma redução do ruído de quantização
0 enquanto aumenta o ganho de compressão (já que a quantização foi mais grosseira).
O conceito inventivo é muito lucrativo, particularmente quando existem bem estimadas dimensões de etapas quantizadoras já para a primeira dimensão de etapa quantizadora, com base na qual é feita a comparação limite. Em uma configuração preferida da presente invenção é, portanto, preferido determinar a primeira dimensão da etapa quantizadora por meio de um cálculo direto com base na energia do ruído médio do que com base em um • · · · • · · · • · · • · · ·
............
·· ·♦·· • · · · ’ · · * * * * ϊ cenário de pior caso. Assim, os ciícuitps..dê..iteração?· *d^ cfcordo com a técnica anterior podem já ser consideravelmente reduzidos ou podem tornar-se totalmente obsoletos.
pós-processamento inventivo da dimensão da 5 etapa quantizadora será então experimentada, somente mais uma vez, uma dimensão de etapa quantizadora ainda mais grosseira na configuração, de maneira a se beneficiar do efeito descrito de melhor impacto de um valor a ser quantizado. Se acontecer, subseqüentemente, da interferência obtida pela dimensão da etapa 10 quantizadora mais grosseira ser menor que a interferência anterior ou ainda menor que o limite, podem ser realizadas mais iterações para tentar uma dimensão de etapa quantizadora ainda mais grosseira. Esse procedimento de engrossamento da dimensão da etapa quantizadora prossegue por um tempo até que a interferência introduzida cresça novamente. Depois, é atingido um critério de término, de maneira que a quantização é feita com a dimensão da etapa quantizadora armazenada que proporcionou a menor interferência introduzida, de maneira que o procedimento de codificação prossegue como necessário.
Em uma configuração alternativa da presente invenção, para estimar a dimensão da primeira etapa quantizadora, pode ser feita uma abordagem análise por síntese aproximada como na técnica anterior, que prossegue por um tempo até que seja aí atingido um critério de término. Depois, pode ser empregado o pós25 processamento inventivo para eventualmente verificar se pode ser possível atingir resultados de interferência igualmente bons, ou até melhores resultados de interferência com uma dimensão de etapa quantizadora mais grosseira. Se for determinado que uma dimensão de etapa quantizadora mais grosseira •.igualVftéhêe ••teow**oU até melhor com relação a interferência introduzida, essa dimensão de. etapa será usada para a quantificação. Se for determinado, entretanto, que uma quantização mais grosseira não produz efeitos positivos, será usado para uma eventual quantização aquela dimensão de etapa quantizadora originalmente determinada, por exemplo, por meio de um método de anãlise/síntese.
De acordo com a invenção, podem ser empregadas quaisquer dimensões de etapa quantizadora para fazer uma primeira comparação de limites. É irrelevante se essa primeira dimensão de etapa quantizadora já tenha sido determinada pelos esquemas de anãlise/síntese ou mesmo por meio de cálculos diretos das dimensões das etapas quantizadoras.
Em uma configuração alternativa da presente invenção, este conceito pode ser empregado para quantizar um sinal de áudio presente na faixa de freqüências. Entretanto, esse conceito também pode ser empregado para quantizar um sinal de domínio de tempo que compreende informações de áudio e/ou de vídeo.
Além disso, deve ser ressaltado que o limite usado para comparar é uma interferência permissível psico-acústica ou psico-ótica, ou outro limite que se deseja reduzir. Por exemplo, esse limite pode, na realidade, ser uma interferência permissível provida por um modelo psico-acústico. Entretanto, esse limite pode também ser uma interferência previamente determinada introduzida para a dimensão da etapa quantizadora original, ou qualquer outro limite.
Deve-se notar que os valores quantizados não
Μ) precisam, necessariamente, ser cod^£ic$íicJ§.· que podem ser alternativamente codificados usando outra codificação de entropia, como uma codificação aritmética. De maneira alternativa, os valores quantizados também podem ser codificados de forma binária, já que essa codificação também tem o efeito que, para transmitir menores valores ou valores iguais a zero, menos bits são necessários do que os necessários para a transmissão de maiores valores ou, em geral, valores diferentes de zero.
Para a determinação dos valores de partida, isto é, a dimensão da etapa quantizadora 1, a abordagem iterativa pode ser preferivelmente totalmente, ou pelo menos em grande parte dispensada, se a dimensão da etapa quantizadora for determinada a partir de uma estimativa direta de energia de ruído. O cálculo da dimensão da etapa quantizadora a partir de uma estimativa exata de energia de ruído é consideravelmente mais rápido do que o cálculo de um circuito análise por síntese, j ã que os valores para o cálculo estão diretamente presentes. Não é necessário primeiro fazer e comparar várias tentativas de quantização até que seja encontrada uma dimensão de etapa quantizadora que seja favorável para a codificação.
Entretanto, como a curva característica quantizadora usada é uma curva característica não linear, a curva característica não linear deve ser levada em consideração na estimativa de energia de ruído. Não é mais possível usar a simples estimativa de energia de ruído para um quantizador linear, já que não tem a precisão suficiente. De acordo com a invenção, é usado um quantizador que tem a seguinte curva característica de quantização:
• ♦· · ·· • * · • · · · ♦ • « y{ - round
Na equação acima, x£ são os valores espectrais a ser quantizados. Os valores de partida são caracterizados por yi, Yi sendo, portanto, valores espectrais quantizados. q é a dimensão da etapa quantizadora. Round é a função de arredondamento, que é preferivelmente a função nint, nint significando o inteiro mais próximo. O expoente que torna o quanti zador um quanti zador não linear é denominado a, a sendo diferente de 1. Tipicamente, o expoente a serã menor que 1, de maneira que o quantizador tem uma característica de compressão. Com camada 3, e com AAC, o expoente α é igual a 0,75. O parâmetro s é um aditivo constante que pode ter qualquer valor, mas que também pode ser zero.
De acordo com a invenção, é usada a seguinte conexão para calcular a dimensão da etapa quantizadora.
ΣΙΜ
7'
12a'
Σ-υ-’
Sendo α igual a resulta a seguinte equação:
|l/2
Nessas equações, o termo da esquerda significa a interferência THR permissível em uma banda de freqüência e que é
0 provida por um módulo psico-acústico para uma banda de fator de escala com as linhas de freqüência de i iguais a ii para i igual a i2. A equação acima permite uma estimativa quase exata de uma interferência introduzida por uma dimensão de etapa quantizadora q para um quantizador não linear que tenha a curva característica quantizadora acima com um expoente α diferente de 1, caracterizado
- 13 • ·· *· ·' ·· ·· ::
······ l·* · · · » • · : ϊ · .· »· ··:
pelo fato de que a função nínt da ec^úaçãS. ,'qnant‘izs‘d®ra,,p2*õ^?orciona a equação quantizadora real, que é arredondada até o inteiro mais próximo.
Deve ser notado que, ao invés da função nint, pode ser usada qualquer função de arredondamento desejada, por exemplo, também arredondando para o próximo inteiro par ou para o próximo inteiro ímpar, ou arredondar para o próximo inteiro de 10, etc. Geralmente falando, a função de arredondamento é responsável pelo mapeamento de um valor a partir de um conjunto de valores que têm um número específico de valores permitidos para um conjunto de valores que têm um segundo número de valores específicos menor.
Em uma configuração preferida da presente invenção, os valores espectrais quantizados foram previamente submetidos ao processamento TNS e, se estiver tratando de, por 15 exemplo, sinais estéreo, para codificação central/lateral, desde que os canais sejam tais que o codificador central/lateral tenha sido ativado.
Assim, o fator de escala para cada banda de fator de escala pode ser indicado diretamente e pode ser alimentado no respectivo codificador de áudio com a conexão entre a dimensão da etapa quantizadora e o fator de escala, que é fornecido de acordo com a seguinte equação:
g - _
O fator de escala resulta da seguinte equação.
« scf = 8.8585 -[logI0(6.75 -THR) -log10(FK4C)];
ΣΗ1'2 =™c
Em uma configuração preferida da presente £2>
,♦· ♦· ·*·;
•» · • * · • ··· invenção, pode também ser feito ·* usç5»’dê*>i*úrna* *itWI16fÇSb ** pósprocessamento baseada em um princípio de análise por síntese, de maneira a variar um pouco a dimensão da etapa quantizadora, que foi calculada diretamente sem iteração, para cada banda de fator de escala de maneira a alcançar o ideal presente.
Entretanto, comparado à técnica anterior, o cálculo já muito preciso dos valores de partida permite uma iteração muito pequena, apesar de ter acontecido que na grande maioria dos casos, a iteração a jusante pode ser totalmente dispensada.
O conceito preferido baseado no cálculo da dimensão da etapa usando a energia do ruído médio proporciona assim uma real e boa estimativa, já que diferentemente da técnica anterior, este não opera com o cenário de pior caso, mas usa um valor esperado do erro de quantização como base e assim permite, com qualidade subjetivamente equivalente, uma codificação mais eficiente dos dados com uma contagem de bits consideravelmente reduzida. Além disso, pode ser obtido um código consideravelmente mais rápido devido ao fato que a iteração pode ser totalmente 2 0 dispensada e/ou que o número de etapas de iteração pode ser claramente reduzido. Isto é notável, em particular, porque os circuitos de iteração no codificador da técnica anterior foram essenciais para o requisito de tempo geral do codificador. Assim, mesmo uma redução de uma ou menos etapas de iteração conduz a uma 25 considerável economia geral de tempo do codificador.
As configurações preferidas da presente invenção serão explicadas abaixo em detalhes, com referência às figuras de acompanhamento, caracterizadas pelo fato de que:
diagrama· *··cfe ·’ ’bloco· · ·· tfe· ·*um um sinal de áudio quantizado;
Fig. 1 é um equipamento para a determinação de
Fig. 2 é um fluxograma da representação do pós-processamento de acordo com uma configuração preferida da 5 presente invenção;
Fig. 3 mostra um diagrama de bloco de um codificador da técnica anterior de acordo com o padrão AAC;
Fig. 4 é uma representação da redução da interferência de quantização por uma dimensão de etapa quantizadora mais grosseira; e
Fig. 5 mostra um diagrama de bloco do equipamento da invenção para a determinação de uma dimensão de etapa quantizadora para a quantização de um sinal.
conceito inventivo será apresentado abaixo com referência â Fig. 5. A Fig. 5 mostra uma representação esquemática de um equipamento para a determinação da dimensão da etapa quantizadora para a quantização de um sinal que compreende informações de áudio ou vídeo e sendo provido por meio de uma entrada de sinal 500. O sinal é fornecido para um meio 502 para prover uma primeira dimensão da etapa quantizadora (QSS) e para prover um limite de interferência que também será denominado abaixo como interferência introduzível. Será notado que o limite de interferência pode ser qualquer limite. De preferência, entretanto, será uma interferência psico-acústica ou psico25 oticamente introduzível, sendo esse limite selecionado de maneira que um sinal em que a interferência tenha sido introduzida será ainda percebido como não interferido por observadores ou ouvintes humanos.
O limite (THR) , bem eornc^a'primeiTa* dlTflêfíSão”de etapa quantizadora, são fornecidos a um meio 504 para a determinação da primeira real interferência introduzida pela primeira dimensão da etapa quantizadora. A determinação da interferência realmente introduzida é feita de preferência por quantização, usando a primeira dimensão de etapa quantizadora, pela re-quantização usando a primeira dimensão de etapa quantizadora, e pelo calculo da distância entre o sinal original e o sinal re-quantizado. De preferência, quando valores espectrais estão sendo processados, os valores espectrais correspondentes do sinal original e do sinal re-quantizado são elevados ao quadrado, de maneira a então determinar a diferença dos quadrados. Podem ser empregados métodos alternativos para a determinação da distância.
O meio 504 fornece um valor para uma primeira interferência realmente introduzida pela primeira dimensão da etapa quantizadora. Essa primeira interferência é fornecida, juntamente com o limite THR, a um meio 506 para comparação. 0 meio 506 faz uma comparação entre o limite THR e a primeira interferência realmente introduzida. Se a primeira interferência
0 realmente introduzida for maior do que o limite, o meio 506 ativará o meio 50 8 para selecionar uma segunda dimensão de etapa quantizadora, o meio 508 sendo configurado para selecionar uma segunda dimensão de etapa quantizadora mais grosseira, isto é, maior do que a primeira dimensão de etapa quantizadora. A segunda dimensão de etapa quantizadora selecionada pelo meio 508 é fornecida ao meio 510 para determinar a segunda interferência realmente introduzida. Para isto, o meio 510 obtém o sinal original, assim como a segunda dimensão de etapa quantizadora e • · · · · · · « » * · • · · · * * φ· φ· ·· J novamente realiza uma quantização usando··^ ••sdgurfda · díftifâilScío^de etapa quantizadora, uma re-quantização usando a primeira dimensão de etapa quantizadora, e um cálculo de distância entre o sinal requantizado e o sinal original, de maneira a fornecer um meio 512 5 para comparar com uma medida da segunda interferência realmente introduzida. O meio 512 de comparação compara a segunda interferência realmente introduzida com a primeira interferência realmente introduzida ou com o limite THR. Se a segunda interferência realmente introduzida for menor do que a primeira interferência realmente introduzida, ou mesmo menor que o limite
THR, a segunda dimensão de etapa quantizadora será utilizada para quantizar o sinal.
Será notado que o conceito mostrado na Fig. 5 é somente esquemático. Naturalmente, não é absolutamente necessário prover meios separados de comparação para realizar as comparações nos blocos 506 e 512, mas é também possível prover um único meio de comparação controlado adequadamente. O mesmo se aplica aos meios 504 e 510 para a determinação das interferências realmente introduzidas. Essas, também, não precisam ser necessariamente configuradas como meios separados.
Além disso, será notado que o meio para quantização não precisa necessariamente ser configurado como um meio separado do meio 510. Para ser exato, os sinais que são quantizados pela segunda dimensão de etapa quantizadora são tipicamente gerados tão precocemente quanto no meio 510, quando o meio 510 faz uma quantização e re-quantização para determinar a interferência realmente introduzida. Os valores quantizados aí obtidos podem também ser armazenados e liberados como um sinal • · ”·· ·· · · ··· .······· » · · quantizado quando o meio 512 para comparado foifLetfe iim**fè*^últ’âdo positivo, de maneira que o meio 514 para quantização se funde, como tal, com o meio 510 para determinar a segunda interferência realmente introduzida.
Em uma configuração preferida da presente invenção, o limite THR é a maior interferência introduzível determinada por meio de psico-acústica, nesse caso o sinal sendo um sinal de áudio. Aqui, o limite THR é fornecido por um modelo psico-acústico que opera de maneira convencional e que provê, para cada banda de fator de escala, uma interferência de quantização máxima estimada introduzível nessa banda de fator de escala. A máxima interferência introduzível se baseia no limite de mascaramento em que é idêntica ao limite de mascaramento ou derivada do limite de mascaramento, no sentido de, por exemplo, 15 ser feita a codificação com espaçamento seguro de maneira que a interferência introduzível seja menor do que o limite de mascaramento, ou que seja feito um código mais ofensivo no sentido de ser obtida uma redução da taxa de bits, especificamente no sentido de que a interferência permissível exceda o limite de
0 mascaramento.
Será apresentada abaixo uma maneira preferida de implementar o meio 502 para prover uma primeira dimensão de etapa quantizadora, com referência à Fig. 1. Nesse aspecto, as funcionalidades do meio 50 da Fig. 2 e do meio 502 da Fig. 5 são 25 as mesmas. Preferivelmente, o meio 502 é configurado para ter as funcionalidades do meio 10 e do meio 12 da Fig. 1. Além disso, nesse exemplo, o quantizador 514 da Fig.
idêntico ao quantizador 14 da Fig. 1.
é configurado para ser ··· ·*· ·· ··· ·· ···· ·* ·· ·· • · ·· ·· · * ·· ·· ·· · • * ·· ····· · · · · · «a· · · · ·· « · ···
Também será apresentado e&ãwxõ· · com* referência· à Fig. 2, um procedimento completo que, se a interferência introduzida ultrapassar o limite, tentará também obter dimensões de etapas quantizadoras mais grosseiras.
Além disso, o ramal esquerdo da Fig. 2, que mostra o conceito inventivo, ê ampliado no sentido que na eventualidade que a interferência introduzida ultrapassar o limite e que o engrossamento da dimensão da etapa quantizadora não produza nenhum efeito, e se as necessidades da taxa de bits não forem particularmente estritas e/ou se ainda houver algum espaço no banco de economia de bits, é feita uma iteração usando uma menor, isto é, mais fina dimensão de etapa quantizadora.
Eventualmente, o efeito em que se baseia a presente invenção será apresentado abaixo, com referência à Fig. 15 4, especificamente o efeito de que, apesar do engrossamento da dimensão da etapa quantizadora, pode ser obtido um reduzido ruído
de quantização e, associado a este, um aumento no ganho de
compressão.
A Fig. 1 mostra um equipamento para a
20 determinação de um sinal de áudio quantizado que é dado como uma
representação espectral sob a forma de valores espectrais. Será notado, particularmente, que na eventualidade de - com referência à Fig. 3 - não ter sido feito nenhum processamento TNS e nenhuma codificação central/lateral, os valores espectrais são diretamente os valores de partida do banco de filtro. Entretanto, se for feito somente o processamento TNS sem codificação central/lateral, os valores espectrais fornecidos para o quantizador 1015 são valores espectrais residuais, já que são formados a partir da filtração de predição TNS.
Figure BRPI0507229B1_D0005
Se for empregado o processamento TNS incluindo uma codificação central/lateral, os valores espectrais enviados para o equipamento inventivo são valores espectrais de um canal médio, ou valores espectrais de um canal lateral.
Para início, a presente invenção inclui um meio para prover uma interferência permissível, indicada por 10 na Fig.
1. 0 modelo psico-acústico 1020 mostrado na Fig. 3, que tipicamente é configurado para prover uma interferência ou um
1imit e permi s s ível, também denominado THR, para cada banda de fator de escala, isto é, para um grupo de vários valores espectrais que são espectralmente adjacentes entre si, pode servir como meio para o provimento de uma interferência permissível. A interferência permissível se baseia no limite de mascaramento 15 psico-acústico e indica a quantidade de energia que pode ser introduzida em um sinal de áudio original sem que a energia de interferência seja percebida pelo ouvido humano. Em outras palavras, a interferência permissível ê a porção do sinal artificialmente introduzida (pela quantização) que é mascarada pelo sinal real de áudio.
meio 10 é mostrado para calcular a interferência THR permissível para uma banda de freqüência, preferivelmente uma banda de fator de escala, e para fornecer essa banda a um meio a jusante 12. 0 meio 12 serve para calcular uma 25 peça das informações da dimensão da etapa quantizadora para a banda de freqüência para a qual a interferência THR permissível foi indicada. O meio 12 é configurado para fornecer a peça das informações da dimensão da etapa quantizadora q para um meio a « t · · • * · « · · 4 φ * * · · • · « « * · jusante 14 para a quantização. 0 meio T4 pât*a*?2uâhti^;a$ãó*‘dpéra’*de acordo com a especificação de quantização constante do bloco 14, sendo usadas as informações da dimensão da etapa quantizadora no caso mostrado na Fig. 1, para inicialmente dividir um valor 5 espectral Xi pelo valor de q, e para então exponenciar o resultado com o expoente cx diferente de 1, e para então somar um fator aditivo s, como possa ser o caso.
Depois, este resultado é enviado para uma função de arredondamento que, na configuração mostrada na Fig. 1, seleciona o inteiro mais próximo. De acordo com a definição, o inteiro pode ser gerado novamente cortando-se os dígitos atrás do ponto decimal, isto é, sempre arredondando para baixo. De maneira alternativa, o inteiro mais próximo também pode ser gerado arredondando para baixo até 0,499 e arredondando para cima até
0,5. Como outra alternativa, o inteiro mais próximo pode ser determinado por sempre arredondar para cima, dependendo da implementação individual. Entretanto, ao invés da função nínt, qualquer outra função de arredondamento pode ser implementada que, de modo geral, mapeia um valor que deve ser arredondado, a partir
0 de um primeiro e maior conjunto de valores para um segundo conjunto menor de valores.
O valor espectral quantizado estará então presente na banda de freqüência na saída do meio 14. Como pode ser visto na equação mostrada no bloco 14, o meio 14 também será naturalmente fornecido, além da dimensão da etapa quantizadora q, com o valor espectral a ser quantizado na banda de freqüência contemplada.
Será notado que o meio 12 não precisa ,· ··· ·* ,·»· ·· «a·· ·· «· ·· « · · · · · · a· ·· · i · * ·«·«· · · * ·* * i« * « a ♦ · · · · · · · · • · necessariamente calcular diretamentê â” *dirflênáâo * cfã’‘*‘êtà’pa quantizadora q, mas esta como informação da dimensão da etapa quantizadora alternativa, pode ser também calculado o fator de escala como usado nos codificadores de áudio baseados em transformação da técnica anterior. O fator de escala está ligado â dimensão da etapa quantizadora real por meio de uma relação mostrada à direita do bloco 12 na Fig. 1. Se os meios para o cálculo forem ainda configurados para calcular, como informações da dimensão de etapa quantizadora, o fator de escala scf, esse fator de escala será fornecido ao meio 14 para quantização, meio que então usará, no bloco 14, o valor de 21/4 sce para o cálculo de quantização ao invés do valor q.
Uma derivação da forma dada no bloco 12 será mostrada abaixo.
Como já mostrado, o quantizador de forma exponencial como mostrado no bloco 14 obedece à seguinte relação:
y- ~ round — +5
A operação inversa será apresentada como segue
Esta equação representa assim a operação necessária para a re-quantização, caracterizada pelo fato de que Yi é um valor espectral quantizado e onde x/ é um valor espectral re-quantizado. Novamente, q é a dimensão da etapa quantizadora que está associada ao fator de escala por meio da relação mostrada na
Fig. 1 â direita do bloco 12.
Como esperado, na eventualidade que α seja igual a 1, o resultado será consistente com esta equação.
I» · · · ·* · · ♦ # * » · -t · * • · · · »· * · ·· · »··» · · · · ·· * a »··« · · ·· ·
Se a equação acima for *&*orfiàdâ· a** ufh VêVóF cfos valores espectrais, a potência de ruído total em uma banda indicada pelo índice i será dada como segue:
ΣΜ
12α·
Em resumo, o valor esperado do ruído de quantização de um vetor é determinado pela dimensão da etapa quantizadora q e do referido fator de forma que descreve a distribuição das quantidades dos componentes do vetor.
O fator de forma, que é o termo mais à direita na 10 equação acima, depende dos valores reais de entrada e somente precisa ser calculado uma vez, mesmo se a equação acima for calculada para níveis de interferência THR desejados em diferentes graus.
Como jã visto anteriormente, essa equação com α igual a % é simplificada como a seguir:
O lado esquerdo desta equação ê assim uma estimativa da energia do ruído de quantização que, em um caso limite, estã conforme a energia permissível de ruído (limite).
Portanto, será feita a seguinte abordagem:
Χ|Δχ,.|2=7ϊΰ?
i
A soma das raízes das linhas de freqüência na parte direita da equação corresponde a uma medida da uniformidade das linhas de freqüência e é conhecida como o fator de forma preferivelmente tão logo possível no codificador:
Assim, resulta o seguinte:
Σ|χ,Γ = FFAC , ·· ···· · : : · ,· • ·· ··
.......
3/2
THR*°--FFAC
6.75 q aqui corresponde à dimensão da etapa quantizadora. Com AAC, é especificado como:
scf é o fator de escala. Se o fator de escala for determinado, a equação pode ser calculada como a seguir, com base na relação entre a dimensão da etapa e o fator de escala:
2(3/8)SC/
THR*~--FFAC
6.75
2(3/8)«/ _
6.75-77¾
FFAC , 8 .6.75-77¾.
^scf=ilos2(-^^) « scf = —1— [log10 (6.75 · THR) - log10 (FFAC)] scf = 8.8585 · [log10 (6.75 THR) - log10 (FK4C)]
A presente invenção assim prove uma conexão mais próxima entre os fatores de escala scf para uma banda de fator de escala que tem um fator de forma específico e para o qual é dado um limite específico de interferência THR, que tipicamente se origina de um modelo psico-acústico.
Como j ã demonstrado, o calculo da dimensão de etapa usando uma energia de ruído médio fornece uma melhor estimativa, jã que a base usada é o valor esperado do erro de quantização, ao invés de um cenário de pior caso.
V
M ·· ···· • · · • · · · · i nvêíífe ivo · * *é· âdé £[tíá ão ‘para
Assim, o conceito determinar a dimensão da etapa quantizadora e/ou, em equivalência a esta, do fator de escala de uma banda de fator de escala sem iterações.
Não obstante, o pós-processamento como será representado abaixo por intermédio da Fig. 2 também pode ser feito caso os requisitos de tempo de calculo não forem muito estritos. Em uma primeira etapa na Fig. 2, é estimada a primeira dimensão da etapa quantizadora (etapa 50) . A estimativa da primeira dimensão da etapa quantizadora (QSS) é feita usando o procedimento mostrado por meio da Fig. 1. Depois, é feita uma quantização usando a primeira dimensão da etapa quantizadora em uma etapa 52, de preferência de acordo com o quantizador como mostrado usando o bloco 14 da Fig. 1. Em sequência, os valores obtidos com a primeira dimensão da etapa quantizadora são re-quant i zados, de maneira a então calcular a interferência introduzida. Depois, em uma etapa 54, verifica-se se a interferência introduzida ultrapassa um limite predefinido.
Será indicado que dimensão da etapa
20 quantizadora q (ou scf) que foi calculada pela conexão
representada no bloco 12 é uma aproximação. Se a conexão
apresentada no bloco 12 : da Fig. 1 foi realmente exata, deve ser
estabelecido, no bloco 54, que a interferência introduzida corresponde exatamente ao limite. Entretanto, devido à natureza da
5 aproximação da conexão no bloco 12 da Fig. 1, a interferência introduzida pode ultrapassar ou cair abaixo do limite THR.
Além disso, será notado que o desvio do limite não será particularmente grande, mesmo porque, não obstante, «
i
4S
,.........
·· · .
• · · · · · . · ·· · · · · · · •ê tapa· * £>4 * · qü ê* * tíâ ãnclo a estará presente. Se for determinado, primeira dimensão da etapa quantizadora a interferência introduzida cai abaixo do limite, isto é, se a pergunta na etapa for respondida no negativo, o ramal direito da Fig. 3 será escolhido. Se a interferência introduzida cair abaixo do limite, isto significa que a estimativa no bloco 12 da Fig. 1 foi muito pessimista, de maneira que na etapa 56 é estabelecida uma dimensão da etapa quantizadora mais grosseira que a segunda etapa quantizadora.
Pode ser selecionado o grau em que a segunda dimensão da etapa quantizadora é mais grosseira, em comparação, do que a primeira dimensão da etapa quantizadora. Entretanto, é preferível adotar incrementos relativamente pequenos, já que a estimativa no bloco 50 já será relativamente exata.
Usando a segunda dimensão da etapa quant i zadora (maior) mais grosseira, são feitos uma quantização dos valores espectrais, uma subseqüente re-quantização e um cálculo da segunda interferência que corresponde à segunda dimensão da etapa quantizadora em uma etapa 58.
Em uma etapa (60), verifica-se então se a segunda interferência, que corresponde à segunda dimensão da etapa quantizadora, ainda cai abaixo do limite original. Se isso acontecer, a segunda dimensão da etapa quantizadora é armazenada (62) , e uma nova iteração é iniciada de maneira a estabelecer uma dimensão da etapa quantizadora ainda mais grosseira em uma etapa (56). Depois, a etapa 60 e, conforme o caso, a etapa 62, são então novamente realizadas usando uma dimensão da etapa quantizadora ainda mais grosseira, de maneira a novamente iniciar uma nova
- 27 • · * · · · · • · • · · • · · · · ?
iteração. Caso se constatar, durante Jíma .Lt‘era?ão'tia·eíâVá”60*,' que a segunda interferência não cai abaixo do limite, isto é, ultrapassa o limite, terã sido atingido um critério de término, e após atingir o critério de término, é feita a quantização (64) usando uma dimensão da etapa quantizadora que foi armazenada por último.
Como a primeira dimensão da etapa quantizadora jã foi um valor relativamente bom, o número de iterações quando comparadas com valores de partida mal estimados será reduzido, o que conduzirá a economias significativas em tempo de cálculo ao codificar, já que as iterações para o cálculo da dimensão da etapa quantizadora consomem a maior parte do tempo de cálculo do codificador.
Será representado abaixo um procedimento inventivo usado quando a interferência introduzida realmente ultrapassa o limite, com referência ao ramal esquerdo na Fig. 2.
Apesar do fato que a interferência introduzida já ultrapassa o limite, é estabelecida uma dimensão da etapa quantizadora ainda mais grosseira de acordo com a invenção (70), uma quantização, uma re-quantização e o cálculo da segunda interferência de ruído, que corresponde à segunda dimensão da etapa quantizadora sendo então realizada na etapa 72. Depois, é feita uma verificação na etapa 74 de se a segunda interferência de ruído agora cai abaixo do limite. Se for o caso, a pergunta na etapa 74 será respondida sim e a segunda dimensão da etapa quantizadora será armazenada (76) . Entretanto, se for constatado que a segunda interferência de ruído ultrapassa o limite, a quantização será realizada usando a dimensão da etapa quantizadora : : : : ♦’ <.
armazenada, ou, se não tiver sido ^rmazfeííacTà^urrtet rtielHW‘segunda dimensão da etapa quantizadora, será feita uma iteração, caracterizada pelo fato de que, como na técnica anterior, é selecionada uma dimensão da etapa quantizadora mais fina para empurrar a interferência introduzida abaixo do limite.
Segue-se uma discussão sobre porque um aperfeiçoamento pode ainda ser obtido quando é usada uma dimensão da etapa quantizadora ainda mais grosseira, particularmente quando a interferência introduzida ultrapassa o limite. Até agora, sempre foi operado na suposição de que uma dimensão da etapa quantizadora mais fina conduz a uma menor energia de quantização introduzida, e que uma maior dimensão da etapa quantizadora conduz a uma maior interferência de quantização introduzida. Na media, isto pode ser verdade, mas nem sempre é verdade, e o oposto será verdade, em particular, para bandas de fator de escala ainda mais finamente povoadas e, em particular, quando o quantizador tem uma curva característica não linear. Determinou-se, de acordo com a invenção, que em alguns casos que não devem ser subestimados, uma dimensão da etapa quantizadora mais grosseira conduz a uma menor interferência introduzida. Isto pode conduzir de volta ao fato que pode também haver o caso quando uma dimensão da etapa quantizadora mais grosseira atinge um valor espectral a ser quantizado melhor do que uma dimensão da etapa quantizadora mais fina, como será apresentado usando o exemplo abaixo com referência â Fig. 4.
Como exemplo, a Fig. 4 mostra uma curva característica de quantização (60), que provê quatro estágios de quantização 0, 1, 2, 3, quando os sinais de entrada entre 0 e 1 são quantizados. Os valores quantizados correspondem a 0,0; 0,25;
SP
0,5 e 0,75. Em comparação, uma curva :carafc>t*eríffit*re& de •CfllâfiEização diferente e mais grosseira é desenhada em linhas pontilhadas na
Fig. 4 (62), que somente tem três estágios de quantização que correspondem aos valores absolutos 0,0; 0,33; 0,66. Assim, no primeiro caso, isto é, com a curva característica quantizadora 60, a dimensão da etapa quantizadora é igual a 0,25, caracterizada pelo fato de que no segundo caso, isto é, com a curva característica quantizadora 62, a dimensão da etapa quantizadora é igual a 0,33. A segunda curva característica quantizadora (62), portanto, tem uma dimensão da etapa quantizadora mais grosseira do que a primeira curva característica quantizadora (60), que representa uma curva característica de quantização fina. Se for contemplado o valor Xi=0,33 a ser quantizado, pode-se ver a partir na Fig. 4 que o erro na quantização usando o quantizador fino com quatro estágios é igual à diferença entre 0,33 e 0,25, sendo, portanto, 0,08. Em contraste, o erro na quantização usando três estágios ê igual a zero, devido ao fato que o estágio quantizador atinge exatamente, o valor a ser quantizado.
Portanto, pode ser visto a partir da Fig. 4, que 20 uma quantização mais grosseira pode conduzir a um menor erro de quantização que uma quantização fina.
Além disso, uma quantização mais grosseira é o fator decisivo para a necessidade de uma menor taxa de bits de partida, já que os estados possíveis são somente três, isto é, 0,
1, 2, diferentemente do caso do quantizador mais fino, onde quatro estágios 0, 1, 2, 3 devem ser assinalados. Além disso, a dimensão da etapa quantizadora mais grosseira tem a vantagem de que mais valores tendem a ser quantizados para mais longe do 0 do que com • · í : :··*.: · ·. .· .* ·♦:
uma dimensão da etapa quantizadora ntais »í5isiâ***c>rfde ’me*hò*s*'valores são quantizados para mais longe do 0 . Mesmo assim, quando são contemplados vários valores espectrais em uma banda de fator de escala, a quantização para 0 conduz a um aumento no erro de quantização, mas isto não deve necessariamente tornar-se problemático, já que uma dimensão da etapa quantizadora mais grosseira pode atingir outros valores espectrais mais importantes de uma maneira mais exata, de maneira que o erro de quantização é cancelado e mesmo supercompensado pela quantização mais grosseira dos outros valores espectrais, ocorrendo ao mesmo tempo uma menor taxa de bits.
Em outras palavras, o resultado do codificador alcançado é melhor, isto é, como o conceito inventivo alcança um menor número de estados a serem sinalizados e, ao mesmo tempo, proporciona um melhor impacto dos estágios de quantização.
De acordo com a invenção, como foi representada no ramal esquerdo da Fig. 2, é tentada uma dimensão da etapa quantizadora ainda mais grosseira, iniciando a partir de valores estimados (etapa 50 da Fig. 2), quando a interferência introduzida ultrapassa o limite, de maneira a beneficiar-se a partir do efeito representado usando a Fig. 4. Além disso, determinou-se que esse efeito é ainda mais significativo com quantizadores não lineares do que no caso, mencionado na Fig. 4, de duas curvas características quantizadoras lineares.
0 conceito apresentado de dimensão da etapa quantizadora pós-processamento e/ou de fator de escala pósprocessamento serve assim para aperfeiçoar o resultado do estimador de fator de escala.
.............. .......
·· ··· * . * ·· · • · · · ····. · · ··· ··· ••t.ií·· · · das dim$nsõe53’..aa·· efcapa ”qtiSMti*áadora de fator de escala (50 na Fig. 2), são análise por síntese, novas dimensões de
Partindo determinadas no estimador determinadas, na etapa de etapa quantizadoras que são as maiores possíveis e para as quais a energia de erro cai abaixo do valor limite predefinido.
Portanto, o espectro é quantizado com as dimensões da etapa quantizadora calculadas, e a energia do sinal de erro, isto é, é determinada preferivelmente a soma dos quadrados das diferenças dos valores espectrais original e quantizado. De maneira alternativa, para a determinação de erro, pode também ser usado um sinal de tempo correspondente, ainda que sejam preferidos os valores espectrais.
A dimensão da etapa quantizadora e o sinal de erro são armazenados com o melhor resultado obtido até então. Se a interferência calculada ultrapassar um valor limite, a seguinte abordagem é adotada:
fator de escala dentro de uma faixa predefinida é variado à volta do valor originalmente calculado, sendo também feito o uso, em particular, de dimensões de etapas quantizadoras mais grosseiras (70).
Para cada novo fator de escala, o espectro é novamente quantizado, sendo calculada a energia do sinal de erro. Se o sinal de erro for menor do que o menor que jã tiver sido calculado, a atual dimensão da etapa quantizadora ê considerada, juntamente com a energia do sinal de erro associado, como o melhor resultado obtido até o momento.
De acordo com a invenção, não somente os fatores de graduação relativamente pequenos, mas também os fatores de graduação relativamente grandes s^ò* Levado & βπτ· 'ôtfntci, de maneira a beneficiar-se do conceito descrito com referência à Fig.
4, particularmente quando o quantizador se trata de um quantizador não linear.
Entretanto, se a interferência calculada cair abaixo do valor limite, isto é, se a estimativa na etapa 50 foi muito pessimista, o fator de escala variará dentro de uma faixa predefinida, à volta do valor originalmente calculado.
Para cada novo fator de escala, o espectro é re10 quantizado, e calculada a energia do sinal de erro.
Se o sinal de erro for menor do que o menor que tiver sido calculado até então, a atual dimensão da etapa quantizadora é considerada, juntamente com a energia do sinal de erro associado, como o melhor resultado obtido até o momento.
Entretanto, aqui somente são levados em conta
fatores de graduação relativamente grosseiros, de maneira a
reduzir o número de bits necessários para a codificação do
espectro de áudio.
Dependendo das circunstâncias, o método inventivo
0 pode ser implementado no hardware ou no software. A implementação pode ser feita em um meio de armazenagem digital, em particular um disco ou CD com sinais de controle com leitura eletrônica, que possam cooperar com um sistema de computador programável, de maneira que o método seja realizado.
Em geral, a invenção consiste assim em um produto de programa de computador dotado de um código de programas, armazenado em um portador com leitura por máquina, para a realização do método inventivo, quando o produto de programa de
Λζ computador opera em um computador. JEm ©Utra’s-^ãi*ãvras·,··SVlrffrenção pode assim ser realizada como um programa de computador dotado de um código de programa para a realização do método, quando o programa de computador é operado em um computador.
1/4

Claims (5)

REIVINDICAÇÕES
1/5 ·· · • · · · · ···· • · · · » , « ··· • · · * « ········ ··
VALORES ESPECTRAIS QUANT1ZADOS NA BANDA DE FREQÜÊNCIA
Figl
1. Equipamento para a determinação da dimensão da etapa quantizadora de quantização de um sinal que compreende informações de áudio ou vídeo, o equipamento caracterizado pelo fato de que compreende: meio (502) para prover uma primeira dimensão de etapa quantizadora e um limite de interferência; meio (504) para determinar uma primeira interferência introduzida pela primeira dimensão de etapa quantizadora; meio (506) para comparar a interferência introduzida pela primeira dimensão de etapa quantizadora com o limite de interferência; meio (508) para selecionar uma segunda dimensão de etapa quantizadora, que é maior do que a primeira dimensão de etapa quantizadora, se a primeira interferência introduzida ultrapassar o limite de interferência;
meio (510) para determinar uma segunda interferência introduzida pela segunda dimensão de etapa quantizadora; meio (512) para comparar a segunda interferência introduzida com o limite de interferência ou a primeira interferência introduzida; e meio (514) para quantizar o sinal com a segunda dimensão de etapa quantizadora, se a segunda interferência introduzida for menor que a primeira interferência introduzida ou for menor que o limite de interferência.
2/5
Fig 2
2(l-a) onde o meio (514) para quantização está configurado para quantizar de acordo com a seguinte equação:
y. = round onde Xi é um valor espectral a ser quantizado, onde q representa as informações da dimensão de etapa quantizadora, onde s é um dado que difere ou é igual a zero, onde α é um expoente diferente de 1, onde round é uma função de arredondamento que mapeia um valor a partir de uma primeira maior faixa de valores para um valor dentro de uma segunda e menor faixa de valores, onde Y|Ax,| i (THR) é a interferência permissível e onde i é um índice de operação para os valores espectrais na banda de freqüência.
Petição 870180051055, de 14/06/2018, pág. 8/10
2/4
2. Equipamento de acordo com a reivindicação 1, caracterizado pelo fato de que o sinal é um sinal de áudio e compreende valores espectrais de uma representação espectral do sinal de áudio, e onde o meio (502) para o provimento é configurado como um modelo psico-acústico que calcula uma interferência permissível para a banda de freqüências, com base em um limite de mascaramento psico-acústico.
Petição 870180051055, de 14/06/2018, pág. 7/10
3/5
Fig 3 (TÉCNICA ANTERIOR)
3/4
5. Equipamento de acordo com qualquer das reivindicações anteriores, caracterizado pelo fato de que o meio (508) para a seleção está ainda configurado para selecionar uma maior dimensão de etapa quantizadora quando a interferência introduzida é menor que a interferência permissível.
6. Equipamento de acordo com qualquer das reivindicações anteriores, caracterizado pelo fato de que o meio (502) para provimento está configurado para prover a primeira dimensão de etapa quantizadora como resultado de uma determinação análise/síntese.
7. Equipamento de acordo com qualquer das reivindicações anteriores, caracterizado pelo fato de que o meio (508) para seleção está configurado para alterar uma dimensão de etapa quantizadora para uma banda de freqüências independentemente de uma dimensão de etapa quantizadora para outra banda de freqüências.
8. Equipamento de acordo com qualquer das reivindicações anteriores, caracterizado pelo fato de que o meio (502) para provimento está configurado para determinar uma primeira dimensão de etapa quantizadora como resultado de uma etapa de iteração precedente com o engrossamento da dimensão de etapa quantizadora, e onde o limite de interferência é uma interferência introduzida na etapa de iteração precedente para a determinação da primeira dimensão de etapa quantizadora.
9. Método para a determinação da dimensão da etapa quantizadora de quantização de um sinal compreendendo informações de áudio ou vídeo, o método caracterizado pelo fato de que compreende as etapas de: prover (502) de uma primeira dimensão de etapa
Petição 870180051055, de 14/06/2018, pág. 9/10
3. Equipamento de acordo com as reivindicações 1 ou 2, caracterizado pelo fato de que o meio (504) para a determinação da primeira interferência introduzida, ou o meio (510) para o cálculo da segunda interferência introduzida está configurado para quantizar usando uma dimensão de etapa quantizadora, para re-quantizar usando a dimensão de etapa quantizadora, e para calcular uma distância entre o sinal re-quantizado e o sinal, de maneira a obter a interferência introduzida.
4/5
- ERRO COM QUANTIZAÇÃO DE 4 ESTÁGIOS (QU. FINA)
0,33 - 0,25 = 0,08
- ERRO COM QUANTIZAÇÃO DE 3 ESTÁGIOS (QU. GROSSA)
0,33-0,33 = 0,00
Fig 4 • · •··· ·· ·· • * · · · · • · · · • · · » · · • ·«······
S1 *·· ·· ···» ·♦ • · · · ♦ · • · ····· · * « · · · · • · ♦ · ··.· *·* ·· »· ··
4?
• · · · · * · • · · · • · · · · · • · · ·
4/4 quantizadora e um limite de interferência; determinar em (504) uma primeira interferência introduzida pela primeira dimensão de etapa quantizadora; comparar em (506) a interferência introduzida pela primeira dimensão de etapa quantizadora com o limite de interferência; selecionar em (508) uma segunda dimensão de etapa quantizadora que seja maior do que a primeira dimensão de etapa quantizadora, se a primeira interferência introduzida ultrapassar o limite de interferência; determinar em (510) uma segunda interferência introduzida pela segunda dimensão de etapa quantizadora; comparar em (512) a segunda interferência introduzida com o limite de interferência ou com a primeira interferência introduzida; quantizar em (514) o sinal com a segunda dimensão de etapa quantizadora, se a segunda interferência introduzida for menor que a primeira interferência introduzida ou for menor que o limite de interferência.
Petição 870180051055, de 14/06/2018, pág. 10/10
4. Equipamento de acordo com qualquer das reivindicações anteriores, caracterizado pelo fato de que o meio (502) para o provimento da primeira dimensão de etapa quantizadora está configurado para calcular a dimensão de etapa quantizadora de acordo com a seguinte equação:
,2a
Υ|Δχ |2«-í__Vx: ν' 12a2
5/5
QUANTIZADO
Fig 5

Family

ID=

Similar Documents

Publication Publication Date Title
KR100852481B1 (ko) 양자화 스텝 사이즈 결정 장치 및 방법
KR100852482B1 (ko) 추정을 결정하는 방법 및 장치
CA2877161C (en) Linear prediction based audio coding using improved probability distribution estimation
BR112015017293B1 (pt) Decodificador e codificador do sinal de áudio, método para decodificar uma representação do sinal de áudio codificado e para prover uma representação correspondente do sinal áudio decodificado e método de codificação de sinal de áudio para prover uma representação de sinal de áudio codificado com base na representação do domínio-tempo de um sinal de entrada de áudio
CA2899072C (en) Apparatus and method for generating a frequency enhanced signal using shaping of the enhancement signal
WO2016016122A1 (en) Encoder, decoder, system and methods for encoding and decoding
WO2014118171A1 (en) Low-complexity tonality-adaptive audio signal quantization
BRPI0507229B1 (pt) Equipamento e método para a determinação da dimensão da etapa de quantização
WO2014198726A1 (en) Apparatus and method for audio signal envelope encoding, processing and decoding by modelling a cumulative sum representation employing distribution quantization and coding
WO2023285630A1 (en) Integral band-wise parametric audio coding
MXPA06009932A (en) Device and method for determining a quantiser step size
MXPA06009934A (es) Metodo y aparato para determinar un estimado