BR9806404B1

BR9806404B1 - Processo e aparelho de codificação/decodificação de áudio estéreo com escala.

Info

Publication number: BR9806404B1
Application number: BRPI9806404-5A
Authority: BR
Inventors: Sung-Hee Park; Yeon-Bae Kim
Original assignee: Samsung Electronics Co Ltd
Priority date: 1997-11-20
Filing date: 1998-07-06
Publication date: 2014-09-16
Also published as: IL125268A; JPH11317672A; DE69834010T2; ID21304A; RU2197776C2; IL125268A0; CN1126265C; BR9806404A; MY120333A; JP3412082B2; US6529604B1; DE69834010D1; EP0918407A3; KR19990041072A; CN1218334A; KR100335611B1; EP0918407B1; EP0918407A2

Description

PROCESSO E APARELHO DE CODIFICAçãO/DECODIFICAçãO DE ÁUDIO

ESTÉREO COM ESCALA

ANTECEDENTES DA INVENçãO 1. Campo da Invenção A invenção presente refere-se a decodificação e codificação de áudio, e mais particularmente, a um processo e aparelho para codificação/decodíficação de áudio estéreo com escala utilizando codificação aritmética de bits divididos. 2. Descrição da Técnica Correlata Em um aparelho de codificação/decodificação de áudio com escala convencional, a graduação de escala de um sinal mono de 1—canal foi levada em consideração (K.

Brandenburg, e col., "First Ideas on Scalable Audio Coding", 97th AES-Convention, preprint 3924, São Francisco, 1994) e (K. Brandenburg, e col., "A two-or Three-Stage Bit Rate Scalable Audio Coding System", 99th AES-Convention, preprint 4132, New York, 1995). Entretanto, padrões de áudio MPEG (MPEG Committee ISO/IEC/JTCI/SC29/WG11, Information technology - Coding of moving pictures and associated audio for data storage media to about 1,5 Mbits/s - Part 3: Audio, ISO/IEC IS 11172-3, 1998) ou os processos AC—2/AC—3 (Dolby, AC-3 Multi-Channel Audio Coding - Submission to the Grand Aliance Audio Specialist Group", Dolby Lab., Agosto de 1993) fornecem uma tecnologia para processamento de sinais em multi-canais e estéreo bem como sinais mono. Na pratica, a maioria dos sinais musicais são compostos de sinais em estéreo. Desta forma, é necessário se empregar um conversor de codificação de áudio com escala adaptável para sinais compostos de dois ou mais fluxos de bits conforme na Internet ou em rede de comunicações.

Em termos gerais, os sinais musicais são sinais em estéreo. Os sinais em estéreo são fornecidos através de um disco compacto (CD) , uma rede de comunicações ou uma rede de radiodifusão, e serão fornecidos através de ambientes de multimídia no futuro. Entretanto, conversores de codificação de áudio com escala existentes tem em sua maior parte tratado os sinais em mono e ainda sem processamento dos sinais em estéreo. Para processamento dos sinais em estéreo, a transmissão de sinal deve ser realizada de modo que todos os sinais para um canal sejam transmitidos e os sinais para outro canal sejam então transmitidos. Neste caso, entretanto, uma vez as que as quantidades de bits gerados nos dois canais não são sempre as mesmas, o desempenho do conversor de áudio com escala á consideravelmente mais baixo a uma taxa de bits mais baixa para os sinais em estéreo.

SUMÁRIO DA INVENçãO

Para resolver os problemas acima, á um objetivo da invenção presente o fornecimento de um processo e aparelho de codificação de dados de áudio digitais em estéreo com escala, e um meio de registro para registro do processo de codificação. Codificação realizada através da geração de fluxos de bits compostos de várias camadas de acentuação com base em uma camada de base utilizando uma técnica de codificação aritmética de bits divididos (BSAC).

Para se alcançar o objetivo da invenção presente, fornecido processo de codificação de áudio estéreo com escala para codificação de sinais de áudio em um fluxo de dados em camadas apresentando uma camada de base e pelo menos duas camadas de reforço, incluindo as etapas de: — processamento de sinal dos sinais de entrada de áudio e quantização dos mesmos para cada faixa de codificação pré-determinada, codificação dos dados quantizados correspondendo a camada de reforço a seguir da camada de base codificada e não-codificando os dados quantizados restantes devido a um limite de tamanho de camada e fazendo parte camada codificada, e executando em sequência as etapas de codificação de camada para todas camadas de reforço para formação de fluxos de bits, aonde a etapa de codificação de camada de base, a etapa de codificação de camada de reforço e a etapa de codificação em sequência são realizadas de modo que a informação lateral e os dados quantizados correspondendo a uma camada a ser codificada são representados através de digitos de um mesmo número pré—determinado, e então codificados por aritmética utilizando um modelo probabilístico pré- determinado na ordem indo das sequências de Bit Mais Significante (MSB) às sequências de Bit Menos Significante (LSB), dados de canal esquerdo e dados de canal direito de bits divididos sendo codificados alternadamente em unidades de vetores pré-determinados. A informação lateral inclui pelo menos fatores de escala e informação para um modelo probabilistico a ser utilizado na codificação aritmética.

Os vetores pré- determinados são vetores quadri— dimensionais produzidos através do acoplamento dos quatro bits divididos de dados do canal de áudio em um vetor. Os vetores quadri-dimensionais são divididos em dois sub- vetores de acordo a pré-estados indicando se os componentes de frequência de bits divididos são codificados ou não, para então serem codificados. Ainda, a etapa de codificação de fatores de escala inclui as etapas de obtenção do fator de escala máxima, obtenção da diferença entre o fator de escala máxima e o primeiro dos fatores de escala e codificando por aritmética a diferença, e obtenção das diferenças entre o fator de escala codificado por aritmética imediatamente anterior e os respectivos fatores de escala subsequentes ao primeiro fator de escala, mapeamento das diferenças em um valor pré—determinado e codificação por aritmética dos valores mapeados. A etapa de codificação dos fatores de escala inclui as etapas de obtenção do fator de escala máxima, e obtenção das diferenças entre o fator de escala máxima e os respectivos fatores de escala e codificação por aritmética das diferenças. A informação de cabeçalho utilizada habitualmente para todas as faixas é codificada e a informação lateral e as frequências quantizadas necessárias para a respectiva camada são formadas pela informação de bits divididos para serem então codificadas para ter uma estrutura em camadas. A quantização é executada através das etapas de conversão dos sinais de entrada de áudio de um domínio temporal em sinais de um domínio de frequência, acoplamento dos sinais convertidos na forma de sinais de faixas de fatores de escala pré—determinados através do mapeamento de frequência/tempo e calculando um limite de operação de substituição em cada faixa de fator de escala, realização de modelagem temporal—ruído para controle do formato temporal do ruído de quantização no interior de cada janela para conversão, realização de processamento intenso em estéreo de modo que somente a informação quantizada de uma faixa de fatores escala para um dos dois canais é codificada, e somente o fator de escala para o outro canal é transmitido, predição de coeficientes de frequência do quadro atual, realização de processamento em estéreo Mid/Side (M/S) para conversão de um sinal no canal esquerdo e um sinal no canal direito em um sinal de adição de dois sinais e um sinal de subtração dos mesmos, e quantização dos sinais para cada faixa de codificação prê-determinada de modo que o ruído de quantização de cada faixa é menor do que o limite de operação de substituição. Quando o dado quantizado é composto do dado de sinal e dado de magnitude, as etapas de codificação da camada de base e camadas de reforço e formação de fluxos de bits incluem as etapas de: - codificação aritmética das sequências de dígito mais significante compostas dos dígitos mais significantes do dado de magnitude, codificação do dado de sinal correspondendo e dado não—zero entre as sequências codificadas de dígito mais significante, codificação das seqilências de dígito mais significante entre os dados de magnitude não-codifiçados do dado digital, codificação do dado de sinal não—codificado entre os dados de sinais correspondendo a dado de magnitude não—zero entre as seqflncias de dígitos codificados, e realização da etapa de codificação de magnitude e a etapa de codificação de sinal nos dígitos respectivos do dado digital, as etapas respectivas sendo realizadas alternadamente nos dados no canal esquerdo e nos dados de canal direito em unidades de vetores pré-determinados. A aparelhagem de decodificação de áudio em estéreo com escala inclui ainda uma porção de processamento em estéreo M/S para realização de processamento em estéreo M/S para verificação de processamento em estéreo M/S foi ou não realizado no processo de codificação de fluxo de bits, e conversão de um sinal no canal esquerdo e um sinal no canal direito em um sinal de adição de dois sinais e um sinal de subtração dos mesmos caso tenha sido realizado o processamento em estéreo M/S, uma porção de predição para verificação se a etapa de previsão foi ou no realizada no processo de codificação de fluxo de bits, e previsão dos coeficientes de frequência do quadro atual caso a etapa de verificação tenha sido realizada, uma porção de processamento intenso em estéreo para verificação de processamento intenso em estéreo foi ou no realizado no processo de codificação de fluxo de bits, e, se o processamento intenso em estéreo foi realizado, então uma vez somente é codificada a informação quantizada da faixa de fator de escala para um dos dois canais (o canal esquerdo), realização do processamento intenso em estéreo para restauração da informação quantiza da do outro canal (o canal direito) em um valor do canal esquerdo, e uma porção de modelagem de ruído temporal (TNS) para verificação se a etapa de modelagem de ruído temporal foi ou no realizada no processo de codificação de fluxo de bits, e caso a etapa TNS tenha sido realizada, realização da modelagem ruído-temporal para controle do formato temporal do ruído de quantização no interior de cada janela para conversão.

De acordo com outro aspecto da invenção presente, é fornecida uma aparelhagem de codificação de áudio em estéreo com escala incluindo uma porção de quantização para processamento de sinal de sinais de entrada de áudio e quantização dos mesmos para cada faixa de codificação, uma porção de codificação aritmética de bits divididos para codificação de fluxos de bits para todas as camadas de modo a ter—se uma estrutura em camadas, através de limitação de faixa para uma camada de base para ser assim graduada em escala, codificação da informação lateral correspondendo à camada de base, codificação em sequência da informação quantizada a partir da sequência de bit mais significante à sequência de bit menos significante, e dos componentes de frequência mais baixa para componentes de frequência mais alta, codificando alternadamente os dados de canal esquerdo e canal direito em unidades de vetores pré—determinados, e codificação da informação lateral correspondendo a próxima camada de reforço a seguir da camada de base e aos dados quantizados, e uma porção de formação de fluxo de bits para coleta de dados formados na porção de quantização e a porção de codificação aritmética de bits divididos e geração de fluxos de bits. A Porção de quantização inclui uma porção de mapeamento de freqüência/tempo para conversão dos sinais de entrada de áudio de um domínio temporal em sinais de um domínio de frequência, uma porção psicoacústica para acoplamento de sinais convertidos pelos sinais de faixas de fator de escala pré—determinado através de mapeamento de frequência /tempo e calculando um limite de operação de substituição em cada faixa de fator de escala utilizando um fenômeno de operação de substituição gerado pela interação dos sinais respectivos, e uma porção de quantização para quantização dos sinais para cada faixa de codificação pré- determinada enquanto o ruído de quantização de cada faixa comparado com o limite de operação de substituição. Além disso, a aparelhagem inclui também uma porção de modelagem de ruído temporal (TNS) para realização de modelagem ruído- temporal para controle do formato temporal do ruído de quantização no interior de cada janela para conversão, uma porção de processamento intenso em estéreo para realização de processamento intenso em estéreo de modo que somente a informação quantizada de uma faixa de fator de escala para um dos dois canais codificada, e somente o fator de escala para o outro canal transmitido, uma porção de previsão para previsão dos coeficientes de frequência do quadro atual, e uma porção de processamento em estéreo M/S para realizaço do processamento em estéreo M/S para conversão de um sinal de canal esquerdo e canal direito em um sinal de adição de dois sinais e um sinal de subtração dos mesmos.

De acordo ainda com outro aspecto da invenção presente, fornecido um processo de decodificação de áudio em estéreo com escala para decodif icação do dado de áudio codificado para apresentarem taxas de bits em camadas, incluindo as etapas de analise dos dados necessários para os módulos respectivos nos fluxos de bits apresentando uma estrutura em camadas, decodificação pelo menos fatores de escala e índices de modelo de codificação aritmética e da dos quantizados, na ordem de criação das camadas nos fluxos de bits apresentando uma estrutura em camadas, os dados quantizados decodificados alternadamente para os respectivos canais através da análise da importância dos bits compondo os fluxos de bits, a partir dos bits significantes superiores aos bits significantes inferiores, restauração dos fatores de escala decodificados e dados quantizados em sinais apresentando as magnitudes originais, e convertendo os por inversão os sinais quantizados em sinais de um domínio temporal. 0 processo de decodificação de áudio em estéreo em escala inclui ainda as etapas de realização de processamento em estéreo M/S para verificação se o processamento em estéreo M/S foi ou no realizada no processo de codificação de fluxo de bit, e conversão de um sinal de canal esquerdo e direito em um sinal de adição de dois sinais e um sinal de subtração dos mesmos caso o processamento em estéreo M/S tenha sido realizado, verificação se uma etapa de previsão foi ou no realizada no processo de codificação de fluxo de bits, e previsão de coeficientes de frequência do quadro atual caso a etapa de verificação tenha sido realizada, verificação se a etapa de processamento intenso em estéreo foi ou no realizada no processo de codificação de fluxo de bits, e, caso o processamento intenso em estéreo tenha sido realizado, então uma vez que ê codificada somente a informação quantizada da faixa de fator de escala para um dos dois canais (o canal esquerdo) , realização do processamento intenso em estéreo para restauração da informação quantiza— da do outro canal (o canal direito) em um valor do canal esquerdo, e verificação se a etapa de modelagem de ruido temporal foi ou no realizada (TNS) no processo de codificação de fluxo de bits, e se a etapa TNS tiver sido realizada, realizaço de modelagem ruído—temporal para controle do formato temporal do ruído de quantização no interior de cada janela para conversão.

Quando o dado quantizado composto de dado de sinal e dado de magnitude, restauração dos componentes de frequência quantizada pela decodificação em sequência do dado de magnitude dos bits de sinais dos componentes de frequência quantizada e acoplamento do dado de magnitude e bits de sinais. A etapa de decodificação realizada a partir dos bits mais significantes aos bits menos significantes e a etapa de restauração ê realizada pelo acoplamento do dado de bit dividido decodificado e restauração do dado acoplado em dado de componente de frequência quantizada. O dado decodificado na etapa de decodificação de forma que a informação de bit dividido de quatro amostras decodificada em unidades de vetores quadri—dimensionais. A decodificação do vetor quadri-dimensional é realizada de modo que dois sub-vetores codificados de acordo a pré— estados indicando se componentes de frequência não—zeros de bits divididos são codificados ou no sendo decodificado aritmeticamente, e dois sub-vetores decodificados de acordo a estados de codificação das amostras respectivas são restaurados em vetores quadri—dimensionais.

Ainda, enquanto é decodificado o dado de bits divididos dos componentes de frequência respectivos a partir dos MSBs, a decodificação é salteada caso o dado de bits divididos seja '0' e o dado de sinal sendo decodificado aritmeticamente quando o dado de bits divididos Ί' aparece pela primeira vez. A decodificação dos vetores de escala é realizada através da decodificação do fator de escala máxima no fluxo de bits, decodificação aritmética das diferenças entre o fator de escala máxima e os respectivos fatores de escala, e subtração das diferenças a partir do fator de escala máxima. Ainda, a etapa de decodificação dos fatores de escala inclui as etapas de decodificação do fator de escala máxima a partir de fluxo de bits, obtenção das diferenças entre o fator de escala máxima e os fatores de escala a serem decodificados pelo mapeamento e decodificação aritmética das diferenças e mapeamento por inversão das diferenças a partir de valores mapeados, e obtenção do primeiro fator de escala pela subtração das diferenças a partir do fator de escala máxima, e obtenção dos fatores de escala a partir das faixas restantes através da subtração das diferenças a partir de fatores de escalas anteriores. A decodificação dos índices do modelo codificado por aritmética é realizada através das etapas de decodificação do índice de modelo aritmético mínino no fluxo de bit, decodificação das diferenças entre o índice mínimo e os respectivos índices na informação lateral das respectivas camadas, e adição do índice mínimo e das diferenças.

Alternativamente, de acordo com a invenção presente, fornecida uma aparelhagem de decodificação de áudio em estéreo com escala para decodif icação do dado de áudio codificado para apresentar taxas de bits em camadas, incluindo uma porção de análise de fluxo de bits para análise dos dados necessários para os respectivos módulos nos fluxos de bits apresentando uma estrutura em camadas, uma porção de decodificação para decodificação pelo menos dos fatores de escala e índices de modelo de codificação aritmética e dados quantizados, na ordem de criação das camadas nos fluxos de bits apresentando uma estrutura em camadas, os dados quantizados decodificados alternadamente para os respectivos canais através da análise da importância de bits compondo os fluxos de bits, a partir dos bits significantes superiores aos bits significantes, uma porção de restauração para restauração dos fatores de escala decodificados e dados quantizados em sinais apresentando as magnitudes originais, e uma porção de mapeamento tempo/ frequência para conversão por inversão dos sinais quantizados em sinais de um domínio temporal. A aparelhagem inclui ainda uma porção de processamento em estéreo M/S para realização do processamento em estéreo M/S para verificação se o processamento em estéreo M/S foi ou não realizado no processo de codificação de fluxo de bits, e conversão de um sinal de canal esquerdo e canal direito em um sinal de adição de dois sinais e um sinal de subtração dos mesmos caso o processamento em estéreo M/S tenha sido realizado, uma porção de previsão para verificação se a etapa de previsão foi ou no realizada no processo de codificação de fluxo de bits, e previsão dos coeficientes de freqüência do quadro atual caso a etapa de verificação tenha sido realizada, uma porção de processamento intenso em estéreo para verificação se o processamento intenso em estéreo foi ou no realizado, então uma vez que somente a informação quantizada da faixa de fator de escala para um dos dois canais (o canal esquerdo) codificada, realizaço de processamento intenso em estéreo para restauração da informação quantizada do outro canal (o canal direito) em um valor do canal esquerdo, e uma porção de modelagem de ruído temporal para verificação se foi realizada ou no a etapa de modelagem de ruído temporal (TNS) no processo de codificação de fluxo de bits, e caso a etapa TNS tenha sido realizada, realização de modelagem ruído—temporal para controle do formato temporal do ruído de quantização no interior de cada janela para conversão.

BREVE DESCRIçãO DOS DESENHOS

Os objetivos e vantagens da invenção presente se tornarão mais evidentes através da descrição em detalhes de uma modalidade preferida da mesma com referência aos desenhos em anexo nos quais: a Figura 1 é um diagrama de blocos de um dispositivo de codificação de acordo com a invenção presente; a Figura 2 mostra a estrutura de um fluxo de bits de acordo com a invenção presente; a Figura 3 um diagrama de blocos de um dispositivo de decodificação de acordo com a invenção presente; a Figura 4 ilustra a disposição de componentes de frequência para um bloco extenso (tamanho de janela = 2048); e a Figura 5 ilustra a disposição dos componentes de frequência para um bloco curto (tamanho de janela = 2048) DESCRIçãO DAS MODALIDADES PREFERIDAS

Serão descritas daqui em diante as modalidades preferidas da invenção presente com referência aos desenhos de acompanhamento. A invenção presente compreende codificar e decodificar dados de áudio digital em estéreo em escala utilizando uma técnica de codificação aritmética de bits divididos (BSAC). Em outras palavras, na invenção presente, somente um módulo de codificação sem perda é substituído com a técnica BSAC, com todos outros módulos do codificador convencional permanecendo inalterados. A invenção presente estende a adaptabilidade do codificador/decodificador assim construídos, isto significa dizer, que a invenção presente pode ser adaptada para um sinal em estéreo. A Figura 1 um diagrama de blocos de uma aparelhagem de codificação de áudio em escala de acordo com a invenção presente.

Um dispositivo de codificação de áudio em escala inclui uma porção de mapeamento 100 de frequência/tempo, uma porção psicoacústica 110, uma porção de modelagem 120 de ruído temporal, uma porção de processamento 130 intenso em estéreo, uma porção de previsão 14 0, uma porção de processamento 150 em estéreo mid/side (M/S), uma porção de quantização 160, uma porção de codificação 170 aritmética de bits divididos, e uma porção de formação 180 de fluxo de bits.

As características da acústica humana mais importantes na codificação de um sinal de áudio digital compreendem um efeito de operação de substituição e uma característica de faixa crítica. O efeito de operação de substituição refere—se a um fenômeno no qual um sinal de áudio (som) inaudível devido a um outro sinal. Por exemplo, quando um trem passa por uma estação ferroviária, uma pessoa no pode ouvir a voz de seu/sua companheiro(a) durante uma conversação em voz baixa devido ao ruído causado pelo trem.

Os sinais de áudio são percebidos de forma diferente para cada faixa dentro da faixa de frequência de audição humana. Também, em vista de características de faixa crítica, ruídos apresentando a mesma amplitude são percebidos de forma diferente quando o sinal de ruído encontra-se em uma faixa crítica ou quando o sinal de ruído encontra—se fora de um sinal crítico. Neste caso, quando o sinal de ruído excede a faixa crítica, o ruído é mais claramente percebido.

As características de codificação da acústica humana utilizam basicamente essas duas características de forma que a faixa de ruído que pode ser alocada no interior de uma faixa crítica é calculada e então o ruído de quantização é gerado correspondendo faixa calculada para minimizar perda de informação devido a codificação. A porção psicoacústica 110 acopla os sinais convertidos através da porção de mapeamento 100 de frequência/tempo pelo s sinais de faixas de fator de escala pré—determinadas e calcula um limite de operação de substituição em cada faixa de fator de escala utilizando um fenômeno de operação de substituição gerado pela interação com os sinais respectivos. A porção de modelagem 120 de ruído de domínio temporal controla o formato temporal de ruído de quantização no interior de cada janela para conversão. O ruído pode ser modelado temporariamente através de filtragem de dados de frequência. Este módulo é utilizado opcionalmente no codificador. A porção de processamento 130 intensa em estéreo é um módulo utilizado para processar de forma mais eficiente um sinal em estéreo, e codifica somente a informação quantizada para a faixa de fator de escala de um dos dois canais com a faixa do fator de escala do outro canal sendo transmitida. Este módulo no é necessariamente utilizado no codificador mas várias matérias são levadas em consideração para cada faixa de fator de escala para determinar se é para ser utilizado ou não. A porção de previsão 140 estima os coeficientes de frequência do quadro atual. A diferença entre o valor previsto e o componente de frequência atual é quantizada e codificada, reduzindo dessa forma a quantidade de bits usáveis gerados. A porção de previsão 140 é utilizada opcionalmente em unidades de quadros. Em outras palavras, uma vez que a utilização da porção de previsão 140 aumenta a previsão do coeficiente de freqilência subsequente aumenta em complexidade, a porção de previsão 140 no pode ser utilizada.

Ocasionalmente, a quantidade de bits atualmente gerados por estimativa pode ser maior do que por falta de estimativa. A esta altura, a porção de previsão 140 não utilizada. A porção de processamento 150 em estéreo M/S para processamento mais eficiente dos sinais em estéreo, converte um sinal de canal esquerdo e um sinal de canal direito em sinais de adição e subtração de dois sinais, respectivamente, para então processar os mesmos. Este módulo não necessariamente utilizado no codificador mas são levadas em consideração virias matérias para cada faixa de fator de escala para determinar se para ser utilizado ou não. A porção de quantização 160 procede a quantização escalar dos sinais de frequência de cada faixa de forma que a magnitude do ruído de quantização de cada faixa menor do que o limite de operação de substituição, de modo a ser imperceptível. A quantização realizada de forma que o valor NMR (Relação Ruído-por-Marcara), que ê uma relação do limiar de mascaramento calculado pela porção psicoacústica 210 ao ruído gerado em cada faixa, apresenta—se menor ou igual a Odb. Um valor NMR menor ou iqual a OdB significa que o limite de operação de substituição maior do que o ruído de quantização. Em outras palavras, o ruído de quantização não audível. A porção de codificação 170 aritmética de bits divididos, um módulo de núcleo da invenção presente, pode ser utilizada como uma alternativa para uma porção de codificação sem perda da técnica ACC uma vez que o conversor de codificação de áudio existente tal como um MPEG-2AAC no pode fornecer condição de graduação de escala. Para implementação do conversor de codificação de áudio em escala, os dados de frequência quantizados pela Porção de quantização 160 são codificados pela combinação da informação lateral de faixa correspondente e da informação de quantização dos dados de áudio. Também, em adição a graduação de escala, desempenhos semelhantes aqueles no AAC podem ser fornecidos em uma camada de topo.

As funções da porção de codificação 170 aritmética de bits divididos serão descritas em maiores detalhes. A faixa é limitada para uma correspondente a camada de base de forma a serem graduadas em escala, e a informação lateral para a camada de base é codificada. A informação para os valores quantizados é codificada em sequência na ordem indo das seqlências MSB s sequências LSB, e a partir dos componentes de frequência mais baixa para os componentes de frequência mais alta.

Também, os canais esquerdo e direito são codificados alternadamente em unidades de vetores pré—determinados para desempenho de codificação da camada de base. Após a codificação da camada de base ser completa, a informação lateral para a camada de reforço seguinte e os valores quantizados dos dados de áudio são codificados de forma que os fluxos de bits assim formados apresentam uma estrutura em camadas. A porção de formação 180 de fluxo de bits gera fluxos de bits de acordo a uma sintaxe adequada para o conversor de codificação em escala através da coleta de informação constituída nos módulos respectivos da aparelhagem de codificação. A Figura 2 mostra a estrutura de um fluxo de bits de acordo com a invenção presente. Conforme mostrado na Figura 2, os fluxos de bits apresentam uma estrutura em camadas aonde os fluxos de bits das camadas de taxas de bits inferiores apresentam-se contidas naquelas camadas de taxas de bits mais elevadas de acordo com as taxas de bits.

Convencionalmente, a informação lateral é codificada primeiro e então a informação restante é codificada para formar fluxos de bits. Entretanto, na invenção presente, conforme mostrado na Figura 2, a informação lateral para cada camada de reforço ê codificada separadamente. Ainda, embora todos os dados quantizados sejam codificados em sequência em unidades de amostras convencionalmente, na invenção presente, o dado quantizado é representado pelo dado binário e é codificado a partir da sequência MSB do dado binário para formar fluxos de bits no interior dos bits alocados. A Figura 3 é um diagrama de blocos de uma aparelhagem de decodificação de acordo com a invenção presente, o qual inclui uma porção de análise 300 de fluxo de bits, uma porção de decodificação 310 aritmética de bit dividido, uma porção de quantização 320 inversa, uma porção de processamento 330 em estéreo M/S, uma porção de previsão 340, uma porção de processamento 350 intenso em estéreo, uma porção de modelagem 360 de ruído de domínio temporal, e uma porção de mapeamento 370 tempo/frequência. A porção de análise 300 de fluxo de bits separa a informação de cabeçalho e o dado codificado na ordem de geração dos fluxos de bits de entrada e transmite os mesmos aos módulos respectivos. A porção de codificação 310 aritmética de bits divididos decodifica a informação lateral e os dados quantizados de bits divididos na ordem de geração dos fluxos de bits a serem transferidas porção de quantização 320 inversa.

A porção de processamento 330 em estéreo M/S adaptada somente para os sinais em estéreo processa a faixa de fator de escala correspondendo ao processamento em estéreo M/S realizado na aparelhagem de codificação.

No caso quando a estimativa é realizada no dispositivo de codificação, a porção de previsão 340 atinge os mesmos valores dos dados decodificados no quadro anterior atrás de estimativa na mesma maneira conforme o dispositivo de codificação. O sinal previsto adicionado com um sinal de diferença decodificado pela porção de análise 300 do fluxo de bits, restaurando assim os componentes de frequência originais. A porção de processamento 350 intenso em estéreo adaptada somente para sinais em estéreo processa a faixa de fator de escala correspondendo ao processamento intenso em estéreo realizado no dispositivo de codificação. A porção de modelagem 360 de ruído de domínio temporal empregada para controlar o formato temporal do ruído de quantização no interior de cada janela para conversão, procede ao processamento correspondente. O dado decodificado restaurado como um sinal de uma região temporal por tal módulo de processamento na forma de um algoritmo de áudio convencional como os padrões AACC.

Primeiro, a porção de quantização 320 inversa restaura o fator de escala decodificado e o dado quantizado em sinais apresentando as magnitudes originais. A porção de mapeamento 370 de tempo/frequência converte por inversão os sinais quantizados em sinais de um domínio temporal de forma a serem reproduzidos.

Então, a operação da aparelhagem de codificação será descrita.

Os sinais de entrada de áudio so convertidos em sinais de um domínio de frequência através do MDCT (Transformada de Coseno Discreta Modificada) na porção de mapeamento 100 de tempo/frequência. A porção psicoacústica 110 acopla os sinais de frequência pelas faixas de fator de escala apropriadas para obtenção de um limite de operação de substituição. Também, os sinais de áudio convertidos em sinais de um domínio de frequência passam através de módulos para reforço da eficiência de codificação, ou seja, a porção 120 TNS, a porção de processamento 130 intenso em estéreo, a porção de previsão 14 0 e a porção de processamento 150 em estéreo M/S, para então se tornarem sinais comprimidos mais eficientes. A porção de quantização 160 realiza quantização escalar de forma que a magnitude do ruído de quantização de cada faixa de fator de escala & menor do que o limite de operação de substituição, que audível mas no perceptível no interior dos bits alocados. Caso a quantização preenchendo tais condições seja realizada, são gerados fatores de escala para as faixas de fator de escala e valores de frequência quantizados respectivos.

Em termos gerais, em vista das psicoacústica humana, componentes de frequência mais próximos podem ser percebidos facilmente a uma frequência mais baixa.

Entretanto, conforme a frequência cresça, torna—se mais amplo o intervalo das frequências perceptíveis. As larguras de faixas das faixas de fator de escala cresce conforme as faixas de frequência tornam—se mais altas.

Entretanto, para facilitar a codificação, as faixas do fator de escala para aquela largura de faixa que não seja constante no são utilizadas para codificação, mas ao contrario são utilizadas as faixas de codificação aonde a largura de faixa seja constante. As faixas de codificação incluem 32 valores de coeficientes de frequências quantizados. A aparelhagem de codificação/decodificação convencional, aonde somente a eficiência de codificação levada em consideração, tal como AAC, codifica primeiro a informação utilizada habitualmente nos canais esquerdo e direito em um local do cabeçalho, no processamento dos sinais em estéreo. O dado do canal esquerdo codificado e então o dado do canal direito codificado. Ou seja, a codificação progredida na ordem de cabeçalho, canal esquerdo e canal direito.

Quando são arranjadas as informações para o canal esquerdo e direito e transmitidas independentemente da importância após o cabeçalho ser processado dessa forma, se a taxa de bits for diminuída, os sinais para o canal direito posicionados posteriormente desaparecem primeiro.

Assim, a redução perceptível no desempenho torna-se séria.

Entretanto, a aparelhagem de codificação de áudio em estéreo de acordo com a invenção presente codifica a informação lateral para cada canal. Em outras palavras, a informação lateral para cada canal é codificada pela porção de codificação 170 aritmética de bits divididos alternadamente na ordem do canal esquerdo e canal direito. O processo de codificação de fatores de escala é ligeiramente modificado para uma compressão mais eficiente.

Primeiro, a codificação dos fatores de escala será descrita. O dispositivo de codificação de áudio em estéreo de acordo com a invenção presente codifica os fatores de escala utilizando dois processos a serem descritos adiante para fins de reforço da eficiência de codificação. A aparelhagem de codificação seleciona um processo exibindo um desempenho melhor e transmite o processo selecionado para a aparelhagem de decodificação.

Para compressão dos fatores de escala, primeiro, o fator de escala máximo (max_scale factor) é obtido a partir dos fatores de escala. Então, as diferenças entre os fatores de escala e o fator de escala máximo respectivos são obtidas e então as diferenças são codificadas por aritmética. Quatro modelos são utilizados na codificação aritmética das diferenças entre os fatores de escala. Os quatro modelos são demonstrados nas Tabelas 5.5 a 5.8. A informação para os modelos armazenada em um scale factor_model. TABELA 5.5 Modelo Aritmético 1 de fator de escala diferencial Tabela 5.6 Modelo Aritmético 2 de fator de escala diferencial Tabela 5.7 Modelo Aritmético 3 de fator de escala diferencial Tabela 5.8 Modelo Aritmético 4 de fator de escala diferencial Em segundo lugar, compressão dos fatores de escala, sendo obtido o fator de escala máximo (max_scale factor) a partir dos fatores de escala, como no primeiro processo.

Então, a diferença entre os primeiros fatores de escala e o fator de escala máxima obtida e então a diferença codificada por aritmética. Então, as diferenças entre os fatores de escala remanescentes e os fatores de escala anteriores são obtidas e as diferenças são codificadas por aritmética. Neste caso, uma vez que os modelos utilizados são prescritos, o valor de sacale factor_model sem importância. A seguir, será descrita a codificação dos componentes de frequência quantizados para um sinal de estéreo. O dado quantizado para um canal em bits divididos.

Quando um sinal de canal mono processado, o dado de bits divididos acoplado por vetores quadri—dimensionais e os vetores quadri—dimensionais são utilizados como uma unidade básica. Isto também verdadeiro para codificação de um sinal de canal em estéreo. Em outras palavras, a codificação é iniciada a partir do MSB. Os vetores quadri-dimensionais dos dados de bits divididos são codificados por aritmética a partir do canal esquerdo. Em seguida, são codificados por aritmética os vetores quadri—dimensionais para o canal direito no mesmo nível de frequência. Em tal maneira, os canais esquerdo e direito são intercalados para codificação.

No caso de um canal simples, a codificação é realizada a partir do MSB ao LSB. O dado de bits divididos apresentando a mesma importância são codificados a partir dos componentes de frequência mais baixa aos componentes de frequência mais elevada. Nesta oportunidade, se os bits alocados aos respectivos vetores so mais importantes do que aqueles sendo atualmente codificados, não é necessário codificar o vetor pertinente e é saltada a codificação do mesmo. XQO, XQ1, XQ2, ..., XQk, ... onde Xqk é o dado de bit dividido dos componentes de frequência quantizados a partir do 4*k ao 4*k+3.

No caso de dois canais, a codificação é realizada a partir do MSB ao LSB, como no caso de um canal simples.

Similarmente, os dados de bits divididos apresentando a mesma importância so codificados dos componentes de frequência mais baixa aos componentes de frequência mais elevada. Entretanto, considerando que existem dois canais, a seqlência de codificação é decidida. Assume-se que os componentes de frequência quantizados nos canais esquerdo e direito são conforme se segue: Canal esquerdo: XQLO, XQL1, XQL2, XQL3, XQL4, XQL5, ..., XQLk, ...

Canal direito: XQRO, XQR1, XQR2, XQR3, XQR4, XQR5, ..., XQRk, ... onde XQLk e XQRk são dados de bits divididos dos componentes de frequência quantizados a partir de 4*k a (4*k+3).

Nesta maneira, no caso de dois canais, a codificação realizada a partir dos componentes de freqüência mais baixa aos componentes de frequência mais elevada em uma sequência similar ao caso de um canal.

Entretanto, a intercalação realizada entre os componentes de canal de modo a codificar primeiro os componentes significantes. Em outras palavras, os vetores respectivos são codificados alternadamente entre dois canais como se segue: XQL1, XQR1, XQL2, XQR2,...

Uma vez que a informação assim formada codificada sequencialmente na ordem de importância em ambos canais, muito embora a taxa de bits seja reduzida em um conversor de codificação de áudio em escala, o desempenho no consideravelmente reduzido. A seguir, será descrita uma modalidade preferida da invenção presente. A invenção presente ê adaptável a estrutura de base dos padrões AAC incluindo todos os módulos tais como módulos adicionais para reforço da eficiência de codificação e implementa um conversor de dados de áudio digital em escala. Em outras palavras, na invenção presente enquanto os módulos básicos utilizados no padrão AAC de decodificação/codificação são empregados, somente ê reposicionado o módulo de codificação sem perda com o processo de codificação de bits divididos para fornecimento de uma aparelhagem de codificação em escala.

Na invenção presente, a informação para somente uma taxa de bit não é codificada no interior de um fluxo de bit mais informação para as taxas de bits de várias camadas de reforço é codificada no interior de um fluxo de bits, com uma estrutura em camadas, conforme mostrado na Figura 2, na ordem indo dos componentes de sinal mais importante para os componentes de sinal menos importantes.

De acordo com a modalidade da invenção presente, os mesmos módulos como nos padrões AAC são empregados até antes da codificação sem perda do conversor de codificação em escala BSAC. Assim, se for formado dado de freqüência quantizado através da decodificação dos fluxos de bits AAC, o dado decodificado pode ser restaurado aos fluxos de bits em escala BSAC. Isto significa que transcodificação sem perda é possível entre os fluxos de bits AAC e os fluxos de bits em escala BSAC. Finalmente, conversão mútua em um formato de fluxo de bits apropriado é permitido dependendo do ambiente ou das circunstâncias. Assim, tanto a graduação de escala e a eficiência de codificação podem ser satisfeitas e são complementares entre si, o que distinguido por outro conversor de codificação em escala. A utilização de fluxos de bits assim formados, os fluxos de bits apresentando uma taxa de bits baixa, podem ser constituídos pela simples re—disposição dos fluxos de bits de taxas de bits baixas contidos no fluxo de bit mais elevado, através de solicitação de usuário ou de acordo com ao estado dos canais de transmissão. Em outras palavras, os fluxos de bits formados pela aparelhagem de codificação em uma base de tempo real, ou os fluxos de bits armazenados em um meio, podem ser re—arranjados para serem convenientes para uma taxa de bits desejada por solicitação do usuário, para serem então transmitidos. Também, se o desempenho do equipamento do usuário é pobre ou se o usuário desejar reduzir a complexidade do decodificador, mesmo com os fluxos de bits apropriados, somente alguns fluxos de bits podem ser restaurados, controlando dessa forma a complexidade.

Por exemplo, na formação de um fluxo de bit em escala, a taxa de bits de uma camada de base é de 16 Kbps, a da camada de topo é de 64 Kbps, e as camadas de reforço respectivas apresentam um intervalo de taxa de bit de 8 Kbps, ou seja, o fluxo de bits apresenta 7 camadas de 16, 24, 32, 40, 48, 56 e 64 Kbps. As camadas de reforço respectivas são definidas conforme demonstrado na Tabela 2.1. Uma vez que o fluxo de bits formado pelo dispositivo de codificação apresenta uma estrutura em camadas, conforme mostrado na Figura 3, o fluxo de bits da camada de topo de 64 Kpbs contêm os fluxos de bits das camadas de reforço respectivas (16, 24, 32, 40, 48, 56 e 64 Kbps) . Se um usuário solicitar dados para a camada de topo, o fluxo de bits para a camada de topo transmitida sem qualquer processamento para a mesma. Também, se um outro usuário solicitar dados para a camada de base (correspondendo a 16 Kbps), somente os fluxos de bits dianteiros so transmitidos simplesmente.

Tabela 2.1 Taxa de bits para cada camada (intervalo de 8 Kbps) Alternativamente, as camadas de reforço podem ser construídas em intervalos mais finos. A taxa de bits de uma camada de base de 16 Kbps, a da camada de topo de 64 Kbps, e cada camada de reforço apresenta um intervalo de taxa de bits de 1 Kbps. As camadas de reforço respectivas são construídas conforme demonstrado na Tabela 3.1. Por conseguinte, a graduação em escala do grânulo fino pode ser implementada, ou seja, os fluxos de bits em escala são formados em um intervalo de taxa de bits de 1 Kbps de 16 Kbps 64 Kbps.

Tabela 3.1 Taxa de bits para cada camada (intervalo de 1—Kbps) As camadas respectivas apresentam larguras de faixas limitadas de acordo com as taxas de bits. Se fôr intencionada uma graduação de escala de intervalo de 8 Kbps, as larguras de faixas são limitadas, conforme demonstrado nas Tabelas 2.2 e 2.3. No caso de um intervalo de 1—Kbps, as larguras de faixas são limitadas, conforme demonstrado nas Tabelas 3.2 e 3.3.

Tabela 2.2 Limite de faixa em cada camada para janelas curtas (intervalo de 8-Kbps) Tabela 2.3 Limite de faixa em cada camada para janelas extensas (intervalo de 8-Kbps) Tabela 3.2 Limite de faixa em cada camada para janelas curtas (intervalo de 1-Kbps) Tabela 3.3 Limite de faixa em cada camada para janelas extensas (in- tervalo de 1-Kbps) O dado de entrada um dado PCM amostrado a 48 KHz, e a magnitude de um quadro 1024. O número de bits utilizável para um quadro para uma taxa de bits de 64 Kbps é de 1365,3333 ( 64000 bits/seg* (1024/48000).) na média.

Similarmente, o tamanho de bits disponíveis para um quadro pode ser calculado de acordo com as taxas de bits respectivas. Os números calculados de bits disponíveis para um quadro so demonstrados na Tabela 2.4 no caso de 8 Kbps, e na Tabela 3.4 no caso de 1 Kbps.

Tabela 2.4 Bits disponíveis para cada canal em cada camada (intervalo de 8-Kbps) A seguir será descrito agora em detalhes o procedimento de codificação e decodificação do sinal de áudio em estéreo de acordo com a invenção atual. 1. Procedimento de codificação Procedimento de codificação inteiro o mesmo como descrito nos padrões MPEG-2ACC, e a codificação de bits divididos proposta na invenção presente ê escolhida como codificação sem perda. 1.1. Porção psicoacústica Utilizando um modelo psicoacústico, o tipo de bloco de um quadro sendo presentemente processado (extenso, início, curto, ou parada) , os valores SMR das faixas de processamento respectivas, informação de grupo de um bloco curto e atraso temporário de dado PCM para sincronização tempo/frequência com o modelo psicoacústico, são primeiramente gerados a partir de dado de entrada, e transmitidos a uma porção de mapeamento de tempo/frequência. O Modelo 2 ISO/lEC 11172-3 empregado para cálculo do modelo psicoacústico (MPEG Committee ISO/lEC/JTcl/sc29/WGll, Information technology-Coding of moving pictures and associated audio for data storage media to about 1,5 Mbit/s-Part 3: Audio, ISO/OEC IS 11172-3, 1993) . Este módulo deve ser usado necessariamente, mas modelos diferentes podem ser utilizados de acordo aos usuários. 1.2. Porção de mapeamento de tempo/frequência Um mapeamento de tempo/frequência definida nos padrões internacionais MPEG-2 AAC & utilizado. A porção de mapeamento de tempo/frequência converte dado de um domínio temporal em dado de um domínio de frequência utilizando MDCT de acordo saída de tipo de bloco utilizando o modelo psicoacústico. Nesta oportunidade, os tamanhos dos blocos são 2048 e 256 no caso de blocos extenso/início/parada e no caso de um bloco curto, respectivamente, e o MDCT & executado 8 vezes. Então, a informação de tipo de janela e grupamento de janela são transmitidos à porção de formação 180 de fluxo de bits. O mesmo procedimento foi utilizado daqui em diante corro usado no MPEG—2 AAC convencional (MPEG Committee ISO/IEC/JTC1/SC29/WG11, ISO/IEC MPEG-2 AAC 1S13818-7, 1997). 1.3. Porção de modelagem de ruído temporal (TNS) É utilizada uma porção de modelagem de ruído temporal definida nos padrões internacionais MPEG-2 AAC. O TNS 120 é um módulo opcional e controla o formato temporal do ruído de quantização no interior de cada janela para conversão. A modelagem de ruído temporal pode ser realizada pelos dados de frequência de filtragem. 0 TNS 120 transmite a informação TNS porção de formação 180 de fluxo de bits. 1.4. Porção de processamento intenso em estéreo É utilizada uma porção de processamento intenso em estéreo definida nos padrões internacionais MPEG-2 AAC. A porção de processamento 130 intenso em estéreo é um processo para processamento mais eficiente dos sinais em estéreo. O processamento intenso em estéreo é realizado de modo que somente a informação quantizada de uma faixa de fator de escala para um dos dois canais é codificada, e somente o fator de escala para o outro canal é transmitido.

Este módulo é um módulo opcional e se é determinado se este módulo é para ser usado ou no para cada faixa de fator de escala considerando—se varias condições. O módulo de processamento 130 intenso em estéreo transmite valores indicadores intensos em estéreo para a porção de formação 180 de fluxo de bits. 1.5. Porção de Previsão Uma porção de previsão é utilizada definida nos padrões internacionais MPEG-2 AAC. A porção de previsão 140 um módulo opcional e prediz os coeficientes de frequência do quadro atual. Ainda, a porção de previsão 140 transmite os parâmetros relacionados a previsão porção de formação 180 de fluxo de bits. 1.6. Porção de processamento em estéreo Mid/Side (M/S) É utilizada uma porção de processamento em estéreo M/S definida nos padrões internacionais MPEG-2 AAC. A porção de processamento 150 em estéreo M/S é um módulo opcional e é um dos processos para processamento de sinais em estéreo mais eficiente. O processamento em estéreo M/S é realizado para conversão de um sinal de canal esquerdo e um sinal de canal direito em um sinal de adição de dois sinais e um sinal de subtração dos mesmos. 1.7. Porção de Quantização O dado convertido naquele de um domínio de frequência é quantizado com fatores de escala crescentes de modo que o valor SNR da faixa de fator de escala mostrado nas Tabelas 1.1 e 1.2 é menor do que o SMR que é o valor de saída do modelo psicoacústico. No presente, a quantização escalar é executada, e o fator de escala básico é 2 Vi. A quantização é executada de modo que o ruído perceptível é minimizado. O procedimento de quantização exato descrito no MPEG-2 AAC. No presente, a saída obtida o dado quantizado e os fatores de escala para as faixas de fator de escala respectivas.

Tabela 1.1 Faixa de fator de escala para blocos extensos Tabela 1.2 Faixa de fator de escala para blocos curtos 1.8. Bits de adensamento utilizando codificação aritmética de bits divididos O adensamento de bits realizado pela porção de codificação 170 aritmética de bits divididos e pela porção de formação 180 de fluxo de bits. Para codificação conveniente, os componentes de frequência são rearranjados. A ordem de rearranjo é diferente dependendo dos tipos de bloco. No caso de utilização de uma janela extensa no tipo de bloco, os componentes de freqüência são dispostos na ordem de faixas de fator de escala, conforme mostrado na Figura 4. No caso de utilização de uma janela curta no tipo de bloco, cada quatro componentes de frequência a partir de oito blocos são dispostos repetidamente na ordem crescente, conforme mostrado na Figura 5.

Os fatores de escala e dados quantizados rearranjados são formados como fluxos de bits em camadas.

Os fluxos de bits são formados por sintaxes demonstradas nas Tabelas de 7.1 até 7.13. Os elementos de cabeçalho de um fluxo de bits são elementos que podem ser utilizados habitualmente no AAC convencional, e os novos elementos propostos na invenção presente são explicados especificamente. Entretanto, a estrutura principal é semelhante aquela dos adr6es AAC.

Tabela 7.1 Sintaxe de bsac_lstep_data_block () Tabela 7.2 Sintaxe de bsac_lstep_strem () Tabela 7.3 Sintaxe de bsac spectral data () Tabela 7.4 Sintaxe de bsacmainstream() Tabela 7.7 Sintaxe de bsac_layer_stream () Tabela 7.8 Sintaxe de bsac_channel_stream () Tabela 7.9 Sintaxe de bsac_general_info () Tabela 7.10 Sintaxe de bsac_side_info () Tabela 7.11 Sintaxe de bsac_spectral_data () Os novos elementos propostos na invenção presente serão especificamente explicados. 1.8.1. Codificação de bsac_channel_stream O 'common_window' representa se dois canais usam o mesmo bloco de formato, "ax_scale factor (ch) 1 representa o valor máximo dos fatores de escala, que é um número inteiro, por exemplo, de 8 bits. Também, o 'tns_data_resent (ch)' representa se o TNS é empregado ou no no dispositivo de codificação. O 'gain_control_data_present(ch)' representa um indicador que indica que o processo de mapeamento de tempo/frequência é utilizado para apoiar a taxa de amostragem em escala (SSR) no AAC. Também, o 'stereo—mode' representa um indicador de 2-bits indicando um processo de processamento de sinal estéreo, no qual '00' significa independente, '01' significa todos ms_utilizados são um, '01' significa substituição de 1 bit de faixas de max_sfb de ms_utilizados sendo localizado na parte de informação de lado de camada, '11' significa substituição de 2-bits de faixas de max_sfb de stereo__info sendo localizado na parte de informação de lado de camada. 1.8.2. Codificação de bsac_data O 'frame_lenght' representa o tamanho de todos fluxos de bits para um quadro, que é expresso em unidades de bites, por exemplo, 9 bits no caso de um sinal mono (MS) , e 10 bits no caso de um sinal em estéreo. Também, a "encoded_layer' representa a codificação para a camada de topo codificada no fluxo de bits, que 3 bits no caso de um intervalo de 8—Kbps e 6 bits no caso de um intervalo de 1— Kbps, respectivamente. A informação para as camadas de reforço demonstrada nas Tabelas 2.1 e 3.1. Também, o 'scalefactor_model (ch) ' representa informação com respeito a modelos a serem usados na codificação aritmética das diferenças nos fatores de escala. Esses modelos são mostrados na Tabela 4.2.

Tabela 4.2 Modelo Aritmético de fator de escala diferencial O 'min_ArModel' representa o valor mínimo dos índices de modelo de codificação aritmética. O 'ArModel_model' representa informação com respeito a modelos usados na codificação aritmética do sinal de diferença entre Ar— Model e min_ArModel.

Esta informação mostrada na Tabela 4.3.

Tabela 4.3 Modelo Aritmético de diferencial ArModel 1.8.3. Codificação de bsac_side_info A informação que pode ser usada para todas as camadas codificada primeiramente e então a informação lateral utilizada habitualmente para as camadas de reforço respectivas codificada. 0 'acode_ms_used(g) (sfb) ' representa uma palavra-chave obtida pela codificação aritmética de ms_used, i.é., um indicador de 1-bit indicando se a codificação M/S foi ou no realizada no grupo de janela g e faixa de fator de escala scf, no qual o ms_ used é definido como segue: 0: Independente 1: msused. O 'acode_ms_used(g) (sfb) representa uma palavra- chave obtida pela codificação aritmética de ms_used, i.é., um indicador de 1-bit indicando se a codificação M/S foi ou não empregada no grupo de janela g e faixa de fator de escala scf, no qual o ms_used definido como segue: 0: Independente; e 1: ms used. O 'acode_stereo_info(g) (sfb) ' representa uma palavra-chave obtida pela codificação-aritmética do ms_used, i.é.; um indicador de 2—bits indicando se a codificação intensa em estéreo foi ou no empregada no grupo de janela g e faixa de fator de escala scf, aonde stereo_info é definida como se segue: 0 0: Independente; 01: msused; 10: Intensityinphase; e 11: Intensityoutofphase. O 'Acode scf' representa uma palavra-chave obtida pela codificação aritmética do fator de escala, e 'acode_ArModel' representa uma palavra-chave obtida pela codificação aritmética de ArModel. O ArModel informação que selecionada a partir dos modelos listados na Tabela 4.3. 1.8.4. Codificação de bsac_spectral_data A informação lateral utilizada habitualmente para as camadas de reforço respectivas, os componentes de frequência quantizados são bits divididos pela utilização da técnica BSAC e então codificados aritmeticamente. O 'acode_vecO' representa uma palavra-chave obtida pela codificação aritmética do primeiro subvetor (subvetor 0) utilizando-se o modelo aritmético definido como o valor ArModel. O 'acode vecl' representa uma palavra-chave obtida pela codificação aritmética do segundo subvetor (subvetor 1) utilizando—se o modelo aritmético definido como o valor ArModel. O 'acode sign' representa uma palavra-chave obtida pela codificação aritmética do bit de sinal usando-se o modelo aritmético definido na Tabela 5.15.

Tabela 5.15 Modelo Aritmético de sinal Enquanto o número de bits utilizado na codificação dos respectivos subvetores são calculados e comparados com o número de bits disponíveis para as camadas de reforço respectivas, quando os bits usados são iguais ou em maior quantidade do que os bits disponíveis, a codificação da camada de reforço a seguir é novamente iniciada.

No caso de um bloco extenso, a largura de faixa da camada de base á limitada a vigésima-primeira faixa de fator de escala. Então, os fatores de escala até a vigésima-primeira faixa de fator de escala e os modelos de codificação aritmética das faixas de codificação correspondentes são codificadas. A informação de distribuição de bits a obtida a partir de modelos de codificação aritmética. O valor máximo dos bits distribuídos ã obtido a partir da informação de bit distribuído para cada faixa de codificação, e a codificação á realizada a partir do valor de bit de quantização máxima através do processo de codificação mencionado acima. Então, os bits quantizados seguintes são codificados em sequência. Se os bits distribuídos de uma certa faixa são menos do que aqueles da faixa sendo presentemente codificada, a codificação não á realizada. Quando os bits distribuídos de uma certa faixa são os mesmos daqueles da faixa sendo presentemente codificada, a faixa á codificada pela primeira vez. Uma vez que a taxa de bits da camada de base á de 16 Kbps, a tolerância total de bits á de 336 bits. Assim, a quantidade total de bits utilizados á calculada continuamente e a codificação á encerrada no momento que, a quantidade de bits excede a 336.

Após serem formados todos os fluxos de bits para a camada de base (16 Kbps) , são formados os fluxos de bits para a camada de reforço a seguir. Uma vez que as larguras de faixas limitadas são aumentadas para as camadas altas, a codificação dos fatores de escala e codificação aritmética de modelos á realizada somente para as novas faixas adicionadas às faixas limitadas para a camada de base. Na camada de base, dados de bits divididos não-codifiçados para cada faixa e dados de bits divididos de uma nova faixa adicionada são codificados a partir dos MSBs na mesma maneira como na camada de base. Quando a quantidade de bits usados total fôr maior que a quantidade de bits disponíveis, a codificação ã terminada e a preparação para a formação dos fluxos de bits da camada de reforço a seguir á feita. Nesta maneira, os fluxos de bits para as camadas restantes de 32, 40, 48, 56 e 64 Kbps podem ser gerados. 2. Procedimento de decodificação 2.1. Análise e decodificação de fluxos de bits 2.1.1. Decodificação de bsac_channel_stream A decodificação de bsac_channel_stream é realizada na ordem a seguir. Primeiro, é obtido o fator de max_scale.

Então, obtido ics_info(). Se o dado TNS está presente, á obtido o dado TNS. Se existem dois canais, é obtido stereo_mode e á obtido então o dado BSAC. 2.1.2. Decodificação de bsac_data A informação lateral necessária na decodificação de frame_length, encoded_layer, modelos de fator de escala e modelos aritméticos decodificada no fluxo de bits. 2.1.3. Decodificação de bsac_stream Os fluxos BSAC apresentam uma estrutura em camadas.

Primeiro, a informação lateral para a camada de base separada do fluxo de bits e então decodificadas por aritmética. Então, a informação de bits divididos para os componentes de frequência quantizados separada do fluxo de ditos bits e então decodificadas por aritmética. Então, a informação lateral para a camada de reforço a seguir decodificada e a informação de bits divididos para os componentes de frequência quantizados decodificada por aritmética. A decodificação da informação lateral para as camadas de reforço a seguir e a decodificação de dados de bits divididos são realizadas de modo repetido até que a camada de reforço mais ampla do que a camada codificada. 2.1.4. Decodificação de stereo_info ou ms_used A decodificação de stereo_info ou ms_used influenciada pelo stereomode representando uma substituição em estéreo. Se o stereo_mode O ou 1, a decodif icação de stereo_info ou ms_used não é necessária.

Caso o stereojmode seja 1, todos os ms_used são 1. A informação para ms_used transmitida para a porção de processamento em estéreo M/S de forma que ocorra o processamento estéreo M/S. Se o stereo_mode 2, o valor do ms_used decodificado aritmeticamente pela utilização do modelo demonstrado na Tabela 5.13. Ainda, a informação para o ms_used transmitida porção de processamento em estéreo de modo que ocorra o processamento em estéreo M/S.

Tabela 5.13 Modelo ms_used Se o stereo_mode fôr 3, o stereo_mode decodificado aritmeticamente utilizando o modelo demonstrado na Tabela 5.14. O dado decodificado transmitido para a porção de processamento em estéreo M/S ou para a porção de processamento em estéreo intenso de modo que ocorra processamento em estéreo M/S ou processamento intenso em estéreo em unidades de faixas de fator de escala, conforme descrito no AAC.

Tabela 5.14 Modelo stereo_info 2.1.5. Decodificação de bsac_side_info Os fluxos de bits em escala formados acima apresentam uma estrutura em camadas. Primeiro, a informação lateral para a camada de base separada do fluxo de bits e então decodificada. Então, a informação de bits divididos para os componentes de frequência quantizados contida no fluxo de bits da camada de base separada do fluxo de bits e daí decodificada. O mesmo procedimento de decodificação como aquele para a camada de base ê aplicado para as outras camadas de reforço. 2.1.5.1. Decodificação de fatores de escala Os componentes de frequência são divididos em faixas de fator de escala apresentando coeficientes de frequência que são múltiplos de 4. Cada faixa de fator de escala apresenta um fator de escala. Existem dois processos para decodificação dos fatores de escala. O processo a ser usado conhecido do valor de scf_coding.

Primeiro, decodificado o max_scalefactor em um inteiro sem sinalização de 8—bits. Em termos gerais, durante a codificação, os valores obtidos pelo mapeamento das diferenças são codificados. Assim, para as respectivas faixas de fatores de escala, os valores mapeados são decodificados aritmeticamente utilizando—se modelos demonstrados na Tabela 5.2. Nesta oportunidade, se o valor de decodificação aritmética é 54, o que significa que o valor mapeado é maior ou igual a 54, uma vez que a diferença entre 54 e o valor mapeado é codificada novamente, a diferença codificada é decodificada novamente para ser restaurada em um valor maior do que ou igual a 54.

Se a decodificação dos valores mapeados é completada, os valores mapeados são mapeados por inverso pelo sinal de diferença. O mapeamento e o mapeamento por inversão so executados utilizando se tabelas de mapeamento demonstradas nas Tabelas 5.1 e 5.2. O primeiro fator de escala pode ser obtido utilizando-se o sinal de diferença entre ele e o max_scalefactor.

Tabela 5.2 Fator de escala diferencial para a tabela de transição de índice Tabela 5.2 Index to differential scale factor transition table Em segundo lugar, o max_scalefactor é decodificado em um inteiro sem sinalização de 8—bits. Para todos os fatores de escala, as diferenças entre um valor deslocado, i.é., são decodificados por aritmética o max_scalefactor e todos os fatores de escala. Os fatores de escala podem ser obtidos pela subtração dos sinais de diferença a partir do max_scalefactor. Os modelos aritméticos utilizados na decodificação das diferenças são um dos elementos de formação dos fluxos de bits, e são separados dos fluxos de bits que jã tenham sido decodificados. O pseudo código a seguir descreve o processo de decodificação para os fatores de escala na camada de base e as outras camadas de reforço. for(ch=0; ch<nch; ch++) if(scf_codingfch] ==1) for(g=0; g<num_window_group; g++) for(sfb=layer_sfb£layer]; sfb<layer_sfb £layer+lj; sfb++){ sf [ch] Jgjjsfb] = max_scalef actor - arithmetic_decoding(); } } } else} for(g=0; g<num_window_jgroup; g++) { for(sfb=layer_sfb layer ; sfb layer_sfb layer+1 ; sfb++) tmp_index = arithmetic_decoding(); i f (tntp_inde x==5 4) tmp__index = 54 + arithmetic_decoding(); if (sfb==0) tmp_index = max_scalefactor - tmp_index; else tmp__index = sf [chj Jgp £sfb-l] -tmp__index; sf fg] [sfb] = index 2 sf£tmp_index]; } } } } No presente, layer_sfb (layer) ê uma faixa de fator de escala para decodificação dos fatores de escala nas camadas de reforço respectivas, e layer_sfb(layer+1) uma faixa de fator de escala de término. 2.1.5.2. Decodificação de índice de modelo aritmético Os componentes de frequência são divididos em faixas de codificação apresentando 32 coeficientes de frequência a serem codificados sem perda. A faixa de codificação uma unidade básica utilizada na codificação sem perda. O índice de modelo de codificação aritmética informação sobre os modelos utilizados na decodificação/ codificação aritmética dos dados de bits divididos de cada faixa de codificação, indicando qual modelo ê utilizado nos procedimentos de codificação/decodificação aritmética, entre os modelos listados na Tabela 4.4.

Tabela 4.4 Parâmetros de Modelo Aritmético BSAC

As diferenças entre um valor deslocado e todos os índices de modelo de codificação aritmética são calculados e então os sinais de diferença são codificados aritmeticamente utilizando—se os modelos listados na Tabela 4.3. No presente, entre os quatro modelos listados na Tabela 4.3, o modelo a ser usado é indicado pelo valor de Ar—Modelmodel e é armazenado no fluxo de bits como 2 bits. O valor deslocado é um valor de 5—bits min_ArModel armazenado no fluxo de bits. Os sinais de diferença são decodificados na ordem inversa do procedimento de codificação e então os sinais de diferença são adicionados ao valor deslocado para restauração dos índices de modelo de codificação aritmética. O pseudo código descreve o processo de decodificação para os índices de modelo de codificação aritmética e ArModel(cband) nas camadas de reforço respectivas. for (ch=0; chcnchj ch++) for (sfb=layer_sfb £layer^] ; sfb<layer_sfb flayer+l^.; sfb++) for (g=0; g<num_window_group; g++){ band = (sfb*num_window_group) + g for (i=0; swb_off set£band] ? i<swb_offset £band+l]; i+ = 4){ cband=index 2cb (g, i); if (Idecode_cband J^ch^j ígj £cbancT[ ) { ArModel fgj] JcbandJ = min_ArModel+arithmetic_ decoding(); decode_cband [ch^j [cbandj = 1; } } } No presente, layer_sfb(layer) é uma faixa de fator de escala de início para decodificação aritmética dos índices de modelo de codificação nas camadas de reforço respectivas, e layer_sfb(layer + 1) é uma faixa de fator de escala de término, O decode_cband(ch) (q) (cband) é um indicador indicativo de se o modelo de codificação aritmética foi decodificado (1) ou no (0). 2.1.6. Decodificação de dado de bits divididos As seqilências quantizadas são formadas de sequências de bits divididos. Os vetores quadri- dimensionais respectivos são subdivididos em dois subvetores de acordo aos seus estados. Para compressão efetiva, os dois subvetores são codificados aritmeticamente como uma codificação sem perda. O modelo a ser usado na codificação sem perda. O modelo a ser usado na codificação aritmética para cada faixa de codificação é decidido. Esta informação é armazenada no ArModel.

Como demonstrado nas Tabelas de 6.1 a 6.31, os modelos de codificação aritmética respectivos são compostos de vários modelos de baixa ordem. Os subvetores são codificados utilizando—se um dos modelos de baixa ordem. Os modelos de baixa ordem são classificados de acordo com a dimensão do subvetor a ser codificado, a importância de um vetor ou os estados de codificação das amostras respectivas. A importância de um vetor é decidida pela posição do bit do vetor a ser codificado. Em outras palavras, de acordo se a informação de bits divididos é para o MSB, o MSB seguinte, ou o LSB, a importância de um vetor difere. O MSB tem a maior importância e o LSB tem a menor importância. Os valores de estado de codificação das amostras respectivas são renovados conforme seja feito progresso da codificação de vetor a partir do MSB ao LSB.

Primeiramente, o valor do estado de codificação é inicializado como zero. Então, quando um valor de bit não— zero é encontrado, o valor de estado de codificação torna- se 1.

Tabela 6.1 Modelo 0 Aritmético BSAC

Bit distribuído = O

Modelo 1 aritmético BSAC Não utilizado Tabela 6.12 Modelo 12 Aritmético BSAC

Bit distribuído 1 Tabela 6.3 Modelo 3 Aritmético BSAC

Bit distribuído = 1 Tabela 6.4 Modelo 4 Aritmético BSAC

Bit distribuídos = 2 Tabela 6.5 Modelo 5 Aritmético BSAC

Bit distribuídos = 2 Tabela 6.6 Modelo 6 Aritmético BSAC

Bits distribuídos 3 Tabela 6.7 Modelo 7 Aritmético BSAC

Bits distribuídos = 3 Tabela 6.8 Modelo 8 Aritmético BSAC

Bits distribuídos = 4 Tabela 6.9 Modelo 9 Aritmético BSAC

Bits distribuídos = 4 Tabela 6.10 Modelo 10 Aritmético BSAC

Bits distribu5dos (Abit) = 5 Tabela 6.11 Modelo 11 Aritmético BSAC

Bits distribuídos (Abit) = 5 Tabela 6.12 Modelo 12 Aritmético BSAC

Idêntico ao modelo 10 aritmético BSAC, mas bit distribuído = 6 Tabela 6.13 Modelo 13 Aritmético BSAC

Idêntico ao modelo 11 aritmético, BSAC, mas bit distribuído = 6 Tabela 6.14 Modelo 14 Aritmético BSAC

Idêntico ao modelo 10 aritmético BSAC, mas bit distribuído = 7 Tabela 6.15 Modelo 15 Aritmético BSAC Idêntico ao modelo 11 aritmético BSAC, mas bit distribuído = 7 Tabela 6.16 Modelo 16 Aritmético BSAC

Idêntico ao modelo li aritmético BSAC, mas bit distribuído = 8 Tabela 6.17 Modelo 17 Aritmético BSAC

Idêntico ao modelo 11 aritmético BSAC, mas bit distribuído Tabela 6.18 Modelo 18 Aritmético BSAC

Idêntico ao modelo 10 aritmético BSAC, mas bit distribuído = 9 Tabela 6.19 Modelo 19 Aritmético BSAC

Idêntico ao modelo 11 aritmético BSAC, mas bit distribuído = 9 Tabela 6.20 Modelo 20 Aritmético BSAC

Idêntico ao modelo 10 aritmético BSAC, mas bit distribuído = 10 Tabela 6.21 Modelo 21 Aritmético BSAC

Idêntico ao modelo 11 aritmético BSAC, mas bit distribuído = 10 Tabela 6.22 Modelo 22 Aritmético BSAC Idêntico ao modelo 10 aritmético BSAC, mas bit distribuído = 11 Tabela 6.23 Modelo 23 Aritmético BSAC

Idêntico ao modelo 11 aritmético BSAC, mas bit distribuído = 11 Tabela 6.24 Modelo 24 Aritmético BSAC

Idêntico ao modelo 10 aritmético BSAC, mas bit distribuído = 12 Tabela 6.25 Modelo 25 Aritmético BSAC

Idêntico ao modelo 11 aritmético BSAC, mas bit distribuído = 12 Tabela 6.26 Modelo 26 Aritmético BSAC

Idêntico ao modelo 10 aritmético BSAC, mas bit distribuído = 13 Tabela 6.27 Modelo 27 Aritmético BSAC

Idêntico ao modelo 11 aritmético, BSAC mas bit distribuído = 13 Tabela 6.28 Modelo 28 Aritmético BSAC

Idêntico ao modelo 10 aritmético BSAC, mas bit distribuído = 14 Tabela 6.29 Modelo 29 Aritmético BSAC

Idêntico ao modelo 11 aritmético BSAC, mas bit distribuído = 14 Tabela 6.30 Modelo 30 Aritmético BSAC

Idêntico ao modelo 10 aritmético BSAC, mas bit distribuído = 15 Tabela 6.31 Modelo 31 Aritmético BSAC

Idêntico ao modelo 11 aritmético, BSAC mas bit distribuído = 15 Os dois subvetores são vetores de uni a quadri— dimensionais. Os subvetores são codificados aritmeticamente a partir do MSB ao LSB, dos componentes de freqüência mais baixa aos componentes de frequência mais alta. Os índices de modelo de codificação aritmética usados na codificação aritmética são armazenados previamente no fluxo de bits na ordem de frequência baixa a frequência alta, antes da transmissão do dado de bits divididos para cada faixa de codificação em unidade de faixas de codificação. O dado de bits divididos respectivo codificado aritmeticamente para obtenção dos índices de palavra- chave. Esses índices são restaurados no dado quantizado original através do bit acoplado utilizando-se o pseudo código a seguir. O 'pre_state()' um indicativo de estado de se o valor decodificado presentemente O ou não. O 'snf" representa a importância de um vetor decodificado. O 'ldxO' um índice de palavra-chave cujo estado anterior 1. O 'dec_sample()' dado decodificado. O 'start_i' uma linha de frequência de início de vetores decodificados. for (i=start_i; i< (start_i+4), i++){ if (pre_state J_iJ { if (idxl & 0x01) dec_sample £ij | =(1 << (snf-1) ) idxl >> =1; } else { if (idxO & 0x01) dec_sample plj | = (1 << (snf-1)) idx0>> = 1; } } Enquanto o dado de bits divididos de componentes de frequência quantizados é codificado a partir do MSB ao LSB, quando os bits de sinais de coeficientes de frequência não- zeros são codificados aritmeticamente. Um bit de sinal negativo (-) é representado por 1 e um bit de sinal positito (+) é representado por 0.

Portanto, se o dado de bits divididos é decodificado aritmeticamente em um decodificador e é encontrado primeiro um valor de bit decodificado aritmeticamente não—zero, segue a informação do sinal no fluxo de bits, i.é., acode_sign. O sign_bit é decodificado aritmeticamente utilizando—se esta informação com os modelos listados na Tabela 5.9. Se o sign_bit for 1, a informação de sinal é dada ao dado quantizado (y) formado pela acoplagem do dado separado como segue. if (y: = 0) if(sign_bit== 1) y = -y. 2.2. Porção de processamento em estéreo M/S (módulo opcional) Se conhece pelo indicador contido no fluxo de bits e ms_used() se um módulo de processamento em estéreo M/S para cada faixa de fator de escala é usado ou não. Caso usado, o processamento em estéreo M/S é realizado utilizando—se o mesmo procedimento como demonstrado no AAC. 2.3. Porção de Previsão (módulo opcional) Se conhece pelo indicador contido no fluxo de bits e prediction_j?resent se um módulo de previsão para faixa de fator de escala é usado ou não. Caso usado, a previsão é realizada utilizando—se o mesmo procedimento conforme demonstrado no AAC. 2.4. Porção de Processamento Intenso em Estéreo (módulo opcional) Se conhece pelo indicador contido no fluxo de bits e stereo_info se um módulo de processamento intenso em estéreo para cada faixa de fator de escala é utilizado ou não. Caso utilizado, o processamento intenso em estéreo é realizado utilizando—se o mesmo procedimento como demonstrado no AAC. 2.5. Porção TNS (módulo opcional) Se conhece pelo indicador contido no fluxo de bits e tns_present se um módulo TNS é utilizado ou não. Caso usado, o TNS é realizado utilizando—se o procedimento como demonstrado no AAC. 2.6. Quantização Inversa A porção de quantização inversa restaura os fatores de escala decodificados e o dado quantizado em sinais apresentando as magnitudes originais. O procedimento de quantização inverso descrito nos padrões AAC. 2.7. Mapeamento de frequência/tempo A porção de mapeamento de frequência/tempo converte inversamente sinais de áudio de um domínio de frequência em sinais de um domínio temporal de forma a serem reproduzidos pelo usuário. A fórmula para mapeamento do sinal de domínio de frequência em sinal de domínio temporal definido nos padrões AAC. Também, vários itens tais como janela relacionada ao mapeamento são também descritos nos padrões AAC. A invenção presente permite um desempenho semelhante aquele do codificador convencional aonde só se levado em consideração a compressão, a uma taxa de bits mais alta, de modo a processar tanto os sinais mono e estéreo para satisfazer as solicitações de vários usuários, enquanto são formados fluxos de bits flexíveis. Em outras palavras, através de solicitação do usuário, a informação para as taxas de bits de várias camadas combinada com um fluxo sem sobreposição, proporcionando dessa forma fluxo de bits apresentando boa qualidade de áudio. Também, nenhum conversor é necessário entre um terminal de transmissão e um terminal de recepção. Ainda, qualquer estado de canais de transmissão e várias solicitaçc3es de usuários podem ser acomodadas. Ainda, a graduação de escala é aplicável aos sinais em estéreo bem como aos sinais em mono. A invenção presente é adaptável a aparelhagem de decodificação/codificação de áudio convencional apresentando módulos para aperfeiçoamento de eficiência de decodificação/codificação, melhorando dessa forma o desempenho para várias taxas de bits. Também, na invenção presente, enquanto os módulos básicos utilizados no padrão AAC de codificação/decodificação tal como mapeamento ou quantização de tempo/frequência são utilizados, é somente substituído o módulo de codificação sem perda com o processo de codificação de bits divididos para fornecimento de graduação de escala.

Uma vez que os fluxos de bits são graduados em escala, um fluxo de bit pode conter vários fluxos de bits apresentando várias taxas de bits. Diferentemente dos codificadores convencionais, o codificador em escala de acordo com a invenção presente apresenta camadas de reforço mais finas, e assim a faixa de aplicação é ampliada.

Também, em contraste com outros conversores de codificação de áudio em escala, é oferecida boa qualidade de áudio a uma taxa de bits mais alta.

Se a invenção presente fôr combinada com os padrões AAC, pode ser obtida quase a mesma qualidade de áudio a uma taxa de bits da camada de topo.

De acordo com a invenção presente, enquanto utilizando o algoritmo de áudio convencional tal como os padrões MPEG-2AAC, somente a porção de codificação sem perda é diferente do padrão convencional. Assim, os sinais quantizados de um domínio de freqilência são decodificados em um fluxo de bits AAC, e os fluxos de bits em escala BSAC podem ser formados com base nos sinais decodificados. Em outras palavras, a transcodificação sem perda é permitida.

Também, os fluxos de bits AAC podem ser formados a partir de fluxos de bits em escala BSAC na ordem inversa. Devido a essas funcionalidades, vários fluxos de bits AAC formados somente para reforço de eficiência de codificação são usados em modo convertido de acordo com seu ambiente.

Assim, para viabilizar a graduação de escala, não é necessário atuação de dois dobramentos ou tri—dobramento para formação de fluxos de bits para proporcionamento de graduação de escala através da aparelhagem de codificação em separado.

Também, a invenção presente apresenta boa eficiência de codificação, ou seja, o melhor desempenho é exibido a uma taxa de bits fixa conforme nas técnicas de codificação convencionais, e relaciona—se a um processo e aparelhaqem de codificação/decodificação aonde a taxa de bits codificada adequada para o advento de tecnologia multimídia restaurada. Também, de acordo com a invenção presente, dados para taxas de bits para varias camadas de reforço podem ser representados dentro de um fluxo de bits.

Assim, de acordo ao desempenho de decodificadores de usuários e largura de faixa/congestão de canais de transmissão ou através de solicitações de usuários, os tamanhos das taxas de bits ou a complexidade dos mesmos podem ser controlados. - REIVINDICAçÕES -

Claims

1. PROCESSO DE CODIFICAçãO/DECODIFICAçãO DE ÁUDIO ESTREO COM ESCALA, para codificação de sinais de áudio em um fluxo de dados em camadas apresentando uma camada de base e pelo menos duas camadas de reforço, caracterizado por compreender as etapas de: — sinais de entrada de áudio para processamento de sinal e quantização dos mesmos para cada faixa de codificação pré-determinada; codificação do dado quantizado correspondendo à camada de base entre os dados quantizados; — codificação do dado quantizado correspondendo à próxima camada de reforço da camada de base codificada e o dado quantizado restante não—codificado devido a um limite de tamanho de camada e fazendo parte à camada codificada; e — realização em sequência das etapas de codificação de camada para todas camadas de reforço para formação de fluxos de bits, em que a etapa de codificação da camada de base, a etapa de codificação de camada de reforço e a etapa de codificação em sequência são realizadas de forma que a informação lateral e o dado quantizado correspondendo a uma camada a ser codificada são representados por dígitos de um mesmo número pré—determinado; e então codificados por aritmética utilizando-se um modelo probabilístico pré- determinado na ordem indo de sequências MSB a sequências LSB, os dados de canal esquerdo e de canal direito de bits divididos sendo codificados alternadamente em unidades de vetores pró—determinados.

2. PROCESSO de codificação de áudio em estéreo em escala, de acordo com a reivindicação 1, caracterizado por a informação lateral incluir pelo menos fatores de escala e informaço em um modelo probabilistico a ser utilizado na codificação aritmética.

3. PROCESSO de codificação de áudio em estéreo em escala, de acordo com a reivindicação 1, caracterizado por os vetores pré—determinados serem vetores quadri— dimensionais produzidos pela acoplagem de quatro dados de canal de áudio de bits divididos em um vetor.

4. PROCESSO de codificação de áudio em estéreo em escala, de acordo com a reivindicação 3, caracterizado por os vetores quadri—dimensionais serem divididos em dois subvetores de acordo a pré—estados indicando se os componentes de frequência de bits divididos são codificados ou não, para então serem codificados.

5. PROCESSO de codificação de áudio em estéreo em escala, de acordo com a reivindicação 2, caracterizado por a etapa de codificação dos fatores de escala compreender as etapas de: - obtenção do fator de escala máxima; — obtenção da diferença entre o fator de escala máxima e o primeiro dos fatores de escala e codificação aritmética da diferença; e — obtenção das diferenças entre o fator de escala codificado por aritmética imediatamente anterior e os respectivos fatores de escala subsequentes ao primeiro fator de escala, mapeamento das diferenças em um valor pré- determinado e codificação aritmética dos valores mapeados.

6. PROCESSO de codificação de áudio em estéreo em escala, de acordo com a reivindicação 5, caracterizado por os modelos probabilisticos listados nas Tabelas 5.1 serem utilizados na etapa de mapeamento.

7. PROCESSO de codificação de áudio em estéreo em escala, de acordo com a reivindicação 5, caracterizado por os modelos probabilisticos listados nas Tabelas 5.3 e 5.4 serem utilizados na etapa de codificação aritmética.

8 . PROCESSO de codificação de áudio em estéreo em escala, de acordo com a reivindicação 2, caracterizado por a etapa de codificação dos fatores de escala compreender as etapas de: — obtenção do fator de escala máxima; e — obtenção das diferenças entre o fator de escala máxima e os respectivos fatores de escala e codificação aritmética das diferenças.

9. PROCESSO de codificação de áudio em estéreo em escala, de acordo com a reivindicação 1, caracterizado por a informação de cabeçalho utilizada habitualmente para todas as faixas ser codificada e a informação lateral e as freqüências quantizadas necessárias para a camada respectiva serem formadas por informação de bits divididos para então serem codificadas para apresentarem uma estrutura assentada.

10. PROCESSO de codificação de áudio em estéreo em escala, de acordo com a reivindicação 1, caracterizado por a quantização ser realizada pelas etapas de: — convertor os sinais de entrada de áudio de um domínio temporal em sinais de um domínio de frequência; — acoplamento dos sinais convertidos como sinais de faixas de fator de escala pró—determinado através de mapeamento frequência/tempo(100) e calculando um limite de operação de substituição em cada faixa de fator de escala; — realização de modelagem ruído-temporal para controle do formato temporal do ruído de quantização no interior de cada janela para conversão; — realização de processamento intenso em estéreo de modo que somente a informação quantizada de uma faixa de fator de escala para um dos dois canais é codificada, e somente o fator de escala para o outro canal é transmitido; — previsão dos coeficientes de frequência do quadro atual; — realização de processamento em estéreo M/S para conversão de um sinal de canal esquerdo e canal direito em um sinal de adição de dois sinais e um sinal de subtração dos mesmos; e — quantização dos sinais para cada faixa de codificação pré-determinada de modo que o ruido de quantização de cada faixa seja menor do que o limite de operação de substituição.

11. PROCESSO de codificação de áudio em estéreo em escala, de acordo com a reivindicação 1, caracterizado por o dado quantizado ser composto de dado de sinal e dado de magnitude, as etapas de codificação da camada de base e camadas de reforço e fluxos de bits de formação compreenderem as etapas de: — codificação aritmética das sequências de dígitos mais significantes compostas dos dígitos mais significantes do dado de magnitude; — codificação do dado de sinal correspondendo a dados não-zeros entre as sequências de dígitos codificados mais siqnificantes; codificação das sequências de dígitos mais significantes entre o dado de magnitude não-codifiçado do dado digital; - codificação do dado de sinal não-codifiçado entre o dado de sinal correspondendo a dado de magnitude não zero entre as seqilências de dígitos codificadas; e - realização da etapa de codificação de magnitude e a etapa de codificação de sinal nos dígitos respectivos do dado digital, as etapas respectivas sendo realizadas alternadamente no dado de canal esquerdo e canal direito em unidades de vetores pré-determinados.

12. APARELHO de codificação de áudio em estéreo em escala, caracterizado por compreender: - uma porção de quantização(160) para processamento de sinal de sinais de entrada de áudio e quantização dos mesmos para cada faixa de codificação; uma porção de codificação aritmética de bits divididos(170) para codificação dos fluxos de bits para todas camadas de forma a apresentarem uma estrutura assentada, através de limitação de faixa para uma camada de base de forma a ser graduada em escala, codificação da informação lateral correspondendo a camada de base, codificação da informação quantizada em sequência a partir da sequência de bit mais importante sequência de bit menos importante, e a partir de componentes de frequência mais baixa componentes de frequência mais elevada, codificando alternadamente o dado do canal esquerdo e canal direito em unidades de vetores pré-determinados, e codificando a informação lateral correspondendo a camada de reforço a seguir da camada de base e do dado quantizado; e - uma porção de formação de fluxo de bits (180) para coleta de dados formados na porção de quantização (160) e a porção de codificação aritmética de bits divididos (170) e geração de fluxos de bits.

13. APARELHO de codificação de áudio em escala, de acordo com a reivindicação 12, caracterizado por a porção de quantização(160) compreender: — uma porção de mapeamento de frequência/tempo(100) para conversão dos sinais de entrada de áudio de um domínio temporal em sinais de um domínio de frequência; — uma porção psicoacústica(110) para acoplamento dos sinais através de sinais de faixas de fator de escala pré— determinado pelo mapeamento de freqlência/tempo e calculando um limite de operação de substituição em cada faixa de fator de escala utilizando um fenômeno de operação de substituição gerado pela interação dos sinais respectivos; e - uma porção de quantização(160) para quantização dos sinais para cada faixa de codificação pré-determinada enquanto o ruído de quantização de cada faixa é comparado com o limite de operação de substituição.

14. APARELHO de codificação de áudio em escala, de acordo com a reivindicação 13, caracterizado por compreender ainda: uma porção de modelagem de ruído temporal(120) (11NS) para realização de modelagem ruído—temporal para controle do formato temporal do ruído de quantização no interior de cada janela para conversão; — uma porção de processamento intenso em estéreo(130) para realizaço do processamento intenso em estéreo de forma que somente a informação quantizada de uma faixa de fator de escala para um dos dois canais é codificada, e somente o fator de escala para o outro canal é transmitido; — uma porção de previsão(140,340) para previsão dos coeficientes de frequência do quadro atual; e — uma porção de processamento em estéreo M/S(150, 330) para realização de processamento em estéreo M/S para conversão de um sinal de canal esquerdo e canal direito em um sinal de adição de dois sinais e um sinal de subtração dos mesmos.

15. PROCESSO de decodificação de áudio em estéreo em escala para decodificação do dado de áudio codificado para apresentarem taxas de bits assentadas, caracterizado por compreender as etapas de: — análise dos dados necessários para os módulos respectivos nos fluxos de bits apresentando uma estrutura assentada; — decodificação de pelo menos fatores de escala e codificação aritmética dos índices de modelo e dado quantizado, na ordem de criação das camadas nos fluxos de bits apresentando uma estrutura assentada, o dado quantizado decodificado alternadamente para os canais respectivos através de análise da importância de bits compondo os fluxos de bits, a partir dos bits significantes superiores aos bits significantes inferiores; — restauração dos fatores de escala decodificados e dados quantizados em sinais apresentando as magnitudes oriqinais; e — conversão dos sinais quantizados inversamente em sinais de um domínio temporal.

16. PROCESSO de decodificação de áudio em estéreo em escala, de acordo com a reivindicação 15, caracterizado por compreender ainda as etapas de; — realização de processamento em estéreo M/S para verificação se o processamento em estéreo M/S foi realizado no processo de codificação de fluxo de bits, e conversão de um sinal de canal direito e um sinal de canal esquerdo em um sinal de adição de dois sinais e um sinal de subtração dos mesmos caso o processamento em estéreo M/S tenha sido realizado; — verificação se a etapa de previsão foi ou no realizada no processo de codificação de fluxo de bits, e previsão dos coeficientes de frequência do quadro atual caso a etapa de previsão tenha sido realizada; - verificação se a etapa de processamento intenso em estéreo foi ou no realizada no processo de codificação de fluxo de bits, e, caso tenha sido realizado o processamento intenso em estéreo, então uma vez que somente a informação quantizada da faixa de fator de escala para um canal de dois canais codificada (o canal esquerdo) , realização do processamento intenso em estéreo para restauração da informação quantizada do outro canal (o canal direito) em um valor de canal esquerdo; e verificação se a etapa de modelagem de ruído temporal foi ou no realizada (TNS) no processo de codificação de fluxo de bits, e caso a etapa TNS tenha sido realizada, realizaço de modelagem ruído—temporal para controle do formato temporal do ruído de quantização no interior de cada janela para conversão.

17. PROCESSO de decodificação de áudio em estéreo em escala, de acordo com as reivindicações 15 ou 1, caracterizado por o dado quantizado ser composto de dado de sinal e dado de magnitude, restauração dos componentes de frequência quantizados através da decodificação em sequência do dado de magnitude dos bits de sinais dos componentes de freqüêncía quantizados e acoplamento dos bits de sinais e dado de magnitude.

18. PROCESSO de decodificação de áudio em estéreo em escala, de acordo com a reivindicação 15, caracterizado por a etapa de decodificação ser realizada a partir dos bits mais significantes aos bits menos significantes e a etapa de restauração ser realizada através do acoplamento do dado de bits divididos decodificado e restauração do dado acoplado em dado de componente de frequência quantizado.

19. PROCESSO de decodificação de áudio em estéreo em escala, de acordo com a reivindicação 18, caracterizado por o dado ser decodificado na etapa de decodif icação de modo que a informação de bits divididos de quatro amostras decodificada em unidades de vetores quadri—dimensionais.

20. PROCESSO de decodificação de áudio em estéreo em escala, de acordo com a reivindicação 19, caracterizado por a decodificação do vetor quadri—dimensional ser realizada de forma que dois subvetores codificados de acordo a pré— estados indicando se componentes de freqüêncía não-zeros de bits divididos estio codificados ou no de- codificada por aritmética, e dois subvetores decodificados de acordo a estados de codificação das amostras respectivas são restaurados em vetores quadri—dimensionais.

21. PROCESSO de decodificação de áudio em estéreo em escala, de acordo com a reivindicação 17, caracterizado por enquanto o dado de bits divididos dos componentes de freqtlncia respectivos ser decodificado a partir dos MSB5, a decodificação saltada caso o dado de bits divididos '0' e o dado de sinal é decodificado por aritmética quando o dado de bits divididos '1' aparece pela primeira vez.

22. PROCESSO de decodificação de áudio em estéreo em escala, de acordo com a reivindicação 15, caracterizado por a decodificação dos fatores de escala ser realizada pela decodificação do fator de escala máxima no fluxo de bits, decodificação aritmética das diferenças entre o fator de escala máxima e os fatores de escala respectivos e subtração das diferenças a partir do fator de escala máxima.

23. PROCESSO de decodificação de áudio em estéreo em escala, de acordo com a reivindicação 15, caracterizado por a etapa de decodificação dos fatores de escala compreenderem as etapas de: — decodificação do fator de escala máxima a partir dos fluxos de bits; — obtenção das diferenças entre o fator de escala máxima e os fatores de escala a serem decodificados pelo mapeamento e decodificação aritméticas das diferenças e mapeamento por inversão das diferenças a partir dos valores mapeados; e — obtenção do primeiro fator de escala pela subtração das diferenças a partir do fator de escala máxima, e obtenção dos fatores de escala para as faixas restantes através da subtração das diferenças a partir de fatores de escala anteriores.

24. PROCESSO de decodificação de áudio em estéreo em escala, de acordo com a reivindicação 15, caracterizado por a decodificação dos 5ndices de modelo codificado por aritmética ser realizada através das etapas de: - decodificação do indice mínimo de modelo aritmético no fluxo de bits, decodificação das diferenças entre o índice mínimo e os índices respectivos na informação lateral das camadas respectivas, e adição do índice mínimo e das diferenças.

25. APARELHO de decodificação de áudio em estéreo em escala para decodificação de dado de áudio codificado para apresentar taxas de bits assentadas, caracterizado por compreender: - uma porção de análise de fluxo de bits(300) para an lise dos dados necessários para os módulos respectivos nos fluxos de bits apresentando uma estrutura assentada; - uma porção de decodificação para decodificação pelo menos de fatores de escala e codificação aritmética dos índices de modelo e dado quantizado, na ordem de criação das camadas nos fluxos de bits apresentando uma estrutura assentada, o dado quantizado decodificado alternadamente para os respectivos canais através de análise da importância dos bits compondo os fluxos de bits, a partir dos bits significantes superiores aos bits significantes inferiores; — uma porção de restauração para restauração dos fatores de escala decodificados e dado quantizado em sinais apresentando as magnitudes originais; e — uma porção de mapeamento de frequência/tempo(100) para conversão por inversão dos sinais quantizados em sinais de um domínio temporal.

26. APARELHO de decodificação de áudio em estéreo em escala, de acordo com a reivindicação 25, caracterizado por compreender ainda: — uma porção de processamento em estéreo M/S(150, 330) para realizaço de processamento em estéreo M/S para verificação se o processamento em estéreo M/S foi ou no realizado no processo de codificação de fluxo de bits, e converso de um sinal de canal esquerdo e um sinal de canal direito em um sinal de adição de dois sinais e um sinal de subtração dos mesmos caso o processamento em estéreo M/S tenha sido realizado; — uma porção de previsão(140,340) para verificação se a etapa de previsão foi ou no realizada no processo de codificação de fluxo de bits, e previsão dos coeficientes de freqlncia do quadro atual caso a etapa de verificação tenha sido realizada; — uma porção de processamento intenso em estéreo(130) para verificação se o processamento em estéreo intenso foi ou no realizado no processo de codificação de fluxo de bits, e, caso o processamento intenso em estéreo tenha sido realizado, então uma vez que somente a informação quantizada da faixa de fator de escala para um dos dois canais (0 canal esquerdo) codificada, a realização do processamento intenso em estéreo para restauração da informação quantizada do outro canal (o canal direito) no valor do canal esquerdo; e — uma porção de modelagem de ruido temporal(120) para verificação se a etapa de modelagem de ruido temporal (TNS) foi ou no realizada no processo de codificação de fluxo de bits, e caso a etapa TNS tenha sido realizada, realização de modelagem ruido—temporal para controle do formato temporal do ruido de quantização no interior de cada janela para conversão.