PT100309B - Aparelho de codificacao e descodificacao de dados digitais de elevado rendimento - Google Patents

Aparelho de codificacao e descodificacao de dados digitais de elevado rendimento Download PDF

Info

Publication number
PT100309B
PT100309B PT100309A PT10030992A PT100309B PT 100309 B PT100309 B PT 100309B PT 100309 A PT100309 A PT 100309A PT 10030992 A PT10030992 A PT 10030992A PT 100309 B PT100309 B PT 100309B
Authority
PT
Portugal
Prior art keywords
data
bits
circuit
block
blocks
Prior art date
Application number
PT100309A
Other languages
English (en)
Other versions
PT100309A (pt
Inventor
Kyoyga Tsutsui
Osamu Shimoyoshi
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP03091183A external-priority patent/JP3089690B2/ja
Priority claimed from JP03091185A external-priority patent/JP3089691B2/ja
Application filed by Sony Corp filed Critical Sony Corp
Publication of PT100309A publication Critical patent/PT100309A/pt
Publication of PT100309B publication Critical patent/PT100309B/pt

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Description

FUNDAMENTO DA INVENÇÃO
A presente invenção refere-se a aparelhos de elevado rendimento para codificação de dados digitais e para a sua descodificação, por codificação de dados digitais de entrada pela chamada codificação de grande rendimento.
Hã uma certa variedade de codificações de elevado rendimento, de sinais de audio ou vocais, tais como, por exemplo a codificação de sub-bandas (SBC) de sinais de audio divisores, etc., no eixo dos tempos, para uma pluralidade de bandas de frequência, para codificação (ATC) de sinais de conversão no eixo dos tempos em sinais no eixo das frequências, por transformação ortogonal para a divisão numa pluralidade de bandas de frequências para a codificação de cada banda, e uma atribuição adaptativa de bits (APC-AB) de SBC, de combinação com codificação adaptativa preditiva (APC) para sinais divisores no eixo dos tempos para uma pluralidade de bandas, conver tendo os sinais das bandas em sinais da banda de base e efectuando uma pluralidade de ordens de análises lineares preditivas para codificação preditiva.
Por exemplo, na codificação de sub-bandas, depois de se dividirem os sinais numa pluralidade de bandas, convertem-se os sinais de cada banda em sinais no eixo das frequências, por transformação ortogonal, após o que se efectua a codificação para cada banda. Ao efectuar a transformação orto gonal, podem agrupar-se os sinais de audio de entrada em blocos, a um intervalo de uma unidade de tempo predeterminada (trama), e efectuar-se a transformação de coseno discreta, para cada blo co, para converter os sinais no eixo dos tempos em sinais no ei. xo das frequências. Ao efectuar a divisão na pluralidade de ban das, podem ser levadas em conta certas características do senti do da audição humano. Assim, podem dividir-se os sinais de audio numa pluralidade de, por exemplo, 25 bandas, de modo que a largura de banda se torne maior no sentido das bandas mais elevadas, conhecidas como bandas críticas. Na. codificação de sub-bandas, o número de bits atribuídos a cada banda é alterado d_i nâmica ou adaptativamente, para aumentar o rendimento de compressão, enquanto se mantém constante o número de bits por bloco com a duração de uma unidade de tempo.
Por exemplo, quando da codificação dos dados dos coeficientes da DCT (transformação discreta de coseno) proveniente da operação de processamento DCT por atribuição de bits, os dados dos coeficientes da transformação DCT, para cada banda, resultantes da operação de processamento da DCT para cada bloco são codificados com um número de bits atribuídos dinamicamente .
Na codificação de rendimento elevado, emprega-se activamente uma técnica de codificação de elevado rendimento, que faz uso do chamado efeito de máscara tendo em conta certas características do sentido da audição humano. 0 efeito de máscara significa um fenómeno no qual certos sinais são mascarados por outros sinais tornando-se inaudíveis. Assim, é tolerável o ruído abaixo de um determinado nível de mascaramento. 0 efeito de mascaramento pode ser tido em conta de modo que o número de bits atribuídos seja reduzido para componentes do sinal abaixo do nível de ruído tolerável, para reduzir a taxa de bits.
Se, com a codificação anterior, os sinais de audio de entrada forem divididos numa pluralidade de bandas, e se deve efectuar-se uma transformação ortogonal, tal como a DCT, para cada banda, isto é, se se efectuarem análises de frequência para cada banda, os sinais de cada banda são diyi didos em blocos, com um intervalo equivalente a unidades de tem po predeterminadas, isto é, na base de trama-a-trama, efectuando-se a transformação ortogonal para cada bloco de cada banda.
Por outro lado, os dados dos coeficientes (dados dos coeficientes da transformada DCT) produzidos pela transformação ortogonal são codificados e o número de bits atribuído no instante da codificação é atribuído para cada bloco na base de trama-a-trama.
Entretanto, os sinais de audio de entra da não são necessariamente sinais estacionários substancialmente livres de flutuações de nível, de modo que o nível dos sinais ê alterado de maneira variada. Por exemplo, os sinais podem ser sinais variados de maneira transitória, tais como sinais cujo nível de pico é alterado significativamente no interior de uma trama. Por exemplo, se os sinais forem sinais de audio de sons de percussão, provenientes de um instrumento de percussão, os sinais do som de percussão tornam-se sinais alterados de maneira transitória.
Se os sinais de audio com as propriedades variarem de estacionários para transitórios, ou vice versa, eles são unanimemente processados por transformação ortogonal, para cada bloco, na base de trama-a-trama, e os dados transformados são codificados, não podendo dizer-se que a codificação seja apropriada para as propriedades do sinal, de modo que não pode dizer-se que seja óptima para o sentido da audição a quali dade do som depois da codificação.
Quando a codificação deve ser efectuada utilizando o nível de ruído permissível, o número de bits atribuídos para a codificação é determinado com base na relação (ou na diferença) entre a energia no bloco e o nível de ruído tolerável conforme com o valor de mascaramento determinado a partir da energia no bloco.
Porém, hã sinais que têm o carácter de som musical (sinais que têm uma elevada tonalidade), entre os sinais de audio. Se os sinais tiverem uma tonalidade elevada, não pode calcular-se com precisão a atribuição de bits com base na energia bloco por bloco. Isto é, a energia dentro de um dado bloco, pode ser a mesma quando os dados em cada bloco são de elevada tonalidade que noutros casos. Não é nesse caso desejável fazer cálculos da atribuição dos bits baseados na energia constante, apesar do facto de as caracteristicas dos dados serem diferentes de bloco para bloco. Sobretudo, a atribuição pre cisa de bits não pode ser feita para os sinais de elevada tonalidade, resultando daí uma deterioração da qualidade do som. Is to é, apesar de ser necessário um grande número de bits para os sinais de elevada tonalidade, o número de bits necessário não pode ser atribuído a estes sinais se o número de bits for calcu lado com base na energia atrás referida, resultando assim novamente uma deterioração da qualidade do sinal.
Tendo em vista o estado da técnica atrás ilustrado, um objecto da presente invenção consiste em proporcionar um aparelho de rendimento elevado de codificação de dados digitais, no qual pode conseguir-se uma codificação por compre_s são de maior rendimento, mais adaptativa ãs propriedades ou características dos sinais de audio de entrada, e no qual podem produzir-se os sinais descodificados mais adaptados ao sentido da audição humano.
Um outro objecto da presente invenção consiste em proporcionar um aparelho de codificação e descodifi cação de dados digitais de elevado rendimento, no qual pode con seguir-se uma atribuição dos bits satisfatória, mesmo com sinais de elevada tonalidade, para melhorar a qualidade do som.
DESCRIÇÃO DA INVENÇÃO
Segundo a presente invenção, proporciona-se um aparelho de codificação de dados digitais de elevado rendimento, no qual os dados digitais de entrada são dispostos em blocos por meio de uma pluralidade de amostragens, se efectua
uma transformação ortogonal em cada bloco para produzir dados de coeficientes, sendo esses dados de coeficientes codificados com um número adaptativo de bits, compreendendo uma pluralidade de meios de transformação ortogonal para efectuar transformações ortogonais dos dados digitais de entrada com diferentes comprimentos dos blocos, caracterizado por apenas uma das saídas dos meios de transformação ortogonal ser escolhida, com base nas saídas dos referidos meios de transformação ortogonal.
Segundo a presente invenção, proporciona-se também um aparelho de codificação de dados digitais de elevado rendimento no qual os referidos dados digitais de entra da são divididos numa pluralidade de bandas, formando-se blocos, cada um constituído por uma pluralidade de amostras, em cada banda, efectuando-se uma transformação ortogonal em cada bloco da banda para produzir dados de coeficientes, sendo os dados de coeficientes codificados, compreendendo um circuito de decisão do comprimento dos blocos para determinar o comprimento dos blo cos para a transformação ortogonal de cada banda, com base nas características dos dados dos blocos antes da transformação ortc gonal de cada banda, sendo a referida transformação ortogonal de cada banda efectuada com o comprimento dos blocos determinado pelo referido circuito de decisão do comprimento dos blocos.
Os dados, digitais de entrada fornecidos a cada um dos meios de transformação ortogonal podem ser dados para cada banda crítica. A transformação ortogonal pode, por exemplo, ser a transformação de coseno discreta (DCT) ou a tranis formação de Fourier rápida (FFT). Neste caso, são os dados de coeficientes que são codificados.
Ao seleccionar a saída ou estabelecer o comprimento dos blocos, o processamento faz-se de modo tal que apenas se selecciona a saída dos meios de transformação ortogonal que minimizará o número dos bits atribuídos necessários para a codificação das saídas dos meios de transformação ortogonal (isto é, o número de bits necessário para a realização de uma determinada qualidade de som). Nota-se que o número de bits, trama por trama, fornecidos na saída dos meios de transformação ortogonal depois de terem sido codificados os dados provenientes da transformação transversal, é um número predeterminado. Porém, como se obtém a atribuição adaptativa de bits durante a codificação, o número de bits necessário para a codificação pode ser diferente do número de bits trama-a-trama predeterminado.
Portanto, se o número de bits necessário para a codificação for menor do que o número de bits predeterminado, os bits restantes redundantes podem ser usados para efectuar uma codificação mais satisfatória, de modo que, seleccionado a saída dos meios de transformação ortogonal que fornecerá o menor número de bits, pode produzir-se uma saída de codi. ficação Óptima. Além disso, mesmo que o número de bits necessário para a codificação se torne maior do que o predeterminado na base de trama-a-trama, pode obter-se uma saída codificada com menor deterioração devida ã codificação escolhendo a saída dos meios de transformação ortogonal que fornece o menor número de bits,,
Segundo a presente invenção, proporciona-se portanto um aparelho de codificação de dados digitais de elevado rendimento que compreende meios de análise de frequências, para a análise de frequências dos dados digitais de entra da, meios de ajustamento do nível de ruído, para determinar as energias de cada bloco constituído por uma pluralidade de dados de saída provenientes dos referidos meios de análise de frequên cias e ajustar o nível de ruído tolerável, com base nas energias, na base de bloco-a-bloco, meios de cálculo de coeficientes flutuantes para calcular os coeficientes flutuantes, com ba se nos dados do valor máximo em cada bloco, consistindo numa pluralidade de dados de saída provenientes dos meios de análise de frequências referidos, meios de codificação, para codificar saídas dos referidos meios de análise de frequências e um circuito de decisão do número de bits atribuídos para determinar o número de bits atribuídos, na altura da codificação, pelos refe ridos meios de codificação com base numa saída dos referidos meios de ajustamento do referido nível de ruído e uma saída dos referidos meios de cálculo dos coeficientes flutuantes.
Entre as características ou propriedades dos dados dos blocos ou tramas, antes da transformação orto gonal, há as características transitórias ou estacionárias dos sinais dentro da trama. As características transitórias ou esta cionárias dos sinais são verificadas com base nos valores calculados de variações temporais do limite superior das amostras no interior da trama ou valores das amostras no interior da trama antes da transformação ortogonal, ou valores calculados de variações temporais de energias na trama. Portanto, com o aparelho segundo a presente invenção, os comprimentos dos blocos de transformação ortogonal em cada faixa ou banda são alte rados de acordo com valores obtidos com base nos sinais estacio nários ou transitórios. A divisão de bandas pode ser feita de acordo com as chamadas bandas críticas.
Entre as técnicas de transformação orto gonal, contam-se a transformação de coseno discreta (DCT), para converter dados digitais de entrada, por transformação ortogonal, em dados espectrais, ou a transformação rápida de Fourier (FFT).
Nos meios de ajustamento do nível de ruído, prefere-se dividir a frequência de modo que a largura de banda se torne maior no sentido das frequências mais elevadas, para formar blocos por dados, para cada banda, e para determinar o nível de ruído tolerável com base nas energias bloco-por-bloco para ter em conta o chamado efeito de máscara. 0 efeito de máscara significa aqui, quer o efeito de máscara ao longo do eixo dos tempos, quer o ao longo do eixo das frequências.
Nos meios de cálculo dos coeficientes flutuantes, podem usar-se como coeficientes flutuantes factores de escala com base nos dados dos valores máximos no bloco constituído por uma pluralidade de dados de saída dos meios de análise de frequências. Em alternativa, podem usar-se os próprios dados dos valores máximos como um valor aproximado do coeficien te flutuante do bloco. Assim, nos meios de decisão do número de bits atribuídos, pode determinar-se o número de bits atribuídos para a descodificação com base no coeficiente flutuante do bloco e no nível de ruído tolerável como foi determinado para cada banda crítica tendo em conta o mascaramento. Neste caso, o núme ro de dados no bloco, nos meios de cálculo do coeficiente flutuante, é adaptado ou tornado igual ao nos meios de ajustamento do nível de ruído.
Para isso, o aparelho de codificação de dados digitais de elevado rendimento compreende meios de análise de frequências para analisar as frequências dos dados digitais de entrada, para converter os referidos dados digitais de entrada numa informação de amplitude e numa informação de fase, e meios de codificação para codificar a referida informação de amplitude e a referida informação de fase. Na altura da codificação pelos meios de codificação, o número de bits atribuídos ã informação de fase é reduzido a um valor menor do que o atribuído ã informação de amplitude, relativamente a uma baixa ou banda predeterminada da saída dos meios de análise de frequências.
Segundo a presente invenção, os dados di gitais de entrada são processados por transformação ortogonal com uma pluralidade de comprimentos dos blocos, sendo seleccionada uma das saídas dos meios de transformação ortogonal, com base nas saídas dos meios de transformação ortogonal. Uma saída de codificação óptima pode ser obtida seleccionando a saída que tem o menor número de bits necessários para a codificação.
Segundo a presente invenção o comprimen to dos blocos da transformação ortogonal de cada banda é ajusta do com base nas características dos dados do bloco ou trama, an tes da transformação ortogonal de cada banda, de modo que pode obter-se uma transformação ortogonal com um comprimento de blocos apropriado para as características do sinal e portanto pode obter-se uma codificação por compressão, com o número de bits adaptado às características do sinal.
Segundo a presente invenção, o número de bits atribuídos é ajustado usando não só o nível de ruído to lerável, mas também o coeficiente flutuante com base nos dados de valor máximo em cada bloco, de modo que pode atribuir-se um número suficientemente grande de bits a sinais de tonalidade elevada, embora se mantenham iguais as energias nos blocos.
Segundo a presente invenção, visto que não se produzem efeitos prejudiciais para o sentido da audição humana, produzidos quando a informação respeitante ao número de bits atribuídos à informação de fase for ajustado de modo a ser menor do que o atribuído à informação de amplitude, pode aumentar-se o factor de compressão de bits reduzindo a informação do
número de bits atribuídos à informação de fase.
Segundo a presente invenção, visto que a banda, na qual é ajustada a informação sobre o número de bits atribuído à informação de fase de modo a ser menor do que o atribuído à informação de amplitude, e a faixa ou banda mais elevada, pode reduzir-se a deterioração da qualidade do som.
Segundo a presente invenção, se a redução do número de bits para a informação de fase, relativamente ao da informação de amplitude, for predeterminado, basta transmitir a informação de amplitude ou a informação de fase simulta neamente com os dados codificados da informação de fase e da in formação de amplitude, de modo que pode reduzir-se ainda mais o número de bits necessários para transmitir a informação do núme ro de bits atribuídos.
Segundo a presente invenção, como o número de bits atribuídos para cada banda é ajustado utilizando o nível de ruído tolerável com base na chamada quantidade de mascaramento, tal como é calculada a partir das energias da informação de amplitude de cada banda, pode obter-se a redução dos bits sem deterioração da qualidade do som.
BREVE DESCRIÇÃO DOS DESENHOS
As figuras dos desenhos anexos represen tam:
A fig. 1, um esquema de blocos que mostra uma construção esquemática do aparelho de codificação de da dos digitais, de elevado rendimento, de acordo com uma primeira forma de realização da presente invenção;
A fig. 2, um esquema de blocos que mostra a construção esquemática de um codificador ilustrativo;
A fig. 3, uma vista esquemática que mos tra um bioco de processamento DCT, no caso de o comprimento dos blocos ser igual para todas as bandas;
A fig. 4, uma vista esquemática que mos tra um bloco de processamento DCT, no caso de o comprimento dos blocos para a faixa de frequências elevadas ser igual a 1/2 do comprimento da trama;
A fig. 5, uma vista esquemática que mos tra um bloco de processamento DCT, no caso de o comprimento dos blocos na faixa de frequências elevadas ser 1/4 do comprimento da trama, sendo para a faixa de frequências médias igual a 1/2 do comprimento da trama;
A fig. 6, uma vista esquemática que mos. tra um bloco de processamento DCT, no caso de o comprimento dos blocos na faixa de frequências elevadas ser 1/4 do comprimento da trama e para a faixa de frequências médias ser 1/4 do compri mento da trama;
A fig. 7, um fluxograma para ilustrar a decisão do número de bits atribuídos de primeira ordem e correc ção do número de bits;
A fig. 8, um esquema de blocos para ilustrar a construção esquemática de uma codificação de dados digitais de elevado rendimento numa segunda forma de realização da presente invenção;
A fig. 9A, um gráfico que mostra sinais transitórios típicos;
A fig. 9B, um gráfico que mostra sinais estacionários típicos;
A fig. 10, uma vista esquemática que mostra um bloco típico de processamento DCT;
A fig. 11, um esquema de blocos que mos tra uma construção esquemática do aparelho descodificador como contrapartida do aparelho de codificação de alto rendimento;
A fig. 12, um esquema de blocos que mo£ tra um aparelho codificador de dados digitais de elevado rendimento de acordo com uma terceira forma de realização da presente invenção;
A fig. 13, uma vista esquemática para explicação de um coeficiente flutuante de bloco e um nível de ruído admissível, por dado;
A fig. 14, um esquema de blocos que mos tra uma construção pormenorizada para o ajustamento do nível de ruído tolerável;
A fig. 15, um gráfico que mostra um espectro de Burke;
A fig. 16, um gráfico que mostra um espectro de mascaramento; e
A fig. 17, um gráfico que mostra uma síntese da curva de audibilidade mínima e um espectro de mascaramento .
MELHOR FORMA DE REALIZAÇÃO PRÁTICA DA INVENÇÃO
Com referência aos desenhos, descrevem-se agora em pormenor certas formas de realização preferidas da presente invenção.
A fig. 1 representa um aparelho de codj. ficação de dados digital de elevado rendimento para dividir dados digitais de entrada, tais como dados de audio, numa plurali. dade de bandas, de modo que a largura de banda seja maior no sentido das frequências crescentes, formando blocos, cada um dos quais é constituído por uma pluralidade de amostras, para cada uma das bandas, efectuando uma transformação ortogonal, por exemplo uma transformação de coseno discreta (dados de coeficientes DCT) e codificando os dados de coeficientes com um nú mero de bits atribuídos de maneira adaptativa. Com este aparelho de codificação de elevado rendimento, uma pluralidade de co dificadores, tais como quatro codificadores (2) a (5), cada um deles provido de meios de transformação ortogonal para efectuar a transformação ortogonal dos dados digitais de entrada para ca da banda, com comprimentos de blocos que são diferentes de uma banda para outra, apenas uma das saídas dos codificadores (2) a (5), isto é, uma das saídas dos meios de transformação ortogonal, é seleccionada com base nas saídas dos meios de transforma ção ortogonal dos codificadores (2) a (5). Isto é, o estado do comutador (7) é alterado com base no sinal de selecção proveniente do circuito de selecção (6) para seleccionar apenas uma das saídas dos codificadores (2) a (5).
Faz-se notar que a operação de selecção pelo circuito de selecção (6) é feita de modo tal que apenas a saída do codificador que tem o menor número de bits necessário para os codificadores que efectuam a operação de selecção é seleccionada. Isto é, embora o número de bits para cada trama à
saída dos codificadores (2) a (5) seja um número predeterminado, o número de bits efectivamente necessários para a codificação de uma dada trama é determinado por uma atribuição de bits adajo tativa tendo em conta o efeito de mascaramento, como atrás se descreveu. A selecção atrás mencionada é feita de modo tal que apenas a saída do codificador com o menor número de bits realmente necessário na operação de codificação é escolhido.
Assim, se o número de bits necessários para a codificação for menor do que o número de bits que é predeterminado numa base de trama-a-trama, os bits redundantes podem ser usados para efectuar uma codificação mais satisfatória. Por outro lado, seleccionando a saída do codificador com o menor número de bits, pode produzir-se a saída codificada mais sa tisfatória. Se o número de bits necessários para os codificadores (2) a (5) exceder o número de bits que é predeterminado numa base de trama-a-trama, pode produzir-se uma saída de codificação com a mínima deterioração devida à codificação, seleccionando a saída dos codificadores (2) a (5) que tem o menor número de bits necessários para a codificação.
Isto é, em cada um dos codificadores (2) a (5) do aparelho de codificação de dados digitais de eleva do rendimento segundo a presente invenção, como se mostra na fig. 2, os dados digitais de entrada, tais como dados de audio ou dados vocais, fornecidos através de um terminal de entrada (1), são dividiudos em frequência, grosseiramente em três bandas de frequências, por meio de filtros de aparelhos em quadratura QMF (41) e (42), de modo que a largura de banda aumente no sentido das frequências crescentes, de acordo com a divisão das bandas de frequência, segundo as chamadas bandas críticas. Nos circuitos DCT (43), (44) e (45), formam-se, em cada banda, blocos, cada um deles com uma pluralidade de amostras, produzidos por divisão e efectua-se uma transformação ortogonal (transformação do eixo dos tempos para o eixo das frequências), para cada bloco, para produzir dados de coeficientes (dados de coefici entes DCT). Entretanto, as saídas dos circuitos DCT (43), (44) e (45) correspondem a, por exemplo, duas bandas de frequências elevadas, três bandas de frequências médias e, por exemplo, 20 bandas de frequências baixas, de acordo com a banda de frequên cias críticas, respectivamente. Os dados de coeficientes DCT das bandas respectivas provenientes dos circuitos DCT (43) a (45) são codificados com um número de bits atribuídos, de manei ra adaptativa, por circuitos de codificação (46), (47) e (48). Isto é, a codificação dos dados de coeficientes DCT das três bandas nos circuitos de codificação (46) , (47) e (48) da presen te forma de realização é efectuada com o número de bits atribuídos com base em certas características do sentido da audição do homem.
Para efectuar a divisão de bandas atrás mencionada, fornecem-se dados digitais (0 - 22,1 KHz) obtidos por amostragem de sinais de audio analógicos, etc. em, por exem pio, 1 024 amostras, a um terminal de entrada (1) de cada um dos codificadores (2) a (5). Estes dados digitais são divididos pelos filtros QMF (41) e (42) grosseiramente em três bandas (0 - 5,5 KHz, 5,5 a 11,0 KHz e 11,0 a 22,1 KHz), de modo que a largura de banda seja maior no sentido das altas frequências. No filtro QMF (41), os dados digitais de 0 a 22,1 KHz são divididos em dois para produzir uma saída de 11,0 a 22,1 KHz e uma saída de 0 a 11,0 KHz, que são fornecidas ao circuito DCT (43) e ao filtro QMF (42), respectivamente. A saída de 0 a 11,0 KHz fornecida ao filtro QMF (42) é ainda dividida em duas pelo filtro QMF (42) para produzir uma saída de 5,5 a 11,0 KHz e uma saída de 0 a 5,5 KHz, que são fornecidas a circuitos DCT (44) e (45), respectivamente.
Em cada um dos circuitos DCT (43), (44) e (45), uma pluralidade de, por exemplo, 1 024 amostras, dos da dos das bandas fornecidos constituem uma trama (B), efectua-se uma transformação de Fourier para cada bloco formado pela trama (B), para produzir dados de coeficientes DCT. Faz-se notar que o comprimento dos blocos de processamento DCT em cada um dos circuitos DCT (43), (44) e (45) tem um valor diferente para cada um dos codificadores (2) a (5).
Por exemplo, com o codificador (2), o comprimento dos blocos DCT é o mesmo comprimento representado na fig. 3. Isto é, com o codificador (2), o comprimento dos blo cos DCT (bH) no circuito DCT (43) associado à faixa mais elevada de 11,0 a 22,1 KHz, o comprimento bM dos blocos de processa mento DCT no circuito DCT (44) associado com a faixa média de 5,5 a 11,0 KHz e o comprimento t>L dos blocos de processamento DCT associado à faixa inferior de 0 a 5,5 KHz, são seleccionados para serem iguais à trama, que tem a duração da unidade de tempo predeterminada atrás mencionada.
Com o codificador (3), o comprimento dos blocos de processamento DCT é escolhido para ser menor na faixa das frequências elevadas. Como se mostra na fig. 4. Isto é, com o codificador (3), o comprimento dos blocos no circuito DCT (43) da faixa elevada é metade do comprimento b„ dos blocos
XI no circuito DCT (45) da faixa baixa e do comprimento dos blo cos no circuito DCT (44) da faixa média. No presente exemplo, o bloco de frequências elevadas está dividido em blocos b^ e b^·
No codificador (4), o comprimento dos blocos de processamento DCT é escolhido para ser menor nas faixas média e alta, como se mostra na fig. 5. Isto é, com o comprimento b^ dos blocos na faixa baixa, a faixa média tem um com primento de blocos b^ e bM2 igual a, por exemplo, metade do comprimento dos blocos na faixa baixa e a faixa alta tem compri mentos dos blocos bH1, bH2, bH3 e bH4 iguais a um quarto do com primento dos blocos na faixa baixa ou metade do comprimento dos blocos da faixa média.
No codificador (5), o comprimento dos blocos de processamento DCT é escolhido para ser menor nas faixas de frequências alta e média e maior nas faixas de frequências baixas, como se mostra na fig. 6. Isto é, com o comprimen to de blocos bL da faixa baixa, a faixa alta tem comprimentos
iguais a um quarto do comprimen to dos blocos na faixa baixa, enquanto a faixa média tem compri.
mentos dos blocos b^, bM2, bM3 e bM4 iguais a, por exemplo, um quarto do comprimento dos blocos na faixa baixa.
Os comprimentos dos blocos das faixas alta e média são escolhidos para ser menores do que o comprimen to dos blocos da faixa baixa, como atrás se discutiu em ligação com as fig. 4 a 6, pela razão seguinte. Isto é, a resolução de frequências no sentido da audição do homem não é tão elevada na faixa elevada, sendo no entanto elevada na faixa média, de modo que é necessário manter a resolução de frequências na faixa bai xa e portanto o comprimento dos blocos, para o processamento DCT, não pode diminuir-se excessivamente na faixa baixa. Por ess ta razão, o comprimento dos blocos é escolhido para ser maior na faixa baixa. Por outro lado, como o período estacionário é maior com os sinais na faixa baixa que com os sinais na faixa alta, ê eficiente encurtar os blocos nas faixas alta e média (isto é, aumentar a resolução temporal). Nesta consideração, o comprimento dos blocos das faixas alta e baixa é escolhido para ser menor e o da faixa baixa é escolhido para ser maior, na pre sente forma de realização.
Assim, na presente forma de realização, para satisfazer simultaneamente os requisitos de resolução no eixo das frequências, tendo em vista o sentido da audição do ho mem, e os requisitos para a resolução no eixo dos tempos, aumen ta-se o número de amostras para a faixa baixa (0 a 5,5 KHz), pa ra aumentar a resolução das frequências, enquanto que a resolução temporal é aumentada para a baixa média (5,5 a 11,0 KHz).
Tendo em vista também as características dos sinais de audio de entrada, é eficiente encurtar os blo cos de processamento DCT para as faixas alta e média.
Isto é, os comprimentos dos blocos para o processamento DCT podem efectivamente variar consoante os sinais de audio de entrada forem sinais transitórios ou sinais e£ tacionãrios. No caso dos sinais estacionários, é eficiente esta belecer os comprimentos dos blocos das bandas respectivas de mo do a terem comprimentos iguais, como se mostra na fig. 3, enquan to que, no caso dos sinais transitórios, é eficiente estabelecer os comprimentos dos blocos das bandas das faixas alta e média de modo a serem menores, como se mostra na fig. 6. Reduzindo-se o comprimento dos blocos de processamento DCT para os sinais transitórios desta maneira, podem atribuir-se mais bits aos blocos na trama (B), que tem um nível de pico elevado (parte do sinal transitório) durante a codificação, enquanto que po de diminuir-se o número de bits para outros blocos. Deste modo, os bits podem ser atribuídos aos blocos verdadeiramente com necessidade de bits em cada banda da trama (B) para seguir as variações temporais do espectro. Por outro lado, pode evitar-se a codificação redundante de sinais com espectros semelhantes em cada bloco da trama (B) , no caso dos sinais estacionários.
Entretanto, os comprimentos dos blocos para o processamento DCT para as bandas respectivas não são limitados aos exemplos apresentados nas fig. 3 a 6. Assim, pode encarar-se uma variedade de padrões dos comprimentos dos blocos por exemplo reduzindo ainda mais o comprimento dos blocos na faixa elevada ou reduzindo simultaneamente o comprimento dos blocos para a faixa baixa.
Em cada um dos codificadores (2) a (5), o processamento DCT é efectuado, em cada um dos circuitos DCT (43) a (45) na fig. 2, para proporcionar comprimentos de blocos diferentes para cada banda, para produzir dados de coeficientes DCT, que são transmitidos para os circuitos de codificação (46) a (48).
Entretanto, cada um dos codificadores (2) a (5) efectua a codificação por atribuição adaptativa, pelo facto de os circuitos de codificação (46) a (48) terem a disposição seguinte.
Isto é, cada um dos codificadores (2) a (5) está provido de um circuito primário (60) de decisão da atribuição do número de bits, para determinar o número de bits efectivamente necessário para os dados de coeficientes da codificação DCT na trama (B), a partir dos circuitos DCT (43) , (44) e (45), isto é, o número de bits necessário para realizar uma qualidade predeterminada do som, e um circuito (61) de correcção do número de bits para efectuar a distribuição dos bits ou a redução dos bits para ajustar o número primário de bits deter minado pelo circuito (60), para preajustar o número de bits final na trama (B). Assim, a codificação dos dados dos coeficientes DCT em cada um dos circuitos de codificação (46) a (48) é efectuada pelo número de bits obtido corrigindo o número primário de bits pelo circuito (61) do número de bits, isto é, o referido número de bits final.
Entretanto, é determinado o número primário de bits no circuito (61) de decisão da atribuição de bits primários, tendo em consideração o chamado efeito de mascaramen to, que vai agora ser explicado.
O mascaramento está relacionado com cer tas características do sentido da audição do homem. Isto é, entre as características do sentido da audição do homem, no que respeita aos sons, hã a que é denominada por efeito de mascaramento, que se divide num efeito de mascaramento temporal e um efeito de mascaramento concorrente. 0 efeito de mascaramento concorrente é um efeito no qual um som ou um ruído pouco intenso é mascarado por um som mais intenso produzido concorrentemen te, tornando-se portanto inaudível. 0 efeito de mascaramento temporal é um efeito tal que um som ou um ruído pouco intenso são mascarados por um som mais intenso produzido temporalmente antes do ruído pouco intenso (mascaramento em avanço) ou por um som mais intenso temporalmente depois do som pouco intenso (mas caramento em atraso), tornando-se portanto inaudível. Devido às características do sentido da audição do homem, o efeito do mas caramento em avanço é mais demorado, por exemplo, cerca de 100 ms, enquanto que o mascaramento em atraso dura menos tempo, da ordem dos 5 ms. O nível do efeito de mascaramento (quantidade de mascaramento) ê da ordem de 20 dB e de 30 dB, respectivamente para o mascaramento em avanço e em atraso.
Portanto, se se tiver em consideração o efeito de mascaramento, no instante da atribuição de bits na tra ma (B), pode obter-se uma atribuição dos bits óptima. Isto é, como o número de bits pode ser reduzido para a parte do sinal mascarada, sem efeitos adversos no sentido da audição, pode reduzir-se o número de bits para a parte do sinal mascarada para realizar a codificação efectiva com um menor número de bits. O nível de mascaramento ou a quantidade de mascaramento pode ser determinada com base na soma das energias das bandas críticas respectivas. Para determinar a quantidade de mascaramento, pode também determinar-se a quantidade de mascaramento de sinais de uma dada banda crítica por outras bandas críticas. 0 nível de ruído tolerável para cada banda é determinado com base na quantidade de mascaramento e o número de bits atribuídos para a codificação pode ser determinado com base no nível de ruído tolerável para cada banda.
O número primário de bits, assim determinado pelo circuito (60) de decisão do número primário de bits atribuídos, é transmitido para o circuito (61) de correcçao do número de bits, efectuando este circuito (61) a distribuição dos bits ou a redução dos bits para adaptar o número primário de bits determinado pelo circuito (60) ao número final de bits atrás referido, preajustado na trama (B).
A sequência de operações para determinar o número primário de bits pelos circuitos (60) e (61) para a distribuição ou redução dos bits está indicada no fluxograma da fig. 7.
Com referência a este fluxograma, consjl derando em primeiro lugar a etapa (Sl), o número primário de bits atribuídos determinado pelo circuito (60) de decisão do nú mero de bits primários a atribuir, isto é o número primário de bits realmente necessário na codificação nos circuitos de codificação (46), (47) e (48), calculado com base na quantidade de mascaramento calculada, é substituído na variável nsumO. Na eta pa (S2) , esta variável nsumO é enviada para o circuito (61) de correcçao do número de bits, que substitui a variável nsumO por uma variável nsum.
Na etapa (S3), verifica-se se a variável nsum é menor ou não é menor que um número nlimit, que indica o número de bits final preajustado na trama (B). Se a variável nsum for menor do que o valor nlimit, o programa segue para a etapa (S4) e, se a variável nsum não for menor do que o valor nlimit, o programa prosegue na etapa (S5).
Se a variável nsum for menor do que o valor nlimit, que indica o número final de bits, o número de bits é excessivo. Assim, na etapa (S4), o número de bits redundantes (o número de bits correspondentes à diferença entre a variável nsum e o valor limite nlimit) ê depois distribuído na tra ma (B). Os bits redundantes são distribuídos nas bandas ou blocos para melhorar ainda a qualidade do som. O número de bits, depois da distribuição de bits, é reenviado para a etapa (S3).
Na etapa (S5), verifica-se se a variável nsum é maior do que o valor limite que indica o número final de bits, ou não é maior que esse valor. Se a variável nsum não for maior do que o valor nlimit, torna-se a variável nsum igual ao valor nlimit tendo em vista a etapa (S3) para terminar o processamento. Se a variável nsum for maior do que o valor nlimit, o programa prossegue para a etapa (S6).
Se a variável nsum for maior do que o valor nlimit, há falta de bits. Assim, na etapa (S6) , o número de bits em falta é subtraído do número de bits correspondentes ao valor da variável nsum. A redução de bits é feita a partir da faixa ou bloco que não afecta a qualidade do som. 0 número de bits depois da redução é reenviado para a etapa (S5).
Pela sequência de operações representada no fluxograma da fig. 7, corrige-se o número de bits fazendo -se a codificação nos circuitos de codificação (46) a (48) com base do número de bits assim corrigido.
Os dados codificados provenientes dos circuitos de codificação (46) a (48) são transmitidos para um circuito de síntese (50). A informação referente ao número primário de bits é determinada pelo circuito (60) de decisão do nú mero de bits primários a atribuir (informaçnão que indica o número de bits necessário para a realização de uma qualidade de som predeterminada) é também transmitida para o circuito de sín tese (50). Os dados das bandas respectivas são combinados no circuito de síntese (50) e, entre os dados assim combinados, dá -se saída pelo terminal de saída (52) dos dados codificados, en quanto que a informação respeitante ao número de bits primário sai pelo terminal de saída (53).
As saídas dos terminais de saída (52) e (53) na fig. 2 são fornecidas pelos codificadores (2) a (5) como se mostra na fig. 1. Os dados codificados provenientes dos codificadores (2) a (5) são enviados para o comutador (7), enquanto que a informação respeitante ao número de bits primário é enviado para o circuito de selecção (6).
No circuito de selecção (6), apenas a saída daquele dos codificadores (2) a (5) no qual se minimiza o número de bits necessário para a codificação, isto é, o número de bits necessário para a realização da qualidade de som predeterminada, é seleccionada, com base na informação respeitante aos números de bits primários respectivos enviados dos codifica dores (2) a (5), como atrás se mencionou, sendo os sinais assim seleccionados transmitidos para o comutador (7). Assim, o comutador (7) efectua a operação de comutação para dar saída apenas a uma das saídas codificadas a ela fornecidas, provenientes dos codificadores (2) a (5), com base no sinal de selecção atrás re ferido. Deste modo, apenas a saída codificada assim seleccionada sai no terminal de saída (8).
Descodificando a saída codificada, por meio de um descodificador, não representado, com base na informação atrás mencionada, respeitante à atribuição dos bits primã rios, o som produzido tem uma óptima qualidade sonora.
Como atrás se descreveu, com o aparelho de codificação de dados digitais de grande rendimento, apenas o sinal de saída da saída optimizada do codificador é seleccionada nas saídas dos codificadores (2) a (5), para produzir dados codificados, podendo os dados codificados ser codificados e con vertidos em som para produzir uma qualidade de som óptima. Também, visto que se selecciona a saída efectivamente codificada, o bloco seleccionado para o processamento tem um comprimento de blocos óptimo, enquanto que a selecção do comprimento do bloco é também facilitado. 0 aparelho segundo a presente invenção po de ser adaptado a um aparelho de codificação para dados grava dos num meio de embalagem, por exemplo um disco compacto (CD). Como neste caso o utilizador apenas tem de possuir um descodifjt cador (leitor), o aparelho codificador pode ter uma dimensão qualquer.
Na forma de realização atrás descrita, os circuitos DCT (43) a (45) com blocos de processamento dife rentes estão dispostos em cada um dos codificadores (2) a (5).
Em alternativa, pode proporcionar-se apenas um codificador, pro porcionando-se um circuito DCT para efectuar o processamento DCT, com a função de efectuar operações de processamento DCT com diferentes comprimentos dos blocos de processamento, para cada banda. Neste caso, apenas é seleccionada a saída do circui to DCT, da pluralidade de circuitos DCT associados, cujas bandas respectivas têm o número mínimo de bits necessário para a codificação.
Num tal aparelho de codificação de elevado rendimento, apenas é proporcionado um codificador, em vez da pluralidade de codificadores, como no caso da fig. 1. Comparando a construção do codificador com a construção representada na fig. 2, os circuitos DCT (43) a (45) (circuitos DCT) não estão associados numa relação de um para um, como na fig. 2, mas sim proporciona-se uma pluralidade de circuitos DCT correspondentes ao número de comprimentos de blocos nas bandas respectivas nas fig. 3 a 6. Por exemplo, proporcionam-se três circuitos DCT com diferentes comprimentos dos blocos para a faixa elevada, enquanto que se proporcionam três circuitos DCT com três compr_i mentos de blocos diferentes para a faixa média e um só circuito DCT para a baixa baixa. Por outras palavras, proporcionam-se três circuitos DCT para a faixa elevada para processamento DCT, com três espécies de comprimentos de blocos correspondentes ao comprimento de bloco b^ da fig. 3, aos comprimentos de bloco bHi e bH2 da fig. 4 e aos comprimentos de blocos b^^, bH2, e bH4 das fig. 5 e 6. De maneira análoga, proporcionam-se três circuitos DCT para a faixa média para processamento de dados DCT da faixa média com três espécies de comprimentos de blocos correspondentes ao comprimento de blocos b^ das fig. 3 e 4, aos comprimentos de blocos b^ e b^ úa fig. 5 e aos comprimentos de blocos bM1, bM2, bM3 e bM4 da fig. 6, enquanto que se propor ciona um circuito DCT para a faixa baixa para processamento DCT de dados da faixa baixa com um só comprimento de blocos correspondente ao comprimento de blocos b^ representado nas fig. 3 a
6. Transmitindo as saídas dos circuitos DCT para o circuito de selecção (6), e seleccionando apenas uma das saídas do circuito DCT para cada faixa, pode obter-se um processamento semelhgante ao obtido com a disposição da fig. 1. Deste modo, pode obter-se o efeito semelhante ao obtido na disposição da fig. 1, tendo no entanto sido simplificada a construção.
Na fig. 8, está representada uma forma de realização modificada do aparelho de codificação de dados di gitais de alto rendimento. 0 aparelho inclui circuitos (49), (50) e (51) de decisão dos comprimentos dos blocos, para determinar os comprimentos dos blocos da transformação ortogonal para cada banda, com base nas características (por exemplo de transitórios ou estacionários) dos dados dos blocos antes da transformação ortogonal para cada banda (dados trama-a-trama du rante um tempo predeterminado). As operações da transformação ortogonal são realizadas por estes circuitos (49) a (51) com ba se nos comprimentos dos blocos determinados para as faixas respectivas. Entretanto, inclui-se nos circuitos DCT (46) a (48) un dispositivo para alterar as dimensões dos blocos.
Com referência ã fig. 8, transmitem-se também sinais de saída para os circuitos de decisão do comprimento dos blocos (49) a (51) . Nestes circuitos, verifica-se se os dados na trama (4) dos dados de audio de entrada são sinais transitórios ou sinais estacionários e, com base no resultado obtido, fornece-se na saída um sinal de decisão do comprimento dos blocos. 0 sinal de decisão do comprimento dos blocos faz com que o comprimento dos blocos do processamento DCT nos circuitos DCT (43) a (45) se torne variável.
Nos circuitos (49) a (51) de decisão do comprimento dos blocos associados com estas bandas, determina-se o nível de pico de cada amostra para cada um dos blocos (b^), (b2)t (b3) e (b^), obtido dividindo o comprimento da trama (B) em quatro partes, e determinam-se variações temporais no nível de pico das amostras para estes blocos (b^), )r (b^) e (b^) . Por exemplo, determinam-se um nível de pico máximo Max^ e um nível de pico mínimo Min^ a partir dos níveis de pico PK^, PK2, PK3 e PK^ dos blocos b^, b2, b3 e b^ e compara-se a relação MaXpk/Minpk com um valor dentro de uma faixa de referência e, se a relação for maior do que o valor de referência, determi na-se que o sinal dentro da trama (B) é um sinal transitório, enquanto que se a relação for menor do que o valor de referência, o sinal dentro da trama (B) ê considerado um sinal estacio nário. Se a relação estiver dentro da faixa de referência, determina-se que o sinal está entre um sinal transitório e um sinal estacionário. As fig. 9A e 9B mostram exemplos do sinal transitório e do sinal estacionário, respectivamente.
Os circuitos (49) a (51) podem também ser concebidos para realizar uma decisão sobre o comprimento dos blocos com base nas energias do sinal nos blocos b^, b2, bg e b^. Neste caso, determinam-se as energias nos blocos respectivos, determina-se a relação entre as energias máxima e mínima e comparam-se a relação e as energias da faixa de referência do sinal, com uma operação de efectivação e detecção, como atrás se mencionou.
A operação de detecção atrás mencionada é efectuada nos circuitos (49) a (51) de decisão do comprimento dos blocos nos quais se determinam esses comprimentos dos blocos em conformidade com os resultados detectados. 0 processamen to DCT nos circuitos (43) a (45) de processamento DCT é efectua do de acordo com os comprimentos dos blocos assim determinados nos circuitos (49) a (51) de decisão dos comprimentos dos blocos.
Se se verificar que os sinais são sinais estacionários pelos circuitos (49) a (51), estabelece-se o comprimento dos blocos de cada banda de modo a ter o mesmo comprimento, tal como o comprimento da trama (B). Assim, ajustam-se os comprimentos dos blocos aos valores b„, b.. e bT para a faixa elevada de 11,0 a 22,1 KHz, para a faixa média de 5,5 a 11,0 KHz e para a faixa baixa de 0 a 5,5 KHz, respectivamente.
Inversamente, se se verificar que o sinal é um sinal transitório, os comprimentos dos blocos são ajujs tados de modo tal que são menores para as faixas alta e média e maiores para a baixa baixa, como se representa na fig. 6. Isto é, para o comprimento dos blocos bL para a faixa baixa, correspondente à trama (B), os comprimentos dos blocos para as faixas alta e média são ajustados de modo a ser um quarto dos compri mentos dos blocos b^. No exemplo da fig. 6, os blocos da faixa alta são de comprimentos bH^, bH2, bH3 e bH4, enquanto que os blocos da faixa média têm comprimentos b^, b^, b^3 e b^4Se o sinal for um sinal intermédio entre sinais transitórios e sinais estacionários, os comprimentos dos blocos são tais que, para o comprimento de blocos bL para a faixa baixa, o comprimento dos blocos para a faixa média é igual a B^, igual ao dos da faixa baixa, ou b^ ou b^/ igual a metade do da faixa baixa, enquanto que o dos blocos da faixa alta é bHl' bH2' bH3 e ^4' ^ue sã° meta-de ou um quarto do comprimento para a faixa baixa.
Embora o comprimento bL dos blocos da faixa baixa seja constante nas formas de realização das fig. 3 a 6, esse comprimento dos blocos da faixa baixa pode também ser variável de acordo com os sinais. Os comprimentos dos blocos pa ra as faixas podem ser divididos para além de metade ou um quar to do comprimento da trama (B).
Os dados no interior da trama (B) para as faixas respectivas, constituídos por uma pluralidade de tramas são processados por procedimentos DCT, pelos circuitos DCT (43) a (45), por comprimentos dos blocos com base nos sinais de decisão dos comprimentos dos blocos provenientes dos circuitos (49) a (51). Isto é, o procedimento DCT para cada banda é efectuado com comprimentos dos blocos de acordo com as característjL cas dos sinais dentro da trama (B).
Entretanto, o comprimento da trama no processamento DCT pelos circuitos DCT (43) a (45) é seleccionado por forma a ser igual a 1 024 amostras menos uma sobreposição (OL), como se representa na fig. 10, que mostra o caso do sinal intermédio entre sinais transitórios e sinais estacionários, em associação com a fig. 5. A transformação ortogonal pode também ser uma transformação de coseno discreta, além de DCT.
Transmitem-se também saídas dos circuitos (49) a (51) de decisão do comprimento dos blocos para os circuitos de codificação (46) a (48), adaptadas para codificar os dados de coeficientes DCT provenientes dos circuitos DCT (43) a (45).
Se se detectar que os dados no interior da trama (B) são sinais transitórios e o comprimento dos blocos de processamento DCT forem encurtados nos circuitos DCT (43) a (45), a codificação dos dados dos coeficientes DCT é efectuada por atribuição adaptativa dos bits no interior da trama (B) nos circuitos de codificação (46) a (48) a jusante dos circuitos DCT (43) a (45). No exemplo da fig. 9A, são atribuídos mais bits ao bloco b^, que tem o nível de pico máximo entre os blocos b^, b2, b3 e b4, enquanto os números de bits são reduzidos para os restantes blocos b^, b2 e b4. Deste modo, podem atribuir-se mais bits ao bloco que verdadeiramente necessita de bits, neste caso o bloco b3, para seguir as variações espectrais temporais. A atribuição de bits neste caso pode ser efectuada tendo em con ta o efeito de mascaramento.
Se se detectar que os dados no interior da trama são sinais estacionários e se se seleccionarem os comprimentos dos blocos de processamento DCT para serem mais com pridos nos circuitos DCT (43) a (45), a codificação nos circuitos de codificação (46) a (48) é feita com o comprimento da tra ma (B) como comprimento unitário. No exemplo da fig. 9B, a codjL ficação é efectuada à base da trama, em vez da divisão nos quatro blocos b^, b2/ bg e b^. Isso dispensa a codificação sobreposta de sinais com espectro idêntico no interior da trama (B).
Além disso, no caso dos sinais estacionários, pode aumentar-se a precisão das análises espectrais nos circuitos DCT (43) a (45). Os cálculos de mascaramento se forem feitos, são também melhorados na sua exactidão, de modo que pode reduzir-se o número de bits usados para a codificação nos circuitos de codificação (46) a (48).
Saídas dos circuitos de codificação (46) a (48) são fornecidas a-partir de terminais de saída (52), (54) e (56). Saídas dos circuitos (49) a (51) de decisão do comprimento dos blocos são também fornecidas a partir dos terminais de saída (53), (55) e (57), como sub-dados. Entretanto, no caso dos sinais estacionários, o número de bits para os sub-dados po de ser menor que no caso dos sinais transitórios. No caso dos sinais transitórios, os sub-dados associados aos quatro blocos são fornecidos nos terminais de saída (53), (55) e (57). No caso dos sinais estacionários, como os sub-dados podem ser os dados com base na trama (B), o número de bits para os sub-dados pode ser reduzido.
Com o aparelho de codificação de dados digitais de elevado rendimento atrás descrito, como os comprimentos dos blocos para a transformação ortogonal para as faixas respectivas são determinados pelos circuitos de decisão (49) a (51), com base em características, tais como o carácter transitório ou estacionário dos dados da trama para as faixas respectivas antes da transformação ortogonal, e o processamento DCT para as faixas respectivas ê efectuado pelos circuitos DCT (43) a (45) pelos comprimentos dos blocos determinados de banda para banda, a codificação pode ser feita em conformidade com as características do sinal, por exemplo o seu carácter transitório ou estacionário.
A fig. 11 representa, num esquema de blocos, um aparelho de descodificação, que é a contrapartida do
aparelho de codificação de elevado rendimento segundo a presente invenção. Com referência à fig. 11, fornecem-se dados codifi cados provenientes dos terminais de saída (52), (54) e (56) do aparelho de codificação, a terminais de entrada (152), (155) e (156), enquanto que se fornecem sub-dados provenientes dos terminais de saída (52), (54) e (56) do aparelho de codificação aos terminais de entrada (153) , (155) e (157) . Os dados codificados e os sub-dados são fornecidos a circuitos de descodificação (146), (147) e (148), adaptados para descodificar os dados codificados com base nos sub-dados. Os dados descodificados são fornecidos a circuitos de transformação de coseno discreta inversa (IDCT) (143), (144) e (145) adaptados para efectuar uma operação que é o inverso do processamento pelos circuitos DCT (43) a (45) (transformação coseno discreta inversa). Os referidos sub-dados são também fornecidos aos circuitos (IDCT) (143) a (145) , de modo que se efectua o processamento pelos circuitos com base nestes sub-dados. Uma saída do circuito IDCT (143) é fornecida a um circuito IQMF (141), adaptado para efectuar uma operação de filtragem, inversa da operação realizada pelo filtro QMF (41). Saídas dos circuitos IDCT (14) e (15) são forneci das a um circuito IQMF (142) , adaptado para realizar uma operação de filtragem inversa da operação realizada pelo filtro QMF (42). Como uma saída do circuito IQMF (142) é fornecida ao circuito IQMF (141), obtém-se um sinal de áudio digital a partir do circuito IQMF (141), que é uma combinação de sinais dividida em bandas respectivas. Este sinal de audio é fornecido numa saí da com os terminais (130).
Descreve-se uma forma de realização com referência à fig. 12.
Um aparelho representado na fig. 12 inclui um circuito (102) analisador de frequências para analisar as frequências dos dados digitais de entrada, um circuito (104) de cálculo da energia e um circuito (105) de cálculo do mascara mento como meio de ajustamento do nível de ruído para estabelecer o nível de ruído tolerável bloco-por-bloco dos dados de saí da provenientes do circuito analisador de frequências (102), um circuito (107) de cálculo da flutuação dos blocos para calcular o coeficiente de flutuação dos blocos com base nos dados de va26
lor máximo na pluralidade de blocos de dados de saída do circujL to (102) analisador de frequências, um circuito (103) de codifjL cação para codificar a saída do circuito (102) de análise de frequências e um circuito (106) de decisão do número de bits atribuídos, para determinar o número de bits atribuídos na altu ra da codificação pelo circuito (103) de codificação, com base na saída dos meios de ajustamento do nível de ruído e na saída do circuito (107) de cálculo do coeficiente de flutuação dos blocos.
O circuito (102) de análise de frequências pode ser um circuito independente ou pode ser usado simultaneamente com circuitos DCT da fig. 2. 0 circuito de codificação (103) ê uma contrapartida dos circuitos de codificação (46) a (48) da fig. 2.
No presente aparelho de codificação, re presentado na fig. 12, fornecem-se dados digitais de entrada, por exemplo dados de audio, a um terminal de entrada (100). Estes dados de audio de entrada são fornecidos ao circuito de aná lise de frequências (102) para analisar os dados de audio. No circuito (102) de análise de frequências convertem-se os dados digitais de audio de uma pluralidade de amostras em dados espec trais (dados de coeficientes DCT) por uma transformação ortogonal, tal como a DCT.
Dados de saída provenientes do circuito (102) são fornecidos ao circuito codificador (103) onde são codificados por atribuição adaptativa de bits antes de serem fornecidos no terminal de saída (108).
O dispositivo seguinte é usado para rea lizar a codificação por atribuição adaptativa de bits pelo circuito codificador (103).
Assim, os dados espectrais provenientes do circuito de análise de frequências (102) são transmitidos pa ra o circuito (104) de cálculo de energia, como meios de ajusta mento do nível de ruído e para o circuito (107) de cálculo da flutuação dos blocos.
No circuito (104) de cálculo de energia formam-se blocos, cada um deles formado por uma pluralidade de dados espectrais provenientes do circuito (102) de análise. Na presente forma de realização, a faixa de frequências é dividida por exemplo em 25 bandas, de modo que a largura de banda torna-se maior no sentido das frequências mais elevadas, de acordo com as bandas críticas que tomam em conta certas características do sentido de audição do homem. Calculam-se as energias de uma banda crítica para a outra, isto ê, a soma das energias dos dados espectrais de uma banda para a outra.
Os pormenores do circuito (104) de cálculo da energia e dos circuitos a jusante são a seguir explicados, com referência à fig. 14.
Os dados de energia para as bandas respectivas, provenientes do circuito (104) de cálculo da energia, são transmitidos para um circuito (105) de cálculo do mascaramento, que calcula a quantidade de mascaramento, levando em con ta o efeito de mascaramento com base nos dados de energia para as faixas respectivas. Entretanto, pode calcular-se o nível de ruído tolerável tendo em conta a chamada curva de igual intensi dade acústica nas caracteristicas da audição do homem, simultaneamente com os cálculos do mascaramento, como se mostra na fig. 14.
Como atrás se descreveu, a informação respeitante ao nível de ruído permissível para as bandas respec tivas, que teve em conta o chamado efeito de máscara em certas caracteristicas do sentido da audição do homem com base nas energias para as bandas críticas respectivas, é transmitida para o circuito (106) de decisão da atribuição do número de bits. Fornecem-se igualmente saídas do circuito de cálculo da flutuação dos blocos ao circuito (106) de decisão da atribuição do nú mero de bits.
No circuito (107) de cálculo da flutuação dos blocos, executa-se a chamada flutuação dos blocos para cada um dos blocos, cada um constituído por uma pluralidade de dados espectrais fornecidos a partir do circuito (102) analisador de frequências. Na operação de flutuação dos blocos, escolhe-se um dado de valor máximo dos dados espectrais em cada blo co e obtém-se um factor de escala, ou o seu valor aproximado correspondente aos dados do valor máximo, como factor de redução dos blocos à escala. A informação respeitante ao coeficiente de flutuação dos blocos é transmitida para o circuito (106) de decisão da atribuição do número de bits. Como valor aproxima do do coeficiente de flutuação dos blocos, podem transmitir-se os próprios dados do valor máximo para o circuito (106) de deci são da atribuição do número de bits.
O circuito (106) de decisão da atribuição do número de bits decide sobre o número de bits atribuídos, com base na informação respeitante ao nível de ruído tolerado calculado para cada banda a partir do circuito (105) de cálculo do mascaramento e da informação do coeficiente de flutuação dos blocos.
circuito (106) de decisão da atribuição do número de bits divide o nível de ruído tolerável para ca da banda proveniente do circuito (105) de cálculo do mascaramen to pelo número de dados em cada banda, designadamente o número de dados espectrais na banda, para calcular o nível de ruído to lerável por dado espectral em cada banda. 0 circuito (106) também calcula a informação respeitante ao número de bits atribuídos com base no nível de ruído tolerável por dado e no coeficiente de flutuação dos blocos por bloco.
Entretanto, ao determinar o número de bits atribuídos, adapta-se o número dos dados espectrais, na al. tura do cálculo do coeficiente de flutuação no circuito (107) de cálculo da flutuação dos blocos, ao número dos dados espectrais na altura do cálculo do nível de ruído tolerável no circuito (104) de cálculo da energia e no circuito (105) de cálculo do mascaramento, como meio de estabelecimento do nível de ruído. Por outras palavras, ao decidir-se o número de bits atri. buídos, adapta-se o número de unidades de processamento ou blocos no circuito (107) de cálculo da flutuação de blocos a uma unidade simples de processamento ou banda nos meios de ajustamento do nível do ruído para adaptar o número de dados espectrais, ou o número de unidades de processamento ou bandas para calcular o nível de ruído é adaptado a uma unidade de processamento ou banda para calcular o coeficiente de flutuação dos blo cos. A operação anterior tem de ser executada, tendo em vista que, visto que as larguras de banda das bandas críticas aumentam no sentido das frequências elevadas, o número de dados ê di ferente de faixa para faixa, de modo que os cálculos para detej? minar o número de bits atribuídos podem não ser viáveis, a menos que o número de dados no cálculo do coeficiente de flutuação dos blocos seja adaptado ao número de dados na faixa.
No presente circuito (106) de decisão do número de bits a atribuir, determina-se um nível AD (E^-E^), como se mostra na fig. 13, onde E3 é o nível de ruído tolerável por dado espectral, tal como é calculado dividindo a energia to tal Εθ pela pluralidade de dados espectrais S no bloco b (o blo co no qual se adaptou o número de dados, como atrás se descreveu) , pelo número dos dados no bloco b e E2 é o nível do factor de escala ou coeficiente de flutuação dos blocos correspondente ao valor máximo S entre os dados espectrais S no bloco b, co mo se mostra na fig. 13. 0 nível representado na fig. 13 é indi_ cado por 6 bits e o nível em dB, calculado a partir de (E2~E3), é calculado em termos de bits ((E2-E3)/6,0 bits). Os dados resultantes são usados como informação respeitante ao número de bits atribuídos para o bloco b.
Entretanto, a prática convencional é calcular um nível ad (Εθ-Ε^), onde Εθ indica o nível de energia total no bloco b e E^, calculado na base do nível de energia to tal Εθ, e calcular o nível ad em dB, a partir de (E2-E3) em ter mos de bits ((E2~E3)/6,0 bits) para utilizar os dados resultantes como a informação respeitante à informação do número de bits atribuídos para o bloco b.
A informação do número de bits atribuídos, calculada da maneira descrita, é fornecida ao circuito (103) onde se realiza a codificação com base na informação do número de bits atribuído.
Na forma de realização atrás descrita, pode suprimir-se o nível de ruído em cada bloco ou banda no interior do nível de ruído tolerável e, mesmo que o sinal seja um sinal de elevada tonalidade, o número de bits pode ser calculado de modo a adaptar-se ao carácter do sinal.
A informação respeitante ao número de bits atribuídos a partir do circuito (106) de decisão do número de bits atribuídos é fornecida no terminal de saída (109), de modo a ser usada numa unidade de descodificação do lado de ju30
sante, não representada, para descodificar os dados codificados. A informação do coeficiente de flutuação dos blocos proveniente do circuito (107) de cálculo da flutuação dos blocos é fornecida no terminal de saída (110), de modo a ser usada para a desco dificação na unidade de descodificação.
Como referência ã fig. 14, vai explicar -se a construção para o estabelecimento do nível de ruído tolerável tendo em conta as bandas críticas e o efeito de mascaramento no circuito (104) de cálculo da energia e nos circuitos a jusante.
A disposição representada na fig. 14 é constituída por vários circuitos como meios de estabelecimento do nível de ruído para estabelecer o nível de ruído tolerável para cada banda, com base nas energias (valores de pico ou médios) para cada uma das bandas críticas.
Na fig. 14, os sinais de audio digitais no eixo dos tempos, fornecidos no terminal de entrada (100) , são transmitidos a um circuito DCT (111) de um circuito (102) de análise de frequências que está também provido de um circuito (112) gerador de informação de amplitude e informação de fase. No circuito DCT (11), os dados de audio no eixo dos tempos são convertidos em dados no eixo das frequências com um interva lo com a duração de uma unidade de tempo ou com a duração de um bloco unitário, para produzir dados de coeficientes DCT constituídos por uma componente real Re e uma componente imaginária Im. Estes dados de coeficientes DCT são transmitidos para o cir cuito (112) gerador da informação de amplitude e de informação de fase, onde se produzem uma informação de amplitude Am e uma informação de fase Ph a partir das componentes Re e Im obtidas na saída.
Das informações de amplitude e de fase, a informação de amplitude Am é transmitida ao circuito (106) de decisão da atribuição dos bits e é utilizada para determinar uma informação de atribuição adaptativa dos bits, num circuito (160) de codificação da informação de amplitude, e a informação de fase Ph é transmitida a um circuito (170) de codificação da informação de fase. Como, em geral, o sentido da audição do homem ê sensível à amplitude ou potência da faixa de frequências, sendo em contrapartida extremamente insensível à fase, apenas a informação de amplitude Am ê usada na presente forma de reali zação para determinar a informação do número de bits atribuídos.
A informação de amplitude Am proveniente do circuito (102) de análise de frequências é transmitida pa ra o circuito (160) de codificação da informação de amplitude para codificação, enquanto que a informação de fase Ph é fornecida ao circuito (170) de codificação da informação de fase, analogamente para codificação. Na codificação pelos circuitos de codificação (160) e (170), o número de bits atribuídos à informação de fase Ph é reduzido de modo a ser menor do que o atribuído ã informação de amplitude Am para a codificação, para uma banda predeterminada da saída do analisador de frequências (102), como adiante se explica. A informação de amplitude é tam bém fornecida ao circuito (106) de decisão do número de bits atribuídos. O circuito (106) de decisão do número de bits atribuídos decide sobre a informação do número de bits atribuídos, a partir do coeficiente de flutuação dos blocos e do nível de ruído tolerável por dado, como se explica adiante. O circuito (106) de decisão do número de bits atribuído também decide sobre a informação do número de bits atribuídos para a codificação da informação de amplitude Am e sobre a informação do número de bits atribuídos para a codificação da informação de fase Ph, na base da informação de amplitude Am, como adiante se explica, para a transmissão para os circuitos de codificação correspondentes (160) e (170).
Faz-se notar que, no circuito (106) de decisão do número de bits atribuídos, a informação de amplitude Am pode ser dividida de acordo com as bandas críticas, tendo em conta as características do sentido da audição do homem, e a quantidade de mascaramento pode ser determinada a partir das energias da informação de amplitude Am para as bandas respectivas, de modo que possa determinar-se o número de bits atribuídos para a codificação da informação de amplitude Am para cada banda e codificar a informação de fase Ph, utilizando o nível de ruído tolerável baseado na quantidade de mascaramento. Ao de terminar o número de bits atribuído a cada banda, escolhe-se o número de bits atribuídos ã informação de fase Ph de modo a ser
menor do que o atribuído ã informação de amplitude Am para ter em conta as características do sentido da audição do homem. Reduzindo o número de bits atribuídos à informação de fase Ph des te modo, pode reduzir-se o número de bits nos dados codificados da informação de fase fornecida na saída do circuito (170) de codificação da fase. Mesmo que o número de bits atribuídos a in formação de fase Ph seja reduzido, essa redução não é sentida como causa de deterioração da qualidade do som para o ouvido hu mano.
Na fig. 14, os dados digitais da informação de amplitude provenientes do circuito de análise de frequências são transmitidos para um circuito (113) de divisão da banda, que divide os dados digitais em bandas críticas. Com as bandas críticas, têm-se em conta certas características do sentido da audição humano ou capacidade de análise de frequências. Por exemplo, o domínio das frequências é dividido em 25 bandas, de modo que a largura de banda seja maior no sentido das frequências elevadas. Isto é, o sentido da audição do homem tem ca racteristicas semelhantes as de filtro de banda. As bandas respectivas divididas pelos filtros respectivos são denominadas bandas críticas.
Os dados digitais das bandas respectivas, divididas pelo circuito (113) de divisão das bandas, são transmitidos para um circuito (114) de detecção da soma total, no qual se determina a energia para cada banda (intensidade espectral em cada banda), tomando a soma total das intensidades dos dados espectrais respectivos em cada banda. Uma saída do circuito (114) de detecção da soma total, isto é o espectro soma de cada banda, designa-se por espectro de Burke. O espectro de Burke (SB) em cada banda está representado, por exemplo, na fig. 15. Nesta figura, o número de bandas críticas é escolhido por forma a ser igual a 12 (B^ a ·
Para ter em conta o efeito do espectro de Burke no chamado mascaramento, faz-se a convolução de uma função de ponderação predeterminada no espectro de Burke. Para isso, a saída do circuito (114) de detecção da soma total, isto * é, os valores dos espectros de Burke (SB) são transmitidos a um 1 circuito de filtro (115). O circuito de filtro (115) é consti tuído por uma pluralidade de dispositivos de atraso para atrasar sequencialmente as saídas dos dispositivos de atraso por coeficientes de filtragem (funções de ponderação), tais como 25 multiplicadores associados às bandas e um dispositivo adicionador para somar as saídas dos multiplicadores. A convolução dos espectros de Burke SB é efectuada no circuito de filtro (115) por meio de coeficientes de filtragem 1, o,15, 0,ool9, 0,000 008 6, 0,4, 0,06 e 0,007, nos multiplicadores (M) , (M-l), (M-2), (M-3), (M+l), (M+2) e (M+3), respectivamente sendo M um inteiro arbitrário. Por meio desta convolução, calcula-se o total da soma da área representada pelas linhas a tracejado na fig. 15.
A saída do circuito de filtro (115) é fornecida a um subtractor (116), adaptado para determinar um ní vel correspondente ao nível de ruído tolerável na zona convoluta. 0 nível oí correspondente ao nível de ruído tolerável é tal que dará um nível de ruído tolerável para cada banda crítica por desconvolução, como adiante se explica. Uma função admijs sível (função que representa o nível de mascaramento para deter minar o nível é fornecida ao subtractor (116) . O nível oC é controlado aumentando ou diminuindo a função admissível. A função admissível é fornecida a partir de um gerador de funções (129), como se descreve mais adiante.
Se for i o número acordado para as bandas críticas da faixa de frequências baixas para a faixa das frequências elevadas, o nível c£ correspondente ao nível de ruído tolerável é calculado a partir da fórmula = S - (n - ai) onde n e a são constantes, sendo a 0, e sendo í3 uma intensidade do espectro de Burke sujeito à convolução, sendo (n - ai), na fórmula anterior, a função admissível. No exemplo da fig. 14 n = 38 e a = 1, caso em que pode obter-se uma codificação óptima sem deterioração da qualidade do som.
nível 0C é assim determinado e os dados correspondentes são transmitidos para um divisor (117), adaptado para a desconvolução do nível ©< na zona convoluta. Assim, por desconvolução, pode determinar-se o espectro de mas34
caramento a partir do nível tK . Isto ê, o espectro de mascaramento transforma-se no nível de ruído tolerável. Embora a desconvolução exija um processamento complexo, ele é efectuado, no exemplo da fig. 14, por meio de um divisor simplificado (117).
espectro de mascaramento é transmitido através de um circuito de síntese (188) para um subtractor (119), que ê fornecido por via de um circuito de atraso (121) com uma saída do circuito (114) de detecção da soma, isto ê o espectro de Burke SB proveniente do circuito de detecção (114) da soma total atrás mencionado. Pela subtracção entre o espectro de mascaramento e o espectro de Burke SB, feita pelo subtractor (119), mascara-se a parte do espectro de Burke SB abaixo do nível de mascaramento (MS), como se mostra na fig. 16.
Na síntese feita pelo circuito de sínte se (118), os dados que indicam uma curva (RC) denominada curva de audibilidade mínima, proveniente de um gerador (122) de curvas de audibilidade mínima que representa características do sentido da audição do homem, como se mostra na fig. 17, podem combinar-se com o espectro de mascaramento atrás referido. Na curva de audibilidade mínima, um ruído é inaudível se o seu nível absoluto for inferior à curva de audibilidade mínima. A cur va de audibilidade mínima varia, por exemplo, com a diferença no volume da reprodução, embora a codificação se mantenha a me_s ma. Porém, num sistema digital prático, como não há qualquer di. ferença significativa na música da faixa dinâmica de 15 bits, se o ruído de quantificação, na faixa dé frequências na proximi dade dos 4 KHz mais audível para o ouvido, for inaudível, consi dera-se o ruído de quantificação inferior ao nível da curva de audibilidade mínima como inaudível noutras faixas de frequência. Portanto, se se admitir que o sistema é usado de modo tal que o nível de ruído na proximidade dos 4 KHz do comprimento das pala vras do sistema é inaudível, e que se pretende obter o nível de ruído tolerável por sintetização da curva RC de audibilidade mí nima e o mascaramento do espectro MS, pode tomar-se neste caso o nível de ruído até às linhas a tracejado. Entretanto, no exem pio da fig. 14, o nível de 4 KHz da curva de inaudibilidade mí- * nima é adaptado ao nível mínimo correspondente a, por exemplo, • 20 bits. Na fig. 17, o espectro do sinal (SS) está também repre sentado.
Faz-se notar que, num circuito (120) de correcção do nível de ruído tolerável, se corrige o nível de ruído tolerável proveniente do substractor (119), com base na informação da chamada curva de igual intensidade sonora. 0 circuito (120) de correcção no nível de ruído tolerável é alimenta do com uma saída do circuito (128) de decisão do valor de correcção.
O circuito (128) de decisão do valor de correcção fornece na sua saída dados do valor de correcção para corrigir o nível de ruído tolerável proveniente do subtractor (119), com base nos dados de informação da curva preajustada de igual intensidade sonora. O nível de ruído tolerável proveniente do subtractor (119) é corrigido pelo valor de correcção que é transmitido para o circuito (120) de correcção do nível de ruído.
Entretanto, a curva de igual nível de ruído está relacionada com certas características do sentido da audição do homem e calculou-se ligando as pressões acústicas ãs frequências respectivas que são ouvidas com a mesma intensidade que o som puro de 1 KHz. A curva de igual intensidade sonora tem uma configuração substancialmente análoga à da curva de audibilidade mínima representada na fig. 17. Na curva de igual in tensidade sonora, um som com uma pressão acústica inferior em 8 a 10 dB ã pressão acústica a 1 KHz na vizinhança de 4 KHz é ouvido com a mesma intensidade que um som de 1 KHz, enquanto que um som não pode ser ouvido na vizinhança dos 50 KHz, a menos que a pressão acústica seja superior em cerca de 15 dB ã pressão acústica a 1 KHz. Nesta consideração, pode ver-se que a cor recção do nível de ruído tolerável, tendo em conta a curva de igual intensidade acústica, ê apropriada para as características da audição humana,
A informação respeitante ao nível de ruído tolerável, assim determinada, é transmitida para uma memó ria ROM (130), onde se armazena uma pluralidade de dados do número de bits atribuídos, usados para a codificação da informação de amplitude Am e da informação de fase Ph. Os dados do número de bits atribuídos correspondentes à saída do circuito de
subtracção (119) (nível da diferença entre a energia de cada banda e a saída dos meios de ajuste do nível de ruído), podem ser obtidos na saída da memória ROM (130). O número de bits atribuídos ã informação de fase é menor do que os atribuídos à informação de amplitude, como atrás se descreveu. A saída da me mória ROM (130) é fornecida ao circuito (160) de codificação da informação de amplitude e ao circuito (170) de codificação da informação de fase. No circuito (160), a informação de amplitude Am fornecida através do circuito de atraso (123) é codificada com o número de bits atribuídos proveniente da memória ROM (130), enquanto que, no circuito (170), a informação de fase Ph é codificada a informação de fase Ph fornecida através do circuito de atraso (124). Por outras palavras, nestes circuitos (160) e (170), são codificadas as componentes das faixas com o número de bits atribuído de acordo com o nível da diferença entre as energias das bandas críticas e o nível de ruído tolerável, de modo que o número de bits atribuído ã informação de fase Ph é menor do que o atribuído ã informação de amplitude Am. Entretanto, proporciona-se o circuito de atraso (121) para atra sar o espectro de Burke (SB) proveniente do circuito (114) de detecção da soma, tendo em consideração os atrasos provocados nos circuitos a montante do circuito de síntese (118), bem como para atrasar a informação de amplitude Am ou a informação de fa se Ph, tendo em consideração os atrasos provocados nos circuitos de atraso (123) e (124) ou nos circuitos a montante da memõ ria ROM (130) .
Embora a informação do número de bits atribuídos para a informação de base Ph e para a informação de amplitude Am possam ser fornecidos directamente, a partir do circuito de decisão (108) , para o circuito de codificação, o nú mero de bits da informação dos bits atribuídos é, na presente forma de realização, comprimido.
Isto é, no circuito de decisão (106), determina-se previamente o número de bits reduzido da informação de fase Ph proveniente da informação de amplitude Am. Por exemplo, o número de bits atribuído à informação de fase Ph e o atribuído à informação de amplitude Am são estabelecidos de antemão de modo tal que o número de bits atribuído ã informação de fase Ph para a faixa elevada (por exemplo 10 KHz ou superior) seja menor, em 1 bit, que para a informação de amplitude Am. Deste modo, apenas uma das informações, dos bits atribuídos ã informação de fase ou dos bits atribuídos à informação de ampli tude, pode ser transmitida juntamente com os dados codificados para a informação de fase Ph e para a informação de amplitude Am.
Isto é, se o codificador de jusante estiver informado das condições pré-determinadas da redução de bits, o codificador pode determinar a outra informação do número de bits atribuídos a partir da informação do número de bits restante. Assim, esta última informação não necessita de ser transmitida, de modo que o número de bits da informação MA pode ser reduzida. Entretanto, se a informação transmitida como informação do número de bits atribuído for a informação de fase Ph, pode reduzir-se o número de bits transmitido em comparação com o caso da transmissão do número de bits atribuídos para a informação de amplitude Am.
Os dados codificados da informação de amplitude Am proveniente do circuito (160) de codificação de am plitude são fornecidos na saída através do terminal de saída (161), enquanto os dados codificados provenientes da informação de fase Ph são fornecidos na saída através do terminal de saída (171). A informação do número de bits atribuídos proveniente do circuito de decisão (106) é fornecida através do sinal de saída (151) . Os dados codificados provenientes da informação de ampli. tude Am e os da informação de fase Ph são descodificados usando a informação do número de bits atribuídos.
Com o aparelho atrás descrito, ;os. dados digitais de entrada são convertidos em informação de amplitude Am e informação de fase Ph por análises de frequência e o número de bits atribuído à informação de fase Ph é reduzido de modo a ser menor do que o atribuído à informação de amplitude Am, na altura da codificação da informação de fase Ph e da informação de amplitude Am, de modo que se torna possível reduzir os dados codificados.
Além disso, se o número de bits reduzidos para a informação de fase Ph, comparado com a informação de amplitude Am, for predeterminado para cada banda, apenas um dos dados do número de bits atribuído para a informação de amplitude Am ou para a informação de fase Ph precisa de ser transmitido, de modo que o número de bits para transmitir a informação dos bits atribuídos pode ainda ser mais reduzido. Além disso, como o número de bits atribuídos às faixas respectivas é ajusta do usando o nível de ruído tolerado, com base na quantidade de mascaramento calculado a partir das energias da informação de amplitude para as bandas respectivas, pode obter-se a compressão de bits de uma maneira menos sujeita a degradação, no que respeita ao sentido da audição do homem.
Entretanto, pode ser dispensada a sínte se da referida curva de audibilidade mínima, caso em que pode eliminar-se o gerador (122) da curva de audibilidade mínima e o circuito de síntese (118), sendo a saída do subtractor (116) transmitida directamente para o subtractor (119), depois da des^ convolução pelo divisor (117) .
A presente invenção pode ser aplicada não só à codificação por transformação adaptativa de processamento de sinais digitais de entrada por transformação ortogonal como na forma de realização da fig. 12, mas também a um aparelho adaptado para executar a codificação de sub-bandas (SBC), caso em que os sinais são divididos numa pluralidade de bandas por filtros de banda, etc., para determinar o número de bits atribuídos a cada banda.
Com o presente aparelho de codificação de dados digitais de elevado rendimento, como os comprimentos dos blocos para a transformação ortogonal para as faixas respec tivas são determinados no circuito de decisão do comprimento dos blocos, com base em características (transitórios ou estacionários, etc.) dos dados dos blocos antes da transformação or togonal de cada banda e a transformação ortogonal para cada ban da é efectuada com o comprimento de blocos assim determinado, a codificação pode ser efectuada em conformidade com as características do sinal, por exemplo se são transitórios ou estaciona rios, enquanto pode também fazer-se a compressão dos bits.
Com o presente aparelho de codificação de dados digitais, de elevado rendimento, como se selecciona ape nas uma das saídas dos respectivos meios de transformação ortogonal, com base na saída dos meios de transformação ortogonal, pode obter-se a saída codificada optimamente em conformidade com as características dos dados digitais de entrada e com as características do sentido da audição do homem seleccionando a saída dos meios de transformação ortogonal com o menor número de bits atribuídos na altura da codificação, de modo que pode produzir-se uma qualidade óptima do som descodificando e conver tendo a saída codificada em som.
Além disso, com o presente aparelho de codificação de dados digitais de elevado rendimento, como o número de bits atribuídos na altura da codificação é determinado com base nos coeficientes de flutuação baseados nos dados de va lores máximos no bloco constituído por dados obtidos por análises de frequências dos dados digitais de entrada, e no nível de ruído tolerável, com base na energia bloco por bloco, pode conseguir-se a atribuição óptima dos bits mesmo que os sinais sejam sinais de elevada tonalidade.
Além disso, com o presente aparelho de codificação dos dados de elevado rendimento, quando os dados d_i gitais de entrada forem convertidos na informação de amplitude e na informação de fase por análises de frequência e a informação de amplitude e a informação de fase forem codificadas, o nú mero de bits atribuído à informação de fase para uma faixa predeterminada é reduzido de modo a ser menor do que o atribuído à informação de amplitude, de modo que a relação de compressão po de ser aumentada e a taxa de bits na transmissão pode ser reduzida.
Além disso, com o presente aparelho de codificação de dados digitais de elevado rendimento, como a ban da na qual se reduz a informação do número de bits atribuídos para a informação de fase Ph é a banda crítica elevada, tendo em conta as características do sentido da audição do homem, pode reduzir-se a qualidade do som, no que se refere ao sentido da audição.
aparelho segundo a presente invenção pode ser aplicado efectivamente num aparelho de codificação de dados para o registo num meio de suporte de informação, tal co mo o chamado disco compacto.

Claims (4)

  1. - lâ -
    Aparelho de codificação de dados digitais de elevado rendimento, no qual se dispõem dados digitais de entrada em blocos por amostras plurais, sendo efectuada uma transformação ortogonal em cada bloco para produzir dados de coeficientes, sendo esses dados de coeficientes codificados com um número adaptativo de bits, compreendendo uma pluralidade de meios de transformação ortogonal para efectuar a transformação ortogonal dos dados digitais de entrada com comprimentos diferentes dos blocos, caracterizado por se seleccionar apenas uma das saídas dos referidos meios de transformação ortogonal com base nas saídas dos referidos meios de transformação ortogonal.
    Aparelho de acordo com a reivindicação 1, caracterizado por os referidos comprimentos dos blocos serem menores no sentido das frequências mais elevadas, por subdivisão.
    Aparelho de codificação de dados digitais de elevado rendimento, caracterizado por os referidos da dos digitais de entrada serem divididos em bandas, blocos plurais, cada um dos quais constituído por amostras plurais formadas em cada banda e por se efectuar a transformação ortogonal em cada bloco da banda produzir dados de coeficientes, sendo esses dados de coeficientes codificados, compreendendo um circuito de decisão do comprimento dos blocos para determinar o comprimento dos blocos para a transformação ortogonal de cada banda, com base nas características dos dados de blocos antes da transformação ortogonal de cada banda, caracterizado por a transformação ortogonal referida de cada banda ser efectuada com o comprimento do bloco determinado pelo referido circuito de decisão do comprimento dos blocos.
    - 4* Aparelho de acordo com a reivindicação 3, caracterizado por a largura de banda de cada banda ser escolhida por forma a ser maior no sentido das frequências elevadas.
    - 5â Aparelho de acordo com a reivindicação
  2. 4, caracterizado por os referidos comprimentos dos blocos serem menores no sentido das frequências mais elevadas, por subdivisão.
    - 6*
    Aparelho de acordo com a reivindicação
    4, caracterizado por os referidos comprimentos dos blocos serem diferentes para os domínios médio e elevado.
    Aparelho de acordo com as reivindicações 1, 2, 3, 4, 5 ou 6, caracterizado por a referida transformação ortogonal ser a transformação discreta de coseno (DCT).
    - 8ã -
    Aparelho de acordo com as reivindicações 1, 2, 3, 4, 5 ou 6, caracterizado por a referida transformação ortogonal ser a transformação de Fourier rápida (FFT).
    - 9â -
    Aparelho de codificação de dados digitais de elevado rendimento, caracterizado por compreender meios de análise de frequências para analisar as frequências de dados digitais de entrada, meios de estabelecimento do nível de ruído para determinar energias para cada bloco constituído por dados de saída plurais provenientes dos referidos meios de análise de frequências e estabelecer o nível de ruído tolerável com base nas energias numa base de bloco por bloco, meios para o cálculo de coeficientes de flutuação para calcular coeficientes de flutuação com base nos dados de valores máximos em cada bloco cons tituído por dados de saída plurais provenientes dos meios de análise de frequências referidos, meios de codificação para codificar saídas dos referidos meios de análise de frequências, um circuito de decisão do número de bits atribuídos para determinar o número de bits atribuídos no instante da codificação pe los referidos meios de codificação com base numa saída dos refe ridos meios de estabelecimento do nível de ruído e uma saída dos referidos meios de cálculo de coeficientes de flutuação.
    Aparelho de acordo com a reivindicação
  3. 9, caracterizado por os referidos meios de estabelecimento do nível de ruído calcularem uma quantidade de máscara a partir das energias em cada bloco para estabelecer o nível de ruído na quantidade de máscara.
    - llâ -
    Aparelho de acordo com a reivindicação
  4. 10, caracterizado por os referidos meios de estabelecimento do nível de ruído calcularem a referida quantidade de máscara tendo em conta uma curva de intensidade acústica característica do sentido de audição do homem.
    - 123 -
    Aparelho de acordo com as reivindicações 9, 10 ou 11, caracterizado por a referida transformação or togonal ser a transformação discreta de coseno (DCT).
    - 133 Aparelho de acordo com as reivindicações 9, 10 ou 11, caracterizado por a referida transformação or togonal ser a transformação de Fourier rápida (FFT).
    Aparelho de codificação de dados digitais de elevado rendimento que compreende meios de análise de frequências para analisar frequências de dados digitais de entrada para converter os referidos dados digitais de entrada numa informação de amplitude e numa informação de base e meios de codificação para codificar a referida informação de amplitude e a referida informação de fase, caracterizado por, na codificação nos referidos meios de codificação, o número de bits atribuídos à referida informação de fase ser escolhido de modo que seja menor do que o atribuído ã referida informação de amplitude num domínio predeterminado de uma saída dos referidos meios de análise das frequências.
    - 15a Aparelho de acordo com a reivindicação 14, caracterizado por, na codificação de modo que o número de bits atribuídos à referida informação de fase seja menor do que os atribuídos ã referida informação de amplitude, o número de bits ser reduzido apenas num domínio de frequências predeterminado.
    - 16â Aparelho de descodificação de dados digitais para descodificar dados digitais transmitidos ou gravados como uma pluralidade de dados codificados e informação subsidiária, sendo os referidos dados codificados e a referida informa ção subsidiária produzidos dispondo os dados digitais de entrada por amostras plurais e efectuando a transformação ortogonal com comprimentos diferentes dos blocos em cada bloco para produ zir dados de coeficientes, sendo esses dados de coeficientes co difiçados com um número adaptativo de bits, caracterizado por os referidos dados codificados e a referida informação subsidiária serem descodificados por uma pluralidade de circuitos de descodificação e processado por um circuito de transformação or togonal inversa para obter uma informação no eixo dos tempos, sendo a referida informação no eixo dos tempos sintetizada por um circuito de filtro (QMF) inverso para produzir sinais de audiofrequência digitais.
    - 17ã Aparelho de acordo com a reivindicação 16, caracterizado por o circuito de transformação ortogonal ser um circuito de transformação discreta de coseno (DCT) inversa.
    A requerente reivindica as prioridades dos pedidos japoneses apresentados em 29 de Março de 1991, sob os NQs P091183/91 e P091185/91.
PT100309A 1991-03-29 1992-03-27 Aparelho de codificacao e descodificacao de dados digitais de elevado rendimento PT100309B (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP03091183A JP3089690B2 (ja) 1991-03-29 1991-03-29 ディジタルデータの高能率符号化方法
JP03091185A JP3089691B2 (ja) 1991-03-29 1991-03-29 ディジタルデータの高能率符号化方法

Publications (2)

Publication Number Publication Date
PT100309A PT100309A (pt) 1994-04-29
PT100309B true PT100309B (pt) 1999-04-30

Family

ID=26432643

Family Applications (1)

Application Number Title Priority Date Filing Date
PT100309A PT100309B (pt) 1991-03-29 1992-03-27 Aparelho de codificacao e descodificacao de dados digitais de elevado rendimento

Country Status (18)

Country Link
US (1) US5414795A (pt)
EP (1) EP0537361B1 (pt)
KR (1) KR100293855B1 (pt)
CN (1) CN1030129C (pt)
AT (1) ATE153165T1 (pt)
AU (2) AU648656B2 (pt)
BR (1) BR9204820A (pt)
CA (1) CA2083713C (pt)
DE (1) DE69219718T2 (pt)
DK (1) DK0537361T3 (pt)
EG (1) EG20351A (pt)
FI (1) FI112979B (pt)
HU (1) HU213963B (pt)
NO (1) NO306007B1 (pt)
PT (1) PT100309B (pt)
TR (1) TR25961A (pt)
WO (1) WO1992017884A1 (pt)
ZA (1) ZA921988B (pt)

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
ATE173366T1 (de) * 1991-09-30 1998-11-15 Sony Corp Verfahren und anordnung zur audiodatenkompression
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
JP3153933B2 (ja) * 1992-06-16 2001-04-09 ソニー株式会社 データ符号化装置及び方法並びにデータ復号化装置及び方法
JP3186292B2 (ja) * 1993-02-02 2001-07-11 ソニー株式会社 高能率符号化方法及び装置
JP3088580B2 (ja) * 1993-02-19 2000-09-18 松下電器産業株式会社 変換符号化装置のブロックサイズ決定法
JP3188013B2 (ja) 1993-02-19 2001-07-16 松下電器産業株式会社 変換符号化装置のビット配分方法
JP3186307B2 (ja) * 1993-03-09 2001-07-11 ソニー株式会社 圧縮データ記録装置及び方法
JP3123290B2 (ja) * 1993-03-09 2001-01-09 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体
JP3531177B2 (ja) * 1993-03-11 2004-05-24 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法
TW232116B (en) * 1993-04-14 1994-10-11 Sony Corp Method or device and recording media for signal conversion
US5581654A (en) * 1993-05-25 1996-12-03 Sony Corporation Method and apparatus for information encoding and decoding
CN1064773C (zh) * 1993-06-30 2001-04-18 索尼公司 数字信号的编码方法和解码方法
US5632003A (en) * 1993-07-16 1997-05-20 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for coding method and apparatus
US5415979A (en) * 1993-07-28 1995-05-16 Konica Corporation Stabilizer composition for processing silver halide photographic light-sensitive material and a method of processing silver halide light-sensitive material using the same
US5451954A (en) * 1993-08-04 1995-09-19 Dolby Laboratories Licensing Corporation Quantization noise suppression for encoder/decoder system
TW327223B (en) * 1993-09-28 1998-02-21 Sony Co Ltd Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal
AU689506B2 (en) * 1993-11-04 1998-04-02 Sony Corporation Signal encoder, signal decoder, recording medium and signal encoding method
JP3125543B2 (ja) * 1993-11-29 2001-01-22 ソニー株式会社 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
JPH07205496A (ja) * 1994-01-14 1995-08-08 Oki Electric Ind Co Ltd ページプリンタ及びデータ圧縮方法
US5608713A (en) * 1994-02-09 1997-03-04 Sony Corporation Bit allocation of digital audio signal blocks by non-linear processing
DE4405659C1 (de) * 1994-02-22 1995-04-06 Fraunhofer Ges Forschung Verfahren zum kaskadierten Codieren und Decodieren von Audiodaten
JP3186412B2 (ja) * 1994-04-01 2001-07-11 ソニー株式会社 情報符号化方法、情報復号化方法、及び情報伝送方法
JP3277682B2 (ja) * 1994-04-22 2002-04-22 ソニー株式会社 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法
JP3277699B2 (ja) * 1994-06-13 2002-04-22 ソニー株式会社 信号符号化方法及び装置並びに信号復号化方法及び装置
JP3277705B2 (ja) 1994-07-27 2002-04-22 ソニー株式会社 情報符号化装置及び方法、並びに情報復号化装置及び方法
JP3341474B2 (ja) * 1994-07-28 2002-11-05 ソニー株式会社 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
JPH09506478A (ja) * 1994-10-06 1997-06-24 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ 光放射半導体ダイオード及びこのようなダイオードの製造方法
US5765136A (en) * 1994-10-28 1998-06-09 Nippon Steel Corporation Encoded data decoding apparatus adapted to be used for expanding compressed data and image audio multiplexed data decoding apparatus using the same
JP3557674B2 (ja) * 1994-12-15 2004-08-25 ソニー株式会社 高能率符号化方法及び装置
JPH08190764A (ja) * 1995-01-05 1996-07-23 Sony Corp ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
EP0721257B1 (en) * 1995-01-09 2005-03-30 Daewoo Electronics Corporation Bit allocation for multichannel audio coder based on perceptual entropy
CN1110955C (zh) * 1995-02-13 2003-06-04 大宇电子株式会社 自适应地编码来自多条通道的输入数字音频信号的装置
JP2842276B2 (ja) * 1995-02-24 1998-12-24 日本電気株式会社 広帯域信号符号化装置
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP2778567B2 (ja) * 1995-12-23 1998-07-23 日本電気株式会社 信号符号化装置及び方法
JP3189660B2 (ja) * 1996-01-30 2001-07-16 ソニー株式会社 信号符号化方法
KR100223169B1 (ko) * 1996-06-14 1999-10-15 윤종용 펄스부호변조된 디지털 오디오신호의 기록 및 재생을 위한 시스템
US5892746A (en) * 1996-06-15 1999-04-06 Samsung Electronics Co., Ltd. System for recording and/or reproducing a pulse code modulation digital audio signal
JP3318825B2 (ja) * 1996-08-20 2002-08-26 ソニー株式会社 デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置
JPH1083623A (ja) * 1996-09-10 1998-03-31 Sony Corp 信号記録方法、信号記録装置、記録媒体および信号処理方法
JP3496411B2 (ja) * 1996-10-30 2004-02-09 ソニー株式会社 情報符号化方法及び復号化装置
DE19736669C1 (de) * 1997-08-22 1998-10-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals
US5903872A (en) * 1997-10-17 1999-05-11 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries
US6654189B1 (en) * 1998-04-16 2003-11-25 Sony Corporation Digital-signal processing apparatus capable of adjusting the amplitude of a digital signal
US6353584B1 (en) * 1998-05-14 2002-03-05 Sony Corporation Reproducing and recording apparatus, decoding apparatus, recording apparatus, reproducing and recording method, decoding method and recording method
US6353807B1 (en) * 1998-05-15 2002-03-05 Sony Corporation Information coding method and apparatus, code transform method and apparatus, code transform control method and apparatus, information recording method and apparatus, and program providing medium
GB2349054A (en) * 1999-04-16 2000-10-18 Nds Ltd Digital audio signal encoders
US6868377B1 (en) * 1999-11-23 2005-03-15 Creative Technology Ltd. Multiband phase-vocoder for the modification of audio or speech signals
US7023789B2 (en) 1999-12-21 2006-04-04 Robert Bosch Gmbh Playback device and storage medium for selective storage of data as a function of data compression method
EP1279167B1 (en) * 2000-04-24 2007-05-30 QUALCOMM Incorporated Method and apparatus for predictively quantizing voiced speech
US6963975B1 (en) * 2000-08-11 2005-11-08 Microsoft Corporation System and method for audio fingerprinting
US7035873B2 (en) * 2001-08-20 2006-04-25 Microsoft Corporation System and methods for providing adaptive media property classification
KR101037931B1 (ko) * 2004-05-13 2011-05-30 삼성전자주식회사 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법
JP5100124B2 (ja) * 2004-10-26 2012-12-19 パナソニック株式会社 音声符号化装置および音声符号化方法
KR20100079121A (ko) * 2008-12-30 2010-07-08 주식회사 동부하이텍 이미지 인코더 및 이미지 인코딩 방법
US8386266B2 (en) * 2010-07-01 2013-02-26 Polycom, Inc. Full-band scalable audio codec
US8428381B2 (en) * 2010-06-04 2013-04-23 Altek Corporation Image compression method with variable quantization parameter
WO2011156905A2 (en) * 2010-06-17 2011-12-22 Voiceage Corporation Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands
KR101468458B1 (ko) 2010-11-12 2014-12-03 폴리콤 인코포레이티드 멀티 포인트 환경에서의 스케일러블 오디오
EP2879131A1 (en) 2013-11-27 2015-06-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder, encoder and method for informed loudness estimation in object-based audio coding systems
US10699721B2 (en) * 2017-04-25 2020-06-30 Dts, Inc. Encoding and decoding of digital audio signals using difference data

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
CA1292071C (en) * 1985-06-28 1991-11-12 Tomohiko Taniguchi Coding transmission equipment for carrying out coding with adaptive quantization
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US4815068A (en) * 1987-08-07 1989-03-21 Dolby Ray Milton Audio encoder for use with more than one decoder each having different characteristics
JPH01276980A (ja) * 1988-04-28 1989-11-07 Sharp Corp 画像データ直交変換符号化方式
JPH0783315B2 (ja) * 1988-09-26 1995-09-06 富士通株式会社 可変レート音声信号符号化方式
EP0370277A3 (de) * 1988-11-24 1991-09-18 Siemens Aktiengesellschaft Subband-Übertragungssystem
CA2140678C (en) * 1989-01-27 2001-05-01 Louis Dunn Fielder Coder and decoder for high-quality audio
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
JPH0366228A (ja) * 1989-08-04 1991-03-20 Matsushita Electric Ind Co Ltd ブロック符号化装置と復号化装置
US4932062A (en) * 1989-05-15 1990-06-05 Dialogic Corporation Method and apparatus for frequency analysis of telephone signals
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
JPH03117919A (ja) * 1989-09-30 1991-05-20 Sony Corp ディジタル信号符号化装置
JP2913731B2 (ja) * 1990-03-07 1999-06-28 ソニー株式会社 ディジタルデータの高能率符号化方法
JP2861238B2 (ja) * 1990-04-20 1999-02-24 ソニー株式会社 ディジタル信号符号化方法
JP2751564B2 (ja) * 1990-05-25 1998-05-18 ソニー株式会社 ディジタル信号符号化装置

Also Published As

Publication number Publication date
FI925401A0 (fi) 1992-11-27
HU213963B (en) 1997-11-28
CA2083713A1 (en) 1992-09-30
WO1992017884A1 (en) 1992-10-15
NO306007B1 (no) 1999-08-30
DE69219718T2 (de) 1997-10-02
HU9203758D0 (en) 1993-04-28
DK0537361T3 (da) 1997-06-09
HUT63269A (en) 1993-07-28
KR100293855B1 (ko) 2001-09-17
CA2083713C (en) 2003-08-19
EG20351A (en) 1999-01-31
AU5516894A (en) 1994-04-28
DE69219718D1 (de) 1997-06-19
ATE153165T1 (de) 1997-05-15
EP0537361A1 (en) 1993-04-21
PT100309A (pt) 1994-04-29
BR9204820A (pt) 1993-07-13
US5414795A (en) 1995-05-09
CN1030129C (zh) 1995-10-18
FI112979B (fi) 2004-02-13
KR930700945A (ko) 1993-03-16
NO924551L (no) 1993-01-25
CN1068689A (zh) 1993-02-03
EP0537361B1 (en) 1997-05-14
NO924551D0 (no) 1992-11-25
ZA921988B (en) 1993-02-24
AU648656B2 (en) 1994-04-28
FI925401A (fi) 1992-11-27
TR25961A (tr) 1993-11-01
AU1448992A (en) 1992-11-02
AU670655B2 (en) 1996-07-25

Similar Documents

Publication Publication Date Title
PT100309B (pt) Aparelho de codificacao e descodificacao de dados digitais de elevado rendimento
US5294925A (en) Data compressing and expanding apparatus with time domain and frequency domain block floating
KR100397690B1 (ko) 데이터부호화장치및그방법
KR100420891B1 (ko) 디지탈신호엔코딩/디코딩방법및장치와기록매체
USRE36683E (en) Apparatus and method for audio data compression and expansion with reduced block floating overhead
US5649053A (en) Method for encoding audio signals
JP3134337B2 (ja) ディジタル信号符号化方法
US5687157A (en) Method of recording and reproducing digital audio signal and apparatus thereof
US5115240A (en) Method and apparatus for encoding voice signals divided into a plurality of frequency bands
JP3153933B2 (ja) データ符号化装置及び方法並びにデータ復号化装置及び方法
US5774844A (en) Methods and apparatus for quantizing, encoding and decoding and recording media therefor
PL182240B1 (pl) Koder akustyczny wielokanalowy PL PL PL PL PL PL PL PL PL
JPH0730432A (ja) 圧縮データ記録及び/又は再生若しくは伝送及び/又は受信装置、圧縮データ記録及び/又は再生若しくは伝送及び/又は受信方法、及び記録媒体
US5946652A (en) Methods for non-linearly quantizing and non-linearly dequantizing an information signal using off-center decision levels
KR0137472B1 (ko) 오디오 신호 코딩 방법
JPH09134200A (ja) ディジタル・オーディオ符号化方法及びその装置
KR100361720B1 (ko) 고능율부호화방법및장치
KR960003628B1 (ko) 디지탈신호의 부호화/복호화 방법 및 장치
JPH08307281A (ja) 非線形量子化方法及び非線形逆量子化方法
JP3465341B2 (ja) オーディオ信号符号化方法
JP3291948B2 (ja) 高能率符号化方法及び装置、並びに伝送媒体
JP4024185B2 (ja) デジタルデータ符号化装置
JPH06324093A (ja) オーディオ信号のスペクトル表示装置
JP2993324B2 (ja) 音声高能率符号化装置
JP3089691B2 (ja) ディジタルデータの高能率符号化方法

Legal Events

Date Code Title Description
BB1A Laying open of patent application

Effective date: 19930923

FG3A Patent granted, date of granting

Effective date: 19990129

MM3A Annulment or lapse

Effective date: 20060731