BR112020025515A2 - Dispositivo e método de codificação, mídia de armazenamento legível por computador, e, dispositivo e método de decodificação - Google Patents

Dispositivo e método de codificação, mídia de armazenamento legível por computador, e, dispositivo e método de decodificação Download PDF

Info

Publication number
BR112020025515A2
BR112020025515A2 BR112020025515-7A BR112020025515A BR112020025515A2 BR 112020025515 A2 BR112020025515 A2 BR 112020025515A2 BR 112020025515 A BR112020025515 A BR 112020025515A BR 112020025515 A2 BR112020025515 A2 BR 112020025515A2
Authority
BR
Brazil
Prior art keywords
transformation
window
coding
transformation window
length
Prior art date
Application number
BR112020025515-7A
Other languages
English (en)
Inventor
Akifumi KONO
Toru Chinen
Hiroyuki Honma
Yoshiaki Oikawa
Original Assignee
Sony Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corporation filed Critical Sony Corporation
Publication of BR112020025515A2 publication Critical patent/BR112020025515A2/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4006Conversion to or from arithmetic code
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4031Fixed length to variable length coding
    • H03M7/4037Prefix coding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/60General implementation details not specific to a particular type of compression
    • H03M7/6064Selection of Compressor
    • H03M7/607Selection between different types of compressors
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/60General implementation details not specific to a particular type of compression
    • H03M7/6064Selection of Compressor
    • H03M7/6082Selection strategies
    • H03M7/6094Selection strategies according to reasons other than compression rate or data type
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Abstract

dispositivo e método de codificação, mídia de armazenamento legível por computador, e, dispositivo e método de decodificação. a presente tecnologia se refere a um codificador e a um método de codificação, um a decodificador e a um método de decodificação, e a um programa capaz de aumentar uma eficiência de codificação. o codificador compreende: uma unidade de conversão da frequência temporal para realizar a conversão da frequência temporal em um sinal de áudio usando uma janela de conversão; e uma unidade de codificação para realizar a codificação huffman na informação do espectro de frequência obtida pela conversão da frequência temporal quando a janela de conversão for comutada de um comprimento curto da janela de conversão para um comprimento longo da janela de conversão, e realizar a codificação aritmética na informação do espectro de frequência quando a janela de conversão não for comutada de um comprimento curto da janela de conversão para um comprimento longo da janela de conversão. a presente tecnologia pode ser aplicada em um codificador e em um decodificador.

Description

1 / 58 DISPOSITIVO E MÉTODO DE CODIFICAÇÃO, MÍDIA DE ARMAZENAMENTO LEGÍVEL POR COMPUTADOR, E, DISPOSITIVO
E MÉTODO DE DECODIFICAÇÃO Campo Técnico
[001] A presente tecnologia se refere a um dispositivo de codificação, a um método de codificação, a um dispositivo de decodificação, a um método de decodificação e a um programa, e, particularmente, se refere a um dispositivo de codificação, a um método de codificação, a um dispositivo de decodificação, a um método de decodificação e a um programa capaz de melhorar a eficiência de codificação. Fundamentos da Invenção
[002] Como métodos de codificação de um sinal de áudio, são conhecidos, por exemplo, codificação ou congêneres de acordo com o padrão MPEG (Grupo de Especialistas em Imagem em Movimento)-2 AAC (Codificação de Áudio Avançada), o padrão MPEG-4 AAC, o padrão MPEG- D USAC (Codificação Unificada de Fala e Áudio), e o padrão de áudio MPEG-H 3D que usa o padrão MPEG-D USAC como um Codificador Central, que são padrões internacionais (consulte, por exemplo, NPLs 1 e 2). Lista de Citação Literatura Não Patente
[003] NPL 1 PADRÃO INTERNACIONAL ISO/IEC 14496-3 Quarta edição 2009-09-01 Tecnologia da informação-codificação de áudio- objetos visuais-parte3: Áudio NPL 2 PADRÃO INTERNACIONAL ISO/IEC 23003-3 Primeira edição 2012-04-01 Tecnologia da informação-codificação de áudio- objetos visuais-parte3: Codificação Unificada de Fala e Áudio Sumário da Invenção Problema Técnico
[004] Neste ínterim, para transmitir muitos materiais (objetos)
2 / 58 sonoros realizados pela reprodução com a presença mais intensificada do que aquela da convencional reprodução de som surround 7.1 ou “áudio 3D”, é necessário usar uma tecnologia de codificação capaz de decodificar mais canais de áudio com eficiência de compressão mais alta em uma velocidade mais alta. Em outras palavras, melhor eficiência de codificação é desejada.
[005] A presente tecnologia foi alcançada à luz de uma circunstância como esta, e um objetivo da presente tecnologia é habilitar a melhor eficiência de codificação. Solução para o Problema
[006] Um dispositivo de codificação de acordo com um primeiro aspecto da presente tecnologia inclui uma seção de transformação da frequência temporal que realiza a transformação de frequência temporal usando uma janela de transformação em um sinal de áudio, e uma seção de codificação que realiza a codificação Huffman na informação do espectro de frequência obtida pela transformação de frequência temporal em um caso em que um comprimento da janela de transformação da janela de transformação for comutado de um pequeno comprimento da janela de transformação para um grande comprimento da janela de transformação, e que realiza a codificação aritmética na informação do espectro de frequência em um caso em que o comprimento da janela de transformação da janela de transformação não for comutado do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação.
[007] Um método de codificação ou um programa de acordo com o primeiro aspecto da presente tecnologia incluem realizar a transformação de frequência temporal usando uma janela de transformação em um sinal de áudio, realizar a codificação Huffman na informação do espectro de frequência obtida pela transformação de frequência temporal em um caso em que um comprimento da janela de transformação da janela de transformação for comutado de um pequeno comprimento da janela de transformação para
3 / 58 um grande comprimento da janela de transformação, e realizar a codificação aritmética na informação do espectro de frequência em um caso em que o comprimento da janela de transformação da janela de transformação não for comutado do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação.
[008] De acordo com o primeiro aspecto da presente tecnologia, a transformação de frequência temporal usando uma janela de transformação é realizada em um sinal de áudio, a codificação Huffman é realizada na informação do espectro de frequência obtida pela transformação de frequência temporal em um caso em que um comprimento da janela de transformação da janela de transformação for comutado de um pequeno comprimento da janela de transformação para um grande comprimento da janela de transformação, e a codificação aritmética é realizada na informação do espectro de frequência em um caso em que o comprimento da janela de transformação da janela de transformação não for comutado do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação.
[009] Um dispositivo de decodificação de acordo com um segundo aspecto da presente tecnologia inclui uma seção de demultiplexação que demultiplexa um fluxo contínuo de bits codificado, e que extrai a informação da janela de transformação que indica um tipo de uma janela de transformação usada na transformação de frequência temporal de um sinal de áudio e os dados codificados em relação à informação do espectro de frequência obtida pela transformação de frequência temporal do fluxo contínuo de bits codificado, e uma seção de decodificação que decodifica os dados codificados por um esquema de decodificação correspondente à codificação Huffman em um caso em que a janela de transformação indicada pela informação da janela de transformação for a janela de transformação selecionada no momento da comutação do comprimento da janela de transformação de um pequeno comprimento da janela de transformação para
4 / 58 um grande comprimento da janela de transformação.
[0010] Um método de decodificação ou um programa de acordo com o segundo aspecto da presente tecnologia incluem as etapas de demultiplexar um fluxo contínuo de bits codificado, e extrair a informação da janela de transformação que indica um tipo de uma janela de transformação usada na transformação de frequência temporal de um sinal de áudio e os dados codificados em relação à informação do espectro de frequência obtida pela transformação de frequência temporal do fluxo contínuo de bits codificado, e decodificar os dados codificados por um esquema de decodificação correspondente à codificação Huffman em um caso em que a janela de transformação indicada pela informação da janela de transformação for a janela de transformação selecionada no momento da comutação do comprimento da janela de transformação de um pequeno comprimento da janela de transformação para um grande comprimento da janela de transformação.
[0011] De acordo com o segundo aspecto da presente tecnologia, um fluxo contínuo de bits codificado é demultiplexado, a informação da janela de transformação que indica um tipo de uma janela de transformação usada na transformação de frequência temporal de um sinal de áudio e os dados codificados em relação à informação do espectro de frequência obtida pela transformação de frequência temporal são extraídos do fluxo contínuo de bits codificado, e os dados codificados são decodificados por um esquema de decodificação correspondente à codificação Huffman em um caso em que a janela de transformação indicada pela informação da janela de transformação for a janela de transformação selecionada no momento da comutação do comprimento da janela de transformação de um pequeno comprimento da janela de transformação para um grande comprimento da janela de transformação. Efeito Vantajoso da Invenção
5 / 58
[0012] De acordo com o primeiro e o segundo aspectos da presente tecnologia, é possível melhorar a eficiência de codificação.
[0013] Percebe-se que as vantagens não são sempre limitadas àquelas aqui descritas, mas podem ser qualquer um dos efeitos vantajosos descritos na presente descrição. Breve Descrição dos Desenhos
[0014] A figura 1 é um diagrama explicativo da codificação MPEG-4 AAC.
[0015] A figura 2 é um diagrama explicativo dos tipos de uma janela de transformação em MPEG-4 AAC.
[0016] A figura 3 é um diagrama explicativo da codificação MPEG-D USAC.
[0017] A figura 4 é um diagrama explicativo dos tipos de uma janela de transformação em MPEG-D USAC.
[0018] A figura 5 é um diagrama explicativo das eficiências de codificação da codificação Huffman e da codificação aritmética.
[0019] A figura 6 é um diagrama explicativo das eficiências de codificação da codificação Huffman e da codificação aritmética.
[0020] A figura 7 é um diagrama explicativo das eficiências de codificação da codificação Huffman e da codificação aritmética.
[0021] A figura 8 é um diagrama explicativo das eficiências de codificação da codificação Huffman e da codificação aritmética.
[0022] A figura 9 é um diagrama explicativo das eficiências de codificação da codificação Huffman e da codificação aritmética.
[0023] A figura 10 é um diagrama explicativo das eficiências de codificação da codificação Huffman e da codificação aritmética.
[0024] A figura 11 é um diagrama explicativo das eficiências de codificação da codificação Huffman e da codificação aritmética.
[0025] A figura 12 é um diagrama explicativo das eficiências de
6 / 58 codificação da codificação Huffman e da codificação aritmética.
[0026] A figura 13 é um diagrama explicativo das eficiências de codificação da codificação Huffman e da codificação aritmética.
[0027] A figura 14 é um diagrama explicativo das eficiências de codificação da codificação Huffman e da codificação aritmética.
[0028] A figura 15 é um diagrama explicativo das eficiências de codificação da codificação Huffman e da codificação aritmética.
[0029] A figura 16 é um diagrama explicativo das eficiências de codificação da codificação Huffman e da codificação aritmética.
[0030] A figura 17 é um diagrama explicativo das eficiências de codificação da codificação Huffman e da codificação aritmética.
[0031] A figura 18 é um diagrama explicativo das eficiências de codificação da codificação Huffman e da codificação aritmética.
[0032] A figura 19 é um diagrama que representa um exemplo de uma configuração de um dispositivo de codificação.
[0033] A figura 20 é um fluxograma que ilustra o processamento de codificação.
[0034] A figura 21 é um diagrama que representa um exemplo de uma configuração de um dispositivo de decodificação.
[0035] A figura 22 é um fluxograma que ilustra o processamento de decodificação.
[0036] A figura 23 é um diagrama explicativo das eficiências de codificação de acordo com a presente tecnologia.
[0037] A figura 24 é um diagrama explicativo das eficiências de codificação de acordo com a presente tecnologia.
[0038] A figura 25 é um diagrama que representa um exemplo de sintaxe de um fluxo contínuo de canal.
[0039] A figura 26 é um diagrama que representa um exemplo de sintaxe de ics_info.
7 / 58
[0040] A figura 27 é um fluxograma que ilustra o processamento de codificação.
[0041] A figura 28 é um fluxograma que ilustra o processamento de decodificação.
[0042] A figura 29 é um fluxograma que ilustra o processamento de codificação.
[0043] A figura 30 é um diagrama que representa um exemplo de uma configuração de um computador. Descrição das Modalidades
[0044] As modalidades nas quais a presente tecnologia é aplicada serão descritas a seguir em relação aos desenhos. <Primeira modalidade> <Presente Tecnologia>
[0045] Um esboço da presente tecnologia será descrito primeiro. Embora um sinal a ser codificado possa ser quaisquer tipos de sinal, tal como um sinal de áudio e um sinal de imagem, a presente tecnologia será descrita a seguir tomando, a título de exemplo, um caso no qual um objeto a ser codificado é um sinal de áudio.
[0046] Por exemplo, em MPEG-4 AAC, um sinal de áudio é codificado da forma representada na figura 1.
[0047] Em outras palavras, quando o processamento de codificação (codificação) for iniciado, a transformação de frequência temporal é realizada primeiro no sinal de áudio usando MDCT (Transformada Discreta de Cosseno Modificada).
[0048] A seguir, um coeficiente de MDCT, que é a informação do espectro de frequência obtida pela MDCT, é quantizado por banda do fator de escala, e os coeficientes de MDCT quantizados são obtidos em decorrência da quantização.
[0049] A banda do fator de escala, aqui, significa uma banda obtida
8 / 58 pela combinação de uma pluralidade de sub-bandas que têm uma largura de banda pré-determinada que é uma potência de resolução de um filtro de análise QMF (Filtro em Espelho de Quadratura).
[0050] Quando os coeficientes de MDCT quantizados forem obtidos por quantização, a codificação Huffman é usada para cada seção em que o mesmo livro código Huffman é usado para codificar os coeficientes de MDCT quantizados e a informação do livro código Huffman. Em outras palavras, a codificação Huffman é realizada. Percebe-se que uma seção é uma banda obtida pela combinação de uma pluralidade de bandas do fator de escala.
[0051] Os códigos Huffman, isto é, os coeficientes de MDCT quantizados codificados por Huffman e a informação do livro código Huffman obtidos da forma supradescrita são transmitidos como dados codificados em relação ao sinal de áudio.
[0052] Além do mais, é conhecido que, na transformação de frequência temporal, a seleção de uma janela de transformação adequada de acordo com uma propriedade do sinal de áudio normalmente a ser processado habilita a compressão do sinal de áudio em uma qualidade de som superior àquela usando uma única janela de transformação.
[0053] Por exemplo, é conhecido que uma janela de transformação que tem um pequeno comprimento da janela de transformação é adequada para um sinal de música que tem uma forte propriedade de ataque que acompanha uma repentina mudança temporal (sinal de música de ataque), e que uma janela de transformação que tem um grande comprimento da janela de transformação é adequada para um sinal de música que tem uma forte propriedade estacionária que não acompanha uma repentina mudança temporal (sinal de música estacionário).
[0054] Especificamente, em MPEG4 AAC, por exemplo, a MDCT é realizada durante a apropriada comutação para uma sequência de janela
9 / 58 adequada dentre quatro sequências de janela, da forma representada na figura
2.
[0055] Na figura 2, “window_sequence” indica uma sequência de janela. A sequência de janela indica, aqui, um tipo da janela de transformação, isto é, um tipo de janela.
[0056] Particularmente, em MPEG4 AAC, é possível selecionar um dentre quatro tipos de janelas de transformação, isto é, ONLY_LONG_SEQUENCE, LONG_START_SEQUENCE, EIGHT_SHORT_SEQUENCE e EIGHT_SHORT_SEQUENCE como a sequência de janela, isto é, o tipo de janela.
[0057] Além do mais, na figura 2, “num_windows” indica o número de janelas de transformação usadas em um momento de realização da MDCT usando a janela de transformação de cada tipo de janela, e uma forma da janela de transformação é ilustrada em cada caixa “aparência”. Particularmente, em cada caixa “aparência”, uma direção horizontal indica uma direção do tempo na figura 2, e uma direção vertical indica uma magnitude da janela de transformação em cada posição da amostra, isto é, uma magnitude de um coeficiente pelo qual cada amostra é multiplicada na figura 2.
[0058] Em MPEG4 AAC, no momento da realização da MDCT no sinal de áudio, ONLY_LONG_SEQUENCE é selecionado para um quadro que tem uma forte propriedade estacionária. A janela de transformação indicada por este ONLY_LONG_SEQUENCE é uma janela de transformação que tem um comprimento da janela de transformação de 2.048 amostras.
[0059] Além do mais, EIGHT_SHORT_SEQUENCE é selecionado para um quadro que tem uma forte propriedade de ataque. A janela de transformação indicada por este EIGHT_SHORT_SEQUENCE compreende oito janelas de transformação divididas na direção do tempo, e um comprimento da janela de transformação de cada janela de transformação
10 / 58 dividida é 256 amostras.
[0060] A janela de transformação indicada por EIGHT_SHORT_SEQUENCE é menor no comprimento da janela de transformação do que as outras janelas de transformação, tal como a janela de transformação indicada por EIGHT_SHORT_SEQUENCE.
[0061] O LONG_START_SEQUENCE é selecionado para um quadro para o qual o window_sequence transiciona de ONLY_LONG_SEQUENCE para EIGHT_SHORT_SEQUENCE. A janela de transformação indicada por este LONG_START_SEQUENCE é uma janela de transformação que tem um comprimento da janela de transformação de 2.048 amostras.
[0062] O EIGHT_SHORT_SEQUENCE é selecionado para um quadro para o qual o window_sequence transiciona de EIGHT_SHORT_SEQUENCE para ONLY_LONG_SEQUENCE.
[0063] Em outras palavras, no caso da comutação do comprimento da janela de transformação da janela de transformação de um pequeno comprimento da janela de transformação para um grande comprimento da janela de transformação, EIGHT_SHORT_SEQUENCE é selecionado. A janela de transformação indicada por EIGHT_SHORT_SEQUENCE é uma janela de transformação que tem um comprimento da janela de transformação de 2.048 amostras.
[0064] Percebe-se que os detalhes das janelas de transformação usadas em MPEG4 AAC são descritos, por exemplo, em “PADRÃO INTERNACIONAL ISO/IEC 14496-3 Quarta edição 2009-09-01 Tecnologia da informação-codificação de áudio-objetos visuais-parte3:Áudio” com detalhes.
[0065] Por outro lado, em MPEG-D USAC, um sinal de áudio é codificado da forma representada na figura 3.
[0066] Em outras palavras, quando o processamento de codificação
11 / 58 (codificação) for iniciado, a transformação de frequência temporal é realizada primeiro no sinal de áudio usando a MDCT, similarmente ao caso de MPEG- 4 AAC.
[0067] Um coeficiente de MDCT obtido pela transformação de frequência temporal é, então, quantizado por banda do fator de escala, e os coeficientes de MDCT quantizados são obtidos em decorrência da quantização.
[0068] Além do mais, a codificação aritmética com base em contexto é realizada nos coeficientes de MDCT quantizados, e os coeficientes de MDCT quantizados aritmeticamente codificados são transmitidos como dados codificados em relação ao sinal de áudio.
[0069] Na codificação aritmética com base em contexto, uma pluralidade de tabelas de probabilidade de aparecimento, em cada uma das quais um código curto é alocado em uma sequência de bits de entrada em uma alta probabilidade de aparecimento e um código longo é alocado em uma sequência de bits de entrada em uma baixa probabilidade de aparecimento, é preparada.
[0070] Além do mais, a tabela da probabilidade de aparecimento eficiente é selecionada com base em um resultado da codificação (contexto) dos coeficientes de MDCT quantizados prévios em proximidade no tempo e na frequência dos coeficientes de MDCT quantizados a serem codificados. Em outras palavras, a tabela da probabilidade de aparecimento é apropriadamente comutada em consideração da correlação dos coeficientes de MDCT quantizados em proximidade no tempo e na frequência. Além do mais, os coeficientes de MDCT quantizados são codificados, usando a tabela da probabilidade de aparecimento selecionada.
[0071] Na codificação aritmética com base em contexto, a realização da codificação pela seleção da tabela da probabilidade de aparecimento eficiente a partir da pluralidade de tabelas de probabilidade de aparecimento
12 / 58 torna possível realizar a codificação de alto eficiência.
[0072] Além do mais, diferente da codificação Huffman, é desnecessário transmitir a informação do livro código na codificação aritmética. Devido a isto, é possível reduzir uma quantidade de código correspondente à informação de livro código na codificação aritmética, se comparada com a codificação Huffman.
[0073] Percebe-se que, em MPEG-D USAC, a MDCT é realizada durante a apropriada comutação para uma sequência de janela adequada dentre cinco sequências de janela, da forma representada na figura 4.
[0074] Na figura 4, “Janela” indica uma sequência de janela, “num_windows” indica o número de janelas de transformação usadas no momento da realização da MDCT usando a janela de transformação de cada tipo de janela, e uma forma da janela de transformação é ilustrada em cada caixa “Forma da Janela”.
[0075] Em MPEG-D USAC, é possível selecionar uma dentre cinco tipos de janelas de transformação, isto é, ONLY_LONG_SEQUENCE, LONG_START_SEQUENCE, EIGHT_SHORT_SEQUENCE, EIGHT_SHORT_SEQUENCE, e STOP_START_SEQUENCE como a sequência de janela.
[0076] Em particular, dentre os window_sequences, isto é, dentre os tipos de janela, ONLY_LONG_SEQUENCE, LONG_START_SEQUENCE, EIGHT_SHORT_SEQUENCE, e EIGHT_SHORT_SEQUENCE são os mesmos do caso de MPEG4 AAC.
[0077] Em MPEG-D USAC, STOP_START_SEQUENCE é adicionalmente preparado, além daqueles quatro tipos de janela.
[0078] STOP_START_SEQUENCE é selecionado para um quadro para o qual o window_sequence transiciona de EIGHT_SHORT_SEQUENCE para LONG_START_SEQUENCE.
[0079] A janela de transformação indicada por este
13 / 58 STOP_START_SEQUENCE é uma janela de transformação que tem um comprimento da janela de transformação de 2.048 amostras.
[0080] Percebe-se que os detalhes de MPEG-D USAC são descritos, por exemplo, no “PADRÃO INTERNACIONAL ISO/IEC 23003-3 Primeira edição 2012-04-01 Tecnologia da informação-codificação de áudio-objetos visuais-parte3:Codificação Unificada de Fala e Áudio”.
[0081] Também percebe-se que MPEG4 AAC será simplesmente referido como “AAC” e que MPEG-D USAC será simplesmente referido como “USAC”.
[0082] A comparação de AAC com USAC supradescrito indica que a codificação aritmética com base em contexto considerada superior na eficiência de compressão (eficiência de codificação) em relação à codificação Huffman adotada em AAC é adotada em USAC atual.
[0083] Entretanto, a codificação aritmética com base em contexto não é sempre maior (superior) na eficiência de compressão em relação à codificação Huffman para todos os sinais de áudio.
[0084] Na codificação aritmética com base em contexto USAC, os códigos são mais curtos e a eficiência de codificação tende a ser superior àquela na codificação Huffman AAC para um sinal de música estacionário; entretanto, os códigos ficam mais longos, e a eficiência de codificação tende a ser inferior para um sinal de música de ataque.
[0085] As figuras 5 a 18 representam tais exemplos. Percebe-se que, nas figuras 5 a 18, um eixo geométrico horizontal indica o tempo, isto é, os quadros de um sinal de áudio, e que um eixo geométrico vertical indica o número de bits codificados (número de bits necessários) ou uma diferença no número de bits necessários (o número de bits diferentes) em um momento de codificação do sinal de áudio. Um quadro contém, aqui, em particular, 1.024 amostras.
[0086] A figura 5 representa o número de bits necessários, necessários
14 / 58 em um caso de realização da MDCT e da quantização em um sinal de música estacionário que serve como um sinal de áudio e de realização da codificação Huffman AAC nos coeficientes de MDCT quantizados depois da quantização, e o número de bits necessários em um caso de realização da codificação aritmética USAC nos mesmos coeficientes de MDCT quantizados depois da quantização.
[0087] Neste exemplo, uma linha rompida L11 indica o número de bits necessários na codificação aritmética USAC em cada quadro, ao mesmo tempo em que uma linha rompida L12 indica o número de bits necessários na codificação Huffman AAC em cada quadro. Neste exemplo, entende-se que a codificação aritmética USAC é menor no número de bits necessários do que a codificação Huffman AAC na maioria dos quadros.
[0088] Além do mais, a figura 6 representa uma vista parcialmente ampliada da figura 5. Percebe-se que as partes na figura 6 correspondentes àquelas na figura 5 são denotadas pelos mesmos caracteres de referência e a descrição das mesmas será omitida.
[0089] Fica claro a partir das partes representadas na figura 6 que uma diferença no número de bits necessários entre a codificação Huffman AAC e a codificação aritmética USAC é de aproximadamente 100 a 150 bits, e que a codificação aritmética USAC é maior (superior) na eficiência de codificação em relação à codificação Huffman AAC.
[0090] A figura 7 representa a diferença entre o número de bits necessários na codificação Huffman AAC e o número de bits necessários na codificação aritmética USAC, isto é, o número de bits diferentes em cada quadro representado na figura 5.
[0091] Na figura 7, um eixo geométrico horizontal indica um quadro (tempo), e um eixo geométrico vertical indica o número de bits diferentes. Percebe-se que o número de bits diferentes é aqui obtido pela subtração do número de bits necessários na codificação Huffman AAC a partir do número
15 / 58 de bits necessários na codificação aritmética USAC.
[0092] Como fica claro a partir da figura 7, os números de bits diferentes assumem valores negativos na maioria dos quadros em um caso em que o sinal de áudio for o sinal de música estacionário, isto é, o sinal de áudio tem uma propriedade estacionária. Em outras palavras, entende-se que a codificação aritmética USAC é menor no número de bits necessários do que a codificação Huffman AAC na maioria dos quadros.
[0093] Em um caso em que o sinal de áudio a ser codificado for um sinal estacionário, portanto, a seleção da codificação aritmética como o esquema de codificação torna possível obter uma eficiência de codificação mais alta.
[0094] Além do mais, durante a MDCT, a sequência de janela, isto é, o tipo de sequência de janela, é selecionada em cada quadro. Quando um gráfico do número de bits diferentes representado na figura 7 for separado em quatro gráficos de acordo com as quatro sequências de janela representadas na figura 2, os quatro gráficos são aqueles representados nas figuras 8 a 11.
[0095] Em outras palavras, a figura 8 indica o número de bits diferentes em cada quadro para o qual ONLY_LONG_SEQUENCE é selecionado como a sequência de janela dentre os números de bits diferentes nos quadros representados na figura 7.
[0096] Igualmente, a figura 9 representa o número de bits diferentes em cada quadro para o qual LONG_START_SEQUENCE é selecionado como a sequência de janela dentre os números de bits diferentes nos quadros representados na figura 7. A figura 10 representa o número de bits diferentes em cada quadro para o qual EIGHT_SHORT_SEQUENCE é selecionado como a sequência de janela dentre os números de bits diferentes nos quadros representados na figura 7.
[0097] Além do mais, a figura 11 representa o número de bits diferentes em cada quadro para o qual EIGHT_SHORT_SEQUENCE é
16 / 58 selecionado como a sequência de dentre os números de bits diferentes nos quadros representados na figura 7.
[0098] Percebe-se que cada um dos eixos geométricos horizontais indica um quadro (tempo) e cada um dos eixos geométricos verticais indica o número de bits diferentes nas figuras 8 a 11.
[0099] Como fica claro a partir das figuras 8 a 11, ONLY_LONG_SEQUENCE é selecionado na maioria dos quadros, já que o sinal de áudio é o sinal de música estacionário. Além do mais, fica claro que há menos quadros para os quais o LONG_START_SEQUENCE, o EIGHT_SHORT_SEQUENCE e o EIGHT_SHORT_SEQUENCE restantes são selecionados.
[00100] Da forma representada na figura 11, em um caso em que EIGHT_SHORT_SEQUENCE for aqui selecionado, os números de bits diferentes são valores positivos; assim, a codificação Huffman AAC é superior na eficiência de codificação em mais quadros. Contudo, da forma representada na figura 7, entende-se que a codificação aritmética USAC é superior na eficiência de codificação em relação à codificação Huffman AAC como um todo.
[00101] Por outro lado, as figuras 12 a 18 correspondem às figuras 5 a 11, respectivamente, e cada qual indica o número de bits necessários ou o número de bits diferentes em um caso em que um sinal de áudio for um sinal de música de ataque.
[00102] Em outras palavras, a figura 12 representa o número de bits necessários, necessários em um caso de realização da MDCT e da quantização em um sinal de música de ataque que serve como um sinal de áudio e realização da codificação Huffman AAC nos coeficientes de MDCT quantizados depois da quantização, e o número de bits necessários em um caso de realização da codificação aritmética USAC nos mesmos coeficientes de MDCT quantizados depois da quantização.
17 / 58
[00103] Neste exemplo, uma linha rompida L31 indica o número de bits necessários na codificação aritmética USAC em cada quadro, ao mesmo tempo em que uma linha rompida L32 indica o número de bits necessários na codificação Huffman AAC em cada quadro.
[00104] Neste exemplo, a codificação aritmética USAC é menor no número de bits necessários do que a codificação Huffman AAC em muitos quadros. Entretanto, o número de quadros para os quais a codificação Huffman AAC é menor no número de bits necessários do que a codificação aritmética USAC no caso do sinal de música de ataque é maior do que aqueles no caso do sinal de música estacionário.
[00105] Além do mais, a figura 13 representa uma vista parcialmente ampliada da figura 12. Percebe-se que as partes na figura 13 correspondentes àquelas na figura 12 são denotadas pelos mesmos caracteres de referência e a descrição das mesmas será omitida.
[00106] É entendido, a partir das partes representadas na figura 13, que a codificação Huffman AAC é menor no número de bits necessários do que a codificação aritmética USAC em diversos quadros.
[00107] A figura 14 representa a diferença entre o número de bits necessários na codificação Huffman AAC e o número de bits necessários na codificação aritmética USAC, isto é, o número de bits diferentes em cada quadro representado na figura 12.
[00108] Na figura 14, um eixo geométrico horizontal indica um quadro (tempo), e um eixo geométrico vertical indica o número de bits diferentes. Percebe-se que o número de bits diferentes é aqui obtido pela subtração do número de bits necessários na codificação Huffman AAC a partir do número de bits necessários na codificação aritmética USAC.
[00109] Como fica claro a partir da figura 14, os números de bits diferentes assumem valores negativos em muitos quadros em um caso em que o sinal de áudio for o sinal de música de ataque, isto é, o sinal de áudio tiver
18 / 58 uma propriedade de ataque.
[00110] Entretanto, no caso em que o sinal de áudio for o sinal de música de ataque, o número de quadros para os quais os números de bits diferentes assumem um valor positivo é grande, se comparado com o caso no qual o sinal de áudio é o sinal de música estacionário. Em outras palavras, entende-se que a codificação Huffman AAC é menor no número de bits necessários do que a codificação aritmética USAC em mais quadros no caso em que o sinal de áudio for o sinal de música de ataque.
[00111] Além do mais, durante a MDCT, a sequência de janela, isto é, o tipo de sequência de janela, é selecionada em cada quadro. Quando um gráfico do número de bits diferentes representado na figura 14 for separado em quatro gráficos de acordo com as quatro sequências de janela representadas na figura 2, os quatro gráficos são aqueles representados nas figuras 15 a 18.
[00112] Em outras palavras, a figura 15 indica o número de bits diferentes em cada quadro para o qual ONLY_LONG_SEQUENCE é selecionado como a sequência de janela a partir dos números de bits diferentes nos quadros representados na figura 14.
[00113] Igualmente, a figura 16 representa o número de bits diferentes em cada quadro para o qual LONG_START_SEQUENCE é selecionado como a sequência de janela a partir dos números de bits diferentes nos quadros representados na figura 14. A figura 17 representa o número de bits diferentes em cada quadro para o qual EIGHT_SHORT_SEQUENCE é selecionado como a sequência de janela a partir dos números de bits diferentes nos quadros representados na figura 14.
[00114] Além do mais, a figura 18 representa o número de bits diferentes em cada quadro para o qual EIGHT_SHORT_SEQUENCE é selecionado como a sequência de janela a partir dos números de bits diferentes nos quadros representados na figura 14.
19 / 58
[00115] Percebe-se que cada um dos eixos geométricos horizontais indica um quadro (tempo) e cada um dos eixos geométricos verticais indica o número de bits diferentes nas figuras 15 a 18.
[00116] Como fica claro a partir das figuras 15 a 18, uma proporção na qual EIGHT_SHORT_SEQUENCE, LONG_START_SEQUENCE ou EIGHT_SHORT_SEQUENCE é selecionado como a sequência de janela no caso em que o sinal de áudio for o sinal de música de ataque é superior àquela no caso em que o sinal de áudio for o sinal de música estacionário.
[00117] Além do mais, entende-se que, em um caso em que ONLY_LONG_SEQUENCE, LONG_START_SEQUENCE ou EIGHT_SHORT_SEQUENCE for selecionado mesmo se o sinal de áudio for o sinal de música de ataque, a codificação aritmética USAC é superior na eficiência de codificação em relação à codificação Huffman AAC na maioria dos quadros, similarmente ao caso do sinal de música estacionário.
[00118] Entretanto, entende-se que, em um caso em que EIGHT_SHORT_SEQUENCE for selecionado, a codificação Huffman AAC é menor no número de bits necessários e superior na eficiência de codificação em relação à codificação aritmética USAC na maioria dos quadros.
[00119] Isto é em virtude de a correlação de contexto diminuir na codificação aritmética USAC devido à transição entre o quadro que tem uma forte propriedade de ataque e o quadro que tem uma forte propriedade estacionária e uma ineficiente tabela da probabilidade de aparecimento ser selecionada.
[00120] Percebe-se que o número de bits necessários (quantidade de código) na codificação aritmética USAC não é grande nos quadros para cada um dos quais EIGHT_SHORT_SEQUENCE é selecionado em virtude de as janelas de transformação divididas em oito na direção do tempo serem usadas para a codificação dos coeficientes de MDCT quantizados. Em outras palavras, a codificação dos coeficientes de MDCT quantizados é realizada
20 / 58 oito vezes separadamente para corresponder às oito janelas de transformação divididas na direção do tempo, cada qual tendo o comprimento da janela de transformação de 256 amostras; assim, um grau de uma redução na correlação de contexto é dispersado e mitigado.
[00121] Como exposto, no caso em que o sinal de áudio tiver a propriedade de ataque, a codificação aritmética USAC é inferior na eficiência de codificação (eficiência de compressão) em relação à codificação Huffman AAC particularmente no quadro no momento da transição do quadro que usa a janela de transformação que tem o pequeno comprimento da janela de transformação para o quadro que usa a janela de transformação que tem o grande comprimento da janela de transformação, isto é, em cada quadro para o qual EIGHT_SHORT_SEQUENCE é selecionado.
[00122] Além do mais, um aumento em um comprimento de código dos códigos aritméticos leva naturalmente a um aumento na complexidade computacional no momento da decodificação.
[00123] Além do mais, a codificação aritmética tem propriedades em que é impossível realizar a decodificação sem tornar todos os sinais de um coeficiente de MDCT quantizado uniformes e mais complexidade computacional do que aquela da codificação Huffman é exigida devido à ocorrência de um grande volume de processamento de computação por bit.
[00124] Para abordar os problemas, portanto, pretende-se que a presente tecnologia seja capaz de melhorar a eficiência de codificação e reduzir a complexidade computacional durante a decodificação pela apropriada seleção do esquema de codificação no momento da codificação do sinal de áudio.
[00125] Especificamente, por exemplo, no codec que usa a transformação de frequência temporal similarmente a USAC, a informação do espectro de frequência quantizada é sujeita à codificação Huffman em um caso de transição de um quadro no qual a transformação de frequência
21 / 58 temporal é realizada usando uma janela de transformação que tem um pequeno comprimento da janela de transformação para um quadro no qual a transformação de frequência temporal é realizada usando uma janela de transformação que tem um comprimento da janela de transformação maior do que aquele do quadro anterior.
[00126] Por exemplo, no caso de USAC, a codificação Huffman é selecionada como o esquema de codificação em cada quadro para o qual EIGHT_SHORT_SEQUENCE é selecionado.
[00127] Além do mais, tanto a codificação Huffman quanto a codificação aritmética é selecionada como o esquema de codificação para os outros quadros, isto é, os quadros diferentes de cada quadro no momento da transição do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação.
[00128] Neste momento, conter um indicador de determinação para identificar o esquema de codificação selecionado em um fluxo contínuo de bits codificado conforme necessário habilita um lado da decodificação a identificar o esquema de codificação selecionado. Em outras palavras, a especificação da comutação do indicador de determinação ou do esquema de decodificação em uma sintaxe do decodificador habilita o lado da decodificação a comutar apropriadamente o esquema de decodificação. <Exemplo de Configuração do Dispositivo de Codificação>
[00129] Subsequentemente, as modalidades específicas de um dispositivo de codificação e um dispositivo de decodificação nos quais a presente tecnologia é aplicada serão descritas. Percebe-se que as modalidades para realizar codificação e decodificação com base em MPEG-D USAC serão descritas a seguir. Entretanto, qualquer outro codec pode ser realizado desde que a codificação seja realizada na informação transformada da frequência temporal pela comutação do comprimento da janela de transformação conforme apropriado e pela seleção de qualquer um de uma pluralidade de
22 / 58 esquemas de codificação, incluindo a codificação aritmética com base em contexto.
[00130] A figura 19 é um diagrama que representa um exemplo de uma configuração de um dispositivo de codificação no qual a presente tecnologia é aplicada.
[00131] Um dispositivo de codificação 11 representado na figura 19 tem uma seção de transformação da frequência temporal 21, uma seção de normalização 22, uma seção de quantização 23, uma seção de seleção do esquema de codificação 24, uma seção de codificação 25, uma seção de controle de bits 26 e uma seção de multiplexação 27.
[00132] A seção de transformação da frequência temporal 21 seleciona uma janela de transformação para cada quadro de um sinal de áudio suprido e realiza a transformação de frequência temporal no sinal de áudio, usando a janela de transformação selecionada.
[00133] Além do mais, a seção de transformação da frequência temporal 21 supre a informação do espectro de frequência obtida pela transformação de frequência temporal para a seção de normalização 22 e supre a informação da janela de transformação que indica o tipo (sequência de janela) da janela de transformação selecionada para cada quadro para a seção de seleção do esquema de codificação 24 e a seção de multiplexação 27.
[00134] Por exemplo, a seção de transformação da frequência temporal 21 realiza a MDCT como a transformação de frequência temporal e obtém um coeficiente de MDCT como a informação do espectro de frequência. A descrição será continuada enquanto se toma um caso no qual a informação do espectro de frequência é o coeficiente de MDCT, a título de exemplo.
[00135] A seção de normalização 22 normaliza o coeficiente de MDCT suprido a partir da seção de transformação da frequência temporal 21 com base nos parâmetros para normalização supridos a partir da seção de controle de bits 26, supre o coeficiente de MDCT normalizado obtido em decorrência
23 / 58 da normalização para a seção de quantização 23, e supre os parâmetros associados com a normalização para a seção de multiplexação 27.
[00136] A seção de quantização 23 quantiza o coeficiente de MDCT normalizado suprido a partir da seção de normalização 22 e supre os coeficientes de MDCT quantizados obtidos em decorrência da quantização para a seção de seleção do esquema de codificação 24.
[00137] A seção de seleção do esquema de codificação 24 seleciona um esquema de codificação com base na informação da janela de transformação suprida a partir da seção de transformação da frequência temporal 21 e supre os coeficientes de MDCT quantizados supridos a partir da seção de quantização 23 para um bloco na seção de codificação 25 de acordo com um resultado da seleção do esquema de codificação.
[00138] A seção de codificação 25 codifica os coeficientes de MDCT quantizados supridos a partir da seção de seleção do esquema de codificação 24 pelo esquema de codificação selecionado (designado) pela seção de seleção do esquema de codificação 24. A seção de codificação 25 tem uma seção de codificação Huffman 31 e uma seção de codificação aritmética 32.
[00139] A seção de codificação Huffman 31 codifica os coeficientes de MDCT quantizados por um esquema de codificação Huffman em um caso em que os coeficientes de MDCT quantizados forem supridos a partir da seção de seleção do esquema de codificação 24. Em outras palavras, os coeficientes de MDCT quantizados são sujeitos à codificação Huffman.
[00140] A seção de codificação Huffman 31 supre os dados codificados MDCT obtidos pela codificação Huffman e a informação do livro código Huffman para a seção de controle de bits 26. A informação do livro código Huffman significa, aqui, a informação que indica um livro código Huffman usado no momento da codificação Huffman. Além do mais, a informação do livro código Huffman suprida para a seção de controle de bits 26 é sujeita à codificação Huffman.
24 / 58
[00141] A seção de codificação aritmética 32 codifica os coeficientes de MDCT quantizados por um esquema de codificação aritmética em um caso em que os coeficientes de MDCT quantizados forem supridos a partir da seção de seleção do esquema de codificação 24. Em outras palavras, os coeficientes de MDCT quantizados são sujeitos à codificação aritmética com base em contexto.
[00142] A seção de codificação aritmética 32 supre os dados codificados MDCT obtidos pela codificação aritmética para a seção de controle de bits 26.
[00143] A seção de controle de bits 26 determina uma quantidade de bits e uma qualidade de som quando os dados codificados MDCT e a informação do livro código Huffman forem supridos da seção de codificação Huffman 31 para a seção de controle de bits 26 ou quando os dados codificados MDCT forem supridos da seção de codificação aritmética 32 para a seção de controle de bits 26.
[00144] Em outras palavras, a seção de controle de bits 26 determina se a quantidade de bits (quantidade de código) dos dados codificados MDCT e/ou congêneres estão em uma quantidade de bits a serem usados alvo e determina se a qualidade de som de um som com base nos dados codificados MDCT é uma qualidade em uma faixa permissível.
[00145] A seção de controle de bits 26 supre os dados codificados MDCT supridos e/ou congêneres para a seção de multiplexação 27 em um caso em que a quantidade de bits dos dados codificados MDCT e/ou congêneres estiver na quantidade de bits a serem usados alvo e a qualidade de som estiver na faixa permissível.
[00146] Inversamente, a seção de controle de bits 26 redefine os parâmetros a serem supridos para a seção de normalização 22, e supre os parâmetros redefinidos para a seção de normalização 22 para fazer com que a codificação seja realizada novamente em um caso em que a quantidade de bits
25 / 58 dos dados codificados MDCT e/ou congêneres não estiver na quantidade de bits a serem usados alvo ou a qualidade de som não estiver na faixa permissível.
[00147] A seção de multiplexação 27 multiplexa os dados codificados MDCT e a informação do livro código Huffman que são supridos a partir da seção de controle de bits 26, a informação da janela de transformação suprida a partir da seção de transformação da frequência temporal 21, e os parâmetros supridos a partir da seção de normalização 22 e transmite um fluxo contínuo de bits codificado obtido em decorrência da multiplexação. <Descrição do Processamento de Codificação>
[00148] As operações realizadas pelo dispositivo de codificação 11 serão descritas a seguir. Em outras palavras, o processamento de codificação realizado pelo dispositivo de codificação 11 será descrito em relação a um fluxograma da figura 20. Percebe-se que este processamento de codificação é realizado para cada quadro do sinal de áudio.
[00149] Na Etapa S11, a seção de transformação da frequência temporal 21 realiza a transformação de frequência temporal em um quadro do sinal de áudio suprido.
[00150] Em outras palavras, a seção de transformação da frequência temporal 21 determina uma propriedade de ataque ou uma propriedade estacionária do quadro a ser processado do sinal de áudio com base, por exemplo, nos coeficientes de MDCT em proximidade no tempo e na frequência em relação aos coeficientes de MDCT ou uma magnitude e uma quantidade de variação do sinal de áudio. Em outras palavras, a seção de transformação da frequência temporal 21 identifica se o sinal de áudio tem uma propriedade de ataque ou uma propriedade estacionária a partir de uma magnitude e uma quantidade de variação dos coeficientes de MDCT, da magnitude e da quantidade de variação do sinal de áudio, e congêneres.
[00151] A seção de transformação da frequência temporal 21 seleciona
26 / 58 uma janela de transformação para o quadro a ser processado com base em um resultado da determinação da propriedade de ataque ou da propriedade estacionária, um resultado da seleção da janela de transformação para o quadro temporalmente imediatamente precedente ao quadro a ser processado, e congêneres, e realiza a transformação de frequência temporal no quadro a ser processado do sinal de áudio, usando a janela de transformação selecionada. A seção de transformação da frequência temporal 21 supre o coeficiente de MDCT obtido pela transformação de frequência temporal para a seção de normalização 22 e supre a informação da janela de transformação que indica o tipo da janela de transformação selecionada para a seção de seleção do esquema de codificação 24 e a seção de multiplexação 27.
[00152] Na Etapa S12, a seção de normalização 22 normaliza o coeficiente de MDCT suprido a partir da seção de transformação da frequência temporal 21 com base nos parâmetros supridos a partir da seção de controle de bits 26, supre o coeficiente de MDCT normalizado obtido em decorrência da normalização para a seção de quantização 23 e supre os parâmetros associados com a normalização para a seção de multiplexação 27.
[00153] Na Etapa S13, a seção de quantização 23 quantiza o coeficiente de MDCT normalizado suprido a partir da seção de normalização 22 e supre os coeficientes de MDCT quantizados obtidos em decorrência da quantização para a seção de seleção do esquema de codificação 24.
[00154] Na Etapa S14, a seção de seleção do esquema de codificação 24 determina se o tipo da janela de transformação, isto é, a sequência de janela indicada pela informação da janela de transformação suprida a partir da seção de transformação da frequência temporal, 21 é EIGHT_SHORT_SEQUENCE ou não.
[00155] Em um caso de determinação, na Etapa S14, que a sequência de janela é EIGHT_SHORT_SEQUENCE, a seção de seleção do esquema de codificação 24 supre os coeficientes de MDCT quantizados supridos a partir
27 / 58 da seção de quantização 23 para a seção de codificação Huffman 31, e o processamento, então, vai para a Etapa S15.
[00156] O quadro para o qual EIGHT_SHORT_SEQUENCE é selecionado é o quadro no momento da transição do quadro que tem uma forte propriedade de ataque e um pequeno comprimento da janela de transformação, isto é, EIGHT_SHORT_SEQUENCE para o quadro que tem uma forte propriedade estacionária e um grande comprimento da janela de transformação, isto é, ONLY_LONG_SEQUENCE.
[00157] Em um caso de um quadro como este para o qual o comprimento da janela de transformação é comutado do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação, isto é, o quadro para o qual EIGHT_SHORT_SEQUENCE é selecionado, a codificação Huffman é superior na eficiência de codificação em relação à codificação aritmética, da forma descrita com referência, por exemplo, à figura 18.
[00158] Portanto, no momento da codificação de um quadro como este, o esquema de codificação Huffman é selecionado como o esquema de codificação. Em outras palavras, os coeficientes de MDCT quantizados e a informação do livro código Huffman são codificados, usando os códigos Huffman para cada seção, usando o mesmo livro código Huffman, similarmente a MPEG4 AAC.
[00159] Na Etapa S15, a seção de codificação Huffman 31 realiza a codificação Huffman nos coeficientes de MDCT quantizados supridos a partir da seção de seleção do esquema de codificação 24, usando a informação do livro código Huffman, e supre os dados codificados MDCT e a informação do livro código Huffman para a seção de controle de bits 26.
[00160] A seção de controle de bits 26 determina a quantidade de bits a serem usados alvo e a qualidade de som com base nos dados codificados MDCT e na informação do livro código Huffman que são supridos a partir da
28 / 58 seção de codificação Huffman 31. O dispositivo de codificação 11 realiza repetidamente uma série de processamento que inclui redefinição de parâmetro, normalização, quantização e codificação Huffman, até que os dados codificados MDCT e a informação do livro código Huffman em uma quantidade de bits alvo e uma qualidade alvo sejam obtidos.
[00161] Além do mais, quando os dados codificados MDCT e a informação do livro código Huffman na quantidade de bits alvo e na qualidade alvo forem obtidos, a seção de controle de bits 26 supre os dados codificados MDCT e a informação do livro código Huffman para a seção de multiplexação 27, e o processamento vai para a Etapa S17.
[00162] Inversamente, em um caso de determinação, na Etapa S14, que a sequência de janela não é EIGHT_SHORT_SEQUENCE, isto é, em um caso de nenhuma comutação do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação, o processamento, então, vai para a Etapa S16. Neste caso, a seção de seleção do esquema de codificação 24 supre os coeficientes de MDCT quantizados supridos a partir da seção de quantização 23 para a seção de codificação aritmética 32.
[00163] Na Etapa S16, a seção de codificação aritmética 32 realiza a codificação aritmética com base em contexto nos coeficientes de MDCT quantizados supridos a partir da seção de seleção do esquema de codificação 24 e supre os dados codificados MDCT para a seção de controle de bits 26. Em outras palavras, os coeficientes de MDCT quantizados são sujeitos a codificação aritmética.
[00164] A seção de controle de bits 26 determina a quantidade de bits a serem usados alvo e a qualidade de som com base nos dados codificados MDCT supridos a partir da seção de codificação aritmética 32. O dispositivo de codificação 11 realiza repetidamente o processamento que inclui a redefinição de parâmetro, a normalização, a quantização e a codificação
29 / 58 aritmética até que os dados codificados MDCT na quantidade de bits alvo e na qualidade alvo sejam obtidos.
[00165] Além do mais, quando os dados codificados MDCT na quantidade de bits alvo e na qualidade alvo forem obtidos, a seção de controle de bits 26 supre os dados codificados MDCT para a seção de multiplexação 27, e o processamento vai para a Etapa S17.
[00166] Quando o processamento das Etapas S15 ou S16 for realizado, o processamento da Etapa S17 é realizado.
[00167] Em outras palavras, na Etapa S17, a seção de multiplexação 27 realiza a multiplexação para gerar um fluxo contínuo de bits codificado e transmite (emite) o fluxo contínuo de bits codificado obtido para um dispositivo de decodificação ou congêneres.
[00168] Por exemplo, em um caso em que o processamento da Etapa S15 for realizado, a seção de multiplexação 27 multiplexa os dados codificados MDCT e a informação do livro código Huffman que são supridos a partir da seção de controle de bits 26, a informação da janela de transformação suprida a partir da seção de transformação da frequência temporal 21, e os parâmetros supridos a partir da seção de normalização 22, e gera o fluxo contínuo de bits codificado.
[00169] Além do mais, em um caso, por exemplo, em que o processamento da Etapa S16 é realizado, a seção de multiplexação 27 multiplexa os dados codificados MDCT supridos a partir da seção de controle de bits 26, a informação da janela de transformação suprida a partir da seção de transformação da frequência temporal 21, e os parâmetros supridos a partir da seção de normalização 22, e gera o fluxo contínuo de bits codificado.
[00170] Quando o fluxo contínuo de bits codificado obtido desta maneira for transmitido, o processamento de codificação é encerrado.
[00171] Da forma descrita até aqui, o dispositivo de codificação 11 seleciona o esquema de codificação de acordo com o tipo da janela de
30 / 58 transformação usada no momento da transformação de frequência temporal. Fazendo isto, é possível selecionar um esquema de codificação adequado para cada quadro e melhorar a eficiência de codificação. <Exemplo de Configuração do Dispositivo de Decodificação>
[00172] Subsequentemente, o dispositivo de decodificação que recebe o fluxo contínuo de bits codificado transmitido a partir do dispositivo de codificação 11 e realiza a decodificação será descrito.
[00173] Um dispositivo de decodificação como este é configurado da forma representada, por exemplo, na figura 21.
[00174] Um dispositivo de decodificação 71 representado na figura 21 tem uma seção de aquisição 81, uma seção de demultiplexação 82, uma seção de seleção do esquema de decodificação 83, uma seção de decodificação 84, uma seção de quantização inversa 85, e uma seção de transformação inversa da frequência temporal 86.
[00175] A seção de aquisição 81 adquire o fluxo contínuo de bits codificado pela recepção do fluxo contínuo de bits codificado suprido a partir do dispositivo de codificação 11 e supre o fluxo contínuo de bits codificado para a seção de demultiplexação 82.
[00176] A seção de demultiplexação 82 demultiplexa o fluxo contínuo de bits codificado suprido a partir da seção de aquisição 81 e supre os dados codificados MDCT e a informação do livro código Huffman que são obtidos pela demultiplexação para a seção de seleção do esquema de decodificação
83. Além do mais, a seção de demultiplexação 82 supre os parâmetros associados com a normalização e obtidos pela demultiplexação para a seção de quantização inversa 85 e supre a informação da janela de transformação obtida pela demultiplexação para a seção de seleção do esquema de decodificação 83 e a seção de transformação inversa da frequência temporal
86.
[00177] A seção de seleção do esquema de decodificação 83 seleciona
31 / 58 um esquema de decodificação com base na informação da janela de transformação suprida a partir da seção de demultiplexação 82, e supre os dados codificados MDCT e congêneres supridos a partir da seção de demultiplexação 82 para um bloco na seção de decodificação 84 de acordo com um resultado da seleção do esquema de decodificação.
[00178] A seção de decodificação 84 decodifica os dados codificados MDCT e congêneres supridos a partir da seção de seleção do esquema de decodificação 83. A seção de decodificação 84 tem uma seção de decodificação Huffman 91 e uma seção de decodificação aritmética 92.
[00179] A seção de decodificação Huffman 91 decodifica os dados codificados MDCT pelo esquema de decodificação correspondente à codificação Huffman, usando a informação do livro código Huffman, e supre os coeficientes de MDCT quantizados obtidos em decorrência da decodificação para a seção de quantização inversa 85 em um caso em que os dados codificados MDCT e a informação do livro código Huffman forem supridos a partir da seção de seleção do esquema de decodificação 83.
[00180] A seção de decodificação aritmética 92 decodifica os dados codificados MDCT pelo esquema de decodificação correspondente à codificação aritmética e supre os coeficientes de MDCT quantizados obtidos em decorrência da decodificação para a seção de quantização inversa 85 em um caso em que os dados codificados MDCT forem supridos a partir da seção de seleção do esquema de decodificação 83.
[00181] A seção de quantização inversa 85 quantiza inversamente os coeficientes de MDCT quantizados supridos a partir da seção de decodificação Huffman 91 ou da seção de decodificação aritmética 92, usando os parâmetros supridos a partir da seção de demultiplexação 82, e supre o coeficiente de MDCT obtido em decorrência da quantização inversa para a seção de transformação inversa da frequência temporal 86. Mais especificamente, a seção de quantização inversa 85 obtém o coeficiente de
32 / 58 MDCT, por exemplo, pela multiplicação de um valor obtido pela quantização inversa dos coeficientes de MDCT quantizados pelos parâmetros ou congêneres supridos a partir da seção de demultiplexação 82.
[00182] A seção de transformação inversa da frequência temporal 86 realiza a transformação inversa da frequência temporal no coeficiente de MDCT suprido a partir da seção de quantização inversa 85 com base na informação da janela de transformação suprida a partir da seção de demultiplexação 82 e transmite um sinal de áudio de saída que é um sinal de tempo obtido em decorrência da transformação inversa da frequência temporal para um estágio posterior. <Descrição do Processamento de Decodificação>
[00183] As operações realizadas pelo dispositivo de decodificação 71 serão descritas a seguir. Em outras palavras, o processamento de decodificação realizado pelo dispositivo de decodificação 71 será descrito em relação a um fluxograma da figura 22. Percebe-se que este processamento de decodificação é iniciado quando a seção de aquisição 81 receber um fluxo contínuo de bits codificado correspondente a um quadro.
[00184] Na Etapa S41, a seção de demultiplexação 82 demultiplexa o fluxo contínuo de bits codificado suprido a partir da seção de aquisição 81 e supre os dados codificados MDCT e congêneres obtidos pela demultiplexação para a seção de seleção do esquema de decodificação 83 e congêneres. Em outras palavras, os dados codificados MDCT, a informação da janela de transformação e vários tipos de parâmetros são extraídos do fluxo contínuo de bits codificado.
[00185] Neste caso, quando o sinal de áudio (coeficiente de MDCT) for sujeito à codificação Huffman, os dados codificados MDCT e a informação do livro código Huffman são extraídos a partir do fluxo contínuo de bits codificado. Ao contrário, quando o sinal de áudio for sujeito à codificação aritmética, os dados codificados MDCT são extraídos a partir do
33 / 58 fluxo contínuo de bits codificado.
[00186] Além do mais, a seção de demultiplexação 82 supre os parâmetros associados com a normalização e obtidos pela demultiplexação para a seção de quantização inversa 85, e supre a informação da janela de transformação obtida pela demultiplexação para a seção de seleção do esquema de decodificação 83 e a seção de transformação inversa da frequência temporal 86.
[00187] Na Etapa S42, a seção de seleção do esquema de decodificação 83 determina se o tipo da janela de transformação indicada pela informação da janela de transformação suprida a partir da seção de demultiplexação 82 é ou não EIGHT_SHORT_SEQUENCE.
[00188] Em um caso de determinação, na Etapa S42, que o tipo da janela de transformação é EIGHT_SHORT_SEQUENCE, a seção de seleção do esquema de decodificação 83 supre os dados codificados MDCT e a informação do livro código Huffman que são supridos a partir da seção de demultiplexação 82 para a seção de decodificação Huffman 91, e o processamento vai para a Etapa S43.
[00189] Neste caso, o quadro a ser processado é o quadro no momento da comutação do quadro que tem o pequeno comprimento da janela de transformação para o quadro que tem o grande comprimento da janela de transformação. Em outras palavras, a janela de transformação indicada pela informação da janela de transformação é a janela de transformação selecionada no momento da comutação do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação. Devido a isto, a seção de seleção do esquema de decodificação 83 seleciona o esquema de decodificação correspondente à codificação Huffman como o esquema de decodificação.
[00190] Na Etapa S43, a seção de decodificação Huffman 91 decodifica os dados codificados MDCT e a informação do livro código
34 / 58 Huffman que são supridos a partir da seção de seleção do esquema de decodificação 83, isto é, os códigos Huffman. Especificamente, a seção de decodificação Huffman 91 obtém os coeficientes de MDCT quantizados com base na informação do livro código Huffman e nos dados codificados MDCT.
[00191] A seção de decodificação Huffman 91 supre os coeficientes de MDCT quantizados obtidos pela decodificação para a seção de quantização inversa 85, e o processamento, então, vai para a Etapa S45.
[00192] Inversamente, em um caso de determinação, na Etapa S42, que o tipo da janela de transformação não é EIGHT_SHORT_SEQUENCE, a seção de seleção do esquema de decodificação 83 supre os dados codificados MDCT supridos a partir da seção de demultiplexação 82 para a seção de decodificação aritmética 92, e o processamento vai para a Etapa S44.
[00193] Neste caso, o quadro a ser processado não é o quadro no momento da comutação do quadro que tem o pequeno comprimento da janela de transformação para o quadro que tem o grande comprimento da janela de transformação. Em outras palavras, a janela de transformação indicada pela informação da janela de transformação não é a janela de transformação selecionada no momento da comutação do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação. Devido a isto, a seção de seleção do esquema de decodificação 83 seleciona o esquema de decodificação correspondente à codificação aritmética como o esquema de decodificação.
[00194] Na Etapa S44, a seção de decodificação aritmética 92 decodifica os dados codificados MDCT supridos a partir da seção de seleção do esquema de decodificação 83, isto é, os códigos aritméticos.
[00195] A seção de decodificação aritmética 92 supre os coeficientes de MDCT quantizados obtidos pela decodificação dos dados codificados MDCT para a seção de quantização inversa 85, e o processamento, então, vai para a Etapa S45.
35 / 58
[00196] Quando o processamento das Etapas S43 ou S44 for realizado, o processamento da Etapa S45 é realizado.
[00197] Na Etapa S45, a seção de quantização inversa 85 quantiza inversamente os coeficientes de MDCT quantizados supridos a partir da seção de decodificação Huffman 91 ou da seção de decodificação aritmética 92, usando os parâmetros supridos a partir da seção de demultiplexação 82 e supre o coeficiente de MDCT obtido em decorrência da demultiplexação para a seção de transformação inversa da frequência temporal 86.
[00198] Na Etapa S46, a seção de transformação inversa da frequência temporal 86 realiza a transformação inversa da frequência temporal no coeficiente de MDCT suprido a partir da seção de quantização inversa 85 com base na informação da janela de transformação suprida a partir da seção de demultiplexação 82 e transmite um sinal de áudio de saída obtido em decorrência da transformação inversa da frequência temporal para um estágio posterior.
[00199] Quando o sinal de áudio de saída for transmitido, o processamento de decodificação é encerrado.
[00200] Da forma descrita até aqui, o dispositivo de decodificação 71 seleciona o esquema de decodificação com base na informação da janela de transformação obtida pela demultiplexação do fluxo contínuo de bits codificado e realiza a decodificação pelo esquema de decodificação selecionado. Particularmente no caso em que o tipo da janela de transformação for EIGHT_SHORT_SEQUENCE, o esquema de decodificação correspondente à codificação Huffman é selecionado; caso contrário, o esquema de decodificação correspondente à codificação aritmética é selecionado. Fazendo isto, é possível não apenas melhorar a eficiência de codificação no lado da codificação, mas, também, reduzir uma taxa de transferência (quantidade de computação) durante a decodificação no lado da decodificação.
36 / 58
[00201] Neste ínterim, uma abordagem de realização da codificação Huffman em um quadro para o qual EIGHT_SHORT_SEQUENCE é selecionado e de realização da codificação aritmética em um quadro para o qual o tipo da janela de transformação diferente de EIGHT_SHORT_SEQUENCE é selecionado será referida como “abordagem de codificação híbrida”. De acordo com uma abordagem de codificação híbrida como esta, é possível melhorar a eficiência de codificação e reduzir a taxa de transferência durante a decodificação.
[00202] Por exemplo, a figura 23 representa um gráfico de uma diferença no número de bits necessários entre um caso de uso da codificação Huffman em um quadro para o qual EIGHT_SHORT_SEQUENCE de acordo com USAC é selecionado, isto é, um caso de realização da codificação pela abordagem de codificação híbrida e um caso de sempre usar a codificação Huffman AAC no momento da codificação do mesmo sinal de música estacionário do caso representado na figura 5.
[00203] Percebe-se que um eixo geométrico horizontal indica um quadro (tempo) e um eixo geométrico vertical indica o número de bits diferentes na figura 23. O número de bits diferentes aqui mencionado é obtido pela subtração do número de bits necessários na codificação Huffman AAC a partir do número de bits necessários na abordagem de codificação híbrida.
[00204] O número de bits diferentes em cada quadro representado na figura 23 corresponde ao número de bits diferentes representado na figura 7. A comparação entre as figuras 23 e 7, isto é, a comparação entre o caso de realização da codificação pela abordagem de codificação híbrida e o caso de sempre realizar a codificação aritmética indica que, embora o exemplo da figura 23 seja superior na eficiência de codificação, uma diferença na eficiência de codificação não é tão grande.
[00205] Ao contrário, a figura 24 representa uma diferença no número de bits necessários entre o caso de uso da codificação Huffman em cada
37 / 58 quadro para o qual EIGHT_SHORT_SEQUENCE de acordo com o USAC é selecionado, isto é, o caso de realização da codificação pela abordagem de codificação híbrida e o caso de sempre usar a codificação Huffman AAC no momento da codificação do mesmo sinal de música de ataque que no caso representado na figura 12.
[00206] Percebe-se que um eixo geométrico horizontal indica um quadro (tempo) e um eixo geométrico vertical indica o número de bits diferentes na figura 24. O número de bits diferentes aqui mencionado é obtido pela subtração do número de bits necessários na codificação Huffman AAC a partir do número de bits necessários na abordagem de codificação híbrida.
[00207] O número de bits diferentes em cada quadro representado na figura 24 corresponde ao número de bits diferentes representado na figura 14. A comparação entre as figuras 24 e 14, isto é, a comparação entre o caso de realização da codificação pela abordagem de codificação híbrida e o caso de sempre realizar a codificação aritmética indica que o exemplo da figura 24 é enormemente menor no número de bits diferentes. Em outras palavras, a comparação indica que o exemplo da figura 24 tem uma melhoria maior na eficiência de codificação.
[00208] Além do mais, com a abordagem de codificação híbrida, usar não a codificação aritmética, mas a codificação Huffman, em cada quadro para o qual EIGHT_SHORT_SEQUENCE é selecionado torna possível, também, reduzir a taxa de transferência durante a decodificação do quadro. <Segunda modalidade> <Seleção do Esquema de Codificação>
[00209] Neste ínterim, foi descrito até aqui que a codificação aritmética é sempre selecionada como o esquema de codificação para cada quadro para o qual o tipo da janela de transformação diferente de EIGHT_SHORT_SEQUENCE é selecionado. Entretanto, na seleção do esquema de codificação, é preferível considerar não apenas a eficiência de
38 / 58 codificação (eficiência de compressão), mas, também, uma margem da taxa de transferência, da qualidade de som e congêneres.
[00210] Portanto, também é possível selecionar, por exemplo, tanto a codificação Huffman quanto a codificação aritmética em um quadro para o qual o tipo da janela de transformação diferente de EIGHT_SHORT_SEQUENCE é selecionado.
[00211] Em um caso como este, um indicador de determinação que indica qual é selecionada, codificação Huffman ou codificação aritmética, como um esquema de codificação durante a codificação é armazenado, por exemplo, no fluxo contínuo de bits codificado.
[00212] É aqui considerado, por exemplo, que um valor “1” do indicador de determinação indica que o esquema de codificação Huffman é selecionado e que um valor “0” do indicador de determinação indica que o esquema de codificação aritmética é selecionado.
[00213] Um indicador de determinação de determinação como este pode ser dito como a informação de seleção que indica o esquema de codificação selecionado para o quadro a ser processado no caso em que o quadro for o quadro para o qual o tipo da janela de transformação diferente de EIGHT_SHORT_SEQUENCE é selecionado, isto é, no caso em que o pequeno comprimento da janela de transformação não é comutado para o grande comprimento da janela de transformação. Em outras palavras, o indicador de determinação pode ser dito como a informação de seleção que indica um resultado da seleção do esquema de codificação.
[00214] Percebe-se que o indicador de determinação não fica contido no fluxo contínuo de bits codificado para o quadro para o qual EIGHT_SHORT_SEQUENCE é selecionado, já que o esquema de codificação Huffman é sempre selecionado para um quadro como este.
[00215] Por exemplo, em um caso em que o indicador de determinação for armazenado no fluxo contínuo de bits codificado conforme apropriado,
39 / 58 uma sintaxe de um fluxo contínuo de canal correspondente a um quadro de um sinal de áudio em um canal pré-determinado no fluxo contínuo de bits codificado pode ser uma sintaxe com base em MPEG-D USAC, da forma representada na figura 25.
[00216] Em um exemplo representado na figura 25, uma parte denotada por uma seta Q11, isto é, uma parte de um caractere “ics_info()” indica ics_info no qual a informação associada com a janela de transformação e congêneres é armazenada.
[00217] Além do mais, uma parte de um caractere “section_data()” denotado por uma seta Q12 indica section_data. A informação do livro código Huffman e congêneres são armazenados neste section_data. Além do mais, um caractere “ac_spectral_data” na figura 25 indica os dados codificados MDCT.
[00218] Além do mais, uma sintaxe da parte ics_info indicada pelo caractere “ics_info()” é, por exemplo, representada na figura 26.
[00219] Em um exemplo representado na figura 26, uma parte de um caractere “window_sequence” indica a informação da janela de transformação, isto é, a sequência de janela, e uma parte de um caractere “window_shape” indica a forma da janela de transformação.
[00220] Além do mais, uma parte de um caractere “huffman_coding_flag” indica o indicador de determinação.
[00221] Em um caso, aqui, no qual a informação da janela de transformação armazenada na parte do caractere “window_sequence” indicar EIGHT_SHORT_SEQUENCE, o indicador de determinação não é armazenado no ics_info. Ao contrário, em um caso em que a informação da janela de transformação indicar o tipo diferente de EIGHT_SHORT_SEQUENCE, o indicador de determinação é armazenado no ics_info.
[00222] No exemplo representado na figura 25, portanto, em um caso
40 / 58 em que a informação da janela de transformação armazenada na parte do caractere “window_sequence” da figura 26 indicar o tipo diferente de EIGHT_SHORT_SEQUENCE e em que o indicador de determinação que tem um valor “1” for armazenado na parte do caractere “huffman_coding_flag” da figura 26, a informação do livro código Huffman e congêneres são armazenados no section_data. Além do mais, também, no caso em que a informação da janela de transformação armazenada na parte do caractere “window_sequence” da figura 26 indicar EIGHT_SHORT_SEQUENCE, a informação do livro código Huffman e congêneres também são armazenados no section_data. <Descrição do Processamento de Codificação>
[00223] No caso em que o indicador de determinação for armazenado no fluxo contínuo de bits codificado conforme apropriado, como nos exemplos representados nas figuras 25 e 26, o dispositivo de codificação 11 realiza o processamento de codificação representado, por exemplo, na figura
27. O processamento de codificação realizado pelo dispositivo de codificação 11 será descrito a seguir em relação a um fluxograma da figura 27.
[00224] Percebe-se que descrição a do processamento das Etapas S71 a S75 será omitida, já que o processamento é similar ao processamento das Etapas S11 a S15 da figura 20.
[00225] Em um caso de determinação, na Etapa S74, que a sequência de janela não é EIGHT_SHORT_SEQUENCE, a seção de seleção do esquema de codificação 24 determina se realiza-se ou não a codificação aritmética na Etapa S76.
[00226] A seção de seleção do esquema de codificação 24 determina se realiza-se ou não a codificação aritmética com base, por exemplo, na informação de designação suprida a partir de um dispositivo de controle de ordem superior.
[00227] A informação de designação significa, aqui, a informação que
41 / 58 indica o esquema de codificação designado, por exemplo, por um produtor de conteúdo ou congêneres. Por exemplo, o produtor de conteúdo pode designar tanto a codificação Huffman quanto a codificação aritmética como o esquema de codificação para cada quadro no caso do quadro para o qual a sequência de janela não é EIGHT_SHORT_SEQUENCE.
[00228] Neste caso, a seção de seleção do esquema de codificação 24 determina realizar a codificação aritmética na Etapa S76 quando o esquema de codificação indicado pela informação de designação for a codificação aritmética. Ao contrário, a seção de seleção do esquema de codificação 24 determina não realizar a codificação aritmética na Etapa S76 quando o esquema de codificação indicado pela informação de designação for a codificação Huffman.
[00229] Além do mais, a seção de seleção do esquema de codificação 24 pode selecionar o esquema de codificação na Etapa S76 com base nos recursos do dispositivo de decodificação 71 e do dispositivo de codificação 11, isto é, a taxa de transferência, uma taxa de bits do sinal de áudio a ser codificado, se ou não uma propriedade em tempo real é demandada e congêneres.
[00230] Especificamente, em um caso, por exemplo, em que a taxa de bits do sinal de áudio for alta e uma qualidade de som suficiente puder ser garantida, a seção de seleção do esquema de codificação 24 pode selecionar a codificação Huffman inferior na taxa de transferência e determinar não realizar a codificação aritmética na Etapa S76.
[00231] Além do mais, em um caso, por exemplo, no qual a propriedade de tempo real é demandada, o dispositivo de decodificação 71 tem menos recursos e é importante realizar o processamento de codificação e de decodificação prontamente com a taxa de transferência inferior, preferivelmente, sobre a qualidade de som, a seção de seleção do esquema de codificação 24 pode selecionar a codificação Huffman e determinar não
42 / 58 realizar a codificação aritmética na Etapa S76.
[00232] No caso em que a propriedade de tempo real for demandada ou o lado da decodificação tiver menos recursos desta maneira, a seleção da codificação Huffman como o esquema de codificação torna possível realizar o processamento (operações) em uma velocidade mais alta do que aquela no momento de sempre realizar a codificação aritmética.
[00233] Percebe-se que, quanto aos recursos do dispositivo de decodificação 71, é apenas suficiente adquirir uma capacidade de processamento de computação de um aparelho em que o dispositivo de decodificação 71 é provido, a informação indicando uma capacidade da memória e congêneres, por exemplo, do dispositivo de decodificação 71 em antecipação antes do início do processamento de codificação ou congêneres como a informação de recurso em relação ao dispositivo de decodificação 71.
[00234] Em um caso de determinação para realizar a codificação aritmética na Etapa S76, a seção de seleção do esquema de codificação 24 supre os coeficientes de MDCT quantizados supridos a partir da seção de quantização 23 para a seção de codificação aritmética 32, e o processamento da Etapa S77 é, então, realizado. Em outras palavras, na Etapa S77, a codificação aritmética com base em contexto é realizada nos coeficientes de MDCT quantizados.
[00235] Percebe-se que a descrição do processamento da Etapa S77 será omitida, já que o processamento é similar àquele da Etapa S16 da figura
20. Quando o processamento da Etapa S77 for realizado, o processamento, então, vai para a Etapa S79.
[00236] Ao contrário, em um caso de determinação de não realizar a codificação aritmética, isto é, determinação de realizar a codificação Huffman na Etapa S76, a seção de seleção do esquema de codificação 24 supre os coeficientes de MDCT quantizados supridos a partir da seção de quantização 23 para a seção de codificação Huffman 31, e o processamento vai para a
43 / 58 Etapa S78.
[00237] Na Etapa S78, o processamento similar àquele da Etapa S75 é realizado, e os dados codificados MDCT e a informação do livro código Huffman que são obtidos em decorrência do processamento são supridos a partir da seção de codificação Huffman 31 para a seção de controle de bits 26. Quando o processamento da Etapa S78 for realizado, o processamento, então, vai para a Etapa S79.
[00238] Quando o processamento das Etapas S77 ou S78 for realizado, a seção de controle de bits 26 gera um indicador de determinação na Etapa S79.
[00239] No caso, por exemplo, em que o processamento da Etapa S77, isto é, a codificação aritmética, for realizado, a seção de controle de bits 26 gera um indicador de determinação que tem um valor “0” e supre o indicador de determinação gerado juntamente com os dados codificados MDCT supridos a partir da seção de codificação aritmética 32 para a seção de multiplexação 27.
[00240] Além do mais, no caso, por exemplo, em que o processamento da Etapa S78, isto é, a codificação Huffman, for realizado, a seção de controle de bits 26 gera um indicador de determinação que tem um valor “1” e supre o indicador de determinação gerado juntamente com os dados codificados MDCT e a informação do livro código Huffman que são supridos a partir da seção de codificação Huffman 31 para a seção de multiplexação 27.
[00241] Quando o processamento da Etapa S79 for realizado, o processamento, então, vai para a Etapa S80.
[00242] Quando o processamento das Etapas S75 ou S79 for realizado, a seção de multiplexação 27 realiza a multiplexação para gerar um fluxo contínuo de bits codificado e transmite o fluxo contínuo de bits codificado obtido para o dispositivo de decodificação 71 na Etapa S80. Percebe-se que o processamento similar àquele da Etapa S17 da figura 20 é basicamente
44 / 58 realizado na Etapa S80.
[00243] No caso, por exemplo, em que o processamento da Etapa S75 for realizado, a seção de multiplexação 27 gera um fluxo contínuo de bits codificado que armazena no mesmo os dados codificados MDCT, a informação do livro código Huffman, a informação da janela de transformação e os parâmetros da seção de normalização 22. O indicador de determinação não fica contido neste fluxo contínuo de bits codificado.
[00244] Além do mais, no caso, por exemplo, em que o processamento da Etapa S78 for realizado, a seção de multiplexação 27 gera um fluxo contínuo de bits codificado que armazena no mesmo o indicador de determinação, os dados codificados MDCT, a informação do livro código Huffman, a informação da janela de transformação e os parâmetros da seção de normalização 22.
[00245] Além do mais, no caso, por exemplo, em que o processamento da Etapa S77 for realizado, a seção de multiplexação 27 gera um fluxo contínuo de bits codificado que armazena no mesmo o indicador de determinação, os dados codificados MDCT, a informação da janela de transformação e os parâmetros da seção de normalização 22.
[00246] Quando o fluxo contínuo de bits codificado for gerado e transmitido desta maneira, o processamento de codificação é encerrado.
[00247] Da forma descrita até aqui, o dispositivo de codificação 11 seleciona tanto a codificação Huffman quanto a codificação aritmética para um quadro para o qual a sequência de janela não é EIGHT_SHORT_SEQUENCE e realiza a codificação pelo esquema de codificação selecionado. Fazendo isto, é possível selecionar um esquema de codificação adequado para cada quadro, melhorar a eficiência de codificação e realizar a codificação com um grau de liberdade mais alto. <Descrição do Processamento de Decodificação>
[00248] Além do mais, no caso em que o dispositivo de codificação 11
45 / 58 realizar o processamento de codificação descrito em relação à figura 27, o dispositivo de decodificação 71 realiza o processamento de decodificação representado na figura 28.
[00249] O processamento de decodificação realizado pelo dispositivo de decodificação 71 será descrito a seguir em relação a um fluxograma da figura 28. Percebe-se que a descrição do processamento das Etapas S121 a S123 será omitida, já que o processamento é similar ao processamento das Etapas S41 a S43 da figura 22. Entretanto, percebe-se que o indicador de determinação é suprido a partir da seção de demultiplexação 82 para a seção de seleção do esquema de decodificação 83 em um caso em que o indicador de determinação for extraído a partir do fluxo contínuo de bits codificado pela demultiplexação na Etapa S121.
[00250] Em um caso de determinação, na Etapa S122, que a sequência de janela não é EIGHT_SHORT_SEQUENCE, a seção de seleção do esquema de decodificação 83 determina se os dados codificados MDCT são ou não códigos aritméticos com base no indicador de determinação suprido a partir da seção de demultiplexação 82 na Etapa S124. Em outras palavras, a seção de seleção do esquema de decodificação 83 determina se o esquema de codificação dos dados codificados MDCT é ou não a codificação aritmética.
[00251] Por exemplo, a seção de seleção do esquema de decodificação 83 determina que os dados codificados MDCT não são códigos aritméticos, isto é, os códigos Huffman em um caso em que o valor do indicador de determinação for “1”, e determina que os dados codificados MDCT são os códigos aritméticos em um caso em que o valor do indicador de determinação for “0”. Desta maneira, a seção de seleção do esquema de decodificação 83 seleciona tanto a codificação Huffman quanto a codificação aritmética, que é o esquema de decodificação correspondente ao esquema de codificação indicado pelo indicador de determinação.
[00252] Em um caso de determinação, na Etapa S124, que os dados
46 / 58 codificados MDCT não são códigos aritméticos, isto é, os códigos Huffman, a seção de seleção do esquema de decodificação 83 supre os dados codificados MDCT e a informação do livro código Huffman que são supridos a partir da seção de demultiplexação 82 para a seção de decodificação Huffman 91, e o processamento vai para a Etapa S123. Os códigos Huffman são, então, decodificados na Etapa S123.
[00253] Ao contrário, em um caso de determinação, na Etapa S124, que os dados codificados MDCT são códigos aritméticos, a seção de seleção do esquema de decodificação 83 supre os dados codificados MDCT supridos a partir da seção de demultiplexação 82 para a seção de decodificação aritmética 92, e o processamento vai para a Etapa S125.
[00254] Na Etapa S125, os dados codificados MDCT que são códigos aritméticos são decodificados pelo esquema de decodificação correspondente à codificação aritmética. A descrição do processamento da Etapa S125 será omitida já que o processamento é similar àquele da Etapa S44 da figura 22.
[00255] Quando o processamento das Etapas S123 ou S125 for realizado, o processamento das Etapas S126 e S127 é, então, realizado, e o processamento de decodificação é encerrado. Entretanto, a descrição das Etapas S126 e S127 será omitido, já que o processamento é similar àquele das Etapas S45 e S46 da figura 22.
[00256] Da forma descrita até aqui, o dispositivo de decodificação 71 seleciona o esquema de decodificação com base na informação da janela de transformação e no indicador de determinação e realiza a decodificação. É particularmente possível não apenas melhorar a eficiência de codificação e reduzir a taxa de transferência no lado da decodificação, mas, também, realizar a codificação e a decodificação com um grau de liberdade mais alto, já que um esquema de decodificação correto pode ser selecionado pela referência ao indicador de determinação mesmo para um quadro para o qual a sequência de janela não é EIGHT_SHORT_SEQUENCE.
47 / 58 <Terceira Modalidade> <Descrição do Processamento de Codificação>
[00257] Alternativamente, no caso de seleção tanto da codificação Huffman quanto da codificação aritmética para um quadro para o qual a sequência de janela não é EIGHT_SHORT_SEQUENCE, o esquema de codificação menor no número de bits necessários pode ser selecionado.
[00258] Por exemplo, em um caso em que a taxa de transferência do dispositivo de decodificação 71 ou do dispositivo de codificação 11 tiver uma margem e a eficiência de codificação (eficiência de compressão) for tomar precedência, os números de bits necessários para a codificação Huffman e a codificação aritmética podem ser calculados, e o esquema de codificação menor no número de bits necessários pode ser selecionado, para um quadro para o qual a sequência de janela não é EIGHT_SHORT_SEQUENCE.
[00259] Em um caso como este, o dispositivo de codificação 11 realiza o processamento de codificação representado, por exemplo, na figura 29. Em outras palavras, o processamento de codificação realizado pelo dispositivo de codificação 11 será descrito a seguir em relação a um fluxograma da figura
29.
[00260] Percebe-se que a descrição do processamento das Etapas S151 a S155 será omitida, já que o processamento é similar ao processamento das Etapas S11 a S15 da figura 20.
[00261] Em um caso de determinação, na Etapa S154, que a sequência de janela não é EIGHT_SHORT_SEQUENCE, a seção de seleção do esquema de codificação 24 supre os coeficientes de MDCT quantizados supridos a partir da seção de quantização 23 tanto para a seção de codificação Huffman 31 quanto para a seção de codificação aritmética 32, e o processamento vai para a Etapa S156. Neste caso, ainda não é determinado no sincronismo da Etapa S154 qual esquema de codificação é selecionado (adotado).
48 / 58
[00262] Na Etapa S156, a seção de codificação aritmética 32 realiza a codificação aritmética com base em contexto nos coeficientes de MDCT quantizados supridos a partir da seção de seleção do esquema de codificação 24 e supre os dados codificados MDCT obtidos em decorrência da codificação para a seção de controle de bits 26. Na Etapa S156, o processamento similar àquele da Etapa S16 da figura 20 é realizado.
[00263] Na Etapa S157, a seção de codificação Huffman 31 realiza a codificação Huffman nos coeficientes de MDCT quantizados supridos a partir da seção de seleção do esquema de codificação 24 e supre os dados codificados MDCT e a informação do livro código Huffman que são obtidos em decorrência da codificação para a seção de controle de bits 26. Na Etapa S157, o processamento similar àquele da Etapa S1155 é realizado.
[00264] Na Etapa S158, a seção de controle de bits 26 compara o número de bits dos dados codificados MDCT e a informação do livro código Huffman que são supridos a partir da seção de codificação Huffman 31 com o número de bits dos dados codificados MDCT supridos a partir da seção de codificação aritmética 32 e seleciona o esquema de codificação.
[00265] Em outras palavras, a seção de controle de bits 26 seleciona a codificação Huffman como o esquema de codificação em um caso em que o número de bits (quantidade de código) dos dados codificados MDCT e a informação do livro código Huffman que são obtidos pela codificação Huffman for menor do que o número de bits dos dados codificados MDCT obtidos pela codificação aritmética.
[00266] Neste caso, a seção de controle de bits 26 supre os dados codificados MDCT e a informação do livro código Huffman que são obtidos pela codificação Huffman para a seção de multiplexação 27.
[00267] Ao contrário, a seção de controle de bits 26 seleciona a codificação aritmética como o esquema de codificação em um caso em que o número de bits dos dados codificados MDCT obtidos pela codificação
49 / 58 aritmética for igual a ou menor do que o número de bits dos dados codificados MDCT e a informação do livro código Huffman que são obtidos pela codificação Huffman.
[00268] Neste caso, a seção de controle de bits 26 supre os dados codificados MDCT obtidos pela codificação aritmética para a seção de multiplexação 27.
[00269] Desta maneira, comparar o número de bits real (quantidade de código) na codificação Huffman com aquele na codificação aritmética, isto é, comparar os números de bits necessários naqueles esquemas de codificação uns com os outros torna possível garantir a seleção do esquema de codificação com menor número de bits necessários. Substancialmente, neste caso, tanto a codificação Huffman quanto a codificação aritmética é selecionada como o esquema de codificação com base no número de bits necessários no momento da codificação Huffman e no número de bits necessários no momento da codificação aritmética, e a codificação é realizada pelo esquema de codificação selecionado.
[00270] Na Etapa S159, a seção de controle de bits 26 gera um indicador de determinação de acordo com um resultado da seleção do esquema de codificação na Etapa S158 e supre o indicador de determinação gerado para a seção de multiplexação 27.
[00271] Por exemplo, a seção de controle de bits 26 gera um indicador de determinação que tem um valor “1” no caso de seleção da codificação Huffman como o esquema de codificação e gera um indicador de determinação que tem um valor “0” no caso de seleção da codificação aritmética como o esquema de codificação.
[00272] Quando o indicador de determinação for gerado desta maneira, o processamento, então, vai para a Etapa S160.
[00273] Quando o processamento da Etapa S159 for realizado ou o processamento da Etapa S155 for realizado, o processamento da Etapa S160 é
50 / 58 realizado, e o processamento de codificação é encerrado. Percebe-se que a descrição do processamento da Etapa S160 será omitido, já que o processamento é similar àquele da Etapa S80 da figura 27.
[00274] Da forma descrita até aqui, o dispositivo de codificação 11 seleciona o esquema de codificação com menor número de bits necessários dentre a codificação Huffman e a codificação aritmética para um quadro para o qual a sequência de janela não é EIGHT_SHORT_SEQUENCE e gera o fluxo contínuo de bits codificado que contém os dados codificados MDCT, codificados pelo esquema de codificação selecionado. Fazendo isto, é possível selecionar um esquema de codificação adequado para cada quadro, melhorar a eficiência de codificação e realizar a codificação com um grau de liberdade mais alto.
[00275] Além do mais, no caso em que o processamento de codificação descrito em relação à figura 29 for realizado, o dispositivo de decodificação 71 realiza o processamento de decodificação descrito em relação à figura 28.
[00276] Da forma descrita até aqui, de acordo com a presente tecnologia, é possível melhorar a eficiência de codificação (eficiência de compressão) e reduzir a taxa de transferência durante a decodificação pela apropriada seleção do esquema de codificação, se comparado com o caso de uso apenas da codificação aritmética.
[00277] Além do mais, nas segunda e terceira modalidades, é possível selecionar um esquema de codificação adequado para um quadro para o qual a sequência de janela não é EIGHT_SHORT_SEQUENCE, mesmo no caso, por exemplo, no qual a taxa de bits do sinal de áudio é alta e a qualidade de som é suficientemente alta, ou no caso no qual a taxa de transferência é mais importante do que a qualidade de som. Desse modo, é possível realizar a codificação e a decodificação com um grau de liberdade mais alto. Em outras palavras, é possível, por exemplo, controlar a taxa de transferência durante a decodificação de forma mais flexível.
51 / 58 <Exemplo de Configuração do Computador>
[00278] Neste ínterim, uma série de processamento supradescrita pode ser tanto executada por hardware quanto executada por software. Em um caso de execução da série de processamento pelo software, um programa que configura o software é instalado em um computador. Aqui, os tipos de computador incluem um computador incorporado no hardware dedicado, um computador que é, por exemplo, um computador pessoal de propósito geral capaz de executar vários tipos de funções pela instalação de vários tipos de programas no computador e congêneres.
[00279] A figura 30 é um diagrama de blocos que representa um exemplo de uma configuração do hardware do computador que faz com que um programa execute a série de processamento supradescrita.
[00280] No computador, uma CPU (unidade central de processamento) 501, uma ROM (memória exclusiva de leitura) 502 e uma RAM (memória de acesso aleatório) 503 são mutuamente conectadas por um barramento 504.
[00281] Uma interface de entrada / saída 505 também é conectada no barramento 504. Uma seção de entrada 506, uma seção de saída 507, uma seção de gravação 508, uma seção de comunicação 509 e uma unidade 510 são conectadas na interface de entrada / saída 505.
[00282] A seção de entrada 506 inclui um teclado, um mouse, um microfone, um elemento de formação de imagem e congêneres. A seção de saída 507 inclui um visor, um alto-falante e congêneres. A seção de gravação 508 inclui um disco rígido, uma memória não volátil e congêneres. A seção de comunicação 509 inclui uma interface de rede e congêneres. A unidade 510 aciona uma mídia de gravação removível 511, tais como um disco magnético, um disco óptico, um disco magneto-óptico ou uma memória semicondutora.
[00283] No computador configurado como exposto, a CPU 501 carrega um programa gravado, por exemplo, na seção de gravação 508 na RAM 503
52 / 58 por meio da interface de entrada / saída 505 e do barramento 504 e executa o programa, de acordo com o que, a série de processamento supradescrita é realizada.
[00284] O programa executado pelo computador (CPU 501) pode ser provido, por exemplo, pela gravação do programa na mídia de gravação removível 511 que serve como uma mídia integrada ou congêneres. Alternativamente, o programa pode ser provido por meio de uma mídia de transmissão com fios ou sem fio, tais como uma rede de área local, a Internet ou um serviço de satélite digital.
[00285] No computador, o programa pode ser instalado na seção de gravação 508 por meio da interface de entrada / saída 505 pelo carregamento da mídia de gravação removível 511 na unidade 510. Alternativamente, o programa pode ser recebido pela seção de comunicação 509 por meio da mídia de transmissão com fios ou sem fio e instalado na seção de gravação
508. Em uma outra alternativa, o programa pode ser instalado na ROM 502 ou na seção de gravação 508 em antecipação.
[00286] O programa executado pelo computador pode ser um programa que realiza o processamento em série de tempo em uma ordem descrita na presente especificação ou pode ser um programa que realiza o processamento tanto em paralelo quanto em sincronismo necessário, tal como o sincronismo da chamada.
[00287] Além do mais, as modalidades da presente tecnologia não são limitadas às modalidades supradescritas, e várias mudanças podem ser feitas sem fugir do espírito da presente tecnologia.
[00288] Por exemplo, a presente tecnologia pode adotar uma configuração de computação em nuvem que faz com que uma pluralidade de dispositivos processe uma função à maneira de compartilhamento ou cooperativa através de uma rede.
[00289] Além do mais, cada etapa descrita nos fluxogramas
53 / 58 supradescritos pode ser não apenas executada por um dispositivo, mas, também, executada por uma pluralidade de dispositivos à maneira de compartilhamento.
[00290] Além do mais, quando uma etapa incluir uma pluralidade de tipos de processamento, a pluralidade de tipos de processamento incluída em uma etapa pode ser não apenas executada por um aparelho, mas, também, executada por uma pluralidade de dispositivos à maneira de compartilhamento.
[00291] Além do mais, a presente tecnologia pode ser configurada como segue.
[00292] (1) Um dispositivo de codificação, que inclui: uma seção de transformação da frequência temporal que realiza a transformação de frequência temporal usando uma janela de transformação em um sinal de áudio; e uma seção de codificação que realiza a codificação Huffman na informação do espectro de frequência obtida pela transformação de frequência temporal em um caso em que um comprimento da janela de transformação da janela de transformação é comutado de um pequeno comprimento da janela de transformação para um grande comprimento da janela de transformação, e que realiza a codificação aritmética na informação do espectro de frequência em um caso em que o comprimento da janela de transformação da janela de transformação não for comutado do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação.
[00293] (2) O dispositivo de codificação, de acordo com (1), que inclui adicionalmente: uma seção de multiplexação que multiplexa os dados codificados em relação à informação do espectro de frequência e à informação da janela de transformação que indica um tipo da janela de
54 / 58 transformação usada na transformação de frequência temporal para gerar um fluxo contínuo de bits codificado.
[00294] (3) O dispositivo de codificação, de acordo com (1) ou (2), em que a seção de codificação codifica a informação do espectro de frequência por um esquema de codificação que é tanto a codificação Huffman quanto a codificação aritmética no caso em que o comprimento da janela de transformação da janela de transformação não for comutado do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação.
[00295] (4) O dispositivo de codificação, de acordo com (3), em que a seção de codificação codifica a informação do espectro de frequência por um esquema de codificação selecionado com base no número de bits necessários durante a codificação, em uma taxa de bits do sinal de áudio, na informação de recurso em um lado da decodificação ou na informação de designação em relação ao esquema de codificação.
[00296] (5) O dispositivo de codificação, de acordo com (3) ou (4), em que a seção de multiplexação multiplexa a informação de seleção que indica o esquema de codificação da informação do espectro de frequência, os dados codificados, e a informação da janela de transformação para gerar o fluxo contínuo de bits codificado no caso em que o comprimento da janela de transformação da janela de transformação não for comutado do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação.
[00297] (6) Um método de codificação, que inclui: por um dispositivo de codificação, realizar a transformação de frequência temporal usando uma janela de transformação em um sinal de áudio;
55 / 58 realizar a codificação Huffman na informação do espectro de frequência obtida pela transformação de frequência temporal em um caso em que um comprimento da janela de transformação da janela de transformação for comutado de um pequeno comprimento da janela de transformação para um grande comprimento da janela de transformação; e realizar a codificação aritmética na informação do espectro de frequência em um caso em que o comprimento da janela de transformação da janela de transformação não for comutado do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação.
[00298] (7) Um programa, para fazer com que um computador execute um processamento que inclui as etapas de: realizar a transformação de frequência temporal usando uma janela de transformação em um sinal de áudio; realizar a codificação Huffman na informação do espectro de frequência obtida pela transformação de frequência temporal em um caso em que um comprimento da janela de transformação da janela de transformação for comutado de um pequeno comprimento da janela de transformação para um grande comprimento da janela de transformação; e realizar a codificação aritmética na informação do espectro de frequência em um caso em que o comprimento da janela de transformação da janela de transformação não for comutado do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação.
[00299] (8) Um dispositivo de decodificação, que inclui: uma seção de demultiplexação que demultiplexa um fluxo contínuo de bits codificado, e que extrai a informação da janela de transformação que indica um tipo de uma janela de transformação usada na transformação de frequência temporal de um sinal de áudio e os dados codificados em relação à informação do espectro de frequência obtida pela transformação de frequência temporal do fluxo contínuo de bits codificado; e
56 / 58 uma seção de decodificação que decodifica os dados codificados por um esquema de decodificação correspondente à codificação Huffman em um caso em que a janela de transformação indicada pela informação da janela de transformação for a janela de transformação selecionada no momento da comutação do comprimento da janela de transformação de um pequeno comprimento da janela de transformação para um grande comprimento da janela de transformação.
[00300] (9) O dispositivo de decodificação, de acordo com (8), em que a seção de decodificação decodifica os dados codificados por um esquema de decodificação correspondente à codificação aritmética em um caso em que a janela de transformação indicada pela informação da janela de transformação não for a janela de transformação selecionada no momento da comutação do comprimento da janela de transformação do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação.
[00301] (10) O dispositivo de decodificação, de acordo com (8), em que a seção de decodificação decodifica os dados codificados por um esquema de decodificação correspondente a um esquema de codificação que é tanto a codificação Huffman quanto a codificação aritmética e que é indicado pela informação de seleção extraída a partir do fluxo contínuo de bits codificado em um caso em que a janela de transformação indicada pela informação da janela de transformação não for a janela de transformação selecionada no momento da comutação do comprimento da janela de transformação do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação.
[00302] (11) Um método de decodificação, que inclui: por um dispositivo de decodificação, demultiplexar um fluxo contínuo de bits codificado, e extrair a
57 / 58 informação da janela de transformação que indica um tipo de uma janela de transformação usada na transformação de frequência temporal de um sinal de áudio e os dados codificados em relação à informação do espectro de frequência obtida pela transformação de frequência temporal do fluxo contínuo de bits codificado; e decodificar os dados codificados por um esquema de decodificação correspondente à codificação Huffman em um caso em que a janela de transformação indicada pela informação da janela de transformação for a janela de transformação selecionada no momento da comutação do comprimento da janela de transformação de um pequeno comprimento da janela de transformação para um grande comprimento da janela de transformação.
[00303] (12) Programa, para fazer com que um computador execute o processamento que inclui as etapas de: demultiplexar um fluxo contínuo de bits codificado, e extrair a informação da janela de transformação que indica um tipo de uma janela de transformação usada na transformação de frequência temporal de um sinal de áudio e os dados codificados em relação à informação do espectro de frequência obtida pela transformação de frequência temporal do fluxo contínuo de bits codificado; e decodificar os dados codificados por um esquema de decodificação correspondente à codificação Huffman em um caso em que a janela de transformação indicada pela informação da janela de transformação for a janela de transformação selecionada no momento da comutação do comprimento da janela de transformação de um pequeno comprimento da janela de transformação para um grande comprimento da janela de transformação. Lista dos Sinais de Referência
[00304] 11 Dispositivo de codificação, 21 Seção de transformação da
58 / 58 frequência temporal, 24 Seção de seleção do esquema de codificação, 26 Seção de controle de bits, 27 Seção de multiplexação, 31 Seção de codificação Huffman, 32 Seção de codificação aritmética, 71 Dispositivo de decodificação, 81 Seção de aquisição, 82 Seção de demultiplexação, 83 Seção de seleção do esquema de decodificação, 91 Seção de decodificação Huffman, 92 Seção de decodificação aritmética

Claims (12)

REIVINDICAÇÕES
1. Dispositivo de codificação, caracterizado pelo fato de que compreende: uma seção de transformação da frequência temporal que realiza a transformação de frequência temporal usando uma janela de transformação em um sinal de áudio; e uma seção de codificação que realiza a codificação Huffman na informação do espectro de frequência obtida pela transformação de frequência temporal em um caso em que um comprimento da janela de transformação da janela de transformação for comutado de um pequeno comprimento da janela de transformação para um grande comprimento da janela de transformação, e que realiza a codificação aritmética na informação do espectro de frequência em um caso em que o comprimento da janela de transformação da janela de transformação não for comutado do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação.
2. Dispositivo de codificação de acordo com a reivindicação 1, caracterizado pelo fato de que compreende adicionalmente: uma seção de multiplexação que multiplexa os dados codificados em relação à informação do espectro de frequência e à informação da janela de transformação que indica um tipo da janela de transformação usada na transformação de frequência temporal para gerar um fluxo contínuo de bits codificado.
3. Dispositivo de codificação de acordo com a reivindicação 1, caracterizado pelo fato de que: a seção de codificação codifica a informação do espectro de frequência por um esquema de codificação que é tanto a codificação Huffman quanto a codificação aritmética no caso em que o comprimento da janela de transformação da janela de transformação não for comutado do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação.
4. Dispositivo de codificação de acordo com a reivindicação 3, caracterizado pelo fato de que: a seção de codificação codifica a informação do espectro de frequência por um esquema de codificação selecionado com base no número de bits necessários durante a codificação, em uma taxa de bits do sinal de áudio, na informação de recurso em um lado da decodificação ou na informação de designação em relação ao esquema de codificação.
5. Dispositivo de codificação de acordo com a reivindicação 3, caracterizado pelo fato de que: a seção de multiplexação multiplexa a informação de seleção que indica o esquema de codificação da informação do espectro de frequência, os dados codificados, e a informação da janela de transformação para gerar o fluxo contínuo de bits codificado no caso em que o comprimento da janela de transformação da janela de transformação não for comutado do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação.
6. Método de codificação, caracterizado pelo fato de que compreende: por um dispositivo de codificação, realizar a transformação de frequência temporal usando uma janela de transformação em um sinal de áudio; realizar a codificação Huffman na informação do espectro de frequência obtida pela transformação de frequência temporal em um caso em que um comprimento da janela de transformação da janela de transformação for comutado de um pequeno comprimento da janela de transformação para um grande comprimento da janela de transformação; e realizar a codificação aritmética na informação do espectro de frequência em um caso em que o comprimento da janela de transformação da janela de transformação não for comutado do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação.
7. Mídia de armazenamento legível por computador, caracterizada pelo fato de que compreende instruções legíveis por computador que, quando executadas em um processador, fazem com que o computador execute as etapas de: realizar a transformação de frequência temporal usando uma janela de transformação em um sinal de áudio; realizar a codificação Huffman na informação do espectro de frequência obtida pela transformação de frequência temporal em um caso em que um comprimento da janela de transformação da janela de transformação for comutado de um pequeno comprimento da janela de transformação para um grande comprimento da janela de transformação; e realizar a codificação aritmética na informação do espectro de frequência em um caso em que o comprimento da janela de transformação da janela de transformação não for comutado do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação.
8. Dispositivo de decodificação, caracterizado pelo fato de que compreende: uma seção de demultiplexação que demultiplexa um fluxo contínuo de bits codificado, e que extrai a informação da janela de transformação que indica um tipo de uma janela de transformação usada na transformação de frequência temporal de um sinal de áudio e os dados codificados em relação à informação do espectro de frequência obtida pela transformação de frequência temporal do fluxo contínuo de bits codificado; e uma seção de decodificação que decodifica os dados codificados por um esquema de decodificação correspondente à codificação Huffman em um caso em que a janela de transformação indicada pela informação da janela de transformação for a janela de transformação selecionada no momento da comutação do comprimento da janela de transformação de um pequeno comprimento da janela de transformação para um grande comprimento da janela de transformação.
9. Dispositivo de decodificação de acordo com a reivindicação 8, caracterizado pelo fato de que: a seção de decodificação decodifica os dados codificados por um esquema de decodificação correspondente à codificação aritmética em um caso em que a janela de transformação indicada pela informação da janela de transformação não for a janela de transformação selecionada no momento da comutação do comprimento da janela de transformação do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação.
10. Dispositivo de decodificação de acordo com a reivindicação 8, caracterizado pelo fato de que: a seção de decodificação decodifica os dados codificados por um esquema de decodificação correspondente a um esquema de codificação que é tanto a codificação Huffman quanto a codificação aritmética e que é indicado pela informação de seleção extraída a partir do fluxo contínuo de bits codificado em um caso em que a janela de transformação indicada pela informação da janela de transformação não for a janela de transformação selecionada no momento da comutação do comprimento da janela de transformação do pequeno comprimento da janela de transformação para o grande comprimento da janela de transformação.
11. Método de decodificação, caracterizado pelo fato de que compreende: por um dispositivo de decodificação, demultiplexar um fluxo contínuo de bits codificado, e extrair a informação da janela de transformação que indica um tipo de uma janela de transformação usada na transformação de frequência temporal de um sinal de áudio e os dados codificados em relação à informação do espectro de frequência obtida pela transformação de frequência temporal do fluxo contínuo de bits codificado; e decodificar os dados codificados por um esquema de decodificação correspondente à codificação Huffman em um caso em que a janela de transformação indicada pela informação da janela de transformação for a janela de transformação selecionada no momento da comutação do comprimento da janela de transformação de um pequeno comprimento da janela de transformação para um grande comprimento da janela de transformação.
12. Mídia de armazenamento legível por computador, caracterizada pelo fato de que compreende instruções legíveis por computador que, quando executadas em um processador, fazem com que o computador execute as etapas de: demultiplexar um fluxo contínuo de bits codificado, e extrair a informação da janela de transformação que indica um tipo de uma janela de transformação usada na transformação de frequência temporal de um sinal de áudio e os dados codificados em relação à informação do espectro de frequência obtida pela transformação de frequência temporal do fluxo contínuo de bits codificado; e decodificar os dados codificados por um esquema de decodificação correspondente à codificação Huffman em um caso em que a janela de transformação indicada pela informação da janela de transformação for a janela de transformação selecionada no momento da comutação do comprimento da janela de transformação de um pequeno comprimento da janela de transformação para um grande comprimento da janela de transformação.
BR112020025515-7A 2018-06-21 2019-06-07 Dispositivo e método de codificação, mídia de armazenamento legível por computador, e, dispositivo e método de decodificação BR112020025515A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018-117635 2018-06-21
JP2018117635 2018-06-21
PCT/JP2019/022681 WO2019244666A1 (ja) 2018-06-21 2019-06-07 符号化装置および方法、復号装置および方法、並びにプログラム

Publications (1)

Publication Number Publication Date
BR112020025515A2 true BR112020025515A2 (pt) 2021-03-09

Family

ID=68983988

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020025515-7A BR112020025515A2 (pt) 2018-06-21 2019-06-07 Dispositivo e método de codificação, mídia de armazenamento legível por computador, e, dispositivo e método de decodificação

Country Status (7)

Country Link
US (1) US20210210108A1 (pt)
EP (2) EP4283877A3 (pt)
JP (1) JP7318645B2 (pt)
KR (1) KR20210022546A (pt)
CN (1) CN112400203A (pt)
BR (1) BR112020025515A2 (pt)
WO (1) WO2019244666A1 (pt)

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020049586A1 (en) * 2000-09-11 2002-04-25 Kousuke Nishio Audio encoder, audio decoder, and broadcasting system
US7433824B2 (en) * 2002-09-04 2008-10-07 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
DE20321883U1 (de) * 2002-09-04 2012-01-20 Microsoft Corp. Computervorrichtung und -system zum Entropiedecodieren quantisierter Transformationskoeffizienten eines Blockes
KR101237413B1 (ko) * 2005-12-07 2013-02-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치
ATE500588T1 (de) 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
KR101485339B1 (ko) * 2008-09-29 2015-01-26 삼성전자주식회사 무손실 부호화/복호화 장치 및 방법
EP2382625B1 (en) * 2009-01-28 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program
JP5304504B2 (ja) * 2009-07-17 2013-10-02 ソニー株式会社 信号符号化装置、信号復号装置、信号処理システム、これらにおける処理方法およびプログラム
US8305243B2 (en) * 2010-06-30 2012-11-06 Schlumberger Technology Corporation Systems and methods for compressing data and controlling data compression in borehole communication
JP5633431B2 (ja) * 2011-03-02 2014-12-03 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
WO2013108685A1 (ja) * 2012-01-17 2013-07-25 ソニー株式会社 符号化装置および符号化方法、復号装置および復号方法、プログラム
JP2014078860A (ja) * 2012-10-11 2014-05-01 Samsung Display Co Ltd 圧縮器、駆動装置、表示装置および圧縮方法
KR20140075466A (ko) * 2012-12-11 2014-06-19 삼성전자주식회사 오디오 신호의 인코딩 및 디코딩 방법, 및 오디오 신호의 인코딩 및 디코딩 장치
EP2830058A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
JP6512916B2 (ja) * 2014-06-16 2019-05-15 キヤノン株式会社 撮像装置およびその制御方法ならびにプログラム

Also Published As

Publication number Publication date
EP3813064A1 (en) 2021-04-28
KR20210022546A (ko) 2021-03-03
WO2019244666A1 (ja) 2019-12-26
EP4283877A2 (en) 2023-11-29
CN112400203A (zh) 2021-02-23
JPWO2019244666A1 (ja) 2021-07-15
EP3813064A4 (en) 2021-06-23
US20210210108A1 (en) 2021-07-08
JP7318645B2 (ja) 2023-08-01
EP4283877A3 (en) 2024-01-10

Similar Documents

Publication Publication Date Title
US9275648B2 (en) Method and apparatus for processing audio signal using spectral data of audio signal
JP6262820B2 (ja) 広義知覚類似性(wide−sense perceptual similarity)を使用するデジタルメディアスペクトルデータの効率的な復号
JP5313669B2 (ja) ディジタルメディアの効率的コーディング用のバンドを入手するための周波数セグメント化
JP4724452B2 (ja) デジタルメディア汎用基本ストリーム
KR102451342B1 (ko) 다수의 오브젝트 오디오의 인코딩 후 비트레이트 감소
CN111489758B (zh) 解码装置、解码方法及存储介质
TWI505262B (zh) 具多重子流之多通道音頻信號的有效編碼與解碼
BR112016017283B1 (pt) Codificação de quadros independentes de coeficientes ambissônicos de ordem mais elevada ambiente
JP2009501944A (ja) ディジタル・メディア・スペクトル・データの効率的コーディングに使用される辞書内のコードワードの変更
BRPI0715516A2 (pt) sistemas, mÉtodos e equipamentos para limitar fator de ganho
BRPI0906619B1 (pt) Métodos para codificar áudio de multicanal, para decodificar um fluxo de áudio de multicanal de taxa de bit variável sem perda e para iniciar decodificação de um fluxo de bit de áudio de multicanal de taxa de bit variável, um ou mais meios legíveis por computador, um ou mais dispositivos semicondutores, e, decodificador de áudio de multicanal
BRPI0606387B1 (pt) Decodificador, dispositivo de reprodução de áudio, codificador, dispositivo de gravação, método para gerar um sinal de áudio multicanal, meio de armazenamento, método paracodificar um sinal de áudio multicanal, receptor, transmissor, sistema de transmissão, método de receber um sinal de áudio multicanal, e método de transmitir um sinal deáudio multicanal
BR122021007425B1 (pt) Aparelho de decodificação, e método de codificação de um sinal de banda superior
BR122020017853B1 (pt) Sistema e aparelho para codificar um sinal de voz em um fluxo de bits, e método e aparelho para decodificar sinal de áudio
JP2016539357A (ja) 音声デコーダ、符号化音声出力データを生成するための装置、及びデコーダの初期化を可能にする方法
BR112016026812B1 (pt) Dispositivo configurado para decodificar dados de áudio indicativos de uma pluralidade de coeficientes ambissônicos de ordem superior (hoa), método para decodificar dados de áudio indicativos de uma pluralidade de coeficientes hoa e método para codificar dados de áudio
JP2019529979A (ja) インデックスコーディング及びビットスケジューリングを備えた量子化器
JP6465020B2 (ja) 復号装置および方法、並びにプログラム
BR112020025515A2 (pt) Dispositivo e método de codificação, mídia de armazenamento legível por computador, e, dispositivo e método de decodificação
JP2023072027A (ja) 復号装置および方法、並びにプログラム
JP2022188262A (ja) ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置
WO2024052499A1 (en) Decoder and decoding method for discontinuous transmission of parametrically coded independent streams with metadata
WO2024051954A1 (en) Encoder and encoding method for discontinuous transmission of parametrically coded independent streams with metadata

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]