PT2216777E - Sistema de codificação áudio usando preenchimento de vazio espectral - Google Patents

Sistema de codificação áudio usando preenchimento de vazio espectral Download PDF

Info

Publication number
PT2216777E
PT2216777E PT10162217T PT10162217T PT2216777E PT 2216777 E PT2216777 E PT 2216777E PT 10162217 T PT10162217 T PT 10162217T PT 10162217 T PT10162217 T PT 10162217T PT 2216777 E PT2216777 E PT 2216777E
Authority
PT
Portugal
Prior art keywords
spectral components
spectral
signal
components
synthesized
Prior art date
Application number
PT10162217T
Other languages
English (en)
Inventor
Michael Mead Truman
Mark Stuart Vinton
Grant Allen Davidson
Matthew Conrad Fellers
Matthew Aubrey Watson
Charles Quito Robinson
Original Assignee
Dolby Lab Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Lab Licensing Corp filed Critical Dolby Lab Licensing Corp
Publication of PT2216777E publication Critical patent/PT2216777E/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Optical Elements Other Than Lenses (AREA)
  • Stereophonic System (AREA)
  • Adornments (AREA)
  • Optical Communication System (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Optical Recording Or Reproduction (AREA)
  • Spectrometry And Color Measurement (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Optical Filters (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Description

DESCRIÇÃO
Sistema de codificação áudio usando preenchimento de vazio espectral
CAMPO TÉCNICO 0 presente invento refere-se, na generalidade, a sistemas de codificação áudio, e relaciona-se mais especificamente à melhoria da qualidade percebida dos sinais áudio obtidos a partir de sistemas de codificação áudio.
ENQUADRAMENTO DA TÉCNICA
Os sistemas de codificação áudio são usados para codificar um sinal áudio num sinal codificado que é adequado para transmissão ou armazenamento, e então subsequentemente receber ou recuperar o sinal codificado e descodificá-lo para obter uma versão do sinal áudio original para playback. Os sistemas de codificação perceptual áudio tentam codificar um sinal áudio num sinal codificado que tem menores exigências de capacidade de informação do que o sinal áudio original, e então subsequentemente descodificar o sinal codificado para proporcionar uma saida que não seja perceptualmente distinguível do sinal áudio original. Um exemplo de um sistema de codificação perceptual áudio está descrito no documento A52 do Advanced Television Standard Committee (ATSC) (1994), que é referido como Dolby AC-3. Outro exemplo está descrito em Bosi et al, "ISO/IEC MPEG-2 1
Advanced Audio Coding", J. AES, volume 45, n° 10, Outubro de 1997, págs. 789 - 814, que é referido como Advanced Audio Coding (AAC). Estes dois sistemas de codificação, assim como muitos outros sistemas de codificação perceptual, aplicam um banco de filtros de análise a um sinal áudio para se obterem componentes espectrais que são dispostos em grupos ou bandas de frequência. As larguras de banda variam normalmente e são normalmente proporcionais com larguras das chamadas bandas criticas do sistema auditivo humano.
Os sistemas de codificação perceptual podem ser usados para reduzir as exigências de capacidades de informação de um sinal áudio enquanto preservam uma medida subjectiva ou percebida da qualidade áudio, para que uma representação codificada do sinal áudio possa ser veiculada através de um canal de comunicações usando menos largura de banda ou guardado num meio de registo usando menos espaço. As exigências de capacidade de informação são menores, quantificando os componentes espectrais. A quantificação injecta ruído no sinal quantificado, mas os sistemas de codificação perceptual áudio usam normalmente modelos psico-acústicos numa tentativas de controlar a amplitude do ruído de quantificação para que seja mascarado ou tornado inaudível por componentes espectrais no sinal.
Os componentes espectrais dentro de uma determinada banda são muitas vezes quantificados à mesma resolução de quantificação e é usado um modelo psico-acústico para determinar a maior resolução de quantificação mínima, ou a menor relação sinal/ruído (SNR), que é possível sem injectar um nível audível de ruído de quantificação. Esta técnica funciona bastante bem para bandas estreitas, mas 2 não funciona tão bem par bandas mais largas quando as exigências de capacidade de informação restringem o sistema de codificação à utilização de uma resolução de quantificação relativamente grosseira. Os componentes espectrais de maior valor numa banda larga são normalmente quantificados para um valor não nulo, tendo a resolução desejada mas os componentes espectrais de valor inferior na banda são quantificados para um valor nulo se tiverem uma dimensão que é inferior ao nível de quantificação mínimo. 0 número de componentes espectrais numa banda que são quantificados para um valor nulo normalmente aumenta à medida que a largura de banda aumenta, uma vez que a diferença entre os valores de componente espectral maior e menor dentro da banda aumenta, e à medida que o nível de quantificação mínimo aumenta.
Infelizmente, a existência de muitos componentes espectrais quantificados para zero num sinal quantificado pode degradar a qualidade percebida do sinal, mesmo se o ruído de quantificação resultante for mantido suficientemente baixo para ser considerado inaudível ou psico-acusticamente mascarado por componentes espectrais no sinal. Esta degradação tem pelo menos três causas. A primeira causa é o facto do ruído de quantificação poder não ser inaudível porque o nível de mascaramento psico-acústico é inferior ao que é previsto pelo modelo psico-acústico usado para determinar a resolução de quantificação. Uma segunda causa é o facto da criação de muitos componentes espectrais quantificados para zero poder reduzir audivelmente a energia ou potência do sinal áudio descodificado, quando comparado com a energia ou potência do sinal áudio original. Uma terceira causa é 3 relevante para o processo de codificação que usa bancos de filtro de eliminação de distorção, tal como o filtro em espelho de quadratura (QMF - Quadrature Mirror filter) ou a especifica transformada discreta de cossenos (DCT Discrete Cosine Transform) e a modificada transformada discreta de cossenos inversa (IDCT - Inverse Discrete Cosine Transform) conhecidas como transformadas de TDAC (Time-Domain Aliasing Cancellation), que estão descritos em Princen et al, "Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation," ICASSP 1987 Conf. Proc, Maio de 1987 págs. 2161 - 64.
Os sistemas de codificação que usam bancos de filtros de eliminação de distorção, tal como o QMF ou as transformadas de TDAC usam um banco de filtros de análise no processo de codificação que introduz distorção ou componentes espúrios no sinal codificado, mas usam um banco de filtros de síntese no processo de descodificação que pode, pelo menos em teoria, eliminar a distorção. Na prática, no entanto, a capacidade do banco de filtros de síntese para eliminar a distorção pode ser prejudicada significativamente se os valores de um ou mais componentes espectrais mudarem significativamente no processo de codificação. Por este motivo, os componentes espectrais quantificados para zero podem degradar a qualidade percebida de um sinal áudio descodificado, mesmo se o ruído de quantificação for inaudível porque a mudanças nos valores de componentes espectrais pode prejudicar a capacidade do banco de filtros de síntese para eliminar a distorção introduzida pelo banco de filtros de análise.
As técnicas usadas em sistemas de codificação conhecidos proporcionaram soluções parciais para estes 4 problemas. Os sistemas de codificação Dolby AC-3 e transformada de AAC, por exemplo, têm alguma capacidade para gerar um sinal de saida de um sinal codificado que retém o nível de sinal do sinal áudio original substituindo o ruído por alguns componentes espectrais quantificados para zero no descodificador. Em ambos estes sistemas, o codificador proporciona no sinal codificado uma indicação de potência para uma banda de frequência e o descodificador usa estes indicação de potência para substituir um nível adequado de ruído para os componentes espectrais quantificados para zero na banda de frequência. Um codificador Dolby AC-3 proporciona uma estimativa grosseira do espectro de potência de curto prazo que pode ser usado para gerar um nível adequado de ruído. Quando todos os componentes espectrais numa banda tiverem sido colocados a zero, o descodificador preenche a banda com ruído tendo aproximadamente a mesma potência que a indicada na estimativa grosseira no espectro de potência de curto prazo. Os sistemas de codificação AAC usam uma técnica chamada Substituição do Ruído Perceptual (PNS - Perceptual Noise Substitution) que transmite explicitamente a potência para uma dada banda. 0 descodif icador usa esta informação para adicionar ruído que corresponda a esta potência. Ambos os sistemas só adicionam ruído na bandas que não têm componentes espectrais não nulos.
Infelizmente, estes sistemas não ajudam a preservar os níveis de potência em bandas que contêm uma mistura de componentes quantificados para zero e espectrais não nulos. A tabela 1 ilustra uma banda hipotética de componentes espectrais para um sistema áudio original, uma representação quantificada de 3 bit de cada componentes 5 espectral que é reunido num sinal codificado, e os componentes espectrais correspondentes obtidos por um descodificador a partir do sinal codificado. A banda quantificada no sinal quantificado tem uma combinação de quantificados para zero e componentes espectrais não nulos.
Tabela 1
Componentes do sinal original Componentes quantificados Componentes desquantifiçados 10101010 101 10100000 00000100 000 00000000 00000010 000 00000000 00000001 000 00000000 00011111 000 00000000 00010101 000 00000000 00001111 000 00000000 01010101 010 01000000 11110000 111 11100000 A primeira coluna da tabela mostra um conjunto de números binários não sinalizados representando componentes espectrais no sinal áudio original que estão agrupados numa banda única. A segunda coluna mostra uma representação dos componentes espectrais quantificados para três bits. Para 6 este exemplo, a porção de cada componentes espectral abaixo de três bits de resolução foi removido por truncagem. Os componentes espectrais quantificados são transmitidos ao descodificador e subsequentemente desquantifiçados anexando zero bits para restaurar o comprimento original do componentes espectral. Os componentes espectrais desquantifiçados estão ilustrados na terceira coluna. Como uma maioria dos componentes espectrais foram quantificados para zero, a banda de componentes espectrais desquantifiçados contém menos energia do que a banda de componentes espectrais originais e essa energia está concentrada nalguns componentes espectrais de valor não nulo. Esta redução de energia pode degradar a qualidade percebida do sinal descodificado, tal como foi explicado acima. A patente US-6,014,621 descreve um sistema de compressão de discurso que proporciona a codificação de um discurso numa banda larga de 7 kHz (amostragem a 16 kHz) num débito binário objectivo de 16 a 32 kb/s (1 a 2 bits/amostra). 0 sistema usa previsões a curto prazo e a longo prazo para remover a redundância no discurso. Um residual de previsão é transformado e codificado no domínio de frequência para aproveitar o conhecimento na percepção auditiva humana. Ά patente WO-0045379 descreve um processo e um aparelho para melhoria de sistemas de codificação de fonte usando uma reconstrução a alta-frequência (HFR). Lida com o problema de teores de ruído insuficientes numa frequência alta reconstruída, através da adição adaptável de ruído de fundo. Também descreve processos para melhor desempenho por meio da limitação de ruído indesejado, interpolação e 7 regularizaçao de factores de amplificação de ajuste da envolvente.
REVELAÇÃO DO INVENTO
Um objectivo do presente invento consiste em melhorar a qualidade percebida de sinais áudio obtidos por sistemas de codificação áudio evitando ou reduzindo a degradação relacionada com componentes espectrais quantificados para zero.
Este objectivo é conseguido proporcionando um processo de acordo com a reivindicação 1, um aparelho de acordo com a reivindicação 5 e um suporte que regista um programa de instruções de acordo com a reivindicação 6.
De acordo com um aspecto do presente invento, a informação áudio é proporcionada recebendo um sinal de entrada e a obtenção a partir daí de um conjunto de sinais de sub-banda tendo cada um um ou mais componentes espectrais representando o conteúdo espectral de um sinal áudio; a identificação dentro do conjunto de sinais de sub-banda de um sinal de sub-banda específica no qual um ou mais componentes espectrais tem um valor nulo e são quantificados por um quantificador tendo um nível de quantificação mínimo; a geração de um ou mais componentes espectrais sintetizados que correspondem ao componente ou componentes espectrais de valor nulo no sinal de sub-banda específica e que são colocados à escala de acordo com uma envolvente de colocação à escala com base no nível de quantificação mínimo; a geração de um conjunto modificado de sinais de sub-banda substituindo os componentes espectrais sintetizados por componentes espectrais 8 correspondentes de valor nulo no sinal de sub-banda específica; e a geração da informação áudio aplicando um banco de filtros de síntese ao conjunto modificado de sinais de sub-banda.
De acordo com outro aspecto do presente documento, um sinal de saída, de preferência um sinal de saída codificado, é proporcionado através da geração de um conjunto de sinais de sub-banda tendo cada um um ou mais componentes espectrais representando o conteúdo espectral de um sinal áudio quantificando a informação que se obtém aplicando um banco de filtros de análise à informação áudio; a identificação dentro do conjunto de sinais de sub-banda de um sinal de sub-banda específico no qual um ou mais componentes espectrais têm um valor não nulo e são quantificados por um quantificador tendo um nível de quantificação mínimo que corresponde a um valor limite, e no qual uma pluralidade de componentes espectrais tem um valor nulo; a derivação da informação de controlo de colocação à escala a partir do conteúdo espectral do sinal áudio, no qual a informação de controlo de colocação à escala controla a colocação à escala de componentes espectrais sintetizados a serem sintetizados e substituídos pelos componentes espectrais tendo um valor nulo num receptor que gera informação áudio em resposta ao sinal de saída; e a geração de um sinal de saída juntando a informação de controlo de colocação à escala e a informação representando o conjunto de sinais de sub-banda.
As várias características do presente invento e as suas formas de realização preferidas podem ser melhor entendidas com referência à discussão seguinte e aos desenhos acompanhantes, nos quais números de referência 9 semelhantes se referem a números semelhantes nas várias figuras. 0 conteúdo da discussão seguinte e dos desenhos é definido apenas como exemplo e não deve ser entendido como representando limitações ao âmbito do presente invento.
BREVE DESCRIÇÃO DOS DESENHOS A figura la é um diagrama de blocos esquemático de um codificador áudio. A figura lb é um diagrama de blocos esquemático de um codificador áudio.
As figuras 2a a 2c são ilustrações gráficas de funções de quantificação. A figura 3 é uma ilustração esquemática gráfica do espectro de um sinal áudio hipotético. A figura 4 é uma ilustração esquemática gráfica do espectro de um sinal áudio hipotético com alguns componentes espectrais colocados a zero. A figura 5 é uma ilustração esquemática gráfica do espectro de um sinal áudio hipotética com componentes espectrais sintetizados substituídos por componentes espectrais de valor nulo. A figura 6 é uma ilustração gráfica esquemática de uma resposta de frequência hipotética para um filtro num banco de filtros de análise. A figura 7 é uma ilustração esquemática gráfica de uma envolvente de colocação à escala que aproxima o roll off de uma fuga espectral ilustrada na figura 6. A figura 8 é uma ilustração esquemática gráfica de envolventes de colocação à escala derivados da saída de um filtro adaptável. 10 A figura 9 é uma ilustração esquemática gráfica do espectro de um sinal áudio hipotético com componentes espectrais sintetizados ponderados por uma envolvente de colocação à escala que aproxima o roll off da figura espectral ilustrada na figura 6. A figura 10 é uma ilustração esquemática gráfica de valores limites de máscaras psico-acústicas hipotéticas. A figura 11 é uma ilustração esquemática gráfica do espectro de um sinal áudio hipotético com componentes espectrais sintetizados ponderados por uma envolvente de colocação à escala que aproxima valores limite de máscara psico-acústicos. A figura 12 é uma ilustração esquemática gráfica de um sinal de sub-banda hipotético. A figura 13 é uma ilustração esquemática gráfica de um sinal de sub-banda hipotético com alguns componentes espectrais colocados a zero. A figura 14 é uma ilustração esquemática gráfica de valores limites de máscara psico-acústica temporais hipotéticos. A figura 15 é uma ilustração esquemática gráfica de um sinal de sub-banda hipotético com componentes espectrais sintetizados ponderados por uma envolvente de colocação à escala que aproxima valores limites de máscara psico-acústica temporais. A figura 16 é uma ilustração esquemática gráfica do espectro de um sinal áudio hipotético com componentes espectrais sintetizados gerados por replicação espectral. 11 A figura 17 é um diagrama de blocos esquemático de um aparelho que pode ser usado para implementar vários aspectos do presente invento num codificador ou descodificador.
MODOS DE EXECUÇÃO DO INVENTO A. Visão global Vários aspectos do presente invento podem ser incorporados numa grande variedade de métodos e dispositivos de processamento de sinal, incluindo dispositivos tais como os ilustrados nas figuras la e lb. Alguns aspectos podem ser executados através de processamento executado em apenas um método ou dispositivo de descodificação. Outros aspectos exigem processamento cooperativo executado, tanto nos métodos e dispositivos de codificação, como nos de descodificação. Uma descrição dos processos que podem ser usados para executar estes vários aspectos do presente invento é proporcionada abaixo, a seguir a uma visão global dos dispositivos típicos que podem ser usados para executar estes processos. 1. Codificador A figura la ilustra uma implementação de um codificador áudio com bandas separadas no qual o banco de filtros de análise 12 recebe do caminho 11 informação áudio representando um sinal áudio e, em resposta, proporciona informação digital que representa sub-bandas de frequência do sinal áudio. A informação digital em cada uma das sub- 12 bandas de frequência é quantificada por um quantificador respectivo 14, 15, 16 e transmitida para o codificador 17. 0 codificador 17 gera uma representação codificada da informação quantificada, que é transmitida para o formatador 18. Na implementação específica ilustrada na figura, as funções de quantificação nos quantificadores 14, 15, 16 estão adaptadas em resposta à informação de controlo de quantificação recebida do modelo 13, que gera a informação de controlo de quantificação em resposta à informação áudio recebida do caminho 11. 0 formatador 18 junta a representação codificada da informação quantificada e a informação de controlo de quantificação num sinal de saída adequado para transmissão ou armazenamento, e passa o sinal de saída ao longo do caminho 19.
Muitas aplicações áudio usam funções de quantificação linear uniforme q(x) tal como a função de quantificação assimétrica de 3 bit ilustrada na figura 2a; no entanto, nenhuma forma específica de quantificação é importante para o presente invento. Os exemplos das duas outras funções Q(X) que podem ser usadas estão ilustradas nas figuras 2b e 2c. Em cada um destes exemplos, a função de quantificação Q (X) proporciona um valor de saída igual a zero para qualquer valor de entrada X no intervalo entre o valor no ponto 30 e o valor no ponto 31. Em muitas aplicações, os dois valores nos pontos 30 e 31 são iguais em dimensão e têm sinal oposto; no entanto, isto não é necessário tal como está ilustrado na figura 2b. Para facilidade de discussão, um valor X que esteja compreendido no intervalo de valores de entrada quantificados para zero por uma função de quantificação específica q(X) é referido como 13 sendo inferior ao nível de quantificação mínimo dessa função de quantificação.
Nesta revelação, termos como "codificador" e "codificação" não se destinam a inferir qualquer tipo específico de processamento de informação. Por exemplo, a codificação é muitas vezes usada para reduzir exigências de capacidade de informação; no entanto, estes termos nesta revelação não se referem necessariamente a este tipo de processamento. 0 codificador 17 pode executar essencialmente qualquer tipo de processamento desejado. Numa implementação, a informação quantificada é codificada em grupos de números colocados à escala tendo um factor de colocação à escala comum. No sistema de codificação Dolby AC-3, por exemplo, os componentes espectrais quantificados estão dispostos em grupos ou bandas de números com vírgula flutuante, no qual os números em cada banda partilham um expoente com vírgula flutuante. No sistema de codificação AAC é usada a codificação de entropia, tal como a codificação de Huffman. Noutra implementação, o codificador 17 é eliminado e a informação quantificada é junta directamente no sinal de saída. Nenhum tipo específico de codificação é importante para o presente invento. 0 modelo 13 pode executar essencialmente qualquer tipo e processamento pretendido. Um exemplo é um processo que aplica um modelo psico-acústico à informação áudio para calcular os efeitos de mascaramento psico-acústico de diferentes componentes espectrais no sinal áudio. São possíveis muitas variantes. Por exemplo, o modelo 13 pode gerar a informação de controlo de quantificação em resposta à informação de sub-banda de frequência disponível à saída do banco de filtros de análise 12 em vez de, ou para além 14 de, a informação áudio disponível à entrada do banco de filtros. Como outro exemplo, o modelo 13 pode ser eliminado e os quantificadores 14, 15, 16 usarem funções de quantificação que não são adaptadas. Nenhum processo de modelagem específico é importante para o presente invento. 2. Descodificador A figura lb ilustra uma implementação de um descodificador áudio de banda separada no qual o desformatador 22 recebe do caminho 21 um sinal de entrada veiculando uma representação codificada da informação digital quantificada representando sub-bandas de frequência de um sinal áudio. 0 desformatador 22 obtém a representação codificada do sinal de entrada e transmite-a para o descodificador 23. 0 descodificador 23 descodifica a representação codificada em sub-bandas de frequência de informação quantificada. A informação digital quantificada em cada uma das sub-bandas de frequência é desquantifiçada por um desquantificador respectivo 25, 26, 27 e transmitida para o banco de filtros de síntese 28, que gera ao longo do caminho 29 informação áudio representando um sinal áudio. Na implementação específica ilustrada na figura, as funções de desquantificação nos desquantificadores 25, 26, 27 são adaptadas em resposta à informação de controlo de quantificação recebida do modelo 24, que gera a informação de controlo de quantificação em resposta à informação de controlo obtida pelo desformatador 22 do sinal de entrada.
Nesta revelação, termos como "descodificador" e "descodificação" não se destinam a inferir qualquer tipo específico de processamento de informação. 0 descodificador 15 23 pode executar essencialmente qualquer tipo de processamento que seja necessário ou pretendido. Numa implementação que é inversa ao processo de codificação descrito acima, a informação quantificada em grupos de números com virgula flutuante têm expoentes partilhados que são descodificados em componentes quantificados individuais que não partilharam expoentes. Noutra implementação é usada a descodificação de entropia, tal como a descodificação de Huffman. Noutra implementação, o descodificador 23 é eliminado e a informação quantificada é obtida directamente pelo desformatador 22. Nenhum tipo de descodificação é importante para o presente invento. 0 modelo 24 pode executar essencialmente qualquer tipo de processamento pretendido. Um exemplo é um processo que aplica um modelo psico-acústico à informação obtida a partir do sinal de entrada para estimar os efeitos de mascaramento psico-acústico de diferentes componentes espectrais num sinal áudio. Como outro exemplo, o modelo 24 é eliminado e os desquantificadores 25, 26, 27 podem usar, quer funções de quantificação que não estão adaptadas, ou podem usar funções de quantificação que estão adaptadas em resposta à informação de controlo de quantificação obtida directamente do sinal de entrada pelo desformatador 22. Nenhuma processo especifico é importante para o presente invento. 3. Bancos de filtros
Os dispositivos ilustrados nas figuras la e lb mostram componentes para três sub-bandas de frequência. São usadas muitas mais sub-bandas numa aplicação típica, mas apenas 16 três estão ilustradas para clareza ilustrativa. Nenhuma número especifico é importante, em principio, para o presente invento.
Os bancos de filtros de análise e de sintese podem ser implementados essencialmente de qualquer forma pretendida, incluindo uma grande gama de tecnologias de filtro digital, transformadas de bloco e transformadas de onda. Num sistema de codificação áudio tendo um codificador e um descodificador tal como os discutidos acima, o banco de filtros de análise 12 é implementado pelo DCT modificado pelo TDAC e o banco de filtros de sintese 28 é implementado pelo IDCT modificado pelo TDAC mencionado acima; no entanto, nenhuma implementação especifica é importante, em principio.
Os bancos de filtros de análise que são implementados por transformadas de bloco dividem um bloco ou intervalo de um sinal de entrada num conjunto de coeficientes de transformada que representam o conteúdo espectral desse intervalo de sinal. Um grupo de um ou mais coeficientes de transformada adjacentes representa o conteúdo espectral dentro de uma sub-banda de frequência específica tendo uma largura de banda proporcional ao número de coeficientes no grupo.
Os bancos de filtros de análise que são implementados por algum tipo de filtro digital, tal como um filtro polifásico, mais do que uma transformada de bloco, dividem um sinal de entrada num conjunto de sinais de sub-bandas. Cada sinal de sub-banda é uma representação de base temporal do conteúdo espectral do sinal de entrada numa sub-banda de frequência específica. De preferência, o sinal de sub-banda tem casas decimais para que cada sinal de sub- 17 banda tenha uma largura de banda que seja proporcional ao número de amostras no sinal de sub-banda para um intervalo de tempo unitário. A seguinte discussão refere-se mais especificamente a implementações que usam transformadas de bloco tal como a transformada TDAC acima mencionada. Nesta discussão, o termo "sinal de sub-banda" refere-se a grupos de um ou mais coeficientes de transformada adjacentes e o termo "componentes espectrais" refere-se a coeficientes de transformadas. Os princípios do presente invento podem ser aplicados a outros tipos de implementações, no entanto, o termo "sinal de sub-banda" pode ser entendido geralmente como referindo-se também a um sinal de base temporal representando o conteúdo espectral de uma sub-banda de frequência específica de um sinal, e o termo "componentes espectrais" pode ser entendido na generalidade como referindo-se a amostras de um sinal de sub-banda de base temporal. 4. Implementação Vários aspectos do presente invento podem ser implementados numa grande diversidade de formas, incluindo software num sistema informático de uso geral ou nalgum outro aparelho que inclua componentes mais especializados, tal como circuitos de processador de sinal digital (DSP) acoplados a componentes semelhantes aos encontrados num sistema informático de uso geral. A figura 17 é um diagrama de blocos do dispositivo 70 que pode ser usado para implementar vários aspectos do presente invento num codificador áudio ou descodificador áudio. 0 DSP 72 18 proporciona recursos de computação. A RAM 73 é uma memória de acesso aleatório (RAM) do sistema usado pelo DSP 72 para processamento de sinal. A ROM 74 representa alguma forma de armazenamento persistente, tal como memória só de leitura (ROM) para guardar programas necessários para operar o dispositivo 70 e para levar a cabo vários aspectos do presente invento. O controlo I/O 75 representa circuitos de interface para receber e transmitir sinais por meio de canais de comunicação 76, 77. Os conversores analógico para digital e conversores digital para analógico podem ser incluídos no controlo I/O 75, de acordo com o pretendido, para receber e/ou transmitir sinais áudio analógicos. Na forma de realização ilustrada, todos os componentes principais do sistema ligam a um bus 71, que pode representar mais do que um bus físico; no entanto, não é necessária uma arquitectura de bus para implementar o presente invento.
Nas formas de realização implementadas num sistema informático de uso geral, podem ser incluídos componentes adicionais para interface com dispositivo tais como um teclado ou rato e um ecrã, e para controlar um dispositivo de armazenamento tendo um meio de armazenamento tal como uma fita ou disco magnéticos, ou um meio óptico. O meio de armazenamento pode ser usado para gravar programas de instruções para sistemas operativos, utilitários e aplicações e pode incluir formas de realização de programas que implementem vários aspectos do presente invento.
As funções necessárias para pôr em prática vários aspectos do presente invento podem ser executadas por componentes que são implementados numa variedade muito grande de formas incluindo componentes lógicos discretos, 19 um ou mais ASIC e/ou processadores controlados por programa. A forma através da qual estes componentes são implementados não é importante para o presente invento.
As implementações de software do presente invento podem ser veiculadas por uma variedade de meios legíveis por máquina, tal como caminhos de comunicação modulada ou banda de base ao longo do espectro, incluindo frequência de supersónica a ultravioleta, ou meios de armazenamento incluindo os que veiculam informação usando essencialmente qualquer tecnologia de gravação magnética ou óptica, incluindo fita magnética, disco magnético e disco óptico. Podem também ser implementados vários aspectos em vários componentes do sistema informático 70 através de circuitos de processamento tal como ASIC, circuitos integrados de uso geral, microprocessadores controlados por programas materializados em várias formas de ROM ou RAM, e outras técnicas. B. Descodificador Vários aspectos do presente invento podem ser executados num descodificador que não exija qualquer processamento ou informação especial de um descodificador. Estes aspectos estão descritos nesta secção da revelação. Outros aspectos que exigem processamento ou informação especial de um codificador estão descritos na secção seguinte. 1. Vazios espectrais 20 A figura 3 é uma ilustração gráfica do espectro de um intervalo de um sinal áudio hipotético que irá ser codificado por um sistema de codificação de transformadas. 0 espectro 41 representa uma envolvente da dimensão dos coeficientes das transformadas ou componentes espectrais. Durante o processo de codificação, todos os componentes espectrais tendo uma dimensão inferior ao valor limite 40 são quantificados para zero. Se for usada uma função de quantificação, tal como a função q(x) ilustrada na figura 2a, o valor limite 40 corresponde aos níveis de quantificação mínimos 30, 31. O valor limite 40 está ilustrado com um valor uniforme ao longo de toda a gama de frequências, para conveniência ilustrativa. Isto não é típico em muitos sistemas de codificação. Nos sistemas de codificação perceptual áudio que quantificam uniformemente componentes espectrais dentro de cada sinal de sub-banda, por exemplo, o valor limite 40 é uniforme dentro de cada sub-banda de frequência, mas varia de sub-banda para sub-banda. Noutras implementações, o valor limite 40 pode também variar dentro de uma dada sub-banda de frequência. A figura 4 é uma ilustração gráfica do espectro do sinal áudio hipotético que é representado pelos componentes espectrais quantificados. O espectro 42 representa uma envolvente da dimensão dos componentes espectrais que foram quantificados. O espectro ilustrado nesta figura, assim como noutras figuras, não mostra os efeitos de quantificação dos componentes espectrais tendo dimensões maiores ou iguais ao valor limite 40. A diferença entre os componentes espectrais quantificados para zero no sinal quantificado e os componentes espectrais correspondentes no sinal original estão ilustrados com linhas paralelas. Estas 21 áreas com linhas paralelas representam "vazios espectrais" na representação quantificada que serão preenchidos com componentes espectrais sintetizados.
Numa implementação do presente invento, um descodificador recebe um sinal de entrada que veicula uma representação quantificada de sinais de sub-banda quantificados tais como os ilustrados na figura 4. 0 descodificador descodifica a representação descodificada e identifica os sinais de sub-banda nos quais um ou mais componentes espectrais têm valores não nulos e uma pluralidade de componentes espectrais têm um valor nulo. De preferência, as extensões de frequência de todos os sinais de sub-banda são conhecidos, quer a priori pelo descodificador, ou são definidos por uma informação de controlo no sinal de entrada. 0 descodificador gera componentes espectrais sintetizadas que correspondem aos componentes espectrais de valor nulo usando um processo tal como os descritos abaixo. Os componentes sintetizados são colocados à escala de acordo com uma envolvente de colocação à escala que é menor ou igual ao valor limite 40, e os componentes espectrais sintetizados colocados à escala são substituídos pelos componentes espectrais de valor zero no sinal de sub-banda. O descodificador não exige qualquer informação do codificador que indique explicitamente o nível do valor limite 40 se os níveis de quantificação mínimos 30, 31 da função de quantificação q(x) usada para identificar os componentes espectrais forem conhecidos. 2. Colocação à escala 22 A envolvente de colocação à escala pode ser estabelecido por meio uma grande variedade de formas. Algumas formas estão descritas abaixo. Pode ser usada mais de uma forma. Por exemplo, pode ser derivada uma envolvente compósita de colocação à escala que seja igual ao máximo de todas as envolventes obtidas de múltiplas formas, ou usando formas diferentes para estabelecer limites superior e/ou inferior para a envolvente de colocação à escala. As formas podem ser adaptadas ou seleccionadas em resposta a caracteristicas do sinal codificado, e podem ser adaptadas ou seleccionadas em função da frequência. a) Envolvente Uniforme
Uma forma é adequada para descodificadores em sistemas de codificação de transformadas áudio e em sistemas que usam outras implementações de bancos de filtros. Esta forma estabelece uma envolvente de colocação à escala uniforme, ajustando-a para um valor igual ao valor limite 40. Um exemplo de um tal envolvente de colocação à escala está ilustrado na figura 5, que usa áreas com linhas paralelas para ilustrar os vazios espectrais que são preenchidos com componentes espectrais sintetizados. O espectro 43 representa uma envolvente dos componentes espectrais de um sinal áudio com furos espectrais preenchidos por componentes espectrais sintetizados. Os limites superiores das áreas com linhas paralelas ilustrados nestas figuras, assim como noutras figuras, não representam os níveis actuais dos próprios componentes espectrais sintetizados, mas representam apenas uma envolvente de colocação à escala para os componentes sintetizados. Os componentes 23 sintetizados que são usados para preencher os vazios espectrais têm níveis espectrais que não excedem a envolvente de colocação à escala. b) Fuga Espectral
Um segundo modo de estabelecimento de uma envolvente de colocação à escala é bem adequado para descodificadores em sistemas de codificação áudio que usam transformadas de bloco, mas baseia-se nos princípios que podem ser aplicados a outros tipos de implementações de bancos de filtros. Esta forma proporciona uma envolvente de colocação à escala não uniforme que varia de acordo com características de fuga espectral da resposta de frequência de filtro protótipo numa transformada de bloco. A resposta 50 ilustrada na figura 6 é uma ilustração gráfica de uma resposta de frequência hipotética para um filtro protótipo de transformada ilustrando a fuga espectral entre coeficientes. A resposta inclui um lóbulo principal, normalmente referido como a banda de passagem do filtro protótipo, e um número de lóbulos laterais adjacentes ao lóbulo principal que diminui em nível para frequências mais afastadas do centro da banda de passagem. Os lóbulos laterais representam uma energia espectral que foge da banda de passagem para bandas de frequência adjacentes. A velocidade à qual o nivel destes lóbulos laterais diminui é referida como a velocidade de roll off da fuga espectral.
As características de fuga espectral de um filtro impõem restrições no isolamento espectral entre sub-bandas de frequências adjacentes. Se um filtro tem uma grande 24 quantidade de fuga espectral, os níveis espectrais em sub-bandas adjacentes não podem diferir tanto como podem diferir dos filtros com menores quantidades de fuga espectral. A envolvente 51 ilustrado na figura 7 aproxima o roll off da figura espectral ilustrada na figura 6. Os componentes espectrais sintetizados podem ser colocados à escala para uma tal envolvente ou, em alternativa, esta envolvente pode ser usada como um limite inferior para uma envolvente de colocação à escala que é derivado por meio de outras técnicas. 0 espectro 44 na figura 9 é uma ilustração gráfica do espectro de um sinal áudio hipotético com componentes espectrais sintetizados que são colocados à escala de acordo com uma envolvente que aproxima o roll off da fuga espectral. A envolvente de colocação à escala para vazios espectrais que estão limitados em cada lado por energia espectral é um compósito de duas envolventes individuais, um para cada lado. 0 compósito é formado assumindo o maior dos dois invólucros individuais. c) Filtro
Uma terceira forma de estabelecer uma envolvente de colocação à escala é também adequada para descodificadores em sistemas de codificação áudio que usam transformadas de bloco, mas também se baseia em princípios que podem ser aplicados a outros tipos de implementação de bancos de filtros. Este modo proporciona uma envolvente de colocação à escala não uniforme que é calculada a partir do output de um filtro no domínio das frequências que é aplicada a coeficientes de transformadas no domínio de frequência. 0 25 filtro pode ser um filtro de previsão, um filtro passa-baixo, ou essencialmente qualquer outro tipo de filtro que proporcione a envolvente de colocação à escala pretendida. Esta forma exige normalmente mais recursos de computação do que os necessários para as duas formas descritas acima, mas permite que a envolvente de colocação à escala varie em função da frequência. A figura 8 é uma ilustração gráfica de duas envolventes de colocação à escala derivadas a partir da saída de um filtro no domínio das frequência adaptáveis. Por exemplo, a envolvente de colocação à escala 52 poderia ser usado para preencher vazios espectrais em sinais ou partes de sinais que se consideram ter mais características de tom, e a envolvente de colocação à escala 53 poderia ser usado para preencher vazios espectrais em sinais ou partes de sinais que se consideram ter mais características de ruído. As propriedades de tom e ruído de um sinal podem ser avaliadas de diversas formas. Algumas destas formas estão discutidas abaixo. Em alternativa, a envolvente de colocação à escala 52 poderia ser usado para preencher vazios espectrais a frequências inferiores nas quais os sinais áudio têm mais frequentemente características de tom e a envolvente de colocação à escala 53 poderia ser usado para preencher vazios espectrais a frequências superiores nas quais o sinal áudio tem mais frequentemente características de ruído. d) Mascaramento perceptual
Uma quarta forma de estabelecimento de uma envolvente de colocação à escala é aplicável a descodificadores em 26 sistemas de codificação áudio que implementam bancos de filtro com transformadas de bloco e outros tipos de filtros. Esta forma proporciona uma envolvente de colocação à escala não uniforme que varia de acordo com efeitos de mascaramento psico-acústico estimados. A figura 10 ilustra dois valores limite hipotéticos de mascaramento psico-acústico. O valor limite 61 representa os efeitos de mascaramento psico-acústico de um componente espectral de frequência inferior 60 e o valor limite 64 representa os efeitos de mascaramento psico-acústico de um componente espectral com frequência superior 63. Os valores limites de mascaramento, tais como estes, podem ser usados para calcular a forma da envolvente de colocação à escala. O espectro 45 na figura 11 é uma ilustração gráfica do espectro de um sinal áudio hipotético com componentes espectrais sintetizados substitutos que são colocados à escala de acordo com envolventes que se baseiam em mascaramento psico-acústico. No exemplo ilustrado, a envolvente de colocação à escala no vazio espectral de frequência mais inferior é calculada a partir da parte inferior do valor limite de mascaramento 61. A envolvente de colocação à escala no furo espectral central é um compósito da parte superior do valor limite de mascaramento 61 e da parte inferior do valor limite de mascaramento 64. A envolvente de colocação à escala no furo espectral com frequência mais elevada é calculada a partir da parte superior do valor limite de mascaramento 64. e) Tonalidade 27
Uma quinta forma de estabelecimento de uma envolvente de colocação à escala baseia-se na avaliação da tonalidade de todo o sinal áudio ou de alguma parte do sinal áudio, tal como para um ou mais sinais de sub-banda. A tonalidade pode ser avaliada através de um conjunto de formas incluindo o cálculo de uma medida de planura espectral (SFM - Spectral Flatness Measure), que é o quociente normalizado da média aritmética de amostras de sinal dividido pela média geométrica das amostras de sinal. Um valor próximo de um indica um sinal com muitas caracteristicas de ruido, e um valor próximo de zero indica um sinal com muitas caracteristicas de tom. A SFM pode ser usada directamente para adaptar a envolvente de colocação à escala. Quando a SFM é igual a zero, não são usados componentes sintetizados para preencher um vazio espectral. Quando a SFM é igual a um, é usado o nível permitido máximo de componentes sintetizados para preencher um vazio espectral. Em geral, no entanto, um codificador pode calcular uma SFM melhor porque tem acesso a todo o sinal áudio original antes da codificação. É provável que um descodificador não calcule uma SFM precisa devido à presença de componentes espectrais quantificados para zero.
Um descodificador pode também avaliar a tonalidade analisando o arranjo ou distribuição dos componentes espectrais com valor não nulo e valor nulo. Numa implementação, um sinal é considerado como tendo mais caracteristicas de tom do que de ruído, se muitas passagens de componentes espectrais com valor nulo estiverem distribuídos entre alguns componentes grandes de valor não nulo porque este arranjo implica uma estrutura de picos espectrais. 28
Ainda noutra implementação, um descodificador aplica um filtro de previsão a um ou mais sinais de sub-banda e determina o ganho previsão. Um sinal é considerado como tendo mais caracteristicas de tom à medida que o ganho de previsão aumenta. f) Colocação à escala na base temporal A figura 12 é uma ilustração gráfica de um sinal de sub-banda hipotético a ser codificado. A linha 46 representa uma envolvente temporal da dimensão dos componentes espectrais. Este sinal de sub-banda pode ser constituído por um componente espectral comum ou coeficiente de transformada numa sequência de blocos obtido a partir de um banco de filtros de análise implementado por uma transformada de bloco, ou pode ser um sinal de sub-banda obtido por outro tipo de banco de filtros de análise implementado por filtro digital que não uma transformada de bloco, tal como um QMF. Durante o processo de codificação, todos os componentes espectrais tendo uma dimensão inferior ao valor limite 40 são levados a zero. O valor limite 40 é ilustrado com um valor uniforme ao longo de todo o intervalo de tempo, para conveniência ilustrativa. Isto não é típico em muitos sistemas de codificação que usam bancos de filtros implementados por transformadas de bloco. A figura 13 é uma ilustração gráfica do sinal de sub-banda hipotético que é representado por componentes espectrais quantificados. A linha 47 representa uma envolvente temporal da dimensão de componentes espectrais que foram quantificados. A linha ilustrada nesta figura, assim como noutras figuras, não mostra os efeitos da 29 quantificação dos componentes espectrais que têm dimensões maiores ou iguais ao valor limite 40. A diferença entre os componentes espectrais quantificados para zero no sinal quantificado e os componentes espectrais correspondentes no sinal original estão ilustrados com linhas paralelas. A área com linhas paralelas representa um furo espectral dentro de um intervalo de tempo que será preenchido com componentes espectrais sintetizados.
Numa implementação do presente invento, um descodificador recebe um sinal de entrada que veicula uma representação codificada de sinais de sub-banda codificados, tais como os ilustrados na figura 13. O descodificador descodifica a representação codificada e identifica os sinais de sub-banda nos quais uma pluralidade de componentes espectrais tem um valor nulo e são precedidos e/ou seguidos por componentes espectrais tendo valores não nulos. O descodificador gera componentes espectrais sintetizados que correspondem a componentes espectrais de valor nulo usando um processo tal como os descritos abaixo. Os componentes sintetizados são colocados à escala de acordo com uma envolvente de colocação à escala. De preferência, a envolvente de colocação à escala tem em conta as caracteristicas de mascaramento temporal do sistema auditivo humano. A figura 14 ilustra um valor limite hipotético de mascaramento psico-acústico temporal. O valor limite 68 representa os efeitos de mascaramento psico-acústico temporal de um componente espectral 67. A parte do valor limite para a esquerda do componente espectral 67 representa caracteristicas de mascaramento pré-temporal, ou o mascaramento que precede a ocorrência do componente 30 espectral. A parte do valor limite para a direita do componente espectral 67 representa caracteristicas de mascaramento pós-temporal, ou o mascaramento que se segue à ocorrência do componente espectral. Os efeitos pós-mascaramento têm normalmente uma duração que é muito superior à duração dos efeitos de pré-mascaramento. Um valor limite de mascaramento temporal tal como este pode ser usada para calcular um formato temporal da envolvente de colocação à escala. A linha 48 na figura 15 é uma ilustração gráfica de um sinal de sub-banda hipotético com componentes espectrais sintetizados substitutos que são colocados à escala de acordo com envolventes que se baseiam em efeitos de mascaramento psico-acústico temporal. No exemplo ilustrado, a envolvente de colocação à escala é um compósito de duas envolventes individuais. A envolvente individual para a parte de menor frequência do vazio espectral é calculada a partir da parte pós- mascaramento do valor limite 68. A envolvente individual para a parte de maior frequência do vazio espectral é calculada a partir da parte pré-mascaramento do valor limite 68. 3. Geração de componentes sintetizados
Os componentes espectrais sintetizados podem ser gerados de várias formas. As formas estão descritas abaixo. Podem ser usadas diversas formas. Por exemplo, podem ser escolhidas diversas formas em resposta a caracteristicas do sinal codificado, ou em função da frequência.
Uma primeira forma gera um sinal com caracteristicas de ruído. Essencialmente, pode ser usada qualquer uma de 31 uma grande variedade de formas para gerar sinais pseudo-ruído .
Uma segunda forma usa uma técnica chamada translação espectral ou replicação espectral que copia componentes espectrais de uma ou mais sub-bandas de frequência. Os componentes espectrais com frequência mais baixa são normalmente copiados para preencher vazios espectrais em frequência mais elevadas porque os componentes de frequência mais elevada estão muitas vezes relacionados, de alguma forma, com componentes de frequência menor. Em princípio, no entanto, os componentes espectrais podem ser copiados para frequências maiores ou menores. 0 espectro 49 na figura 16 é uma ilustração gráfica do espectro de um sinal áudio hipotético com componentes espectrais sintetizados gerados por replicação espectral. Uma parte do pico espectral é replicada para baixo e para cima em tempos múltiplos de frequência para preencher vazios espectrais nas frequências baixa e intermédia, respectivamente. Uma parte dos componentes espectrais perto da extremidade superior do espectro é replicada para uma frequência maior para preencher o vazio espectral na extremidade superior do espectro. No exemplo ilustrado, os componentes replicados são colocados à escala por meio de uma envolvente uniforme de colocação à escala; no entanto, pode ser usada essencialmente qualquer forma de envolvente de colocação à escala. C. Codificador
Os aspectos do presente invento que são descritos acima podem ser executados num descodificador sem qualquer 32 exigência de modificação dos codificadores existentes. Estes aspectos podem ser realçados se o codificador for modificado para proporcionar informação de controlo adicional que, de outra forma, não estaria disponível para o descodificador. A informação de controlo adicional pode ser usada para adaptar a forma na qual os componentes espectrais sintetizados são gerados e colocados à escala no descodificador. 1. Informação de controlo
Um codificador pode proporcionar uma variedade de informação de controlo de colocação à escala que um descodificador pode usar para adaptar a envolvente de colocação à escala para componentes espectrais sintetizados. Cada um dos exemplos referido abaixo pode ser proporcionado para um sinal completo e/ou para sub-bandas de frequência do sinal.
Se uma sub-banda contém componentes espectrais que estão significativamente abaixo do nivel de quantificação mínimo, o codificador pode proporcionar informação ao descodificador que indica esta condição. A informação pode ser um tipo de índice que o descodif icador pode usar para seleccionar dois ou mais níveis de colocação à escala, ou a informação pode veicular algumas medidas de nível espectral, tal como uma média ou valor média quadrático (RMS). 0 descodificador pode adaptar a envolvente de colocação à escala em resposta a esta informação.
Tal como está explicado acima, um descodificador pode adaptar a envolvente de colocação à escala em resposta aos efeitos de mascaramento psico-acústico estimados a partir 33 do próprio sinal codificado; no entanto, é possível ao descodificador proporcionar uma melhor estimativa destes efeitos de mascaramento quando o codificador tem acesso a caracterí st icas do sinal que se perdem por meio de um processo de caracterização. Isto pode ser feito tendo o módulo 13 a proporcionar informação psico-acústica ao formatador 18 que, de outra forma, não está disponível a partir do sinal codificado. Usando este tipo de informação, o descodificador pode adaptar a envolvente de colocação à escala para configurar os componentes espectrais sintetizados de acordo com um ou mais critérios psico-acústicos. A envolvente de colocação à escala pode também ser adaptado em resposta a alguma avaliação das qualidades das características de ruído ou de tom de um sinal ou sinal de sub-banda. Esta avaliação pode ser feita de várias formas, quer pelo codificador quer pelo descodificador; no entanto, um codificador é normalmente capaz de efectuar uma melhor avaliação. Os resultados desta avaliação pode ser juntos ao sinal codificado. Uma avaliação é a SFM descrita acima.
Uma indicação da SFM pode também ser usada por um descodificador para seleccionar quais os processos a usar para gerar componentes espectrais sintetizados. Se a SFM estiver próxima de um, pode usar-se a técnica de geração de ruído. Se a SFM estiver próxima de zero, pode usar-se a técnica de replicação espectral.
Um codificador pode proporcionar alguma indicação de potência para os componentes espectrais não nulos e quantificados para zero, tal como uma relação entre estas duas potências. 0 descodificador pode calcular a potência dos componentes espectrais não nulos e então usar esta 34 relaçao ou outra indicaçao para adaptar adequadamente a envolvente de colocação à escala. 1. Coeficientes espectrais nulos A discussão anterior referiu por vezes os componentes espectrais de valor nulo como componentes quantificados para zero, porque a quantificação é uma fonte comum de componentes de valor nulo num sinal codificado. Isto não é essencial. 0 valor dos componentes espectrais num sinal codificado pode ser colocado a zero essencialmente através de qualquer processo. Por exemplo, um codificador pode identificar o maior ou os dois maiores componentes espectrais em cada sinal de sub-banda acima de uma frequência especifica, e ajustar para zero todos os outros componentes espectrais nesses sinais de sub-banda. Em alternativa, um codificador pode levar a zero todos os componentes espectrais em determinadas sub-bandas que estão abaixo de algum valor limite. Um descodificador que incorpore vários aspectos do presente invento, tal como descrito acima, pode preencher vazios espectrais independentemente do processo que é responsável pela sua criação. 0 seguinte descreve aspectos do presente invento: 1. Processo para gerar informações áudio, no qual o processo compreende: a recepção de um sinal de entrada e a obtenção a partir dai de um conjunto de sinais de sub-banda, tendo cada um um ou mais componentes espectrais 35 que representam o conteúdo espectral de um sinal áudio; a identificação dentro do conjunto de sinais de sub-banda de um sinal de sub-banda específico no qual um ou mais componentes espectrais tem um valor zero e são quantificados por um quantificado tendo um nível de quantificação mínimo; a geração de um ou mais compostos espectrais sintetizados que correspondem a um ou mais componentes espectrais de valor nulo no sinal de sub-banda especifico e que são colocados à escala de acordo com uma envolvente de colocação à escala com base no nível de quantificação mínimo; a geração de um conjunto modificado de sinais de sub-bandas através da substituição de componentes espectrais sintetizados por componentes espectrais de valor nulo no sinal de sub-banda específica; a geração e de um informações áudio aplicando um banco de filtros de síntese ao conjunto modificado de sinais de sub-banda. 2. Processo para gerar informações áudio, no qual o processo compreende: a recepção de um sinal de entrada e a obtenção a partir daí de um conjunto de sinais de sub-banda, tendo cada um um ou mais componentes espectrais que representam o conteúdo espectral de um sinal áudio; 36 a identificação dentro do conjunto de sinais de sub-banda de um sinal de sub-banda especifico no qual um ou mais componentes espectrais tem um valor zero e são quantificados por um quantificado tendo um nivel de quantificação mínimo, e no qual um ou mais componentes espectrais têm um valor nulo; a derivação de uma envolvente de colocação à escala a partir de um ou mais compostos espectrais que têm valores não nulos; a geração de um ou mais compostos espectrais sintetizados que correspondem aos componentes espectrais de valor nulo no sinal de sub-banda específica e que são colocados à escala de acordo com a envolvente de colocação à escala; a geração de um conjunto modificado de sinais de sub-bandas através da substituição dos componentes espectrais sintetizados por componentes espectrais de valor nulo correspondendo no sinal de sub-banda específica; e a geração de um informações áudio aplicando um banco de filtros de síntese ao conjunto modificado de sinais de sub-banda 3. 0 processo de acordo com 1 ou 2, em que o sinal de entrada veicula para sinais de sub-banda individuais uma indicação de potência. 4. Processo de acordo com qualquer um dos pontos 1 a 3, no qual os componentes espectrais dentro de um sinal de 37 sub-banda respectiva são representados por valores colocados à escala que partilham um factor de colocação à escala. 5. Processo de acordo com qualquer um dos pontos 1 a 4, no qual os componentes espectrais dentro de um sinal de sub-banda respectivo têm um nível de quantificação mínimo comum. 6. Processo de acordo com qualquer um dos pontos 1 a 5, que obtém informação do controlo de colocação à escala a partir do sinal de entrada, no qual valores dos componentes sintetizados são colocados à escala também em resposta à informação de controlo de colocação à escala. 7. Processo de acordo com qualquer uma dos pontos 1 a 6, no qual a envolvente de colocação à escala responde a um nível de quantificação mínimo. 8. Processo de acordo com qualquer um dos pontos 1 a 7, no qual o banco de filtros de síntese tem fuga espectral entre sinais de sub-bandas adjacentes e os valores dos componentes espectrais sintetizados são colocados à escala de acordo com uma envolvente de colocação à escala que varia a uma velocidade substancialmente igual a uma velocidade de roll off da fuga espectral. 9. Processo de acordo com qualquer um dos pontos 1 a 8, no qual o banco de filtros de síntese é implementado por uma transformada de bloco e o método compreende: 38 a aplicação de um filtro no domínio das frequências a um ou mais componentes espectrais no conjunto de sinais de sub-banda; e o cálculo da envolvente de colocação à escala a partir de uma saída do filtro no domínio das frequências. 10. Processo de acordo com 9, que compreende a variação da resposta do filtro no domínio das frequências como função da frequência. 11. Processo de acordo com qualquer um dos pontos 1 a 10 que compreende: a obtenção de uma medida de tonalidade do sinal áudio representada pelo conjunto de sinais de sub-banda; e a adaptação da envolvente de colocação à escala em resposta à medida de tonalidade. 12. Processo de acordo com 11, que obtém a medida de tonalidade a partir do sinal de entrada. 13. Processo de acordo com 11 que compreende o cálculo da medida da tonalidade a partir da forma na qual os componentes espectrais de valor nulo estão dispostos no sinal de sub-banda específico. 14. Processo de acordo com qualquer um dos pontos 1 a 13 que compreende: 39 a obtenção de uma sequência de conjuntos de sinais de sub-banda do sinal de entrada; a identificação de um sinal de sub-banda comum na sequência de conjuntos de sinais de sub-banda em que um ou mais componentes espectrais têm um valor nulo; a colocação à escala de um ou mais componentes espectrais sintetizados que correspondem a um ou mais dos componentes espectrais de valor nulo de acordo com a envolvente de colocação à escala, na qual a envolvente de colocação à escala se estende de conjunto para conjunto na sequência; a geração de uma sequência de conjuntos modificados de sinais de sub-banda através da substituição dos componentes espectrais sintetizados para os componentes espectrais de valor nulo correspondentes, nos conjuntos; e a geração da informação áudio através da aplicação do banco de filtro de síntese à sequência de conjuntos modificados de sinais de sub-banda. 15. Processo de acordo com qualquer um dos pontos 1 a 14, no qual os componentes espectrais sintetizados são gerados por translação espectral de outros componentes espectrais no conjunto de sinais de saída. 16. Processo de acordo com qualquer um dos pontos 1 a 15, no qual a envolvente de colocação à escala varia de 40 acordo com características de mascaramento temporal do sistema auditivo humano. 17. Processo para gerar um sinal de saída, no qual o método compreende: a geração de um conjunto de sinais de sub-banda, tendo cada um um ou mais componentes espectrais representando o conteúdo espectral de um sinal áudio através da quantificação da informação que é obtida aplicando um banco de filtros de análise à informação áudio; a identificação dentro do conjunto de sinais de sub-banda de um sinal de sub-banda específico no qual um ou mais componentes espectrais tem um valor não nulo e são quantificados por um quantificador tendo um nível de quantificação mínimo, e no qual um ou mais componentes espectrais têm um valor nulo; a derivação de uma informação de controlo de colocação à escala a partir de uma primeira medida de níveis espectrais para partes do sinal áudio representadas pelos componentes espectrais de valor nulo, em que a informação de controlo de escala controla a colocação à escala dos componentes espectrais sintetizados a serem sintetizados e substituídos pelos componentes espectrais tendo um valor nulo num receptor que gera informação áudio em resposta ao sinal de saída; e 41 a geração de um sinal de saída através da união da informação de controlo de colocação à escala e da informação representando o conjunto de sinais de sub-banda. 18. Processo de acordo com 17, que compreende: a obtenção de uma medida de tonalidade do sinal áudio representado pelo conjunto de sinais de sub-banda; e o cálculo da informação de controlo de colocação à escala a partir da medida de tonalidade. 19. Método de acordo com 17 ou 18 que compreende: a obtenção de um valor limite de mascaramento psico-acústico estimado representado pelo conjunto de sinais de sub-banda; e o cálculo da informação de controlo de colocação à escala a partir do valor limite de mascaramento psico-acústica estimado. 20. Método de acordo com qualquer um dos pontos 17 a 19 que compreende: a obtenção de uma segunda medida de níveis espectrais para partes do sinal áudio representadas pelos componentes espectrais de valor não nulo; e 42 o cálculo da informação de controlo de colocação à escala a partir das primeira e segunda medidas de níveis espectrais. 21. Aparelho que compreende meios para executar os passos de qualquer um dos pontos 1 a 20. 22. Um suporte que veicula um programa de instruções e é legível por um dispositivo para executar o programa de instruções para executar o método de qualquer um dos pontos 1 a 20.
Lisboa, 5 de Março de 2012. 43

Claims (6)

  1. REIVINDICAÇÕES 1. Processo para gerar informações áudio, no qual o processo compreende: a recepção de um sinal de entrada que veicula uma representação codificada de sinais de sub-bandas quantificados, em que os componentes espectrais que tinham uma dimensão inferior a um valor limite foram quantificados para um valor nulo; a descodificação da representação codificada e a identificação de um sinal de sub-banda especifico no qual um ou mais componentes espectrais têm valores não nulos e uma pluralidade de componentes espectrais tem um valor nulo; a derivação de uma envolvente de colocação à escala a partir de uma saída de um filtro no domínio das frequências aplicado aos compostos espectrais, em que a envolvente de colocação à escala é menor ou igual ao valor limite; a geração de compostos espectrais sintetizados que correspondem aos componentes espectrais de valor nulo que são colocados à escala em função da envolvente de colocação à escala; a geração de um conjunto modificado de sinais de sub-bandas substituindo os componentes espectrais sintetizados por componentes espectrais de valor nulo correspondendo aos sinais de sub-banda específica; e a geração de um informações áudio aplicando um banco de filtros de síntese ao conjunto modificado de sinais de sub-banda. 1
  2. 2. Processo de acordo com a reivindicação 1, que compreende a variação da resposta do filtro no dominio das frequências em função da frequência.
  3. 3. Processo de acordo com as reivindicações 1 ou 2, que compreende a geração de componentes espectrais sintetizados gerando um sinal com caracteristicas de ruído.
  4. 4. Processo de acordo com qualquer uma das reivindicações 1 a 3, que compreende a geração de compostos espectrais sintetizados de várias formas, escolhidos como uma função da frequência.
  5. 5. Aparelho destinado a gerar informações áudio, no qual o aparelho compreende meios adaptados para executar todos os passos no processo de acordo com qualquer uma das reivindicações 1 a 4.
  6. 6. Suporte que regista um programa de instruções e que é legível por um aparelho destinado a executar o programa de instruções para executar todos os passos no processo de acordo com qualquer uma das reivindicações 1 a 4. Lisboa, 5 de Março de 2012. 2
PT10162217T 2002-06-17 2003-05-30 Sistema de codificação áudio usando preenchimento de vazio espectral PT2216777E (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/174,493 US7447631B2 (en) 2002-06-17 2002-06-17 Audio coding system using spectral hole filling

Publications (1)

Publication Number Publication Date
PT2216777E true PT2216777E (pt) 2012-03-16

Family

ID=29733607

Family Applications (1)

Application Number Title Priority Date Filing Date
PT10162217T PT2216777E (pt) 2002-06-17 2003-05-30 Sistema de codificação áudio usando preenchimento de vazio espectral

Country Status (20)

Country Link
US (4) US7447631B2 (pt)
EP (6) EP2209115B1 (pt)
JP (6) JP4486496B2 (pt)
KR (5) KR100991448B1 (pt)
CN (1) CN100369109C (pt)
AT (7) ATE349754T1 (pt)
CA (6) CA2489441C (pt)
DE (3) DE60310716T8 (pt)
DK (3) DK1514261T3 (pt)
ES (1) ES2275098T3 (pt)
HK (6) HK1070729A1 (pt)
IL (2) IL165650A (pt)
MX (1) MXPA04012539A (pt)
MY (2) MY159022A (pt)
PL (1) PL208344B1 (pt)
PT (1) PT2216777E (pt)
SG (3) SG2014005300A (pt)
SI (2) SI2209115T1 (pt)
TW (1) TWI352969B (pt)
WO (1) WO2003107328A1 (pt)

Families Citing this family (144)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
DE10134471C2 (de) * 2001-02-28 2003-05-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
AU2003242903A1 (en) * 2002-07-08 2004-01-23 Koninklijke Philips Electronics N.V. Audio processing
US7889783B2 (en) * 2002-12-06 2011-02-15 Broadcom Corporation Multiple data rate communication system
KR101164937B1 (ko) 2003-05-28 2012-07-12 돌비 레버러토리즈 라이쎈싱 코오포레이션 오디오 신호의 인식된 라우드니스를 계산 및 조정하는방법, 장치 및 컴퓨터 프로그램
US7461003B1 (en) * 2003-10-22 2008-12-02 Tellabs Operations, Inc. Methods and apparatus for improving the quality of speech signals
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
CA2555182C (en) * 2004-03-12 2011-01-04 Nokia Corporation Synthesizing a mono audio signal based on an encoded multichannel audio signal
KR101143724B1 (ko) * 2004-05-14 2012-05-11 파나소닉 주식회사 부호화 장치 및 부호화 방법, 및 부호화 장치를 구비한 통신 단말 장치 및 기지국 장치
EP1742202B1 (en) * 2004-05-19 2008-05-07 Matsushita Electric Industrial Co., Ltd. Encoding device, decoding device, and method thereof
CN101006496B (zh) * 2004-08-17 2012-03-21 皇家飞利浦电子股份有限公司 可分级音频编码
JP2008513845A (ja) * 2004-09-23 2008-05-01 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声データを処理するシステム及び方法、プログラム要素並びにコンピュータ読み取り可能媒体
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
CN101048935B (zh) 2004-10-26 2011-03-23 杜比实验室特许公司 控制音频信号的单位响度或部分单位响度的方法和设备
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
KR100707173B1 (ko) * 2004-12-21 2007-04-13 삼성전자주식회사 저비트율 부호화/복호화방법 및 장치
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
KR100851970B1 (ko) * 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7546240B2 (en) 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
US20070053603A1 (en) * 2005-09-08 2007-03-08 Monro Donald M Low complexity bases matching pursuits data coding and decoding
US8121848B2 (en) * 2005-09-08 2012-02-21 Pan Pacific Plasma Llc Bases dictionary for low complexity matching pursuits data coding and decoding
US7848584B2 (en) * 2005-09-08 2010-12-07 Monro Donald M Reduced dimension wavelet matching pursuits coding and decoding
US7813573B2 (en) * 2005-09-08 2010-10-12 Monro Donald M Data coding and decoding with replicated matching pursuits
US8126706B2 (en) * 2005-12-09 2012-02-28 Acoustic Technologies, Inc. Music detector for echo cancellation and noise reduction
JP5185254B2 (ja) 2006-04-04 2013-04-17 ドルビー ラボラトリーズ ライセンシング コーポレイション Mdct領域におけるオーディオ信号音量測定と改良
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
WO2007121778A1 (en) * 2006-04-24 2007-11-01 Nero Ag Advanced audio coding apparatus
AU2007243586B2 (en) 2006-04-27 2010-12-23 Dolby Laboratories Licensing Corporation Audio gain control using specific-loudness-based auditory event detection
US20070270987A1 (en) * 2006-05-18 2007-11-22 Sharp Kabushiki Kaisha Signal processing method, signal processing apparatus and recording medium
WO2008051347A2 (en) 2006-10-20 2008-05-02 Dolby Laboratories Licensing Corporation Audio dynamics processing using a reset
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
AU2012261547B2 (en) * 2007-03-09 2014-04-17 Skype Speech coding system and method
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US7761290B2 (en) * 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US7774205B2 (en) * 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
CN101790758B (zh) 2007-07-13 2013-01-09 杜比实验室特许公司 用于控制音频信号的信号处理的设备和方法
CN101939782B (zh) * 2007-08-27 2012-12-05 爱立信电话股份有限公司 噪声填充与带宽扩展之间的自适应过渡频率
ES2774956T3 (es) 2007-08-27 2020-07-23 Ericsson Telefon Ab L M Método y dispositivo para la descodificación espectral perceptual de una señal de audio, que incluyen el llenado de huecos espectrales
RU2469423C2 (ru) * 2007-09-12 2012-12-10 Долби Лэборетериз Лайсенсинг Корпорейшн Повышение разборчивости речи с помощью четкости голоса
JP4970596B2 (ja) * 2007-09-12 2012-07-11 ドルビー ラボラトリーズ ライセンシング コーポレイション 雑音レベル推定値の調節を備えたスピーチ強調
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
WO2009084918A1 (en) * 2007-12-31 2009-07-09 Lg Electronics Inc. A method and an apparatus for processing an audio signal
PL2311033T3 (pl) 2008-07-11 2012-05-31 Fraunhofer Ges Forschung Dostarczanie sygnału aktywującego dopasowanie czasowe i kodowanie sygnału audio z jego użyciem
EP4372744A1 (en) 2008-07-11 2024-05-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
WO2010016271A1 (ja) * 2008-08-08 2010-02-11 パナソニック株式会社 スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法
WO2010028297A1 (en) 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
WO2010028299A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
US8515747B2 (en) * 2008-09-06 2013-08-20 Huawei Technologies Co., Ltd. Spectrum harmonic/noise sharpness control
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
WO2010031003A1 (en) 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
EP2182513B1 (en) * 2008-11-04 2013-03-20 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
TWI716833B (zh) * 2009-02-18 2021-01-21 瑞典商杜比國際公司 用於高頻重建或參數立體聲之複指數調變濾波器組
TWI618350B (zh) 2009-02-18 2018-03-11 杜比國際公司 用於高頻重建或參數立體聲之複指數調變濾波器組
KR101078378B1 (ko) * 2009-03-04 2011-10-31 주식회사 코아로직 오디오 부호화기의 양자화 방법 및 장치
KR101320963B1 (ko) * 2009-03-31 2013-10-23 후아웨이 테크놀러지 컴퍼니 리미티드 신호 잡음 제거 방법, 신호 잡음 제거 장치, 및 오디오 디코딩 시스템
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
RU2605677C2 (ru) 2009-10-20 2016-12-27 Франхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Аудио кодер, аудио декодер, способ кодирования аудио информации, способ декодирования аудио информации и компьютерная программа, использующая итеративное уменьшение размера интервала
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
PL2524372T3 (pl) 2010-01-12 2015-08-31 Fraunhofer Ges Forschung Koder audio. dekoder audio, sposób kodowania i dekodowania informacji audio i program komputerowy uzyskujący wartość podobszaru kontekstu w oparciu o normę uprzednio zdekodowanych wartości widmowych
CA3225485A1 (en) 2010-01-19 2011-07-28 Dolby International Ab Improved subband block based harmonic transposition
TWI557723B (zh) 2010-02-18 2016-11-11 杜比實驗室特許公司 解碼方法及系統
WO2011121955A1 (ja) 2010-03-30 2011-10-06 パナソニック株式会社 オーディオ装置
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
WO2011156905A2 (en) * 2010-06-17 2011-12-22 Voiceage Corporation Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands
US9236063B2 (en) 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9208792B2 (en) * 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5695074B2 (ja) * 2010-10-18 2015-04-01 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 音声符号化装置および音声復号化装置
CN105225669B (zh) 2011-03-04 2018-12-21 瑞典爱立信有限公司 音频编码中的后量化增益校正
US9009036B2 (en) 2011-03-07 2015-04-14 Xiph.org Foundation Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding
US8838442B2 (en) 2011-03-07 2014-09-16 Xiph.org Foundation Method and system for two-step spreading for tonal artifact avoidance in audio coding
US9015042B2 (en) * 2011-03-07 2015-04-21 Xiph.org Foundation Methods and systems for avoiding partial collapse in multi-block audio coding
ES2559040T3 (es) 2011-03-10 2016-02-10 Telefonaktiebolaget Lm Ericsson (Publ) Relleno de subvectores no codificados en señales de audio codificadas por transformada
EP3067888B1 (en) * 2011-04-15 2017-05-31 Telefonaktiebolaget LM Ericsson (publ) Decoder for attenuation of signal regions reconstructed with low accuracy
JP6189831B2 (ja) 2011-05-13 2017-08-30 サムスン エレクトロニクス カンパニー リミテッド ビット割り当て方法及び記録媒体
US9264094B2 (en) * 2011-06-09 2016-02-16 Panasonic Intellectual Property Corporation Of America Voice coding device, voice decoding device, voice coding method and voice decoding method
JP2013007944A (ja) 2011-06-27 2013-01-10 Sony Corp 信号処理装置、信号処理方法、及び、プログラム
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
WO2013188562A2 (en) * 2012-06-12 2013-12-19 Audience, Inc. Bandwidth extension via constrained synthesis
EP2717263B1 (en) * 2012-10-05 2016-11-02 Nokia Technologies Oy Method, apparatus, and computer program product for categorical spatial analysis-synthesis on the spectrum of a multichannel audio signal
CN103854653B (zh) * 2012-12-06 2016-12-28 华为技术有限公司 信号解码的方法和设备
PT2939235T (pt) * 2013-01-29 2017-02-07 Fraunhofer Ges Forschung Quantização de sinal de áudio de tonalidade adaptativa de baixa complexidade
CN105264597B (zh) 2013-01-29 2019-12-10 弗劳恩霍夫应用研究促进协会 感知转换音频编码中的噪声填充
EP3217398B1 (en) 2013-04-05 2019-08-14 Dolby International AB Advanced quantizer
JP6157926B2 (ja) * 2013-05-24 2017-07-05 株式会社東芝 音声処理装置、方法およびプログラム
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
EP2830055A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
EP2830060A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling in multichannel audio coding
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
BR112016014476B1 (pt) 2013-12-27 2021-11-23 Sony Corporation Aparelho e método de decodificação, e, meio de armazenamento legível por computador
EP2919232A1 (en) * 2014-03-14 2015-09-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and method for encoding and decoding
JP6035270B2 (ja) 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
RU2572664C2 (ru) * 2014-06-04 2016-01-20 Российская Федерация, От Имени Которой Выступает Министерство Промышленности И Торговли Российской Федерации Устройство активного гашения вибрации
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
JP7118642B2 (ja) 2014-08-08 2022-08-16 アリ リサーチ ソシエタ ア レスポンサビリタ リミタータ センプリフィカタ 炎症性およびアレルギー性病変の治療に用いるための脂肪酸とパルミトイルエタノールアミドの混合物
DE112015004185T5 (de) 2014-09-12 2017-06-01 Knowles Electronics, Llc Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten
US10460736B2 (en) * 2014-11-07 2019-10-29 Samsung Electronics Co., Ltd. Method and apparatus for restoring audio signal
US9875756B2 (en) 2014-12-16 2018-01-23 Psyx Research, Inc. System and method for artifact masking
US9668048B2 (en) 2015-01-30 2017-05-30 Knowles Electronics, Llc Contextual switching of microphones
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10553228B2 (en) * 2015-04-07 2020-02-04 Dolby International Ab Audio coding with range extension
US20170024495A1 (en) * 2015-07-21 2017-01-26 Positive Grid LLC Method of modeling characteristics of a musical instrument
MX2018010753A (es) * 2016-03-07 2019-01-14 Fraunhofer Ges Forschung Método de ocultamiento híbrido: combinación de ocultamiento de pérdida paquete de dominio de frecuencia y tiempo en códecs de audio.
DE102016104665A1 (de) * 2016-03-14 2017-09-14 Ask Industries Gmbh Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals
JP2018092012A (ja) * 2016-12-05 2018-06-14 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
WO2018106088A1 (ko) * 2016-12-09 2018-06-14 주식회사 엘지화학 밀봉재 조성물
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
EP3544005B1 (en) 2018-03-22 2021-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding with dithered quantization
EP3662469A4 (en) 2018-04-25 2020-08-19 Dolby International AB INTEGRATION OF HIGH FREQUENCY RECONSTRUCTION TECHNIQUES WITH REDUCED POST-PROCESSING DELAY
KR20210005164A (ko) 2018-04-25 2021-01-13 돌비 인터네셔널 에이비 고주파 오디오 재구성 기술의 통합
WO2023118600A1 (en) * 2021-12-23 2023-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using different noise filling methods
WO2023117145A1 (en) * 2021-12-23 2023-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using different noise filling methods
WO2023117146A1 (en) * 2021-12-23 2023-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using a filtering
WO2023118605A1 (en) * 2021-12-23 2023-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using a filtering

Family Cites Families (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US36478A (en) * 1862-09-16 Improved can or tank for coal-oil
US3995115A (en) 1967-08-25 1976-11-30 Bell Telephone Laboratories, Incorporated Speech privacy system
US3684838A (en) 1968-06-26 1972-08-15 Kahn Res Lab Single channel audio signal transmission system
JPS6011360B2 (ja) 1981-12-15 1985-03-25 ケイディディ株式会社 音声符号化方式
US4667340A (en) 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4790016A (en) 1985-11-14 1988-12-06 Gte Laboratories Incorporated Adaptive method and apparatus for coding speech
WO1986003873A1 (en) 1984-12-20 1986-07-03 Gte Laboratories Incorporated Method and apparatus for encoding speech
US4885790A (en) 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4935963A (en) 1986-01-24 1990-06-19 Racal Data Communications Inc. Method and apparatus for processing speech signals
JPS62234435A (ja) 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
EP0243562B1 (en) 1986-04-30 1992-01-29 International Business Machines Corporation Improved voice coding process and device for implementing said process
US4776014A (en) 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
US5054072A (en) 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US5127054A (en) 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
JPH02183630A (ja) * 1989-01-10 1990-07-18 Fujitsu Ltd 音声符号化方式
US5109417A (en) 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5054075A (en) 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
ES2087522T3 (es) 1991-01-08 1996-07-16 Dolby Lab Licensing Corp Descodificacion/codificacion para campos sonoros multidimensionales.
JP3134337B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル信号符号化方法
EP0551705A3 (en) * 1992-01-15 1993-08-18 Ericsson Ge Mobile Communications Inc. Method for subbandcoding using synthetic filler signals for non transmitted subbands
JP2563719B2 (ja) 1992-03-11 1996-12-18 技術研究組合医療福祉機器研究所 音声加工装置と補聴器
JP2693893B2 (ja) 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
JP3508146B2 (ja) * 1992-09-11 2004-03-22 ソニー株式会社 ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置
JP3127600B2 (ja) * 1992-09-11 2001-01-29 ソニー株式会社 ディジタル信号復号化装置及び方法
US5402124A (en) * 1992-11-25 1995-03-28 Dolby Laboratories Licensing Corporation Encoder and decoder with improved quantizer using reserved quantizer level for small amplitude signals
US5394466A (en) * 1993-02-16 1995-02-28 Keptel, Inc. Combination telephone network interface and cable television apparatus and cable television module
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
JPH07225598A (ja) 1993-09-22 1995-08-22 Massachusetts Inst Of Technol <Mit> 動的に決定された臨界帯域を用いる音響コード化の方法および装置
JP3186489B2 (ja) * 1994-02-09 2001-07-11 ソニー株式会社 ディジタル信号処理方法及び装置
JP3277682B2 (ja) * 1994-04-22 2002-04-22 ソニー株式会社 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法
KR960704300A (ko) * 1994-05-25 1996-08-31 이데이 노부유키 부호화 방법, 복호화 방법, 부호화/복호화 방법, 부호화 장치, 복호화 장치 및 부호화/복호화 장치(Encoding method, decoding method, encoding/decoding method, encoding apparatus, decoding apparatus, and encoding/decoding apparatus)
US5748786A (en) * 1994-09-21 1998-05-05 Ricoh Company, Ltd. Apparatus for compression using reversible embedded wavelets
JP3254953B2 (ja) 1995-02-17 2002-02-12 日本ビクター株式会社 音声高能率符号化装置
DE19509149A1 (de) 1995-03-14 1996-09-19 Donald Dipl Ing Schulz Codierverfahren
JPH08328599A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
DE69620967T2 (de) * 1995-09-19 2002-11-07 At & T Corp., New York Synthese von Sprachsignalen in Abwesenheit kodierter Parameter
US5692102A (en) * 1995-10-26 1997-11-25 Motorola, Inc. Method device and system for an efficient noise injection process for low bitrate audio compression
US6138051A (en) * 1996-01-23 2000-10-24 Sarnoff Corporation Method and apparatus for evaluating an audio decoder
JP3189660B2 (ja) * 1996-01-30 2001-07-16 ソニー株式会社 信号符号化方法
JP3519859B2 (ja) * 1996-03-26 2004-04-19 三菱電機株式会社 符号器及び復号器
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
US6092041A (en) * 1996-08-22 2000-07-18 Motorola, Inc. System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
JPH1091199A (ja) * 1996-09-18 1998-04-10 Mitsubishi Electric Corp 記録再生装置
US5924064A (en) 1996-10-07 1999-07-13 Picturetel Corporation Variable length coding using a plurality of region bit allocation patterns
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
JP3213582B2 (ja) * 1997-05-29 2001-10-02 シャープ株式会社 画像符号化装置及び画像復号装置
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
KR20000068538A (ko) * 1997-07-11 2000-11-25 이데이 노부유끼 정보 복호 방법 및 장치, 정보 부호화 방법 및 장치, 및 제공매체
DE19730130C2 (de) 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US6351730B2 (en) * 1998-03-30 2002-02-26 Lucent Technologies Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
JP2000148191A (ja) * 1998-11-06 2000-05-26 Matsushita Electric Ind Co Ltd ディジタルオーディオ信号の符号化装置
US6300888B1 (en) * 1998-12-14 2001-10-09 Microsoft Corporation Entrophy code mode switching for frequency-domain audio coding
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
JP4843142B2 (ja) * 1999-04-16 2011-12-21 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 音声符号化のための利得−適応性量子化及び不均一符号長の使用
FR2807897B1 (fr) * 2000-04-18 2003-07-18 France Telecom Methode et dispositif d'enrichissement spectral
JP2001324996A (ja) * 2000-05-15 2001-11-22 Japan Music Agency Co Ltd Mp3音楽データ再生方法及び装置
JP3616307B2 (ja) * 2000-05-22 2005-02-02 日本電信電話株式会社 音声・楽音信号符号化方法及びこの方法を実行するプログラムを記録した記録媒体
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP2001343998A (ja) * 2000-05-31 2001-12-14 Yamaha Corp ディジタルオーディオデコーダ
JP3538122B2 (ja) 2000-06-14 2004-06-14 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
GB0103245D0 (en) * 2001-02-09 2001-03-28 Radioscape Ltd Method of inserting additional data into a compressed signal
US6963842B2 (en) * 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling

Also Published As

Publication number Publication date
CA2736055C (en) 2015-02-24
JP5253564B2 (ja) 2013-07-31
HK1141624A1 (en) 2010-11-12
CN1662958A (zh) 2005-08-31
HK1146146A1 (en) 2011-05-13
KR100986153B1 (ko) 2010-10-07
US8050933B2 (en) 2011-11-01
EP1514261A1 (en) 2005-03-16
EP2209115A1 (en) 2010-07-21
EP2216777A1 (en) 2010-08-11
EP2207169B1 (en) 2011-10-19
PL208344B1 (pl) 2011-04-29
CA2489441C (en) 2012-04-10
PL372104A1 (en) 2005-07-11
CA2736065C (en) 2015-02-10
CA2736060C (en) 2015-02-17
EP2209115B1 (en) 2011-09-28
JP5705273B2 (ja) 2015-04-22
HK1146145A1 (en) 2011-05-13
IL216069A0 (en) 2011-12-29
SG177013A1 (en) 2012-01-30
JP5345722B2 (ja) 2013-11-20
US8032387B2 (en) 2011-10-04
US20030233236A1 (en) 2003-12-18
JP2012078866A (ja) 2012-04-19
JP2012103718A (ja) 2012-05-31
KR20100086067A (ko) 2010-07-29
CA2736046A1 (en) 2003-12-24
DE60310716D1 (de) 2007-02-08
DK2207169T3 (da) 2012-02-06
JP2010156990A (ja) 2010-07-15
ATE470220T1 (de) 2010-06-15
KR20050010950A (ko) 2005-01-28
TWI352969B (en) 2011-11-21
ATE536615T1 (de) 2011-12-15
US20090144055A1 (en) 2009-06-04
AU2003237295A1 (en) 2003-12-31
SG10201702049SA (en) 2017-04-27
IL165650A0 (en) 2006-01-15
JP5063717B2 (ja) 2012-10-31
SI2207169T1 (sl) 2012-05-31
HK1070728A1 (en) 2005-06-24
US7447631B2 (en) 2008-11-04
IL165650A (en) 2010-11-30
EP1736966A3 (en) 2007-11-07
DE60333316D1 (de) 2010-08-19
ES2275098T3 (es) 2007-06-01
EP1736966B1 (en) 2010-07-07
DK1514261T3 (da) 2007-03-19
MY159022A (en) 2016-11-30
MXPA04012539A (es) 2005-04-28
KR100986150B1 (ko) 2010-10-07
EP1736966A2 (en) 2006-12-27
CA2736060A1 (en) 2003-12-24
KR100986152B1 (ko) 2010-10-07
ATE526661T1 (de) 2011-10-15
EP2216777B1 (en) 2011-12-07
ATE529858T1 (de) 2011-11-15
ATE349754T1 (de) 2007-01-15
JP4486496B2 (ja) 2010-06-23
EP2207170A1 (en) 2010-07-14
HK1070729A1 (en) 2005-06-24
CA2736065A1 (en) 2003-12-24
CN100369109C (zh) 2008-02-13
KR20100086068A (ko) 2010-07-29
TW200404273A (en) 2004-03-16
JP2012212167A (ja) 2012-11-01
HK1141623A1 (en) 2010-11-12
CA2736055A1 (en) 2003-12-24
EP2207170B1 (en) 2011-10-19
ATE529859T1 (de) 2011-11-15
JP2013214103A (ja) 2013-10-17
KR20100063141A (ko) 2010-06-10
CA2735830A1 (en) 2003-12-24
IL216069A (en) 2015-11-30
ATE473503T1 (de) 2010-07-15
DE60310716T2 (de) 2007-10-11
WO2003107328A1 (en) 2003-12-24
EP1514261B1 (en) 2006-12-27
KR100991450B1 (ko) 2010-11-04
US7337118B2 (en) 2008-02-26
DE60332833D1 (de) 2010-07-15
CA2489441A1 (en) 2003-12-24
US20030233234A1 (en) 2003-12-18
JP5253565B2 (ja) 2013-07-31
DK1736966T3 (da) 2010-11-01
US20090138267A1 (en) 2009-05-28
KR20050010945A (ko) 2005-01-28
JP2005530205A (ja) 2005-10-06
DE60310716T8 (de) 2008-01-31
SG2014005300A (en) 2016-10-28
MY136521A (en) 2008-10-31
CA2735830C (en) 2014-04-08
SI2209115T1 (sl) 2012-05-31
KR100991448B1 (ko) 2010-11-04
EP2207169A1 (en) 2010-07-14

Similar Documents

Publication Publication Date Title
PT2216777E (pt) Sistema de codificação áudio usando preenchimento de vazio espectral
US5625746A (en) Method and apparatus for encoding, decoding and compression of audio-type data
PL183498B1 (pl) Dekoder akustyczny wielokanałowy
MXPA05000653A (es) Codificacion de audio de baja tasa de transferencia de bitios.
Musmann Genesis of the MP3 audio coding standard
JP2005338850A (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
PL207861B1 (pl) Sposób wytwarzania kodowanych sygnałów akustycznych w telekomunikacji
Thiagarajan et al. Analysis of the MPEG-1 Layer III (MP3) algorithm using MATLAB
AU2003237295B2 (en) Audio coding system using spectral hole filling
Spanias et al. Analysis of the MPEG-1 Layer III (MP3) Algorithm using MATLAB
Bhaskar Low rate coding of audio by a predictive transform coder for efficient satellite transmission