BR112015017753B1 - Codificador de áudio, decodificador de áudio, método para fornecer uma informação de áudio codificado, método para fornecer uma informação de áudio decodificado, programa de computador e representação codificada utilizando uma extensão da largura de banda adaptável ao sinal. - Google Patents

Codificador de áudio, decodificador de áudio, método para fornecer uma informação de áudio codificado, método para fornecer uma informação de áudio decodificado, programa de computador e representação codificada utilizando uma extensão da largura de banda adaptável ao sinal. Download PDF

Info

Publication number
BR112015017753B1
BR112015017753B1 BR112015017753-0A BR112015017753A BR112015017753B1 BR 112015017753 B1 BR112015017753 B1 BR 112015017753B1 BR 112015017753 A BR112015017753 A BR 112015017753A BR 112015017753 B1 BR112015017753 B1 BR 112015017753B1
Authority
BR
Brazil
Prior art keywords
audio
bandwidth
information
bandwidth extension
audio information
Prior art date
Application number
BR112015017753-0A
Other languages
English (en)
Other versions
BR112015017753A2 (pt
Inventor
Helmrich Christian
Hilpert Johannes
Robilliard Julien
Disch Sascha
Schmidt Konstantin
Wilde Stephan
Original Assignee
Fraunhofer - Gesellschaft Zur Foerderung Der Angewandten Forschung E.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer - Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. filed Critical Fraunhofer - Gesellschaft Zur Foerderung Der Angewandten Forschung E.V.
Publication of BR112015017753A2 publication Critical patent/BR112015017753A2/pt
Publication of BR112015017753B1 publication Critical patent/BR112015017753B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Abstract

CODIFICADOR DE ÁUDIO, DECODIFICADOR DE ÁUDIO, MÉTODO PARA FORNECER UMA INFORMAÇÃO DE ÁUDIO CODIFICADO, MÉTODO PARA FORNECER UMA INFORMAÇÃO DE ÁUDIO DECODIFICADO, PROGRAMA DE COMPUTADOR E REPRESENTAÇÃO CODIFICADA UTILIZANDO UMA EXTENSÃO DA LARGURA DE BANDA ADAPTÁVEL AO SINAL Um codificador de áudio que fornece uma informação de áudio codificado, com base em uma informação de áudio de entrada, compreende um codificador de baixa frequência configurado para codificar uma parte de baixa frequência de informação de áudio de entrada, para obter uma representação codificada da parte de baixa frequência, e um fornecedor de informação da extensão da largura de banda configurado para fornecer informação da extensão de largura de banda, com base na informação de áudio de entrada. O codificador de áudio é configurado para incluir seletivamente a informação da extensão da largura de banda na informação de áudio codificado em um modo adaptável ao sinal.

Description

DESCRIÇÃO CAMPO TÉCNICO
[0001] Aplicações de acordo com a invenção referem- se a um codificador de áudio para fornecer uma informação de áudio codificado, com base em uma informação de áudio de entrada.
[0002] Aplicações adicionais de acordo com a invenção referem-se ao decodificador de áudio para fornecer informação de áudio decodificado com base em uma informação de áudio codificado.
[0003] Aplicações adicionais de acordo com a invenção referem-se a um método para fornecer uma informação de áudio codificado com base em uma informação de áudio de entrada.
[0004] Aplicações adicionais de acordo com a invenção referem-se a um método para fornecer uma informação de áudio decodificado com base em uma informação de áudio codificado.
[0005] Aplicações adicionais de acordo com a invenção referem-se a um programa de computador para executar um dos métodos referidos.
[0006] Aplicações adicionais de acordo com a invenção referem-se a uma representação de áudio codificado que representa uma informação de áudio.
[0007] Algumas aplicações de acordo com a invenção referem-se a uma extensão da largura de banda de áudio genérico com taxa de informação adicional adaptável ao sinal para codificação de áudio com de taxa de bit muito baixa.
HISTÓRICO DA INVENÇÃO
[0008] Nos últimos anos, houve um aumento da demanda para codificação e decodificação de conteúdo de áudio. Ao passo que as taxas de bits disponíveis e as capacidades de armazenamento para transmissão e armazenamento de conteúdo de áudio codificado aumentaram substancialmente, ainda há uma demanda para uma codificação eficiente de taxa de bit, transmissão, armazenamento e decodificação de conteúdo de áudio de qualidade razoável, especialmente em sinais de fala nos cenários de comunicação.
[0009] Sistemas de codificação de fala contemporânea são capazes de codificar conteúdo de áudio digital de banda larga (WB | wideband) , isto é, sinais com frequências de no máximo 7-8 kHz, em taxas de bits tão baixas quanto 6 kbps. Os exemplos mais amplamente discutidos são as recomendações G.722.2 de ITU-T (cf., por exemplo, a referência [1]), assim como as mais recentemente desenvolvidas G.718 (cf., por exemplo, as referências [4] e [10]) e fala unificada por MPEG e codec de áudio xHE-AAC (cf., por exemplo, a referência [8]). Tanto a G.722.2, também conhecida como AMR-WB, quanto a G.718 empregam técnicas da extensão da largura de banda (BWE I bandwidth extension) entre 6,4 e 7 kHz para permitir que o codificador central subjacente de ACELP "foque" nas frequências baixas mais perceptivelmente relevantes (particularmente aquelas nas quais o sistema auditivo humano está em fase sensivel) e, assim, alcance uma qualidade suficiente, especialmente em taxas de bits muito baixas. Em xHE-AAC, a replicação de banda espectral aprimorada (eSBR | enhanced spectral band replication) é usada para extensão da largura de banda (BWE). 0 processo da extensão da largura de banda pode geralmente ser dividido em duas abordagens conceituais: • BWE "cega" ou "artificial", na qual os componentes de alta frequência (HF | high-frequency) são reconstruídos somente a partir do sinal do codificador central de baixa frequência (LF I low-frequency) decodificado, isto é, sem precisar da informação adicional transmitida pelo codificador. Esse esquema é usado por AMR-WB e G.718 em 16 kbps e abaixo, assim como algumas versões compatíveis de sistemas pós-processamento da extensão da largura de banda na banda estreita tradicional da fala telefônica (cf., por exemplo, as referências [5] e [9]). • BWE "guiada", a qual difere da extensão da largura de banda cega, em que os parâmetros usados para a reconstrução de conteúdo de alta frequência (HF) são transmitidos para o decodificador como uma informação adicional, ao invés de serem estimadas a partir do sinal do central decodificado. 0 AMR-WB, G.718, xHE-AAC, assim como outros codecs (cf., por exemplo, as referências [2], [7] e [11]), usam essa abordagem, mas não em taxas de bits muito baixas.
[0010] Entretanto, verificou-se que é difícil fornecer a extensão da largura de banda apropriada em baixas taxas de bits, o que fornece uma qualidade suficientemente boa na reconstrução do conteúdo de áudio.
[0011] Assim, há uma necessidade para um conceito da extensão da largura de banda que traga uma troca entre taxa de bits e qualidade de áudio.
RESUMO DA INVENÇÃO
[0012] Uma aplicação de acordo com a invenção cria um codificador de áudio para fornecer uma informação de áudio codificado, com base em uma informação de áudio de entrada. O codificador de áudio compreende um codificador de baixa frequência configurado para codificar uma parte de baixa frequência da informação de áudio de entrada para obter uma representação codificada da parte de baixa frequência. 0 codificador de áudio também compreende um fornecedor de informação da extensão da largura de banda configurado para fornecer informação da extensão da largura de banda, com base na informação de áudio de entrada. O codificador de áudio é configurado para incluir seletivamente a informação da extensão da largura de banda na informação de áudio codificado em um modo adaptável ao sinal.
[0013] Esta aplicação, de acordo com a invenção, tem base na constatação de que, para alguns tipos de conteúdo de áudio, e mesmo para algumas partes de uma parte contigua do conteúdo de áudio, uma extensão da largura de banda de boa qualidade pode ser alcançada com base na representação codificada da parte de baixa frequência sem qualquer informação adicional da extensão da largura de banda, ou somente com uma pequena quantidade de informação adicional da extensão da largura de banda (por exemplo, um pequeno número de parâmetros da extensão da largura de banda, que é incluido na informação de áudio codificado). No entanto, o conceito também tem base na constatação de que, para outros tipos de conteúdo de áudio, e mesmo para outras partes de uma parte contigua de conteúdo de áudio, talvez seja necessário (ou pelo menos desejável) incluir uma informação adicional da extensão da largura de banda (por exemplo, parâmetros dedicados da extensão da largura de banda), ou um aumento da quantidade de informação adicional da extensão da largura de banda (por exemplo, quando comparado com o caso mencionado anteriormente) na informação de áudio codificado, uma vez que, de outro modo, uma extensão da largura de banda do lado do decodificador não fornecerá uma qualidade de áudio satisfatória.
[0014] Ao incluir seletivamente uma informação da extensão da largura de banda na informação do áudio codificado (por exemplo, variando seletivamente uma quantidade de informação da largura de banda ou parâmetros da extensão da largura de banda incluidos na informação de áudio codificado, ou comutando seletivamente entre uma inclusão da informação da extensão da largura de banda na informação do áudio codificado e uma omissão da inclusão referida de informação da extensão da largura de banda na informação de "desnecessárias" da extensão da largura de banda consumam preciosas taxas de bits para o caso de que a extensão da largura de banda do lado do decodificado não precise realmente de uma informação da extensão da largura de banda, e pode, entretanto, assegurar que a informação da extensão da largura de banda (ou um aumento da quantidade de informação da extensão da largura de banda) seja incluida na informação do áudio codificado, se a informação da extensão da largura de banda for realmente solicitada para uma extensão da largura de banda adicional do decodificador, isto é, para uma reconstrução adicional do decodificador do conteúdo de áudio.
[0015] Desse modo, ao incluir seletivamente a informação da extensão da largura de banda na informação de áudio codificado em um modo adaptável ao sinal, isto é, quando a informação da extensão da largura de banda é realmente necessária para alcançar uma qualidade suficientemente boa de uma representação de sinal do áudio decodificado, a média de taxa de bits pode ser reduzida enquanto ainda mantém a possibilidade de obter um áudio de boa qualidade.
[0016] Em outras palavras, o codificador de áudio pode, por exemplo, comutar entre uma disposição de uma informação da extensão da largura de banda, que permite uma extensão da largura de banda guiada por parâmetro ao lado de um decodificador de áudio, e uma omissão da disposição da informação da extensão da largura de banda, a qual necessita da utilização de uma extensão cega da largura de banda ao lado de um decodificador de áudio.
[0017] Consequentemente, uma troca particularmente boa entre a taxa de bits e a qualidade de áudio pode ser obtida, usando-se os conceitos descritos acima.
[0018] Em uma aplicação preferida, o codificador de áudio compreende um sensor configurado para identificar partes da informação de áudio de entrada que não podem ser decodificadas com uma qualidade suficiente ou desejada (por exemplo, em termos de uma medida de qualidade predeterminada), com base em uma representação codificada de uma parte de baixa frequência e usando uma extensão cega da largura de banda. Nesse caso, o codificador de áudio é configurado para incluir seletivamente a informação da extensão da largura de banda na informação de áudio codificado para partes de informação de áudio de entrada identificadas pelo sensor. Ao determinar ou estimar (por exemplo, com base nas características da informação de áudio de entrada, ou com base em uma reconstrução parcial ou completa da informação de áudio no lado do codificador de áudio) que partes da informação de áudio de entrada não podem ser decodificadas com uma qualidade suficiente (ou desejável), com base na representação codificada da parte de baixa frequência e usando uma extensão cega da largura de banda, um critério significativo é obtido para decidir se deve-se incluir ou não a informação da extensão da largura na informação de áudio codificado para partes (por exemplo, estruturas) da informação de áudio de entrada (ou equivalentemente, para estruturas ou partes da informação de áudio codificado). Em outras palavras, o critério mencionado acima, que é avaliado pelo sensor, permite uma boa troca entre a impressão de audição, a qual pode ser alcançada ao decodificar a informação de áudio codificado e a taxa de bits da informação de áudio codificado.
[0019] Em uma aplicação preferida, o codificador de áudio compreende um sensor configurado para identificar partes da informação de áudio de entrada, para que parâmetros da extensão da largura de banda não possam ser estimados com base na parte de baixa frequência com precisão suficiente ou desejada. Nesse caso, o codificador de áudio é configurado para incluir seletivamente a informação da extensão da largura de banda na informação do áudio codificado para partes da informação de áudio de entrada identificadas pelo sensor. Esta aplicação, de acordo com a invenção, tem base na constatação de que uma determinação em relação à possibilidade de parâmetros da extensão da largura de banda poderem ou não ser estimados com base na parte de baixa frequência com precisão suficiente ou desejada constitui um critério que pode ser avaliado com esforço computacional moderado, e que, entretanto, constitui um bom critério para decidir se inclui ou não informação da extensão da largura de banda na informação de áudio codificado.
[0020] Em uma aplicação preferida, o codificador de áudio compreende um sensor configurado para identificar partes de uma informação de áudio de entrada na dependência da possibilidade de as partes serem temporariamente estacionárias e na dependência da possibilidade de as partes terem um caráter de passa-baixa. Além disso, o codificador de áudio é configurado para omitir seletivamente uma inclusão de informação da extensão da largura de banda na informação do áudio codificado para partes da informação de áudio de entrada identificadas pelo sensor como partes estacionárias temporariamente tendo um caráter de passa-baixa.
[0021] Esta aplicação, de acordo com a invenção, tem base na constatação de que normalmente não é necessário incluir informação da extensão da largura de banda na informação de áudio codificado para partes da informação de áudio de entrada que são temporariamente estacionárias e compreendem um caráter de baixa-passa, uma vez que uma extensão cega da largura de banda (que não depende dos parâmetros ou da informação da extensão da largura de banda da taxa de bits) normalmente permite uma reconstrução suficientemente boa de tais partes do sinal. Portanto, há um critério que pode ser avaliado de modo computacionalmente eficiente, e que, no entanto, permite bons resultados (em termos de troca entre a taxa de bits e a qualidade de áudio).
[0022] Em uma aplicação preferida, o sensor é configurado para identificar partes da informação de áudio de entrada na dependência da possibilidade de as partes compreenderem linguagem sonora e/ou na dependência da possibilidade de as partes compreenderem ruidos ambientais (por exemplo, carro), e/ou na dependência da possibilidade de as partes compreenderem música sem instrumento de percussão. Verificou-se que tais partes, que compreendem linguagem sonora, ou que compreendem ruidos ambiente, ou que compreende música sem instrumento de percussão, podem normalmente ser reconstruídas usando uma extensão cega da largura de banda com qualidade de áudio suficiente, de modo que é recomendável omitir a inclusão da informação da extensão da largura de banda na informação de áudio codificado para tais partes.
[0023] Em uma aplicação preferida, o codificador de áudio compreende um sensor configurado para identificar partes da informação de áudio de entrada na dependência da possibilidade de uma diferença entre um envelope espectral de uma parte de baixa frequência e um envelope espectral de uma parte de alta frequência ser maior ou igual à medida de diferença predeterminada. Nesse caso, o codificador de áudio é configurado para incluir seletivamente a informação da extensão da largura de banda na informação de áudio codificado nas partes da informação de áudio de entrada identificadas pelo sensor.
[0024] Verificou-se que partes da informação de áudio de entrada, que compreendem uma grande diferença entre uma parte do envelope espectral de baixa frequência e uma parte do envelope espectral de alta frequência, normalmente podem não ser bem reconstruídas usando uma extensão cega da largura de banda, uma vez que uma extensão cega da largura de banda muitas vezes fornece envelopes espectrais similares na parte de alta frequência (isto é, no sinal a extensão da largura de banda), quando comparado à respectiva parte de baixa frequência. Portanto, verificou-se que uma análise da diferença entre a parte do envelope espectral de baixa frequência e a parte do envelope espectral de alta frequência constitui um bom critério para decidir se inclui ou não a informação da extensão da largura de banda na informação do áudio codificado.
[0025] Em uma aplicação preferida, o sensor é configurado para identificar partes da informação de áudio de entrada na dependência da possibilidade de as partes compreenderem linguagem não sonora, e/ou na dependência da possibilidade de as partes compreenderem sons de percussão. Verificou-se que partes que compreendem linguagem não sonora e partes que compreendem sons de percussão normalmente compreendem espectro, no qual o envelope espectral da parte de baixa frequência difere consideravelmente do envelope espectral da parte de alta frequência. Portanto, verificou-se que detectar a linguagem não sonora e/ou os sons de percussão é um bom critério para decidir se deve-se incluir ou não a informação da extensão da largura de banda na informação do áudio codificado.
[0026] Em uma aplicação preferida, o codificador de áudio compreende um sensor configurado para determinar uma inclinação espectral das partes da informação de áudio de entrada e para identificar partes da informação de áudio de entrada na dependência da possibilidade de a inclinação espectral determinada ser maior ou igual ao valor limiar de inclinação fixa ou variável. Nesse caso, o codificador de áudio é configurado para incluir seletivamente a informação da extensão da largura de banda na informação de áudio codificado para partes da informação de áudio de entrada identificadas pelo sensor. Verificou-se que uma inclinação espectral pode ser derivada com esforço computacional moderado e ainda fornecer um bom critério para a decisão da possibilidade de incluir ou não a informação da extensão da largura de banda na informação de áudio codificado. Por exemplo, se a inclinação espectral alcança ou excede um valor limiar de inclinação, pode-se concluir que o espectro tem um caráter de passa-alta e não pode ser bem reconstruída por extensão cega da largura de banda. Em particular, a extensão cega da largura de banda normalmente não pode reconstruir espectros compreendendo uma inclinação positiva (caracterizado por uma parte de alta frequência ser enfatizada acima de uma parte de baixa frequência) com precisão boa. Além disso, uma vez que uma parte de alta frequência é de particular relevância perceptual no caso de uma inclinação espectral positiva, é recomendável, nesses casos, incluir a informação da extensão da largura de banda na representação do áudio codificado.
[0027] Em uma aplicação preferida, o sensor é, ainda, configurado para determinar uma taxa de cruzamento zero das partes da informação de áudio de entrada e identificar partes da informação de áudio de entrada também na dependência da possibilidade de a taxa de cruzamento zero determinada ser maior ou igual a um valor limiar da taxa de cruzamento zero fixa ou variável. Verificou-se que a taxa de cruzamento zero é também um bom critério para detectar partes da informação de áudio de entrada que não podem ser bem reconstruídas usando uma extensão cega da largura de banda, de modo que faça sentido (em termos de atingir uma boa troca entre a taxa de bits e a qualidade de áudio) incluir a informação da extensão da largura de banda na informação de áudio codificado.
[0028] Em uma aplicação preferida, o sensor é configurado para aplicar uma histerese para identificar partes do sinal da informação de áudio de entrada, a fim de reduzir um número de transições entre partes de sinal identificadas (para que a informação da extensão da largura de banda seja incluida na representação do áudio codificado) e partes de sinal não identificadas (para que a informação da extensão da largura de banda não seja incluida na representação do áudio codificado). Verificou-se ser vantajoso evitar uma comutação excessiva entre uma inclusão da informação da extensão da largura de banda na informação de áudio codificado e uma omissão na inclusão da informação da extensão da largura de banda na representação de áudio codificado, uma vez que transições podem trazer algumas perturbações, principalmente se o número de transições for muito alto. Portanto, usando uma histerese, que pode, por exemplo, ser aplicada a um valor limiar de inclinação (que é, nesse caso, um valor limiar de inclinação variável) ou ao valor limiar da taxa de cruzamento zero (que é, nesse caso, um valor limiar da taxa de cruzamento zero variável), esse objetivo pode ser alcançado.
[0029] Em uma aplicação preferida, o codificador de áudio é configurado para incluir seletivamente os parâmetros que representam um envelope espectral de partes de alta frequência da informação de áudio de entrada na informação de áudio codificado em um modo adaptável ao sinal como a informação da extensão da largura de banda. Esta aplicação tem base na ideia de que parâmetros que representam o envelope espectral das partes de alta frequência são particularmente importantes em uma extensão da largura de banda guiada por parâmetro, de modo que a inclusão dos parâmetros referidos que representam o envelope espectral da parte de alta frequência da informação de áudio de entrada permite alcançar uma boa qualidade da extensão da largura de banda sem causar uma taxa de bits alta.
[0030] Em uma aplicação preferida, o codificador de baixa frequência é configurado para codificar uma parte de baixa frequência da informação de áudio de entrada compreendendo frequências de até um máximo de frequência em uma faixa entre 6 kHz e 7 kHz, Além disso, o codificador de áudio é configurado para incluir seletivamente na representação de áudio codificado entre três e cinco parâmetros descrevendo intensidades de partes ou subpartes de sinal de alta frequência (por exemplo, partes de sinal tendo frequências acima de aproximadamente 6 a 7 kHz) tendo largura de banda entre 300 Hz e 500 Hz. Verificou-se que tal conceito resulta em uma boa qualidade de áudio, sem necessariamente comprometer um esforço de taxa de bits.
[0031] Em uma aplicação preferida, o codificador de áudio é configurado para incluir seletivamente na representação de áudio codificado 3-5 parâmetros de quantização escalar descrevendo intensidades de quatro partes de sinal de alta frequência (ou subpartes), as partes (ou subpartes) de sinal de alta frequência abrangendo faixas de frequência acima da parte da baixa frequência. Verificou-se que a utilização de 3 - 5 parâmetros de quantização escalar descrevendo intensidades de quatro partes de sinal de alta frequência é normalmente suficiente para alcançar uma extensão da largura de banda guiada por parâmetro que excede uma qualidade de áudio relativamente baixa alcançada por uma extensão cega da largura de banda na mesma parte de sinal. Portanto, não há grandes diferenças de qualidade entre partes de sinal de áudio reconstruídas, independentemente de as partes de sinal de áudio reconstruídas serem reconstruídas usando uma extensão cega da largura de banda ou uma extensão guiada da largura de banda. Desse modo, o conceito mencionado acima é bem adaptado ao conceito que permite uma comutação entre uma extensão cega da largura de banda e uma extensão da largura de banda guiada por parâmetro.
[0032] Em uma aplicação preferida, o codificador de áudio é configurado para incluir seletivamente na representação de áudio codificado uma pluralidade de parâmetros descrevendo uma relação entre energias de partes de frequência espectral adjacente, caracterizado por um dos parâmetros descrever uma relação entre uma energia de uma primeira parte de alta frequência da extensão da largura de banda e uma parte de baixa frequência da extensão da largura de banda, e em que outros parâmetros descrevem relação entre energias (pares) de outras partes da extensão de alta frequência. Verificou-se que tal conceito que descreve relações (ou diferenças) entre energias (ou, equivalentemente, intensidades) de diferentes partes de frequência (preferencialmente adjacentes) permite uma codificação eficiente da informação da extensão da largura de banda. Verificou-se, também, que tais parâmetros que descrevem a relação entre energias de partes de frequência espectral adjacente podem normalmente ser quantizadas com somente um pequeno número de bits, sem comprometer substancialmente uma qualidade de áudio alcançada por uma extensão da largura de banda.
[0033] Outra aplicação de acordo com a invenção cria um decodificador de áudio para fornecer uma informação de áudio decodificado, com base em uma informação de áudio codificado. O decodificador de áudio compreende um decodificador de baixa frequência configurado para decodificar uma representação codificada de uma parte de baixa frequência (de um conteúdo de áudio) , a fim de obter uma representação decodificada de uma parte de baixa frequência. O decodificador de áudio também compreende uma extensão da largura de banda configurada para obter um sinal da extensão da largura de banda usando uma extensão cega da largura de banda para partes de um conteúdo de áudio, para que parâmetros da extensão da largura de banda não sejam incluidos na informação do áudio codificado e para obter o sinal da extensão da largura de banda usando uma extensão da largura de banda guiada por parâmetro para partes do conteúdo de áudio, para que parâmetros da extensão da largura de banda sejam incluidos na informação de áudio codificado.
[0034] Esse codificador de áudio tem base na ideia de que uma boa troca entre a qualidade de áudio e a taxa de bits é alcançável se for possível comutar uma extensão cega da largura de banda e uma extensão da largura de banda guiada por parâmetro mesmo dentro de uma parte contígua do conteúdo de áudio, uma vez que foi verificado que muitos pedaços típicos do conteúdo de áudio compreendem tanto os setores para que uma boa qualidade de áudio possa ser obtida usando uma extensão cega da largura de banda quanto setores para que uma extensão da largura de banda guiada por parâmetro seja necessária para alcançar uma qualidade de áudio suficiente. Além disso, deve ser evidente que as mesmas considerações explicadas acima em relação ao codificador de áudio também se aplicam ao decodificador de áudio.
[0035] Em uma aplicação preferida, o decodificador de áudio é configurado para decidir se obtém o sinal de extensão da largura de banda usando uma extensão cega da largura de banda ou usando uma extensão da largura de banda guiada por parâmetro em uma base de estrutura-a-estrutura. Verificou-se que comutar um grão fino (estrutura-por- estrutura) entre uma extensão cega da largura de banda e uma extensão da largura de banda guiada por parâmetro ajuda a manter a taxa de bits razoavelmente baixa, mesmo se houver regularmente algumas estruturas nas quais uma extensão da largura de banda guiada por parâmetro é necessária para evitar uma degradação excessiva do conteúdo de áudio.
[0036] Em uma aplicação preferida, o decodificador de áudio é configurado para comutar entre uma utilização de uma extensão cega da largura de banda e uma extensão da largura de banda guiada por parâmetro dentro de uma parte contígua do conteúdo de áudio. Essa aplicação tem base na constatação de que mesmo uma única parte (contígua) do conteúdo de áudio muitas vezes compreende passagens (ou partes, ou estruturas) de diferentes tipos, alguns dos quais devem ser codificados (e, consequentemente, decodificados) usando uma extensão da largura de banda guiada por parâmetro, enquanto outras passagens ou estruturas podem ser decodificados usando uma extensão cega da largura de banda sem uma degradação substancial do conteúdo de áudio.
[0037] Em uma aplicação preferida, o áudio decodificador é configurado para avaliar indicadores incluídos na informação de áudio codificado para partes diferentes (por exemplo, estruturas) do conteúdo de áudio, para decidir se deve utilizar uma extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro (por exemplo, para a estrutura à qual o indicador é associado). Portanto, a decisão da possibilidade de uma extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro dever ser usada é mantida simples, e o decodificador de áudio não precisa ter uma inteligência substancial para decidir se deve utilizar uma extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro.
[0038] No entanto, em outra aplicação preferida, o decodificador de áudio é configurado para decidir se deve utilizar uma extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro com base na representação codificada da parte de baixa frequência, sem avaliar um modo indicador de sinalização da extensão da largura de banda. Além disso, ao fornecer inteligência ao decodificador de áudio, um modo indicador de sinalização da extensão da largura de banda pode ser omitido, o que reduz a taxa de bits.
[0039] Em uma aplicação preferida, o decodificador de áudio é configurado para decidir se deve utilizar uma extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro, com base em uma ou mais características da representação decodificada parte de baixa frequência (do conteúdo de áudio). Verificou-se que as características da representação de áudio da parte de baixa frequência constituem quantidades que podem ser utilizadas, com boa precisão, para decidir se deve utilizar uma extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro. Isso é particularmente verdadeiro se as mesmas características forem utilizadas no lado do codificador de áudio. Portanto, não é mais necessário avaliar um modo indicador de sinalização da extensão da largura de banda que, por sua vez, permite a redução da taxa de bits, uma vez que não é necessário incluir um modo indicador de sinalização da extensão da largura de banda na representação de áudio codificado no lado de um codificador de áudio.
[0040] Em uma aplicação preferida, o decodificador de áudio é configurado para decidir se deve utilizar uma extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro, com base em coeficientes de predição linear quantizados e/ou estatísticas de dominio de tempo da representação decodificada da parte de baixa frequência (do conteúdo de áudio). Verificou-se que coeficientes de predição linear quantizados são facilmente alcançados no lado do decodificador de áudio, e ao permitir derivar uma inclinação espectral, pode, portanto, servir como uma boa indicação se deve utilizar uma extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro. Além disso, os coeficientes de predição linear quantizados são também facilmente acessiveis no lado de um codificador de áudio, de modo que é facilmente possivel coordenar uma comutação entre uma extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro no lado de um codificador de áudio e no lado de um decodificador de áudio. De modo semelhante, verificou-se que as estatísticas de dominio do tempo da representação decodificada da parte de baixa frequência, assim como uma taxa de cruzamento zero, são uma quantidade segura para decidir se deve utilizar uma extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro no lado de um decodificador de áudio.
[0041] Em uma aplicação preferida, a extensão da largura de banda é configurada para obter o sinal da extensão da largura de banda usando uma ou mais características da representação decodificada da parte de baixa frequência e/ou usando um ou mais parâmetros do decodif icador de baixa frequência para partes temporais da informação (ou conteúdo) de áudio de entrada, para que parâmetros da extensão da largura de banda não sejam incluídos na informação de áudio codificado. Verificou-se que uma extensão cega da largura de banda resulta em qualidade boa de áudio.
[0042] Em uma aplicação preferida, a extensão da largura de banda é configurada para obter o sinal da extensão da largura de banda usando uma informação centroide espectral e/ou usando uma informação de energia e/ou usando uma informação de inclinação (espectral) e/ou usando coeficientes de filtro codificados para partes temporais da informação (ou conteúdo) de áudio de entrada, para que parâmetros da extensão da largura de banda não sejam incluidos na informação de áudio codificado. Verificou-se que a utilização dessas quantidades produz uma maneira eficiente de obter uma boa qualidade da extensão da largura de banda.
[0043] Em uma aplicação preferida, a extensão da largura de banda é configurada para obter o sinal da extensão da largura de banda usando parâmetros da taxa de bits descrevendo um envelope espectral da parte de alta frequência para partes temporais do conteúdo de áudio, a fim de que parâmetros da extensão da largura de banda sejam incluidos na informação de áudio codificado. Verificou-se que a utilização dos parâmetros da taxa de bits descrevendo um envelope espectral da parte de alta frequência permite uma eficiente taxa de bits da extensão da largura de banda com boa qualidade, caracterizado pelos parâmetros da taxa de bits descrevendo o envelope espectral normalmente não necessitarem de uma taxa de bits alta, mas poderem ser codificados com apenas um número comparativamente pequeno de bits por estrutura de áudio. Consequentemente, nem mesmo a comutação para a extensão da largura de banda guiada por parâmetro resulta em um aumento substancial de taxa de bits.
[0044] Em uma aplicação preferida, a extensão da largura de banda é configurada para avaliar entre três e cinco parâmetros de taxa de bits descrevendo intensidades de partes de sinal de alta frequência tendo a largura de banda entre 300 Hz e 500 Hz, para obter o sinal da extensão da largura de banda. Verificou-se que um número comparativamente pequeno de parâmetros de taxa de bits é suficiente para obter uma extensão da largura de banda acima de uma faixa perceptual importante, de modo que uma boa qualidade de áudio pode ser obtida com um pequeno aumento na taxa de bits.
[0045] Em uma aplicação preferida, entre três e cinco parâmetros da taxa de bits descrevem intensidades das partes de sinal de alta frequência, tendo a largura de banda entre 300 Hz e 500 Hz de quantização escalar com 2 ou 3 bits de resolução, que modo que há entre 6 e 15 bits de parâmetros em formato espectral da extensão da largura de banda por estrutura de áudio. Verificou-se que essa escolha permite uma eficiência muito alta na taxa de bits da extensão da largura de banda guiada por parâmetro, enquanto uma qualidade de extensão da largura de banda é tipicamente comparável com a qualidade da extensão da largura de banda alcançável usando uma extensão cega da largura de banda para partes "acriticas" do conteúdo de áudio, no qual a extensão cega da largura de banda oferece bons resultados. Portanto, há uma qualidade equilibrada tanto no caso em que a extensão cega da largura largura de banda guiada por parâmetro é aplicada.
[0046] Em uma aplicação preferida, a extensão da largura de banda é configurada para executar um nivelamento de energias do sinal da extensão da largura de banda quando comutando da extensão cega da largura de banda para a extensão da largura de banda guiada por parâmetro e/ou quando comutando da extensão da largura de banda guiada por parâmetro para a extensão cega da largura de banda. Portanto, cliques ou "bloqueios de perturbações" que podem ser causados por diferentes propriedades da extensão cega da largura de banda e da extensão da largura de banda guiada por parâmetro, podem ser evitados.
[0047] Em uma aplicação preferida, a extensão da largura de banda é configurada para amortecer uma parte de alta frequência do sinal da extensão da largura de banda para uma parte do conteúdo de áudio no qual uma extensão da largura de banda guiada por parâmetro é aplicada após uma parte do conteúdo de áudio, no qual uma extensão cega da largura de banda é aplicada. Além disso, a extensão da largura de banda é configurada para reduzir um amortecimento para uma parte de alta frequência do sinal da extensão da largura de banda para uma parte do conteúdo de áudio à qual uma extensão cega da largura de banda é aplicada após uma parte do conteúdo de áudio, no qual uma extensão da largura de banda guiada por parâmetro é aplicada. Em conformidade, o efeito da extensão cega da largura de banda normalmente mostra uma característica de passa-baixa, enquanto esse não é necessariamente o caso para a extensão da largura de banda guiada por parâmetro, que pode ser compensada até certo ponto. Portanto, as perturbações entre as partes do conteúdo de áudio decodificado usando uma extensão cega da largura de banda e usando uma extensão da largura de banda guiada por parâmetro, são reduzidas.
[0048] Outra aplicação de acordo com a invenção cria um método para fornecer uma informação de áudio codificado com base em uma informação de áudio de entrada. O método compreende codificar uma parte de baixa frequência da informação de áudio de entrada para obter uma representação codificada da parte de baixa frequência. O método também compreende fornecer informação da extensão da largura de banda, com base na informação de áudio de entrada. A informação da extensão da largura de banda é incluida seletivamente na informação de áudio codificado em um modo adaptável ao sinal. Esse método tem base nas mesmas considerações do codificador de áudio descrito acima.
[0049] Outra aplicação de acordo com a invenção cria um método para fornecer uma informação de áudio decodificado com base em uma informação de áudio codificado. O método compreende decodificar uma representação codificada da parte de baixa frequência para obter uma representação decodificada da parte da parte de baixa frequência. O método compreende, ainda, obter um sinal da extensão da largura de banda usando uma extensão cega da largura de banda para partes de um conteúdo de áudio para quais nenhuma extensão da largura de banda guiada por parâmetro seja incluida na informação de áudio codificado. 0 método compreende, ainda, obter um sinal da extensão da largura de banda usando uma extensão da largura de banda guiada por parâmetro para partes do conteúdo de áudio para as quais parâmetros da extensão da largura de banda sejam incluidos na informação de áudio codificado. Esse método tem base nas mesmas considerações do decodificador de áudio descrito acima.
[0050] Outra aplicação de acordo com a invenção cria um programa de computador para executar um dos métodos mencionados acima quando o programa de computador rodar em um computador.
[0051] Outra aplicação de acordo com a invenção cria uma representação do áudio codificado que representa uma informação de áudio. A representação do codificador de áudio compreende uma representação codificada de uma parte de baixa frequência de uma informação de áudio e uma informação da extensão da largura de banda. A informação da extensão da largura de banda é incluida em uma representação de áudio codificado em um modo adaptável ao sinal para algumas partes da informação de áudio, mas não todas. Essa informação de áudio codificado é fornecida pelo codificador de áudio descrito acima e pode ser avaliada pelo decodificador de áudio descrito acima.
BREVE DESCRIÇÃO DAS FIGURAS
[0052] As aplicações, de acordo com a presente invenção, serão posteriormente descritas com referência às figuras anexas, em que:
[0053] A Fig. 1 mostra um diagrama esquemático de blocos de um codificador de áudio, de acordo com uma aplicação da presente invenção;
[0054] A Fig. 2 mostra um diagrama esquemático de blocos de um codificador de áudio, de acordo com outra aplicação da presente invenção;
[0055] A Fig. 3 mostra uma representação gráfica das partes de frequência e a informação de áudio codificado relacionada a ela;
[0056] A Fig. 4 mostra um diagrama esquemático de blocos de um decodificador de áudio, de acordo com aplicação da presente invenção;
[0057] A Fig. 5 mostra um diagrama esquemático de blocos de um decodif icador de áudio, de acordo com outra aplicação da presente invenção;
[0058] A Fig. 6 mostra um fluxograma de um método para fornecer uma representação de áudio codificado, de acordo com uma aplicação da presente invenção;
[0059] A Fig. 7 mostra um fluxograma de um método para fornecer uma representação de áudio decodificado, de acordo com uma aplicação da presente invenção;
[0060] A Fig. 8 mostra uma ilustração esquemática de uma representação de áudio codificado, de acordo com uma aplicação da presente invenção.
DESCRIÇÃO DETALHADA DAS APLICAÇÕES 1. CODIFICADOR DE ÁUDIO DE ACORDO COM A FIG. 1
[0061] A Fig. 1 mostra um diagrama esquemático de blocos de um codificador de áudio, de acordo com uma aplicação da presente invenção.
[0062] O codificador de áudio 100, de acordo com a Fig. 1, recebe uma informação de áudio de entrada 110 e fornece, com base nela, uma informação do áudio codificado 112. O codificador de áudio 100 compreende um codificador de baixa frequência 120, que é configurado para codificar uma parte de baixa frequência da informação de áudio de entrada 110, para obter uma representação codificada 122 da parte de baixa frequência. O codificador de áudio 100 compreende, também, um fornecedor de informação da extensão da largura de banda 130 configurado para fornecer uma informação de extensão da largura de banda 132 com base na informação de áudio de entrada 110. 0 codificador de áudio 100 é configurado para incluir seletivamente a informação da extensão da largura de banda 132 na informação do áudio codificado 112 em um modo adaptável ao sinal.
[0063] Em relação à funcionalidade do codificador de áudio 100, pode-se dizer que o codificador de áudio 100 fornece uma codificação de taxa de bits suficiente da informação de áudio de entrada 110. Uma parte de baixa frequência, por exemplo, uma frequência em uma faixa de frequência de aproximadamente 6 ou 7 kHz, é codificada usando o codificador de baixa frequência 120, caracterizado por quaisquer dos conceitos de codificação de áudio conhecidos poderem ser usados. Por exemplo, o codificador de baixa frequência 120 pode ser um codificador de "áudio universal" (por exemplo, um codificador de áudio AAC) ou um codificador de áudio tipo linguagem (por exemplo, um codificador de áudio linear à base de predição, um codificador de áudio CELP [Predição Linear Excitada por Código | Code-excited linear prediction] , um codificador de áudio ACELP, ou similar) . Portanto, a parte de baixa frequência da informação de áudio de entrada é codificada usando qualquer dos conceitos convencionais. No entanto, a taxa de bits da representação codificada 122 da parte de baixa frequência é mantida razoavelmente baixa, uma vez que somente componentes de frequência de até aproximadamente 6 a 7 kHz são codificados. Além disso, o codificador de áudio, 100 é capaz de fornecer uma informação da extensão da largura de banda, por exemplo, em forma de parâmetros da extensão da largura de banda descrevendo uma parte de alta frequência da informação de áudio de entrada 110, como uma região de frequência compreendendo frequências mais altas do que região de frequência codificada pelo codificador de baixa frequência 120. Desse modo, o fornecedor de informação da extensão da largura de banda 130 é capaz de fornecer uma informação adicional da informação do áudio codificado 112, que pode controlar uma extensão da largura de banda executada no lado de um codificador de áudio não mostrado na Fig. 1. A informação da extensão da largura de banda (ou informação adicional da extensão da largura de banda) pode, por exemplo, representar um formato espectral (ou envelope espectral) da parte de alta frequência da informação de áudio de entrada, isto é, uma faixa de frequência da informação de áudio de entrada que não é coberta pelo codificador de baixa frequência 120.
[0064] No entanto, o codificador de áudio 100 é configurado para decidir, em um modo adaptável ao sinal, se a informação da extensão da largura de banda deve ser incluida na informação de áudio codificado 112. Portanto, o codificador de áudio 100 é capaz de somente incluir a informação da extensão da largura de banda na informação de áudio codificado 112 se a informação da extensão da largura de banda for necessária (ou pelo menos desejada) para uma reconstrução da informação de áudio do lado de um codificador de áudio. Nesse contexto, o codificador de áudio pode também controlar a possibilidade de a informação da extensão da largura de banda 132 ser fornecida pelo fornecedor da informação da extensão da largura de banda 130 para uma parte da informação de áudio de entrada (ou, equivalentemente, para uma parte da informação do áudio codificado), uma vez que não é naturalmente necessário fornecer uma informação da extensão da largura de banda para uma parte da informação de áudio de entrada (ou da informação do áudio codificado) se a informação da extensão da largura de banda não deve ser incluida na informação de áudio codificado. Portanto, o codificador de áudio 100 é capaz de manter a taxa de bits da informação de áudio codificado 112 o mais baixo possivel, evitando a inclusão da informação da extensão da largura de banda 132 na informação de áudio codificado 112, se for achado, com base em alguns processos de análise e/ou processos de decisão executados pelo codificador de áudio 100, que a informação da extensão da largura de banda não é necessária para obter certa qualidade de áudio quando reconstruindo uma parte correspondente do conteúdo de áudio do lado do decodificador de áudio.
[0065] Desse modo, o codificador de áudio 100 inclui somente a informação da extensão da largura de banda na informação de áudio codificado se for necessário (para obter certa qualidade de áudio) no lado de um decodif icador de áudio, o qual, por outro lado, ajuda a reduzir a taxa de bits da informação de áudio codificado 112 e a qual, por outro lado, assegura que uma informação da extensão da largura de banda apropriada 132 seja incluida na informação de áudio codificado 112, se for necessário para evitar uma má qualidade de áudio quando decodificar a informação de áudio codificado no lado de um decodificador de áudio. Desse modo, uma melhor troca entre a taxa de bits e a qualidade de áudio é alcançada pelo codificador de áudio 100 quando comparado a soluções convencionais.
[0066] Por exemplo, o decodificador de áudio pode decidir, por estrutura de áudio, se a informação da extensão da largura de banda deve ser incluida na informação de áudio codificado 112 (ou mesmo se a informação da extensão da largura de banda deve ser determinada). De maneira alternativa, no entanto, o decodificador de áudio pode decidir, por "entrada" (por exemplo, por arquivo de áudio ou por fluxo de áudio), se a informação da extensão da largura de banda deve ser incluida na informação de áudio codificado 112. Para tanto, a entrada deve ser analisada (por exemplo, antes da codificação), para que a decisão seja feita de um modo adaptável ao sinal. 2. Codificador de Áudio de Acordo com a Fig. 2
[0067] A Fig. 2 mostra um diagrama esquemático de blocos de um codificador de áudio, de acordo com outra aplicação da presente invenção. 0 codificador de áudio 200 recebe uma informação de áudio de entrada 210 e fornece, com base nela, uma informação de áudio codificado 212. O codificador de áudio 200 compreende um codificador de baixa frequência 220, que pode ser substancialmente idêntico ao codificador de baixa frequência 120 descrito acima. O codificador de baixa frequência 220 fornece uma representação codificada 222 de uma parte de baixa frequência da informação de áudio de entrada (ou, de maneira equivalente, do conteúdo de áudio representado pela informação de áudio de entrada 210). O codificador de áudio 200 também compreende um fornecedor de informação da extensão da largura de banda 230, que pode ser substancialmente idêntico ao fornecedor de informação da extensão da largura de banda 130 descrito acima. O fornecedor de informação da extensão da largura de banda 230 normalmente recebe uma informação de áudio de entrada 210. No entanto, o fornecedor de informação da extensão da largura de banda 230 pode também receber uma informação de controle (ou uma informação intermediária) do codificador de baixa frequência 220, caracterizado pela referida informação de controle (ou informação intermediária) poder, por exemplo, compreender informação sobre um espectro (ou um formato espectral ou envelope espectral) da parte de baixa frequência da informação de áudio de entrada 210. No entanto, a informação de controle (ou informação intermediária) também pode compreender parâmetros codificados (por exemplo, coeficientes de filtro LPC [Codificação preditiva Linear | Linear Predictive Coding], ou transformar valores de dominio, como coeficientes MDCT [Transformada Discreta de Cosseno Modificada | Modified Discrete Cosine Transform] ou coeficientes QMF [Filtros de Quadratura Espelhada I Quadrature Mirror Filter]) ou similares. Além disso, o fornecedor informação da extensão da largura de banda 230 pode, opcionalmente, receber a representação codificada 222 da parte de baixa frequência, ou pelo menos uma respectiva parte. Além disso, o codificador de áudio 200 compreende um sensor 240, que é configurado para decidir se a informação da extensão da largura de banda é incluida na informação de áudio codificado 212 para uma parte dada da informação de áudio de entrada 210 (ou para uma parte dada da informação de áudio codificado 212) . Opcionalmente, o sensor 240 pode também determinar se a informação da extensão da largura de banda referida é determinada pelo fornecedor de informação da extensão da largura de banda 230 para a parte referida da informação de áudio de entrada 210 (ou da informação de áudio codificado 212) . O sensor 240 pode, portanto, receber a informação de áudio de entrada 210 e/ou uma informação de controle ou informação intermediária 224 do codificador de baixa frequência 220 (por exemplo, conforme descrito acima), e/ou a representação codificada 222 da parte de baixa frequência. Além disso, o sensor 240 é configurado para fornecer um sinal de controle 242 que controla uma disposição seletiva da informação da extensão da largura de banda e/ou uma inclusão seletiva da informação da extensão da largura de banda na informação de áudio codificado 212.
[0068] Em relação à funcionalidade do codificador de áudio 200, é feita referência às explicações acima em relação ao codificador de áudio 100.
[0069] Além disso, deve-se notar que o sensor 240 compreende uma função central, uma vez que o sensor 240 decide se a informação da extensão da largura de banda é incluida ou não na informação de áudio codificado 212, e, portanto, decide se um decodificador de áudio, que recebe a informação de áudio codificado 212, reconstrói o conteúdo de áudio, que é descrito pela informação de áudio de entrada 210, usando uma extensão cega da largura de banda ou usando uma extensão da largura de banda guiada por parâmetro (caracterizado pela informação da extensão da largura de banda representar os parâmetros orientados pela extensão da largura de banda guiada por parâmetro).
[0070] De um modo geral, o sensor identifica partes da informação de áudio de entrada que não podem ser decodificadas com qualidade suficiente ou desejável, com base na representação codificada 222 da parte de baixa frequência, usando uma extensão cega da largura de banda. Em outras palavras, o sensor 240 deve reconhecer quando a representação codificada da parte de baixa frequência 222 por si só não permite uma extensão cega da largura de banda com qualidade suficiente. De outro modo, o sensor 240 identifica preferencialmente partes da informação de áudio de entrada para que parâmetros da extensão da largura de banda não possam ser estimados com base na parte de parte de baixa frequência com precisão suficiente (ou desejável), para alcançar uma qualidade de áudio aceitável (ou desejada). Consequentemente, o sensor 240 pode determinar, usando sinal de controle 242, que a informação da extensão da largura de banda deve ser incluida na informação de áudio codificado para partes da informação de áudio de entrada que não podem ser decodificadas com uma qualidade suficiente ou desejável com base na representação codificada 222 da parte de baixa frequência usando uma extensão cega da largura de banda (isto é, sem receber nenhuma informação da extensão da largura de banda do codificador). De maneira equivalente, o sensor pode determinar, usando um sinal de controle 242, que a informação da extensão da largura de banda deva ser incluida na informação de áudio codificado para partes da informação de áudio de entrada, para que parâmetros da extensão da largura de banda não possam ser estimados com base na parte de baixa frequência (ou de maneira equivalente, a representação codificada 222 da parte de baixa frequência) com uma precisão suficiente ou desejada.
[0071] A fim de identificar tais partes, para que a informação da extensão da largura de banda deva ser incluida na informação de áudio codificado (ou, de maneira equivalente, para identificar partes da informação de áudio de entrada para que não seja necessário incluir a informação extensão da largura de banda na informação de áudio codificado 212), o sensor 240 pode usar estratégias diferentes. Conforme mencionado acima, o sensor 240 pode receber diferentes tipos de informação de entrada. Em alguns casos, a decisão do sensor sobre a possibilidade de a informação da extensão da largura de banda dever ser incluida ou não na informação de áudio codificado 212 pode ter base somente na informação de áudio de entrada 210. Em outras palavras, o sensor 240 pode, por exemplo, ser configurado para analisar a informação de áudio de entrada 210, para descobrir para que partes da informação de áudio de entrada (que correspondem às partes da informação de áudio de codificado 212) é necessário incluir a informação da extensão da largura de banda 232 na informação de áudio codificado 212 para alcançar uma qualidade de áudio aceitável (ou desejada). No entanto, a decisão do sensor 240 pode, alternativamente, ter base em algumas informações de controle ou informação intermediária 224, fornecida pelo codificador de baixa frequência 200. Alternativamente ou em complemento, a decisão do sensor 240 pode ter base na representação codificada 222 da parte de baixa frequência da informação de áudio de entrada 210. Desse modo, o sensor pode avaliar quantidades diferentes para determinar (ou estimar) se a extensão cega da largura de banda do lado de um decodif icador de áudio resultará em uma qualidade de áudio suficiente (ou se é provável que resulte em uma qualidade de áudio suficiente, ou se espera-se que resulte em qualidade de áudio suficiente).
[0072] Por exemplo, o sensor pode determinar se as partes da informação de áudio de entrada 210 são temporariamente estacionárias e se as partes da informação de áudio de entrada 210 tem um caráter de passa-baixa. Por exemplo, o sensor 240 pode concluir que não é necessário incluir uma informação da extensão da largura de banda na informação de áudio codificado 212 para partes que são consideradas partes estacionárias temporariamente, e que têm um caráter de passa-baixa, uma vez que foi reconhecido que as partes da informação de áudio de entrada 210 podem normalmente ser reproduzidas com qualidade de áudio suficientemente boa no lado de um decodificador de áudio, mesmo usando uma extensão cega da largura de banda. Isso é devido ao fato de que uma extensão cega da largura de banda normalmente funciona bem para partes da informação (ou conteúdo) de áudio de entrada que não compreendem grandes mudanças do conteúdo de áudio (ou que não compreendem quaisquer transitórias ou outras grandes variações do conteúdo de áudio) e pode, portanto, ser considerada como sendo temporariamente estacionária. Além disso, verificou-se que a extensão cega da largura de banda funciona bem para partes do conteúdo de áudio que compreende caráter de passa- baixa, isto é, para uma parte do conteúdo de áudio para a qual a intensidade de uma parte de baixa frequência é maior que uma intensidade de uma parte de alta frequência, uma vez que esse é um pressuposto fundamental da maioria dos conceitos de extensão da largura de banda. Em conformidade, o sensor 240 pode sinalizar, usando o sinal de controle 242, para omitir seletivamente uma inclusão da extensão da largura de banda na informação de áudio codificado 212 para tais partes estacionárias temporariamente tendo um caráter de passa-baixa.
[0073] Por exemplo, o sensor 240 pode ser configurado para identificar partes da informação de áudio de entrada que compreendem linguagem sonora, e/ou partes da informação de áudio de entrada que compreendem ruido ambiente, e/ou partes da informação de áudio de entrada que compreendem música sem instrumento de percussão. Tais partes da informação de áudio de entrada são normalmente estacionárias temporariamente e compreendem um caráter de passa-baixa, de modo que o sensor 240 normalmente sinaliza para omitir uma inclusão da informação da extensão da largura de banda na informação de áudio codificado para tais partes.
[0074] Alternativamente, ou em complemento, o sensor 240 pode analisar se um formato espectral na parte de alta frequência da informação de áudio de entrada pode ser previsto com precisão razoável (por exemplo, usando os conceitos aplicados pela extensão cega da largura de banda) com base em um envelope espectral da parte de baixa frequência. Portanto, o sensor pode, por exemplo, ser configurado para determinar se uma diferença entre um envelope espectral de uma parte de baixa frequência (que pode ser descrita, por exemplo, pela informação intermediária 224, ou pela representação codificada 222 da parte de baixa frequência) e um envelope espectral de uma parte de alta frequência (que pode, por exemplo, ser determinada pelo sensor 240 com base na informação de áudio de entrada 210) é maior ou igual à diferença da medida predeterminada. Por exemplo, o sensor 240 pode determinar a diferença em termos de uma diferença de intensidade, ou em termos de uma diferença de formato, ou em termos de uma variação maior de frequência, ou em termos de quaisquer outros elementos característicos dos envelopes espectrais. Portanto, o sensor 240 pode decidir (e sinalizar) incluir uma informação da extensão da largura de banda 232 na informação de áudio de entrada em resposta à constatação de que a diferença entre o envelope espectral da parte de baixa frequência e o envelope espectral da parte de alta-frequência é maior ou igual à diferença da medida predeterminada. Em outras palavras, o sensor 240 pode determinar o quão bom o envelope espectral da parte de alta-frequência pode ser previsto com base no envelope espectral da parte de baixa frequência e, se a previsão não for possível com bons resultados (que é, por exemplo, o caso de envelope espectral da parte de alta frequência previsto diferir muito do envelope espectral da parte de alta frequência atual), pode-se concluir que a informação da extensão da largura de banda 232 será necessária no lado do decodificador de áudio. No entanto, em vez de comparar o envelope espectral da parte de alta frequência previsto com o envelope espectral da parte de alta frequência atual, o sensor 240 pode, alternativamente, comparar o envelope espectral da parte de baixa frequência com o envelope espectral da parte de baixa frequência. Isso faz sentido se for suposto que o envelope espectral da parte de alta frequência é normalmente similar ao envelope espectral da parte de baixa frequência, quando aplicada uma estimativa da extensão cega da largura de banda.
[0075] Alternativamente, ou em complemento, o sensor 240 pode identificar partes compreendendo linguagem não sonora e/ou partes compreendendo sons de percussão. Uma vez que o envelope espectral da parte de alta frequência normalmente difere muito do envelope espectral da parte de baixa frequência em tais casos, o sensor pode sinalizar para incluir a informação da extensão da largura de banda na representação do áudio codificado para tais partes da informação de áudio de entrada (ou da informação de áudio codificado) compreendendo linguagem não sonora ou compreendendo linguagem de percussão.
[0076] Portanto, alternativamente ou em complemento, o sensor 240 pode analisar a inclinação espectral das partes da informação de áudio de entrada 210. O sensor 240 também pode usar uma informação sobre a inclinação espectral das partes da informação de áudio de entrada para decidir se a informação da extensão da largura de banda 232 deve ser incluida na informação de áudio codificado 212. Tal conceito tem base na ideia de que uma extensão cega da largura de banda funciona bem para partes de um conteúdo de áudio para que haja mais energia (ou, geralmente, intensidade) na faixa de baixa frequência quando comparada à faixa de alta frequência. Por outro lado, se a parte de alta frequência (também designada como faixa de alta frequência) for "dominante", isto é, compreender uma quantidade substancial de energia, a extensão cega da largura de banda normalmente não poderá produzir bem o conteúdo de áudio, de forma que a informação da extensão da largura de banda deverá ser incluida na informação de áudio codificado. Portanto, em algumas aplicações, o sensor determina se a inclinação espectral (que descreve uma distribuição de energia, ou geralmente intensidades, sobre frequências) é maior ou igual ao valor limiar da inclinação fixa ou variável. Se a inclinação espectral for maior do que o valor limiar da inclinação fixa ou variável (que significa que há energia ou intensidade comparativamente grande na parte de alta frequência do conteúdo de áudio, pelo menos quando comparado a um caso "normal" no qual a energia ou a intensidade diminui com o aumento da frequência), o sensor pode decidir incluir uma informação da extensão da largura de banda na informação de áudio codificado.
[0077] Além de algumas ou todas das características mencionadas acima, o sensor pode, também, avaliar uma taxa de cruzamento zero para partes da informação de áudio de entrada. Além disso, a decisão do sensor de incluir uma informação da extensão da largura de banda pode também ter base na possibilidade de a taxa de cruzamento determinada ser maior ou igual ao valor limiar da taxa de cruzamento fixa ou variável. Esse conceito tem base na consideração de que uma taxa ade cruzamento alta normalmente indica que altas frequências desempenham um papel importante na informação de áudio de entrada, que, por sua vez, indica que uma extensão da largura de banda guiada por parâmetro deve ser usada no lado do decodificador de áudio.
[0078] Além disso, deve-se notar que o sensor 240 pode usar preferencialmente algumas histereses para evitar uma comutação excessiva entre a inclusão da informação da extensão da largura de banda 232 na informação de áudio codificado e uma omissão da referida inclusão. Por exemplo, as histereses podem ser aplicadas ao valor limiar de inclinação variável, ao valor limiar de taxa de cruzamento zero variável ou a qualquer outro valor limiar que é usado para decidir sobre uma transição de uma inclusão da informação da extensão da largura de banda para uma prevenção da inclusão referida, ou vice-versa. Desse modo, as histereses podem variar um valor limiar para reduzir uma probabilidade para comutar para uma omissão da inclusão da informação da extensão da largura de banda quando a informação da extensão da largura de banda for incluida para uma parte atual da informação de áudio de entrada. De maneira análoga, o valor limiar pode ser variado para reduzir uma probabilidade de comutar para a inclusão da informação da extensão da largura de banda, quando a inclusão da informação da extensão da largura de banda for evitada para a parte atual da informação de áudio de entrada. Desse modo, perturbações, que podem ser causadas pelas transições entre os modos diferentes, podem ser reduzidas.
[0079] Na sequência, alguns detalhes sobre o fornecedor de informação de extensão de largura de banda 230 serão discutidos. Em particular, será explicado que a informação é incluida na informação de áudio codificado 212 em resposta ao sensor sinalizando que a informação da extensão da largura de banda 232 deve ser incluida na informação de áudio codificado. Para fins de explicação, serão feitas também referências à Fig. 3, que mostra uma representação esquemática das partes de frequência da informação de áudio de entrada e dos parâmetros incluidos na representação do áudio codificado. Uma abscissa 310 descreve uma frequência e uma ordenada 312 descreve uma intensidade (por exemplo, uma intensidade, como uma amplitude ou uma energia) de caixas espectrais diferentes (por exemplo, coeficientes MDCT, coeficientes QMF, coeficientes FFT [Transformada rápida de Fourier | Fast Fourier Transform] , ou similares). Como se pode verificar, uma parte de baixa frequência da informação de áudio de entrada pode, por exemplo, cobrir uma faixa de frequências a partir de um limite de frequência baixo (por exemplo, 0, ou 50 Hz, ou 300 Hz, ou qualquer outro limite de frequência razoavelmente baixo) até uma frequência de aproximadamente 6,4 kHz. Como se pode verificar, a representação codificada 222 deve ser fornecida para essa parte de baixa frequência (por exemplo, de 300 Hz a 6,4 kHz, ou similar). Além disso, há uma parte de alta frequência que, por exemplo, varia de 6,4 kHz a 8 kHz. No entanto, a parte de alta frequência pode normalmente cobrir uma faixa de frequência diferente que é normalmente limitada pela faixa de frequência perceptível por um ouvinte humano. No entanto, pode-se verificar na Fig. 3 que, como um exemplo, um envelope espectral mostrado no número de referência 320, compreende um formato irregular da parte da alta frequência. Além disso, pode-se verificar que o envelope espectral 320 compreende energia comparativamente grande na parte de alta frequência e, ainda, uma energia comparativamente alta entre 7,2 kHz e 7,6 kHz. Como comparação, um segundo envelope espectral 330 também é mostrado na Fig. 3, caracterizado pelo segundo envelope espectral 330 mostrar uma decadência da energia ou intensidade (por exemplo, por unidade de frequência) na arte de alta frequência. Portanto, o envelope espectral 320 normalmente irá fazer com que o sensor decida por uma inclusão da informação da extensão da largura de banda na representação do áudio codificado para a parte compreendendo o envelope espectral 320, enquanto o envelope espectral 330 normalmente irá fazer com que o sensor decida por uma omissão da inclusão da informação da extensão da largura de banda para a parte do conteúdo de áudio compreendendo o envelope espectral 330.
[0080] Como se verificou, ainda, para uma parte de conteúdo áudio compreendendo o envelope espectral 320, quatros parâmetros escalares serão incluidos na representação de áudio codificado como uma informação da extensão da largura de banda. Um primeiro parâmetro escalar deve, por exemplo, descrever o envelope espectral (ou uma média do envelope espectral) para a região da frequência entre 6,4 kHz e 6,8 kHz, um segundo parâmetro escalar pode descrever o envelope espectral 320 (ou a média dele) para a região de frequência entre 6,8 kHz e 7,2 kHz, um terceiro parâmetro escalar pode descrever o envelope espectral 320 (ou uma média dele) para a região de frequência entre 7,2 kHz e 7,6 kHz, e um quarto parâmetro escalar pode descrever o envelope espectral (ou uma média deste) para a região de frequência entre 7,6 kHz e 8 kHz. Os parâmetros escalares podem descrever o envelope espectral em um modo absoluto ou relativo, por exemplo, com referência a uma faixa (ou região) de frequência espectral anterior. Por exemplo, o primeiro parâmetro escalar pode descrever uma relação de intensidade (que pode, por exemplo, ser normalizada para algumas quantidades) entre o envelope espectral na região de frequência entre 6,4 kHz e 6,8 kHz e o envelope espectral em uma região de baixa frequência (por exemplo, abaixo de 6,4 kHz) . 0 segundo, o terceiro e o quarto parâmetros escalares podem, por exemplo, descrever a diferença (ou a relação) entre (intensidades) do envelope espectral na faixa de frequência adjacente, tal que, por exemplo, o segundo parâmetro escalar pode descrever uma relação entre (um valor médio) o envelope espectral na faixa de frequência entre 6,8 kHz e 7,2 kHz e o envelope espectral na faixa de frequência entre 6,4 kHz e 6,8 kHz.
[0081] Além disso, deve-se notar que uma representação codificada da parte de baixa frequência, isto é, parte de frequência abaixo de 6,4 kHz, pode ser incluida em qualquer caso. A parte de frequência abaixo 6,4 kHz (parte de baixa frequência) pode ser codificada usando qualquer conceito de codificação bem conhecido, por exemplo usando um codificador de "áudio geral" como AAC (ou um derivado dele) ou uma linguagem de codificação (por exemplo CELP, ACELP, ou um derivado deles). Portanto, para uma parte do conteúdo de áudio compreendendo o envelope espectral 320, tanto uma representação codificada da parte de baixa frequência quanto quatro parâmetros da extensão da largura de banda (que podem ser quantizados usando um número de bits comparativamente pequeno) serão incluidos na representação de áudio codificado. Por outro lado, para uma parte do conteúdo de áudio compreendendo o envelope espectral 330, somente a representação codificada da parte de baixa frequência será incluida na representação de áudio codificado, mas os parâmetros de extensão da largura de banda (escalar) não serão incluidos na representação de áudio codificado (que, entretanto, não causa problemas sérios, uma vez que o envelope espectral 330 exibe uma característica regular e decadente (passa-baixa), que pode ser bem produzida usando uma extensão cega da largura de banda).
[0082] Para concluir, o codificador de áudio 200 é configurado para incluir seletivamente os parâmetros que representam um envelope espectral de uma parte de alta frequência da informação de áudio de entrada na informação de áudio codificada em um modo adaptável ao sinal como uma informação da extensão da largura de banda. Por exemplo, os parâmetros da extensão da largura de banda escalar mencionados, tendo como referência a Fig. 3, podem ser incluidos na informação de áudio codificado de um modo adaptável ao sinal. De um modo geral, o codificador de menor frequência 220 pode ser configurado para codificar uma parte de baixa frequência da informação de áudio de entrada 210, compreendendo frequências de até no máximo frequências das faixas entre 6 e 7 kHz (caracterizado por um limite de 6,4 kHz ter sido usado no exemplo da Fig. 3) . Além disso, o codificador de áudio pode ser configurado para incluir seletivamente na representação de áudio codificado entre três e cinco parâmetros descrevendo intensidades de partes de sinal de alta frequência tendo a largura de banda entre 300 Hz e 500 Hz. No exemplo da Fig. 3, quatro parâmetros escalares descrevendo intensidades das partes de sinal de alta frequência tendo largura de banda de aproximadamente 400 Hz foram mostrados. Em outras palavras, o codificador de áudio pode ser configurado para incluir na representação de áudio codificado, quatro parâmetros de quantização escalar descrevendo intensidades de quatro partes de sinal de alta frequência, partes de sinal de alta frequência abrangendo faixas de frequência (conforme mostrado na Fig. 3) sobre a parte de baixa frequência (por exemplo, conforme explicado na referência da Fig. 3) . Por exemplo, o codificador de áudio pode ser configurado para incluir seletivamente na representação de áudio codificado uma pluralidade de parâmetros descrevendo a relação entre energias e intensidades das partes de frequência espectral adjacente, caracterizado por um dos parâmetros descrever uma relação entre uma energia ou uma intensidade de uma primeira parte de alta frequência da extensão da largura de banda e uma energia ou uma intensidade de uma parte de baixa frequência, e em que outros dos parâmetros descrevem relações entre energias e intensidades de outra parte de alta frequência da extensão da largura de banda (em que as partes de alta frequência da extensão da largura de banda podem ser partes de frequência entre 6,4 e 6,8 kHz, entre 6,8 e 7,2 kHz, entre 7,2 kHz e 7,6 kHz e entre 7.6 kHz e 8 kHz. Alternativamente, entre três e cinco parâmetros de forma de envelope (descrevendo intensidades de partes de sinal alta frequência) podem ser vetores quantizados. Quantização de vetor é normalmente um pouco mais eficiente que uma quantização escalar. Por outro lado, quantização de vetor é mais complexa do que quantização escalar. Em outras palavras, a quantização de quatro valores de energia da extensão da largura de banda podem ser alternativamente executadas usando uma quantização de vetor (em vez de usar uma quantização escalar).
[0083] Para concluir, o codificador de áudio pode ser configurado para incluir uma extensão comparativamente simples da largura de banda na representação de áudio codificado, de modo que uma taxa de bits da representação seja apenas um pouco maior para partes da informação de áudio de entrada (ou da representação de áudio codificado), para que seja verificado, pelo sensor, que a extensão da largura de banda guiada por parâmetro seria desejada. 3. Decodificador de Áudio de Acordo com a Fig. 4
[0084] A Fig. 4 mostra um diagrama esquemático de blocos de um decodificador de áudio, de acordo com uma aplicação da presente invenção. O decodificador de áudio 400, de acordo com a Fig. 4, recebe uma informação de áudio codificado 410 (que pode, por exemplo, ser fornecida por um codificador de áudio 100 ou por um codificador de áudio 200), e fornece, com base nela, a informação de áudio decodificado 412.
[0085] O decodificador de áudio 400 compreende um decodificador de baixa frequência 420, que recebe a informação de áudio decodificado 410 (ou pelo menos a representação codificada da parte de baixa frequência incluida nela), decodifica a representação codificada da parte de baixa frequência e obtém uma representação decodificada 422 da parte de baixa frequência. O decodificador de áudio 400 também compreende uma extensão da largura de banda 430 que é configurada para obter um sinal da extensão da largura de banda 432 usando uma extensão cega da largura de banda para partes do (codificado) conteúdo de áudio (representado pela informação de áudio codificada 410) para que parâmetros da extensão da largura de banda não sejam incluidos na informação de áudio codificado 410 e obtenham o sinal de extensão da largura de banda 432 usando uma extensão da largura de banda guiada por parâmetro (fazendo uso da informação da extensão da largura de banda ou parâmetros da extensão da largura de banda incluido na informação de áudio codificado 410) para partes do conteúdo de áudio para que parâmetros da extensão da largura de banda sejam incluidos na informação de áudio codificado (ou representação de áudio codificado) 410.
[0086] Portanto, o decodificador de áudio 400 é capaz de executar uma extensão da largura de banda independentemente da possibilidade de os parâmetros da extensão da largura de banda serem incluidos ou não na informação de áudio codificado 410. Desse modo, o decodificador de áudio pode se adaptar à informação de áudio codificado 410 e permite que um conceito que tenha comutação entre uma extensão cega da largura de banda e uma extensão da largura de banda guiada por parâmetro. Consequentemente, o decodificador de áudio 400 é capaz de lidar com uma informação de áudio codificado 410 em que os parâmetros da extensão da largura de banda são somente incluidos para partes (por exemplo estruturas) do conteúdo de áudio que não podem ser reconstruídas com qualidade suficiente usando uma extensão cega da largura de banda. Desse modo, a informação de áudio decodificado 412, que compreende tanto a representação decodificada da parte de baixa frequência quanto o sinal da extensão da largura de banda (caracterizado pelo último poder, por exemplo, ser adicionado à representação decodificada 422 da parte de baixa frequência para, assim, obter a informação de áudio decodificado 412) pode ser fornecida.
[0087] Desse modo, o decodificador de áudio 400 ajuda a obter uma boa troca entre qualidade de áudio e taxa de bits.
[0088] Uma melhora adicional opcional do decodificador de áudio 400 será descrita a seguir, por exemplo, tendo como referência a Fig. 5.
[0089] 4. Decodificador de Áudio de Acordo com a Fig. 5
[0090] A Fig. 5 mostra um diagrama esquemático de blocos de um decodificador de áudio 500, de acordo com outra aplicação da presente invenção. 0 decodificador de áudio 500 recebe uma informação de áudio codificado (também designada base nela, uma informação de áudio (também designada como representação de áudio decodificado) 512. O decodificador de áudio 500 compreende um decodificador de baixa frequência 520, que pode ser igual ao decodificador de baixa frequência 420 e pode cumprir uma funcionalidade comparável. Desse modo, o decodificador de baixa frequência 500 fornece uma representação decodificada 522 de uma parte de baixa frequência de um conteúdo de áudio representado pela informação de áudio codificado 510. O decodificador de áudio 500 também compreende uma extensão da largura de banda 530, que pode cumprir a mesma funcionalidade que a extensão da largura de banda 430.
[0091] A extensão da largura de banda 530 pode, portanto, fornecer um sinal de extensão da banda larga 532, que é normalmente combinado (por exemplo, adicionado) à representação decodificada 522 da parte de baixa frequência, para, assim, obter a informação de áudio decodificado 512. A extensão da largura de banda 530 pode, por exemplo, receber a representação decodificada 522 da parte de baixa frequência 522. Alternativamente, no entanto, a extensão da largura e da banda 532 pode receber uma informação de controle (que também será considerada como informação auxiliar ou uma informação intermediária) 524, que é fornecida pelo decodificador de baixa frequência 520. A informação auxiliar ou informação de controle ou informação intermediária 524 pode, por exemplo, representar um formato espectral da parte de baixa frequência do conteúdo de áudio, uma taxa de cruzamento zero da representação decodificada da parte de baixa frequência, ou qualquer outra quantidade intermediária usada pelo decodificador de baixa frequência 520 que é útil no processo da extensão da largura de banda. Além disso, o decodificador de áudio compreende um controle 540, que é configurado para fornecer uma informação de controle 542 indicando se uma extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro deve ser executada pela extensão da largura de banda 530. O controle 540 pode usar diferentes tipos de informação para fornecer a informação de controle 542. Por exemplo, o controle 540 pode receber uma extensão da largura de banda de modo indicador de fluxo de bits, que pode ser incluida na informação de áudio codificado 510. Por exemplo, pode haver uma extensão da largura de banda de modo indicador de fluxo de bits para cada parte (por exemplo, estrutura) da informação de áudio codificado, que pode ser extraida da informação de áudio codificado pelo controle 540 e que pode ser usada para derivar a informação de controle 542 (ou que pode imediatamente constituir a informação de controle 542). Alternativamente, no entanto, o controle 540 pode receber uma informação que representa a parte de baixa frequência e/ou que descreve como decodificar a parte de baixa frequência (e que é, portanto, também designada como "informação decodificadora da parte de baixa frequência"). Alternativamente, ou em complemento, o controle 540 pode receber a informação de controle, ou informação auxiliar, ou informação intermediária 524 a partir do decodificador de baixa frequência, que pode, por exemplo, carregar informações sobre um envelope espectral da parte de baixa frequência, e/ou uma informação sobre a taxa de cruzamento zero da representação decodificada da parte de baixa frequência. No entanto, a informação de controle, ou informação auxiliar, ou informação intermediária 524 pode, também, carregar uma informação sobre a estatística da representação decodificada 522 da parte de baixa frequência ou pode representar qualquer informação intermediária que derivada do decodificador de baixa frequência 520 a partir da representação codificada da parte de baixa frequência (também designada como informação decodificadora da parte de baixa frequência).
[0092] Alternativamente, ou em complemento, o controle 540 pode receber a representação decodificada 522 da parte de baixa frequência e pode por si só derivar características de valor (por exemplo, uma informação de taxa de cruzamento zero, uma informação de envelope espectral, uma informação de inclinação espectral, ou similares) a partir da representação decodificada 522 da parte de baixa frequência.
[0093] Portanto, o controle 540 pode avaliar um indicador de fluxo de bits para fornecer a informação de controle guiada por parâmetro/cega 542, se o tal indicador de fluxo de bits (sinalizando se uma extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro deve ser usada) for incluido na informação de áudio codificado 510. Se, contudo, nenhum indicador de fluxo de bits for incluido na informação de áudio codificado 510 (por exemplo, para salvar taxas de bits), o controle 540 normalmente determina se usa uma extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro com base em outra informação. Para essa finalidade, a informação decodificadora da parte de baixa frequência (que pode ser igual à representação codificada da parte de baixa frequência ou a um subconjunto dela) pode ser avaliada pelo controle 540. Alternativamente, ou em complemento, o controle pode considerar a representação decodificada 522 da parte de baixa frequência para fazer uma decisão se deve utilizar uma extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro, isto é, para fornecer a informação de controle 542. Além disso, o controle 540 pode, opcionalmente, utilizar a informação de controle, ou informação auxiliar, ou informação intermediária 524, fornecida pelo descodificador de baixa frequência 520, desde que o decodificador de baixa frequência 520 forneça quaisquer quantidades intermediárias que são utilizáveis pelo controle 540.
[0094] Portanto, o controle 540 pode comutar a extensão da largura de banda entre a extensão cega da largura de banda e a extensão da largura de banda guiada por parâmetro.
[0095] No caso de uma extensão cega da largura de banda, a extensão da largura de banda 530 pode fornecer o sinal da extensão da largura de banda 532 com base na representação codificada 522 da parte de baixa frequência sem avaliar qualquer parâmetro de fluxo de bits adicional. Por outro lado, no caso de uma extensão da largura de banda guiada por parâmetro, a extensão da largura de banda 530 pode fornecer o sinal da extensão da largura de banda 532 levando em consideração parâmetros adicionais (dedicados) de fluxo de bits da extensão da largura de banda, que auxiliam na determinação de características da parte de alta frequência do conteúdo de áudio (isto é, características do sinal da extensão da largura de banda). No entanto, a extensão da largura de banda 530 pode, também, utilizar a representação decodificada 522 da parte de baixa frequência e/ou a informação de controle, ou informação auxiliar, ou informação intermediária 524, fornecida pelo decodificador de baixa frequência 520, para fornecer o sinal da extensão da largura de banda.
[0096] Desse modo, a decisão entre a utilização da extensão cega da largura de banda e da extensão da largura de banda guiada por parâmetro determina efetivamente se os parâmetros dedicados de extensão da largura de banda (que normalmente não são utilizados pelo decodificador de baixa frequência 520 para fornecer a representação decodificada da parte de baixa frequência) são aplicados para obter o sinal da extensão da largura de banda (que normalmente descreve a parte de alta frequência do conteúdo de áudio representado pela informação do áudio codificado).
[0097] Para resumir o supracitado, o decodificador de áudio 500 pode ser configurado para decidir se obtém o sinal da extensão da largura de banda 532 usando uma extensão cega da largura de banda ou usando uma extensão da largura de banda guiada por parâmetro em uma base estrutura-por- estrutura (caracterizado por uma "estrutura" ser um exemplo de uma parte do conteúdo de áudio, e em que uma estrutura pode, por exemplo, compreender uma duração entre 10 ms e 40 ms, e pode ter preferencialmente uma duração de aproximadamente 20 ms ± 2 ms). Desse modo, o decodificador de áudio pode ser configurado para comutar entre uma extensão cega da largura de banda e uma extensão da largura de banda guiada por parâmetro com uma granularidade temporal muito fina.
[0098] Deve-se notar, também, que o decodificador de áudio 500 é normalmente capaz de comutar entre uma utilização de uma extensão cega da largura de banda e uma extensão da largura de banda guiada por parâmetro dentro de uma parte contigua do conteúdo de áudio. Desse modo, a comutação entre a extensão cega da largura de banda e a extensão da largura de banda guiada por parâmetro pode ser executada substancialmente em qualquer momento (considerando, naturalmente, a estruturação) dentro de uma parte contigua de conteúdo de áudio, para adaptar a extensão da largura de banda às (mudanças de) características das partes diferentes de um pedaço único do conteúdo de áudio.
[0099] Conforme mencionado anteriormente, o decodificador de áudio (preferencialmente o controle 540) deve ser configurado para avaliar indicadores (por exemplo, um único indicador de bits por estrutura) incluidos na informação de áudio codificado 510 para partes diferentes (por exemplo, estruturas) do conteúdo de áudio, para decidir se deve utilizar uma extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro. Nesse caso, o controle 540 pode ser mantido muito simples, a custa de que um indicador de sinalização deve ser incluido na informação de áudio codificado para cada parte do conteúdo de áudio. Alternativamente, no entanto, o controle 540 pode ser configurado para decidir se deve utilizar uma extensão cega da largura de banda ou uma extensão da largura de banda guiada com base na representação codificada da parte de baixa frequência (que pode incluir a utilização da informação de controle, ou informação auxiliar, ou informação intermediária 524, derivada do decodificador de baixa frequência 520 a partir da referida representação codificada da parte de baixa frequência, e que pode também incluir a utilização da representação decodificada 522, que é derivada da representação codificada da parte de baixa frequência pelo decodificador de baixa frequência 520) sem avaliar um modo indicador de sinalização (dedicado) da extensão da largura de banda. Desse modo, a comutação entre a extensão cega da largura de banda e a extensão da largura de banda guiada por parâmetro pode ser executada mesmo sem uma sinalização sobrecarregada no fluxo de bits.
[0100] O decodificador de áudio (ou o controle 540) pode ser configurado para decidir se deve utilizar urna extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro corn base em urna ou mais características da representação decodificada da parte de baixa frequência. Tais características, corno urna informação da inclinação espectral, uma informação da taxa de cruzamento zero, ou similar, podem ser tanto extraídas da representação 57/79 decodificada 522 da parte de baixa frequência, como podem ser sinalizadas pela informação de controle/informação auxiliar/informação decodificador de intermediária 524. Por exemplo, o áudio (ou o controle 540) pode ser configurado para decidir se deve utilizar uma extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro com base nos coeficientes de predição linear quantizados (que podem, por exemplo, ser incluídos na informação de controle/informação auxiliar/informação intermediária 524) e/ou na dependência das estatísticas do domínio do tempo da representação decodificada 522 da parte de baixa frequência.
[0101] Na sequência, alguns conceitos de como alcançar a extensão da largura de banda serão descritos. Por exemplo, a extensão da largura de banda pode ser configurada para obter o sinal da extensão da largura de banda 532 usando uma ou mais características da representação decodificada 522 da parte de baixa frequência e/ou um ou mais parâmetros do decodificador de baixa frequência 520 (que pode ser sinalizado pela informação de controle/informação auxiliar/informação intermediária 524) para partes temporais do conteúdo de áudio (de entrada) para que parâmetros da extensão da largura de banda não sejam incluídos na informação de áudio codificado, Desse modo, a extensão da largura de banda 530 pode executar uma extensão cega da largura de banda, que tem base na ideia de concluir a partir da representação decodificada da parte de baixa frequência para a parte de alta frequência do conteúdo de áudio pela 58/79 informação de áudio codificado. Por exemplo, a extensão da largura de banda 530 pode ser configurada para obter o sinal da extensão da largura de banda 532 usando uma informação centroide espectral, e/ou usando uma informação de energia, e/ou usando coeficientes de filtro (por exemplo, codificados) para partes temporais do conteúdo de áudio para que parâmetros da extensão da largura de banda não sejam incluídos na informação de áudio codificado 510. Portanto, uma boa extensão cega da largura de banda poderá ser alcançada.
[0102] No entanto, conceitos diferentes de extensão cega da largura de banda podem, naturalmente, ser aplicados.
[0103] No entanto, a extensão da largura de banda pode ser configurada para obter o sinal da extensão da largura de banda 532 usando parâmetros de fluxo de bi ts, descrevendo um envelope espectral de uma parte de alta frequência para partes temporais do conteúdo de áudio para que parâmetros da extensão da largura de banda sejam incluídos na informação de áudio codificado. Em outras palavras, a extensão da largura de banda guiada por parâmetros pode ser executada usando parâmetros de fluxo de bits descrevendo o envelope espectral da parte de alta frequência. Os parâmetros de fluxo de bi ts que descrevem o envelope espectral da parte de alta frequência podem suportar a extensão da largura de banda guiada por parâmetro ( que pode, entretanto, além disso, contar com algumas ou todas as quantidades usadas pela extensão cega da largura de banda).
[0104] Por exemplo, verificou-se que a extensão da largura de banda deve ser preferencialmente configurada para avaliar entre três e cinco parâmetros de fluxo de bits descrevendo intensidades de partes do sinal de alta frequência tendo a largura de banda entre 300 Hz e 500 Hz, para obter o sinal da extensão da largura de banda. A utilização de um número relativamente pequeno dos parâmetros de fluxo de bits não aumenta substancialmente a taxa de bits, mas ainda traz uma melhora suficiente da extensão da largura de banda no caso de partes de sinal "dificil", de modo que a qualidade alcançável pela então extensão da largura de banda guiada para partes de sinal "dificil" seja comparável ã qualidade alcançável para partes de sinal "fácil" usando a extensão cega da largura de banda (caracterizado por partes de sinal "dificil" serem partes de sinal nas quais a extensão cega da largura de banda não resultaria em uma qualidade de áudio boa ou aceitável, enquanto partes de sinal "fácil" são partes de sinal nas quais a extensão cega da largura de banda trazem resultados suficientes).
[0105] Portanto, é preferido que entre três e cinco parâmetros de fluxo de bits descrevendo intensidades de partes de sinal de alta frequência, tendo largura de banda entre 300 Hz e 500 Hz, sejam de quantização escalar com dois ou três bits de resolução, de modo que haja entre 6 e 15 bits dos parâmetros de formato espectral da extensão da largura de banda por estrutura. Verificou-se que uma taxa de bits baixa da informação da extensão da largura de banda já é suficiente para obter uma razoável extensão da largura de banda no caso de partes "dificeis" do conteúdo de áudio.
[0106] Opcionalmente, a extensão da largura de banda 530 pode ser configurada para executar um nivelamento de energias do sinal da extensão da largura de banda quando comutar da extensão cega da largura de banda para a extensão da largura de banda guiada por parâmetro e/ou quando comutar da extensão da largura de banda guiada por parâmetro para a extensão cega da largura de banda. Portanto, descontinuidades do formato espectral quando comutado entre a extensão cega da largura de banda e a extensão da largura de banda guiada por parâmetro são reduzidas. Por exemplo, a extensão da largura de banda pode ser configurada para amortecer a parte de alta frequência do sinal da extensão da largura de banda para uma parte do conteúdo de áudio no qual uma extensão da largura de banda guiada por parâmetro é aplicada seguindo uma parte do conteúdo de áudio no qual a extensão cega da largura de banda é aplicada. A extensão da largura de banda pode, também, ser configurada para reduzir um amortecimento para uma parte de alta frequência do sinal de extensão da largura de banda (isto é, enfatizar um pouco uma parte de alta frequência do sinal da extensão da largura de banda) para uma parte de conteúdo de áudio na qual uma extensão da largura de banda é aplicada após uma parte do conteúdo de áudio, no qual uma extensão da largura de banda guiada por parâmetro é aplicada. Contudo, um nivelamento deve também ser realizado por qualquer outra operação que reduza as descontinuidades do formato espectral da parte de alta frequência, quando comutado entre os modos das extensões da largura de banda. Assim, uma qualidade de áudio é melhorada pela redução das perturbações.
[0107] Para concluir, o decodificador de áudio 500 permite uma boa qualidade de decodificação de um conteúdo de áudio tanto no caso em que uma informação da extensão da largura de banda é fornecida na informação de áudio codificado, quanto para o caso que em nenhuma informação da extensão da largura de banda é fornecida na informação de áudio codificado. O decodificador de áudio pode comutar entre uma extensão ceda da largura de banda de banda e uma extensão da largura de banda guiada por parâmetro sem granularidade temporal fina (por exemplo, em uma base estrutura-por- estrutura), caracterizado pelas perturbações serem mantidas baixas. 5. Método para Fornecer uma Informação de Áudio Codificado com Base em uma Informação de Áudio de Entrada, de Acordo com a Fig. 6
[0108] A Fig. 6 mostra um fluxograma de um método para fornecer uma representação de áudio codificado, de acordo com uma aplicação da presente invenção. O método 600 compreende codificar 610 uma parte de baixa frequência da informação de áudio de entrada para obter uma representação codificada da parte de baixa frequência. O método 600 também compreende fornecer informação da extensão da largura de banda com base na informação de áudio de entrada, em que a informação da extensão da largura de banda é incluída seletivamente na informação de áudio codificado em um modo adaptável ao sinal.
[0109] Deve-se notar que o método 600, de acordo com 62/79 a Fig. 6, pode ser completado por quaisquer características ou funcionalidades descritas aqui em relação ao codificador de áudio (e também em relação ao decodificador de áudio). 6. Método para Fornecer uma Informação de
Áudio Decodificado de Acordo com a Fig. 7
[0110] A Fig. 7 mostra um fluxograma de um método para fornecer uma representação de áudio decodificado, de acordo com uma aplicação da presente invenção. O método 700 compreende decodificar 710 uma representação codificada da parte de baixa frequência para obter uma representação codificada da parte de baixa frequência. O método 700 também compreende obter 720 um sinal da extensão da largura de banda usando uma extensão da largura de banda para partes de um conteúdo de áudio para que parâmetros da extensão da largura de banda não sejam incluidos na informação de áudio codificado. Além disso, o método 700 compreende obter 730 o sinal da extensão da largura de banda usando uma extensão da largura de banda guiada por parâmetro para partes do conteúdo de áudio, para que parâmetros da extensão da largura de banda sejam incluidos na informação de áudio codificado.
[0111] Deve-se notar que o método 700, de acordo com a Fig. 7, pode ser completado por quaisquer características ou funcionalidades descritas aqui em relação ao decodificador de áudio (e também em relação ao codificador de áudio). 7. Representação de Áudio Codificado de Acordo com a Fig. 8
[0112] A Fig. 8 mostra uma ilustração esquemática de uma representação de áudio codificado, de acordo com uma aplicação da presente invenção.
[0113] A representação de áudio codificado (também designado como informação de áudio codificado) compreende uma representação codificada de uma parte de baixa frequência da informação de áudio. Por exemplo, uma representação codificada 810 de uma parte de baixa frequência de uma informação de áudio é fornecida para uma parte da informação de áudio, por exemplo, para a primeira estrutura da informação de áudio. Além disso, uma representação codificada da parte de baixa frequência da informação de áudio também é fornecida para uma segunda parte (por exemplo, uma segunda estrutura) da informação de áudio. No entanto, a representação de áudio codificado 800 também compreende uma informação da extensão da largura de banda, caracterizado pela informação da extensão da largura de banda é incluida na representação de áudio codificado em um modo adaptável ao sinal para algumas partes da informação de áudio, mas não todas. Por exemplo, uma informação da extensão da largura de banda 812 é incluida para a primeira parte da informação de áudio. Por outro lado, nenhuma informação da extensão da largura de banda é fornecida para a segunda parte da informação de áudio.
[0114] Para concluir, a representação do áudio codificado 800 é normalmente fornecida pelos decodificadores de áudio descritos aqui e avaliada pelos decodificadores descritos aqui. Naturalmente, a representação de áudio codificado pode ser armazenada em uma midia de computador legivel não transitória, ou similar. Além disso, deve-se notar que a representação de áudio 800 pode ser completada por qualquer característica, intensidade informação etc., descrita em relação ao codificador de áudio e ao decodificador de áudio. 8. Conclusões e Aspectos Adicionais
[0115] As aplicações, de acordo com a presente invenção, resolvem os problemas de extensão da largura de banda convencional em uma codificação de áudio de taxa de bits muito baixa, e deficiências das técnicas de largura de banda convencional existente, ao propor uma extensão da largura de banda "minimamente guiada" como uma combinação adaptável ao sinal de uma extensão de largura de banda cega ou guiada por parâmetro que • usa uma extensão de largura de banda guiada, isto é, transmite poucos bits da informação adicional por 20 ms (por exemplo, por estrutura de áudio), somente se o conteúdo de alta frequência (por exemplo, a parte de alta frequência) do áudio de entrada não puder ser reconstruído bem o suficiente a partir do áudio de baixa frequência (por exemplo, a parte de baixa frequência do conteúdo de áudio), • usa uma extensão cega da largura de banda, isto é, reconstrução clássica de componentes de alta frequência (por exemplo, de uma parte de alta frequência) a partir de características de núcleo de baixa frequência (por exemplo, características de uma parte de baixa frequência reconstruída) , tais como centroide espectral, inclinação, coeficientes de filtro codificado, caso contrário, exibe complexidade computacional muito baixa ao utilizar quantização escalar ao invés de vetor da informação adicional ao evitar operações envolvendo grandes quantidades de pontos de dado, tais como transformadas de Fourier e autocorrelação e/ou cálculos de filtro, • é robusto em relação às características de sinal de entrada, isto é, não é otimizado para sinais de entrada particular, tais como linguagem adulta em ambientes silenciosos, para funcionar bem em todos os tipos de linguagem, assim como música.
[0116] A questão de transmitir parâmetro(s) como informação adicional na extensão da largura de banda guiada, parte das aplicações de acordo com a presente invenção, e quando transmitir os parâmetros, continua a ser respondida.
[0117] Verificou-se que, em codecs de banda larga, tais como AMR-WB, o envelope espectral da região de alta frequência sobre a região do codificador central representa os dados necessários (ou desejados) mais criticos para executar a extensão da largura de banda com qualidade adequada. Todos os outros parâmetros, tais como estrutura fina espectral e envelope temporal, podem ser derivados do sinal de núcleo decodificado com bastante precisão ou são de importância percentual pequena. A parte guiada da extensão da largura de banda minimamente guiada descrita aqui, portanto, somente transmite o envelope espectral de alta frequência como informação de lado (por exemplo, como informação da extensão da largura de banda). Isso ajuda a manter baixa a taxa da informação adicional da extensão da largura de banda. Além disso, foi descoberto experimentalmente que extensões cegas da largura de banda fornecem qualidade suficiente, isto é, pelo menos aceitável, de passagens de sinal estacionário temporariamente com um caráter de passa-baixa mais ou menos acentuado. Linguagem sonora, ruido ambiental e artigos de música sem instrumento de percussão são exemplos comuns. Na verdade, a maioria das entradas para uma linguagem de banda larga e sistema de codificação de áudio normalmente entra nessa categoria.
[0118] Segmentos de sinal, no entanto, cujos espectros instantâneos exibem um envelope muito diferente da região de alta frequência (por exemplo, na parte de alta frequência) do que na região (ou parte) de baixa frequência (codificador central) são, preferencialmente, codificados via uma extensão da largura de banda guiada transmitindo uma representação quantizada do envelope espectral de alta frequência como informação adicional (por exemplo, como informação da extensão da largura de banda). A razão é que em tais constituições espectrais, extensões cegas da largura de banda são geralmente incapazes de prever a progressão do envelope espectral de alta frequência a partir do envelope de núcleo de sinal, conforme dado pelos coeficientes de filtro codificados ou sinal residual de formato espectral (também conhecidos como excitação em codificadores de linguagem). Os exemplos proeminentes são de linguagem não sonora, especialmente fricativos e africativos fortes como "s" ou o "z" no alemão, assim como certos sons de percussão, principalmente em música moderna. As aplicações de acordo com somente ativada para tais espectros de alta frequência "imprevisíveis".
[0119] Uma extensão da largura de banda minimamente guiada, de acordo com a presente invenção, foi implementada no contexto de LD-USAC [Pouco Atraso - Linguagem Unificada e Codificador de Áudio | Low-Delay - Unified Speech and Audio Coding], uma versão de pouco atraso da xHE-AAC para estender sinal da largura de banda da banda larga codificada (WB-coded I wideband-coded) em 13,2 kbits/s de 6,4 a 8,0 kHz. No lado do codificador, a decisão cega/guiada é computada por estrutura codec de 20 ms a partir da inclinação espectral do sinal de entrada em uma escala de frequência perceptual (uma característica existente também usada na via de codificação de ACELP), assim como características de dominio de tempo, como a mudança de taxa de cruzamento zero do sinal de entrada fornecido por um sensor transiente existente (que é também utilizado para outras decisões de modo de codificação). Mais especificamente, se a inclinação espectral for positiva, significa que a energia espectral tende a aumentar com o aumento da frequência, e acima de um limite especificado, e ao mesmo tempo a taxa de cruzamento zero aumentou em certa relação ou está acima de certo imite, significando que a estrutura atual representa o começo ou fica dentro de uma passagem em forma de onda ruidosa, então a extensão de largura de banda guiada é escolhida e sinalizada. Caso contrário, a extensão cega da largura de banda é selecionada. Em relação aos limiares acima mencionados, uma simples histerese é, ainda, aplicada para reduzir a probabilidade de comutação para frente e para trás entre a extensão de largura de banda cega e guiada. Uma vez que o modo de extensão da largura de banda guiada é adotado por uma estrutura, os limiares de decisão a serem utilizados em estruturas sucessivas são reduzidos um pouco, de modo que é mais provável que o codec que se mantenha no modo guiado. Uma vez que se tenha decidido comutar de volta ao modo cego, os limites originais são restabelecidos, tornando menos provável para a decisão da extensão da largura de banda alternar para o modo guiado imediatamente.
[0120] O restante do procedimento da extensão de largura por estrutura pode ser resumido do seguinte modo: 1. Se o modo de extensão cega da largura de banda estiver no modo cego, um "0" é transmitido usando um bit no fluxo de bits para sinalizar esse modo ao decodificador. Opcionalmente, não transmite nenhum bit e deixa o decodificador identificar a estrutura como usando o modo de extensão cega da largura de banda por uma análise adicional do decodificador do sinal de núcleo. 2. Se a extensão da largura de banda estiver no modo guiado, um "1" transmitido usando um bit no fluxo de bits. Então, o codificador computa quatro indices de ganho de frequência, cada um abrangendo 400 Hz do sinal de entrada, para permitir formato espectral preciso de 6,4 a 8 kHz da região da extensão da largura de banda. Em uma realização de USAC de pouco atraso, cada um dos quatro indices é o resultado de uma quantização escalar de uma das quatro regiões da extensão da largura de banda QMF de energias relativas ao procedimento QMF de energia (ou à energia do espectro QMF de 4,8-6,4 kHz, em caso de ganho da primeira extensão da largura de banda). Uma vez que um quantizador de tamanho médio de 2 bit com um tamanho do passo de 2 dB é empregado, os ganhos cobrem uma faixa de valor de -3...3 dB e consomem 8 bits por estrutura. Obtém-se um total de informação adicional de 9 bit por estrutura da extensão da largura de banda ou, opcionalmente, 8 bits, se excluir a sinalização, como no passo 1. 3. No decodificador correspondente, o primeiro bit da extensão da largura de banda é lido. Se for "0", a extensão cega da largura de banda é usada, caso contrário, mais 8 bits são lidos e a extensão da largura de banda guiada é usada. Opcionalmente, a leitura do primeiro bit da extensão da largura de banda é ignorada (uma vez que este bit não está presente no fluxo de bits) e a decisão de cego/guiado é executada localmente por análise de núcleo de sinal, conforme mencionado no passo 1. 4. Se o modo da extensão cega da largura de banda foi determinado no decodificador, é executada uma extensão da largura de banda usando somente características do núcleo de sinal decodificado. Essa extensão da largura de banda segue essencialmente o conceito da extensão da largura de banda descrito em uma das referências [2], [3], [6] e [9], mas na QMF invés do dominio DFT [Transformada discreta de Fourier | Discrete Fourier Transform] e somente características de baixa complexidade derivadas do núcleo de espectro QMF, por exemplo, inclinação/centroide espectral. 5. Se o modo da extensão da largura de banda guiada foi selecionado no decodificador, os quatro indices de ganhos de 2-bit são quantizados de forma inversa no ganho de energia QMF e aplicados a um formato espectral do grupo da região da extensão da largura de banda QMF que são reconstruídas como no passo 4. Em outras palavras, a extensão cega da largura de banda também é aplicada aqui, exceto que o formato espectral é feito por meio da escala de fatores transmitida no fluxo de bits, em vez de por meio da escalada extrapolada a partir do sinal do núcleo (que, como um resultado, constitui uma extensão de largura de banda guiada por parâmetro). 6. Quando comutado entre a extensão da largura de banda cega e guiada de uma estrutura para a outra, um simples nivelamento de energias de alta frequência é executado para minimizar a comutação de perturbações (descontinuidades de energia de alta frequência) causada pelo comportamento do tipo passa-baixa da extensão cega da largura de banda. O nivelamento funciona essencialmente como um cross-fader entre as extensões da largura de banda cega e guiada: uma primeira estrutura da extensão da largura de banda guiada seguida de algumas estruturas da extensão da largura de banda é amortecida em um bit em sua região de alta frequência, enquanto o amortecimento de alta frequência de uma primeira estrutura da extensão da largura de banda depois de algumas extensões da largura de banda é reduzida em um bit.
[0121] Em um conteúdo de linguagem normal de telefone e música popular, experimentos têm mostrado que 13% de todas as estruturas de 20 ms estão utilizando a extensão guiada da largura de banda em LD-USAC. A média da taxa de informação de lado da extensão da largura de banda, portanto, equivale aproximadamente a 2 bit por estrutura ou 0,1 kbit/s. Isso é muito menos que as taxas de (e)SBR (cf., por exemplo, referência [8]) ou quaisquer das extensões da largura de banda dos codificadores de linguagem guiados aqui referenciadas.
[0122] Deve-se notar, ainda, conforme sugerido como método opcional na descrição de passo-a-passo precedente nesta secção, a sinalização de 1 bit do modo de decisão da extensão da largura de banda do decodificador pode ser evitada, se tanto o codificador quanto o decodificador puderem derivar tal decisão do sinal do núcleo codificado em uma forma exata de bit. Isso pode ser alcançado se o codificador selecionar o modo de extensão da largura de banda com base em algumas características derivadas do sinal do núcleo decodificado localmente, uma vez que esse é o único sinal disponível no decodificador. Supondo que não houve erro de transmissão em uma estrutura especifica, e tanto o codificador quanto o decodificador determinam o modo da extensão da largura de banda exatamente a partir das mesmas características do sinal de núcleo (tais como, coeficientes LPC [Código Preditivo Linear | Linear Predictive Coding] quantizados, ou estatísticas de domínio de tempo do sinal residual decodificado como a taxa de cruzamento zero, codificador e no decodificador.
[0123] As aplicações, de acordo com a invenção, ultrapassam certo dilema de qualidade em codecs de banda larga que podem ser observados nas taxas de bits de 9-13 kbit/s. Verificou-se que, por outro lado, tais taxas são realmente muito baixas para justificar a transmissão, mesmo moderada, de quantidades de dados da extensão da largura de banda, descartando sistemas tipicos de extensão de largura de banda guiada com 1 kbit/s ou mais da informação adicional. Por outro lado, verificou-se que a viabilidade da extensão cega da largura de banda soa significativamente pior, em pelo menos alguns tipos de material de linguagem ou música, devido à incapacidade de previsão adequada do parâmetro a partir do sinal de núcleo. Verificou-se, no entanto, que é desejável reduzir a taxa de informação de lado de um esquema de extensão de banda guiada a um nivel muito abaixo de 1 kbit/s, o que permite sua adoção, mesmo em codificação de taxa de bits muito baixa. A abordagem, que é usada em aplicações de acordo com a invenção, é identificar segmentos de sinais de entrada tipicos que são reconstruídos de modo ruim ou otimizado pela extensão da largura de banda, e transmitir somente para esses segmentos a informação adicional necessária para melhorar a qualidade de reconstrução de alta frequência para um nivel aceitável (ou, pelo, menos, um nivel que esteja na faixa da média de qualidade da extensão da largura de banda daquele sinal). Em outras palavras: partes do sinal de entrada de alta frequência que são recriadas razoavelmente bem pela extensão cega da largura de banda, devem ser codificadas com pouca ou nenhuma informação adicional da extensão da largura de banda, e apenas as passagens em que uma extensão cega da largura de banda puder degradar a impressão geral da qualidade do codec devem ter seus componentes de alta frequência reproduzidos por uma extensão de largura de banda guiada. Tal modelo de largura de banda que ajusta a taxa de informação adicional em um modo adaptável ao sinal é o assunto da presente invenção e é denominado "extensão da largura de banda guiada minimamente".
[0124] As aplicações, de acordo com a invenção, ultrapassam múltiplas abordagens da extensão da largura de banda que foram documentadas nos últimos anos (cf., por exemplo, referências [1], [2], [3], [4], [5], [6], [7], [8], [9] e [10]). De modo geral, todas essas são completamente cegas ou completamente guiadas em um determinado ponto operacional, independentemente das características instantâneas do sinal de entrada. Além disso, todas as implementações das extensões cegas da largura de banda (cf., por exemplo, referências [1], [3], [4], [5], [9] e [10]) são otimizadas exclusivamente para sinais de linguagem e é improvável que produzam uma qualidade satisfatória em outra entrada como música (que ainda é observado em algumas publicações). Finalmente, a maioria das realizações da extensão da largura de banda convencional são relativamente complexas, empregando transformadas de Fourier, cálculos de filtro LPC, ou quantização de vetor na informação de lado. Isso pode causar uma desvantagem na adoção da nova tecnologia de codificação no mercado de telecomunicação móvel, uma vez que a maioria dos dispositivos móveis oferece poder computacional muito limitado.
[0125] Para melhor concluir, as aplicações de acordo com a invenção criam um codificador de áudio ou um método para codificação de áudio ou um programa de computador relacionado, conforme descrito acima.
[0126] Outras aplicações, de acordo com a invenção, criam um decodificador de áudio ou método de decodificação de áudio ou um programa de computador relacionado, conforme descrito acima.
[0127] Aplicações adicionais, de acordo com a invenção, criam um sinal de áudio codificado ou uma midia de armazenamento tendo armazenado o sinal de áudio codificado, conforme descrito acima. 9. Alternativas de Implementação
[0128] Embora alguns aspectos tenham sido descritos no contexto de um aparelho, é evidente que esses aspectos representam também uma descrição do método correspondente, no qual um bloco ou dispositivo corresponde a uma etapa do método ou a uma característica de uma etapa do método. De maneira análoga, os aspectos descritos no contexto de uma etapa do método também representam uma descrição de um bloco correspondente ou item ou característica de um aparelho correspondente. Alguns ou todos os passos do método podem ser executados por um (ou com um) aparelho de hardware, como um microprocessador, um computador programável ou um circuito eletrônico. Em algumas aplicações, alguns ou mais os métodos mais importantes podem ser executados por tal aparelho.
[0129] O sinal de áudio codificado inventivo pode ser armazenado em uma midia de armazenamento digital ou pode ser transmitido por meio de uma midia de transmissão, tal como uma midia de transmissão sem fios ou de uma midia de transmissão com fios, tal como a Internet.
[0130] Dependendo de certos requisitos das implementações, aplicações da invenção podem ser implementadas em hardware ou em software. A implementação pode ser realizada utilizando uma midia de armazenamento digital, por exemplo, um disquete, um DVD, um Blu-Ray, um CD, uma ROM, uma PROM, uma EPROM, uma EEPROM ou uma memória FLASH, tendo sinais de controle eletronicamente legiveis armazenados nela, os quais cooperam (ou são capazes de cooperar) com um sistema de computador programável, de modo que o respectivo método seja realizado. Portanto, a midia de armazenamento digital pode ser legivel por computador.
[0131] Algumas aplicações, de acordo com a invenção, compreendem um suporte de dados com sinais de controle eletronicamente legiveis, que são capazes de cooperar com um sistema de computador programável, de modo que um dos métodos descritos aqui seja realizado.
[0132] Geralmente, as aplicações da presente invenção podem ser implementadas como um produto de programa de computador com um código de programa, o código de programa sendo operativo para executar um dos métodos quando o produto de programa de computador rodar em um computador. 0 código de programa pode, por exemplo, ser armazenado em uma máquina legivel transportadora.
[0133] Outras aplicações compreendem o programa de computador para executar os métodos descritos aqui, armazenados em uma transportadora legivel por máquina.
[0134] Em outras palavras, uma aplicação do método inventivo é, portanto, um programa de computador com um código de programa para executar um dos métodos aqui descritos, quando o programa de computador rodar em um computador.
[0135] Outra aplicação dos métodos inventivos é, portanto, um suporte de dados (ou uma midia de armazenamento digital, ou uma midia legivel por computador) que compreende, nele gravado, o programa de computador para executar um dos métodos aqui descritos. O suporte de dados, a midia de armazenamento digital ou a midia gravada são normalmente tangiveis e/ou não transitórios.
[0136] Outra aplicação do método inventivo da invenção é, portanto, uma corrente de dados ou uma sequência de sinais, que representam o programa de computador para executar um dos métodos aqui descritos. O fluxo de dados ou a sequência de sinais pode, por exemplo, ser configurada para ser transferida por meio de uma conexão de comunicação de dados, por exemplo, via Internet.
[0137] Outra aplicação compreende um meio de processamento, por exemplo, um computador, ou dispositivo lógico programável, configurado ou adaptado para executar um dos métodos aqui descritos.
[0138] Outra aplicação compreende um computador tendo nele instalado o programa de computador para executar um dos métodos aqui descritos.
[0139] Outra aplicação, de acordo com a invenção, compreende um aparelho ou um sistema configurado para transferir (por exemplo, eletronicamente ou opticamente) um programa de computador para executar de um dos métodos descritos aqui para um receptor. O receptor pode, por exemplo, ser um computador, um dispositivo móvel, um dispositivo de memória, ou similar. O aparelho ou sistema pode, por exemplo, compreender um servidor de arquivos para transferir o programa de computador para o receptor.
[0140] Em algumas aplicações, um dispositivo lógico programável (por exemplo, um arranjo de portas programável em campo) pode ser utilizado para executar algumas ou todas as funcionalidades dos métodos aqui descritos. Em algumas aplicações, um arranjo de portas programável em campo pode cooperar com um microprocessador para executar um dos métodos aqui descritos. Geralmente, os métodos são executados preferencialmente por qualquer aparelho de hardware.
[0141] 0 aparelho aqui descrito pode ser implementado utilizando um aparelho de hardware, ou utilizando um computador, ou utilizando uma combinação de um aparelho de hardware e um computador.
[0142] Os métodos aqui descritos podem ser executados utilizando um aparelho de hardware, ou utilizando um computador, ou utilizando uma combinação de um aparelho de hardware e um computador.
[0143] As aplicações descritas acima são meramente ilustrativas para principios da presente invenção. Entende-se ■ que modificações e variações dos acordos e que os detalhes aqui descritos serão evidentes para outros especialistas na técnica. É a intenção, portanto, serem limitados apenas pelo escopo das reivindicações da patente iminentes e não pelos detalhes específicos apresentados a titulo de descrição e explicação das aplicações contidas aqui.
[0144] Referências
[0145] [1] B. Bessette et al., "The Adaptive Multirate Wideband Speech Codec (AMR-WB)," IEEE Trans, on Speech and Audio Processing, Vol. 10, No. 8, Nov. 2002.
[0146] [2] B. Geiser et al., "Bandwidth Extension for Hierarchical Speech and Audio Coding in ITU-T Rec. G.729.1," IEEE Trans. on Audio, Speech, and Language Processing, Vol. 15, No. 8, Nov. 2007.
[0147] [3] B. Iser, W. Minker, and G. Schmidt, Bandwidth Extension of Speech Signals, Springer Lecture Notes in Electrical Engineering, Vol. 13, New York, 2008.
[0148] [4] M. Jelinek and R. Salami, "Wideband Speech Coding Advances in VMR-WB Standard," IEEE Trans, on Audio, Speech, and Language Processing, Vol. 15, No. 4, May 2007.
[0149] [5] I. Katsir, I. Cohen, and D. Malah, "Speech Bandwidth Extension Based on Speech Phonetic Content and Speaker Vocal Tract Shape Estimation," in Proc. EUSIPCO 2011, Barcelona, Spain, Sep. 2011.
[0150] [6] E. Larsen and R. M. Aarts, Audio Bandwidth Extension: Application of Psychoacoustics, Signal Processing and Loudspeaker Design, Wiley, New York, 2004.
[0151] [7] J. Mâkinen et al., "AMR-WB+: A New Audio Coding Standard for 3rd Generation Mobile Audio Services," in Proc. ICASSP 2005, Philadelphia, USA, Mar. 2005.
[0152] [8] M. Neuendorf et al., "MPEG Unified Speech and Audio Coding - The ISO/MPEG Standard for High-Efficiency Audio Coding of All Content Types," in Proc. 132nd AES Convention, Budapest, Hungary, Apr. 2012. Also appears in the Journal of the AES, 2013.
[0153] [9] H. Pulakka and P. Alku, "Bandwidth Extension of Telephone Speech Using a Neural Network and a Filter Bank Implementation for Highband Mel Spectrum," IEEE Trans, on Audio, Speech, and Language Processing, Vol. 19, No. 7, Sep. 2011.
[0154] [10] T. Vaillancourt et al., "ITU- T EV-VBR: A Robust 8-32 kbit/s Scalable Coder for Error Prone Telecommunications Channels," in Proc. EUSIPCO 2008, Lausanne, Switzerland, Aug. 2008.
[0155] [11] L. Miao et al., "G.711.1 Annex D and G.722 Annex B: New ITU-T Superwideband codecs," in Proc. ICASSP 2011, Prague, Czech Republic, May 2011.

Claims (34)

1. Um codificador de áudio (100; 200) para fornecer uma informação de áudio codificado (112; 212) com base em uma informação de áudio de entrada (110; 210), o codificador de áudio compreendendo: um codificador de baixa frequência (120; 220) configurado para codificar uma parte de baixa frequência da informação de áudio de entrada para obter uma representação codificada (122; 222) da parte de baixa frequência; e um fornecedor de informação da extensão da largura de banda (130; 230) configurado para fornecer informação da extensão da largura de banda (132; 232) com base na informação de áudio de entrada; caracterizado pelo codificador de áudio ser configurado para incluir seletivamente a informação da extensão da largura e banda na informação de áudio codificado em um modo adaptável ao sinal; em que o áudio codificado compreende um sensor (240) configurado para identificar partes da informação de áudio de entrada para as quais os parâmetros da extensão da largura de banda não podem ser estimados com base na parte de baixa frequência com uma precisão suficiente ou desejada; e em que o codificador de áudio é configurado para incluir seletivamente a informação da extensão da largura de banda na informação de áudio codificado para partes da informação de áudio de entrada identificadas pelo sensor.
2. O codificador de áudio (100; 200) de acordo com a reivindicação 1, caracterizado pelo codificador de áudio compreender um sensor (240) configurado para identificar partes da informação de áudio de entrada que não podem ser decodificadas com uma qualidade suficiente ou desejada com base na representação codificada da parte de baixa frequência, e uma extensão cega da largura de banda; e em que o codificador de áudio é configurado para incluir seletivamente a informação da extensão da largura de banda na informação de áudio codificado para partes da informação de áudio de entrada identificadas pelo sensor.
3. O codificador de áudio (100; 200) de acordo com uma das reivindicações de 1 a 2, caracterizado pelo codificador de áudio compreender um sensor (240) configurado para identificar partes da informação de áudio de entrada na dependência da possibilidade de as partes serem partes temporariamente estacionárias e na dependência da possibilidade de as partes terem um caráter de passa-baixa; e em que o codificador de áudio é configurado para omitir seletivamente uma inclusão de informação da extensão da largura de banda na informação de áudio codificado para partes da informação de áudio de entrada identificadas pelo sensor como partes temporariamente estacionárias tendo um caráter de passa-baixa.
4. O codificador de áudio (100; 200) de acordo com a reivindicação 3, caracterizado pelo sensor ser configurado para identificar partes da informação de entrada de áudio na dependência da possibilidade de as partes compreenderem linguagem sonora, e/ou na dependência da possibilidade de as partes compreenderem ruído ambiente, e/ou na dependência da possibilidade de as partes compreenderem música sem instrumentação de percussão.
5. O áudio codificador (100; 200) de acordo com uma das reivindicações de 1 a 4, caracterizado pelo codificador de áudio compreender um sensor (240) configurado para identificar partes da informação de áudio de entrada na dependência da possibilidade de uma diferença entre um envelope espectral de uma parte de baixa frequência e um envelope espectral de uma parte de alta frequência ser maior que ou igual a uma diferença de medida predeterminada; e em que o codificador de áudio é configurado para incluir seletivamente a informação da extensão da largura de banda na informação de áudio codificado para partes da informação de áudio de entrada identificadas pelo sensor.
6. O codificador de áudio (100; 200) de acordo com a reivindicação 5, caracterizado pelo sensor ser configurado para identificar partes na dependência da possibilidade de as partes compreenderem linguagem não sonora, e/ou em que o sensor é configurado para identificar partes na dependência da possibilidade de as partes compreenderem sons de percussão.
7. O codificador de áudio (100; 200) de acordo com uma das reivindicações de 1 a 6, caracterizado pelo codificador de áudio compreender um sensor (240) configurado para determinar uma inclinação espectral das partes da informação de áudio de entrada, e para identificar partes da informação de áudio de entrada na dependência da possibilidade de a inclinação espectral determinada ser maior ou igual a um valor limiar de inclinação fixa ou variável; e em que o codificador de áudio é configurado para incluir seletivamente a informação da extensão da largura de banda na informação de áudio codificado para partes da informação de áudio de entrada identificadas pelo sensor.
8. O codificador de áudio (100; 200) de acordo com a reivindicação 7, caracterizado pelo sensor ser, ainda, configurado para determinar uma taxa de cruzamento zero de partes da informação de áudio de entrada, e para identificar partes da informação de áudio de entrada também na dependência da possibilidade de a taxa de cruzamento zero determinada ser maior ou igual a um valor limiar de taxa de cruzamento fixo ou variável ou na dependência da possibilidade de a taxa de cruzamento zero compreender uma mudança temporal que excede um valor limiar de mudança de taxa de cruzamento zero.
9. O codificador de áudio (100; 200) de acordo com uma das reivindicações de 2 a 8, caracterizado pelo sensor (240) ser configurado para aplicar uma histerese para identificar partes de sinal da informação de áudio de entrada, para reduzir um número de transições entre partes de sinal identificadas e partes de sinal não identificadas.
10. O codificador de áudio (100; 200) de acordo com uma das reivindicações de 1 a 9, caracterizado pelo codificador de áudio ser configurado para incluir seletivamente parâmetros representando um envelope espectral de uma parte de alta frequência da informação de áudio de entrada na informação de áudio codificado em um modo adaptável ao sinal como a informação da extensão da largura de banda.
11. O codificador de áudio (100; 200) de acordo com uma das reivindicações de 1 a 10, caracterizado pelo codificador de baixa frequência ser configurado para codificar uma parte de baixa frequência da informação de áudio, compreendendo frequências de até uma frequência máxima que se está em uma faixa entre 6 e 7 kHz, e em que o codificador de áudio é configurado para incluir seletivamente na representação de áudio codificado entre três e cinco parâmetros descrevendo intensidades de partes de sinal de alta frequência tendo larguras de banda entre 300 Hz e 500 Hz.
12. O codificador de áudio (100; 200) de acordo com a reivindicação 11, caracterizado pelo codificador de áudio ser configurado para incluir seletivamente na representação de áudio codificado 4 parâmetros escalares quantizados descrevendo intensidades de quatro partes de sinal de alta frequência, as partes de sinal de alta frequência cobrindo faixas de frequência acima da parte de baixa frequência.
13. O codificador de áudio (100; 200) de acordo com a reivindicação 11 ou a reivindicação 12, caracterizado pelo codificador de áudio ser configurado para incluir seletivamente na representação de áudio codificado uma pluralidade de parâmetros descrevendo uma relação entre energias ou intensidades das partes de frequência espectralmente adjacentes, em que um dos parâmetros descreve uma relação ou diferença entre uma energia ou intensidade da primeira parte de alta frequência da extensão da largura de banda e uma parte de baixa frequência, e em que outro dos parâmetros descreve relações ou diferenças entre energia ou intensidades de outras partes de alta frequência da extensão da largura de banda.
14. Um codificador de áudio (400; 500) para fornecer uma informação de áudio decodificado (412; 512) com base em uma informação de áudio codificado (410; 510), o decodificador de áudio compreendendo: um decodificador de baixa frequência (420; 520) configurado para decodificar uma representação codificada de uma parte de baixa frequência para obter uma representação decodificada (422; 522) da parte de baixa frequência; e uma extensão da largura de banda (430; 530) configurada para obter um sinal da extensão da largura de banda (432; 532) usando uma extensão cega da largura de banda para partes de um conteúdo de áudio para que parâmetros da extensão da largura de banda não sejam incluídos na informação de áudio codificado, e para obter o sinal da extensão da largura de banda usando uma extensão da largura de banda guiada por parâmetro para partes do conteúdo de áudio, para que parâmetros da extensão da largura de banda sejam incluídos na informação de áudio codificado; caracterizado pelo codificador de áudio ser configurado para decidir se o uso da extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro com base na representação codificada da parte de baixa frequência sem avaliar um modo de indicador de sinalização da extensão da largura de banda.
15. O codificador de áudio (400; 500) de acordo com a reivindicação 14, caracterizado pelo decodificador de áudio ser configurado para decidir se obtém o sinal da extensão da largura de banda usando uma extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro em uma base de quadro-a-quadro.
16. O codificador de áudio (400; 500) de acordo com a reivindicação 14 ou reivindicação 15, caracterizado pelo decodificador de áudio ser configurado para alterar entre um uso de uma extensão cega da largura de banda e uma extensão da largura de banda guiada por parâmetro dentro de uma parte contígua do conteúdo de áudio.
17. O decodificador de áudio (400; 500) de acordo com uma das reivindicações de 14 a 16, caracterizado pelo decodificador de áudio ser configurado para avaliar os indicadores incluídos na informação de áudio codificado para partes diferentes do conteúdo de áudio, para decidir se deve utilizar uma extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro.
18. O decodificador de áudio (400; 500) de acordo com uma das reivindicações de 14 a 17, caracterizado pelo decodificador de áudio ser configurado para decidir se deve utilizar uma extensão cega da largura da banda ou uma extensão da largura de banda guiada por parâmetro com base em uma ou mais características da representação decodificada da parte de baixa frequência.
19. O decodificador de áudio (400; 500) de acordo com uma das reivindicações de 14 a 18, caracterizado pelo decodificador de áudio ser configurado para decidir se deve utilizar uma extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro com base em coeficientes de previsão linear e/ou com base nas estatísticas no domínio do tempo da representação decodificada da parte de baixa frequência.
20. O decodificador de áudio (400; 500) de acordo com uma das reivindicações de 14 a 19, caracterizado pela extensão da largura de banda ser configurada para obter o sinal da extensão da largura de banda usando uma ou mais características da representação decodificada da parte de baixa frequência e/ou usando um ou mais parâmetros do decodificador de baixa frequência para partes temporais de conteúdo de áudio da entrada para que parâmetros de extensão da largura de banda não sejam incluídos na informação de áudio codificado.
21. O decodificador de áudio (400; 500) de acordo com uma das reivindicações de 14 a 20, caracterizado pela extensão da largura de banda ser configurada para obter o sinal de extensão da largura de banda usando uma informação centroide espectral e/ou usando uma informação de energia, e/ou usando uma informação de inclinação, e/ou usando coeficientes do filtro para partes temporais do conteúdo de áudio da entrada, para que parâmetros da extensão da largura de banda não sejam incluídos na informação de áudio codificado.
22. O decodificador de áudio (400; 500) de acordo com uma das reivindicações de 14 a 21, caracterizado pela extensão da largura de banda ser configurada para obter o sinal da extensão da largura de banda usando parâmetros de fluxo de bits descrevendo um envelope espectral da parte de alta frequência para partes temporais do conteúdo de áudio, para que os parâmetros da extensão da largura de banda sejam incluídas na informação de áudio codificado.
23. O decodificador de áudio (400; 500) de acordo com a reivindicação 22, caracterizado pela extensão da largura de banda ser configurada para avaliar entre três e cinco parâmetros de fluxo de bits descrevendo intensidades de partes de sinal de alta frequência tendo largura de banda entre 300 Hz e 500 Hz, a fim de obter o sinal da extensão da largura de banda.
24. O decodificador de áudio (400; 500) de acordo com a reivindicação 23, caracterizado por entre três e cinco parâmetros de fluxo de bits descrevendo intensidades das partes de sinal de alta frequência serem quantizados escalares com 2 ou 3 bits de resolução, de modo que haja entre 6 e 15 bits de parâmetros de formulação espectral da extensão da largura de banda por quadro de áudio.
25. O decodificador de áudio (400; 500) de acordo com uma das reivindicações de 14 a 24, caracterizado pela extensão da largura de banda ser configurada para realizar um nivelamento de energias do sinal da extensão da largura de banda quando alterado da extensão cega da largura de banda para a extensão da largura de banda guiada por parâmetro e/ou quando alterado da extensão da largura de banda guiada por parâmetro para a extensão cega da largura de banda.
26. O decodificador de áudio (400; 500) de acordo com a reivindicação 25, caracterizado pela extensão da largura de banda ser configurada para amortecer a parte de alta frequência do sinal da extensão da largura de banda para uma parte do conteúdo de áudio na qual uma extensão da largura de banda guiada por parâmetro é aplicada após uma parte do conteúdo de áudio na qual uma extensão cega da largura de banda é aplicada; e em que a extensão da largura de banda é configurada para reduzir um amortecimento ou aumentar um nível para a parte de alta frequência do sinal da extensão da largura de banda para uma parte do conteúdo de áudio na qual uma extensão da largura de banda é aplicada após uma parte de conteúdo de áudio na qual uma extensão da largura de banda guiada por parâmetro é aplicada.
27. Um método (600) para fornecer uma informação de áudio codificado com base em uma informação de áudio de entrada, o método compreendendo: codificar (610) uma parte de baixa frequência da informação de áudio de entrada para obter uma representação codificada da parte de baixa frequência; e fornecer (620) informação da extensão da largura de banda com base na informação de áudio; caracterizado pela informação da extensão da largura de banda ser incluída seletivamente na informação de áudio codificado em um modo adaptável ao sinal; em que o método compreende identificar partes da informação de áudio de entrada para que parâmetros da extensão da largura de banda não possam ser estimados com base na parte de baixa frequência com uma precisão suficiente ou desejada; e em que o método compreende informação da extensão da largura de banda incluída seletivamente na informação de áudio codificado para partes identificadas da informação de áudio de entrada.
28. Um método (700) para fornecer uma informação de áudio decodificado com base em uma informação de áudio codificado, o método compreendendo: decodificar (710) uma representação codificada de uma para de baixa frequência para obter uma representação decodificada da parte de baixa frequência; e obter (720) um sinal da extensão da largura de banda usando uma extensão cega da largura de banda para partes de um conteúdo de áudio, para que parâmetros de extensão da largura de banda não sejam incluídos na informação de áudio codificado, e obter (730) o sinal da extensão da largura de banda usando uma extensão da largura de banda guiada por parâmetros para partes do conteúdo de áudio, para que parâmetros da extensão da largura de banda sejam incluídos na informação de áudio codificado; caracterizado pelo método compreender decidir se usa uma extensão cega da largura de banda ou uma extensão da largura de banda guiada por parâmetro com base na representação codificada da parte de baixa frequência sem avaliar um modo dos indicadores de sinalização da extensão da largura de banda.
29. Um codificador de áudio (100; 200) para fornecer uma informação de áudio codificado (112; 212) com base em uma informação de áudio de entrada (110; 210), o codificador de áudio compreendendo: um codificador de baixa frequência (120; 220) configurado para codificar uma parte de baixa frequência da informação de áudio de entrada para obter uma representação codificada (122; 222) da parte de baixa frequência; e um fornecedor de informação da extensão da largura de banda (130; 230) configurado para fornecer informação da extensão da largura de banda (132; 232) com base na informação de áudio de entrada; caracterizado pelo áudio codificado ser configurado para incluir seletivamente informação da extensão da largura de banda na informação de áudio codificado em um modo adaptável ao sinal; em que o codificador de áudio compreende um sensor (240) configurado para identificar partes de informação de entrada de áudio na dependência da possibilidade de uma diferença entre um envelope espectral de uma parte de baixa frequência e um envelope espectral de uma parte de alta frequência ser maior ou igual a uma medida diferente predeterminada; e em que um codificador de áudio é configurado para incluir seletivamente informação da extensão da largura de banda em uma informação de áudio codificado para partes da informação de áudio de entrada identificadas pelo sensor.
30. Um codificador de áudio (100; 200) para fornecer uma informação de áudio codificado (112; 212) com base em uma informação de áudio de entrada (110; 210), o codificador de áudio compreendendo: um codificador de baixa frequência (120; 220) configurado para codificar uma parte de baixa frequência da informação de áudio de entrada para obter uma representação codificada (122; 222) da parte de baixa frequência; e um fornecedor de informação da extensão da largura de banda (130; 230) configurado para fornecer informação da extensão da largura de banda (132; 232) com base na informação de áudio de entrada. caracterizado pelo codificador de áudio ser configurado para incluir seletivamente a informação da extensão da largura de banda na informação de áudio codificado em um modo adaptável ao sinal; em que o codificador de áudio compreende um sensor (240) configurado para determinar uma inclinação espectral de partes da informação de áudio, e para identificar partes da informação de áudio na dependência da possibilidade de a inclinação espectral determinada ser maior ou igual a um valor limiar de inclinação fixa ou variável; e em que o codificador de áudio é configurado para incluir seletivamente a informação da extensão da largura de banda na informação de áudio codificado para partes da informação de áudio de entrada identificadas pelo sensor.
31. Um decodificador de áudio (400; 500) para fornecer uma informação de áudio decodificado (412; 512) com base em uma informação de áudio codificado (410; 510), o decodificador de áudio compreendendo: um decodificador de baixa frequência (420; 520) configurado para decodificar uma representação codificada de uma parte de baixa frequência para obter uma representação decodificada (422; 522) da parte de baixa frequência; e uma extensão da largura de banda (430; 530) configurada para obter um sinal da extensão da largura de banda (432; 532) usando uma extensão cega da largura de banda para partes de um conteúdo de áudio, para que os parâmetros da extensão da largura de banda não sejam incluídos na informação codificada, e para obter o sinal da extensão da largura de banda usando uma extensão da largura de banda guiada por parâmetro para partes do conteúdo de áudio, para que os parâmetros da extensão da largura de banda sejam incluídos na informação de áudio codificado; caracterizado pela extensão da largura de banda ser configurada para realizar um nivelamento de energias do sinal da extensão da largura de banda quando alterado da extensão cega da largura de banda para a extensão da largura de banda guiada por parâmetros e/ou quando alterado da extensão da largura de banda guiada por parâmetro para a extensão cega da largura de banda; em que a extensão da largura de banda é configurada para amortecer uma parte de alta frequência do sinal da extensão da largura de banda para uma parte do conteúdo de áudio para que uma extensão da largura de banda guiada por parâmetro seja aplicada após uma parte do conteúdo de áudio na qual uma extensão cega da largura de banda ser aplicada; e em que a extensão da largura de banda é configurada para reduzir um amortecimento ou aumentar um nível para uma parte de alta frequência do sinal da extensão da largura de banda para uma parte do conteúdo de áudio na qual uma extensão cega da largura de banda é aplicada após uma parte do conteúdo de áudio na qual a extensão da largura de banda guiada por parâmetro ser aplicada.
32. Um método (600) para fornecer uma informação de áudio codificado com base em uma informação de áudio de entrada, o método compreendendo: codificar (610) uma parte de baixa frequência da informação de áudio de entrada para obter uma representação codificada da parte de baixa frequência; e fornecer (620) informação da extensão da largura de banda com base na informação de áudio de entrada; caracterizado pela informação da extensão da largura de banda ser incluída seletivamente na informação de áudio codificado em um modo adaptável ao sinal; em que o método compreende partes identificativas da informação de áudio de entrada na dependência da possibilidade de uma diferença entre um envelope espectral de uma parte de baixa frequência e um envelope espectral de uma parte de alta frequência ser maior ou igual a uma diferença de medida predeterminada; e em que o método compreende incluir seletivamente a informação da extensão da largura de banda na informação do áudio codificado para partes identificadas da informação de áudio de entrada.
33. Um método (600) para fornecer uma informação de áudio codificado com base em uma informação de áudio de entrada, o método compreendendo: codificar (610) uma parte de baixa frequência da informação de áudio de entrada para obter uma representação codificada da parte de baixa frequência; e fornecer (620) informação da extensão da largura de banda com base na informação de áudio de entrada; caracterizado pela informação da extensão da largura de banda ser incluída seletivamente na informação de áudio codificado em um modo adaptável ao sinal; em que o método compreende determinar uma inclinação espectral das partes de uma informação de áudio de entrada, e identificar partes da informação de áudio de entrada na dependência da possibilidade de a inclinação espectral determinada ser maior ou igual a um valor limiar de inclinação fixa ou variável; e em que o método compreende incluir seletivamente a informação da extensão da largura de banda na informação do áudio codificado para partes identificadas da informação de áudio de entrada.
34. Um método (700) para fornecer uma informação de áudio codificado com base na informação de áudio decodificado, o método compreendendo: decodificar (710) uma representação codificada de uma parte de baixa frequência para obter uma representação decodificada da parte de baixa frequência; e obter (720) um sinal de extensão da largura de banda usando uma extensão cega da largura de banda para partes de um conteúdo de áudio para que parâmetros da extensão da largura de banda não sejam incluídos na informação de áudio codificado, e obter (730) o sinal da extensão da largura de banda usando uma extensão da largura de banda guiada por parâmetro para partes do conteúdo de áudio para que parâmetros da extensão da largura de banda sejam incluídos na informação de áudio codificado; caracterizado pelo método compreender realizar um nivelamento de energias do sinal da extensão da largura de banda quando alterado da extensão cega da largura de banda para a extensão da largura de banda guiada por parâmetro e/ou quando alterado da extensão da largura de banda guiada por parâmetro para a extensão cega da largura de banda; em que o método compreende amortecer uma parte de alta frequência do sinal da extensão da largura de banda para uma parte do conteúdo de áudio na qual uma extensão da largura de banda guiada por parâmetro é aplicada após uma parte do conteúdo de áudio na qual uma extensão cega da largura de banda ser aplicada; e em que o método compreende reduzir um amortecimento ou aumentar um nível para uma parte de alta frequência do sinal da extensão da largura de banda para uma parte do conteúdo de áudio na qual uma extensão cega da largura de banda é aplicada após uma parte do conteúdo de áudio na qual uma extensão da largura de banda guiada por parâmetro ser aplicada.
BR112015017753-0A 2013-01-29 2014-01-28 Codificador de áudio, decodificador de áudio, método para fornecer uma informação de áudio codificado, método para fornecer uma informação de áudio decodificado, programa de computador e representação codificada utilizando uma extensão da largura de banda adaptável ao sinal. BR112015017753B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361758205P 2013-01-29 2013-01-29
US61/758,205 2013-01-29
PCT/EP2014/051641 WO2014118185A1 (en) 2013-01-29 2014-01-28 Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension

Publications (2)

Publication Number Publication Date
BR112015017753A2 BR112015017753A2 (pt) 2018-05-02
BR112015017753B1 true BR112015017753B1 (pt) 2022-05-31

Family

ID=50029037

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112015017753-0A BR112015017753B1 (pt) 2013-01-29 2014-01-28 Codificador de áudio, decodificador de áudio, método para fornecer uma informação de áudio codificado, método para fornecer uma informação de áudio decodificado, programa de computador e representação codificada utilizando uma extensão da largura de banda adaptável ao sinal.

Country Status (20)

Country Link
US (1) US9646624B2 (pt)
EP (4) EP3067890B1 (pt)
JP (1) JP6239007B2 (pt)
KR (1) KR101771828B1 (pt)
CN (2) CN105264599B (pt)
AR (2) AR094681A1 (pt)
AU (1) AU2014211479B2 (pt)
BR (1) BR112015017753B1 (pt)
CA (4) CA2985115C (pt)
ES (4) ES2959240T3 (pt)
HK (1) HK1218179A1 (pt)
MX (1) MX347062B (pt)
MY (1) MY185176A (pt)
PL (4) PL3070713T3 (pt)
PT (3) PT3070713T (pt)
RU (1) RU2641461C2 (pt)
SG (1) SG11201505912QA (pt)
TW (1) TWI533288B (pt)
WO (1) WO2014118185A1 (pt)
ZA (1) ZA201506312B (pt)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9886959B2 (en) * 2005-02-11 2018-02-06 Open Invention Network Llc Method and system for low bit rate voice encoding and decoding applicable for any reduced bandwidth requirements including wireless
KR101261677B1 (ko) 2008-07-14 2013-05-06 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
SG11201505903UA (en) * 2013-01-29 2015-08-28 Fraunhofer Ges Forschung Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program
EP2830059A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling energy adjustment
TW202242853A (zh) 2015-03-13 2022-11-01 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10049684B2 (en) * 2015-04-05 2018-08-14 Qualcomm Incorporated Audio bandwidth selection
CN106294331B (zh) 2015-05-11 2020-01-21 阿里巴巴集团控股有限公司 音频信息检索方法及装置
EP3288031A1 (en) * 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using a compensation value
GB201620317D0 (en) * 2016-11-30 2017-01-11 Microsoft Technology Licensing Llc Audio signal processing
TWI807562B (zh) 2017-03-23 2023-07-01 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
EP3382702A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to an artificial bandwidth limitation processing of an audio signal
US10650806B2 (en) 2018-04-23 2020-05-12 Cerence Operating Company System and method for discriminative training of regression deep neural networks
US11570849B2 (en) * 2018-12-06 2023-01-31 Schneider Electric Systems Usa, Inc. Wireless instrument area network node with internal force sensor
KR20210003507A (ko) * 2019-07-02 2021-01-12 한국전자통신연구원 오디오 코딩을 위한 잔차 신호 처리 방법 및 오디오 처리 장치
US20230345195A1 (en) * 2020-06-22 2023-10-26 Sony Group Corporation Signal processing apparatus, method, and program
CN112019282B (zh) * 2020-08-13 2022-10-28 西安烽火电子科技有限责任公司 一种短波时变信道衰落带宽估计方法
CN112669860B (zh) * 2020-12-29 2022-12-09 北京百瑞互联技术有限公司 一种增加lc3音频编解码有效带宽的方法及装置
CN113035211B (zh) * 2021-03-11 2021-11-16 马上消费金融股份有限公司 音频压缩方法、音频解压缩方法及装置
WO2024080597A1 (ko) * 2022-10-12 2024-04-18 삼성전자주식회사 오디오 비트스트림을 적응적으로 처리하는 전자 장치, 방법, 및 비일시적 컴퓨터 판독가능 저장 매체

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8901032A (nl) 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
JPH0758629B2 (ja) * 1989-08-24 1995-06-21 矢崎総業株式会社 端子係止具付コネクタ
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
US7469206B2 (en) * 2001-11-29 2008-12-23 Coding Technologies Ab Methods for improving high frequency reconstruction
KR101271069B1 (ko) * 2005-03-30 2013-06-04 돌비 인터네셔널 에이비 다중채널 오디오 인코더 및 디코더와, 인코딩 및 디코딩 방법
TWI319565B (en) * 2005-04-01 2010-01-11 Qualcomm Inc Methods, and apparatus for generating highband excitation signal
US9043214B2 (en) 2005-04-22 2015-05-26 Qualcomm Incorporated Systems, methods, and apparatus for gain factor attenuation
US7610197B2 (en) * 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
US7953605B2 (en) 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
US7835904B2 (en) * 2006-03-03 2010-11-16 Microsoft Corp. Perceptual, scalable audio compression
KR20070115637A (ko) * 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
RU2455709C2 (ru) * 2008-03-03 2012-07-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для обработки аудиосигнала
BRPI0910511B1 (pt) * 2008-07-11 2021-06-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para decodificar e codificar um sinal de áudio
PL4231290T3 (pl) * 2008-12-15 2024-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
CN101521014B (zh) * 2009-04-08 2011-09-14 武汉大学 音频带宽扩展编解码装置
PL2273493T3 (pl) * 2009-06-29 2013-07-31 Fraunhofer Ges Forschung Kodowanie i dekodowanie z rozszerzaniem szerokości pasma
CN102612712B (zh) * 2009-11-19 2014-03-12 瑞典爱立信有限公司 低频带音频信号的带宽扩展
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
CA2903681C (en) * 2011-02-14 2017-03-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
CN102543086B (zh) * 2011-12-16 2013-08-14 大连理工大学 一种基于音频水印的语音带宽扩展的装置和方法

Also Published As

Publication number Publication date
TW201443883A (zh) 2014-11-16
PL3067890T3 (pl) 2018-06-29
CN105264599B (zh) 2019-05-10
PT3067890T (pt) 2018-03-08
HK1218179A1 (zh) 2017-02-03
CA2985121A1 (en) 2014-08-07
AU2014211479B2 (en) 2017-02-23
EP3054446A1 (en) 2016-08-10
JP6239007B2 (ja) 2017-11-29
ES2664185T3 (es) 2018-04-18
EP3070713A1 (en) 2016-09-21
WO2014118185A1 (en) 2014-08-07
TWI533288B (zh) 2016-05-11
EP3070713B1 (en) 2018-01-17
EP2951822A1 (en) 2015-12-09
CA2898637C (en) 2020-06-16
US20150332702A1 (en) 2015-11-19
CN105264599A (zh) 2016-01-20
PL3054446T3 (pl) 2024-02-19
AR115823A2 (es) 2021-03-03
CA2985121C (en) 2019-03-12
EP2951822B1 (en) 2019-11-13
RU2641461C2 (ru) 2018-01-17
US9646624B2 (en) 2017-05-09
BR112015017753A2 (pt) 2018-05-02
ES2659177T3 (es) 2018-03-14
CN110111801B (zh) 2023-11-10
CA2985115C (en) 2019-02-19
PL2951822T3 (pl) 2020-06-29
PL3070713T3 (pl) 2018-07-31
CA2985105A1 (en) 2014-08-07
CA2985115A1 (en) 2014-08-07
ZA201506312B (en) 2016-12-21
PT3070713T (pt) 2018-04-24
AU2014211479A1 (en) 2015-09-10
KR101771828B1 (ko) 2017-08-25
AR094681A1 (es) 2015-08-19
RU2015136792A (ru) 2017-03-10
MY185176A (en) 2021-04-30
KR20150114979A (ko) 2015-10-13
CA2985105C (en) 2019-03-12
MX2015009682A (es) 2015-11-30
CN110111801A (zh) 2019-08-09
MX347062B (es) 2017-04-10
EP3054446C0 (en) 2023-08-09
ES2768179T3 (es) 2020-06-22
EP3067890B1 (en) 2018-01-03
ES2959240T3 (es) 2024-02-22
SG11201505912QA (en) 2015-08-28
EP3054446B1 (en) 2023-08-09
CA2898637A1 (en) 2014-08-07
EP3067890A1 (en) 2016-09-14
PT2951822T (pt) 2020-02-05
JP2016509257A (ja) 2016-03-24

Similar Documents

Publication Publication Date Title
BR112015017753B1 (pt) Codificador de áudio, decodificador de áudio, método para fornecer uma informação de áudio codificado, método para fornecer uma informação de áudio decodificado, programa de computador e representação codificada utilizando uma extensão da largura de banda adaptável ao sinal.
RU2487428C2 (ru) Устройство и способ для вычисления числа огибающих спектра
BR112016009805B1 (pt) Decodificador áudio e método para fornecer uma informação de áudio decodificada utilizando uma dissimulação de erro que modifica um sinal de excitação de domínio de tempo
BR112016009819B1 (pt) Decodificador áudio e método para fornecer uma informação de áudio decodificada utilizando uma dissimulação de erro baseada em um sinal de excitação de domínio de tempo
TWI585754B (zh) 用以產生頻率增強音訊信號之解碼器與方法、用以產生編碼信號之編碼器與方法、以及電腦可讀媒體
BR122021000241B1 (pt) Aparelho de quantização de coeficientes de codificação preditiva linear
BR112015018040B1 (pt) Ênfase de baixa frequência para codificação com base em lpc em domínio de frequência
BR112020009034A2 (pt) controle de largura de banda em codificadores e/ou decodificadores

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B350 Update of information on the portal [chapter 15.35 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 28/01/2014, OBSERVADAS AS CONDICOES LEGAIS