BR112017018441B1 - Codificador de áudio para codificação de um sinal multicanal e decodificador de áudio para decodificação de um sinal de áudio codificado - Google Patents

Codificador de áudio para codificação de um sinal multicanal e decodificador de áudio para decodificação de um sinal de áudio codificado Download PDF

Info

Publication number
BR112017018441B1
BR112017018441B1 BR112017018441-9A BR112017018441A BR112017018441B1 BR 112017018441 B1 BR112017018441 B1 BR 112017018441B1 BR 112017018441 A BR112017018441 A BR 112017018441A BR 112017018441 B1 BR112017018441 B1 BR 112017018441B1
Authority
BR
Brazil
Prior art keywords
signal
channel
encoder
decoded
band
Prior art date
Application number
BR112017018441-9A
Other languages
English (en)
Other versions
BR112017018441A2 (pt
Inventor
Disch Sascha
Fuchs Guillaume
Ravelli Emmanuel
Neukam Christian
Schmidt Konstantin
Benndorf CONRAD
Niedermeier Andreas
Schubert Benjamin
Geiger Ralf
Original Assignee
Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. filed Critical Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V.
Publication of BR112017018441A2 publication Critical patent/BR112017018441A2/pt
Publication of BR112017018441B1 publication Critical patent/BR112017018441B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Abstract

CODIFICADOR DE ÁUDIO PARA CODIFICAÇÃO DE UM SINAL MULTICANAL E DECODIFICADOR DE ÁUDIO PARA DECODIFICAÇÃO DE UM SINAL DE ÁUDIO CODIFICADO. Um codificador de áudio 2? para codificação de um sinal multicanal 4 é mostrado. O codificador de áudio compreende um downmixer 12 para reduzir o sinal multicanal 4 para obter um sinal de downmix 14, um codificador central de domínio de previsão linear 16 para codificar o sinal de downmix 14, caracterizado pelo sinal de downmix 14 ter uma banda baixa e uma banda alta, em que o codificador central de domínio de previsão linear 16 é configurado para aplicar um processamento de extensão de largura de banda para parametricamente codificar a banda alta, um banco de filtro 82 para gerar uma representação espectral do sinal multicanal 4 e um codificador multicanal conjunto 18 configurado para processar a representação espectral, compreendendo a banda baixa e a banda alta do sinal multicanal para gerar a informação multicanal 20.

Description

RELATÓRIO DESCRITIVO
[0001] A presente invenção se refere a um codificador de áudio para codificação de um sinal de áudio multicanal e a um decodificador de áudio para decodificação de um sinal de áudio codificado. As aplicações se referem à codificação multicanal no modo LPD, utilizando um banco de filtro para processamento multicanal (DFT), que não é aquele utilizado para a extensão da largura de banda.
[0002] A codificação perceptual dos sinais de áudio para fins de redução de dados para armazenamento e transmissão eficientes destes sinais é uma prática amplamente utilizada. Em particular, quando é necessário alcançar uma eficiência mais alta, os codecs que são mais proximamente adaptados às características de entrada do sinal são utilizados. Um exemplo é o codec de núcleo USAC MPEG-D que pode ser configurado para predominantemente utilizar a codificação de ACELP (algebraic code-excited linear prediction | previsão linear excitada por código algébrica) nos sinais de fala, de TCX (transform coded excitation | excitação codificada de transformada) no ruído de fundo e sinais misturados e conteúdo de AAC (advanced audio coding | codificação de áudio avançada) no conteúdo de música. Todas as três configurações de codec interno podem ser instantaneamente comutadas em uma forma adaptativa de sinal em resposta ao conteúdo do sinal.
[0003] Além disso, técnicas de codificação multicanal conjunta (codificação Meio/Lateral, etc.) ou, para eficiência mais alta, técnicas de codificação paramétrica são empregadas. As técnicas de codificação paramétrica basicamente visam a recriação de um sinal de áudio equivalente perceptual do que uma reconstrução fiel de uma dada forma de onda. Exemplos abrangem preenchimento de ruído, extensão da largura de banda e codificação de áudio espacial.
[0004] Ao combinar um codificador de núcleo adaptativo de sinal e as técnicas de codificação multicanal conjunta ou codificação paramétrica nos codecs da técnica prévia, o codec central é comutado para combinar a característica do sinal, mas a escolha das técnicas de codificação multicanal, como M/S-Estéreo, a codificação de áudio espacial ou de estéreo paramétrico, permanece fixa e independente das características do sinal. Estas técnicas são geralmente empregadas ao codec central como um pré- processador ao codificador central e um pós-processador ao decodificador central, ambos sendo ignorantes na escolha real do codec central.
[0005] Por outro lado, a escolha das técnicas de codificação paramétrica para a extensão da largura de banda é, às vezes, feita dependente do sinal. Por exemplo, as técnicas aplicadas no domínio de tempo são mais eficientes para os sinais de fala enquanto um processamento de domínio de frequência é mais relevante para outros sinais. Neste caso, as técnicas de codificação multicanal adotadas devem ser compatíveis com ambos os tipos de técnicas de extensão de largura de banda.
[0006] Tópicos relevantes na técnica prévia compreendem: - PS e MPS como um pré-/pós-processador ao codec central de USAC MPEG-D; - Padrão USAC MPEG-D; - Padrão de Áudio MPEG-H 3D.
[0007] Em USAC MPEG-D, um codificador de núcleo comutável é descrito. Entretanto, em USAC, as técnicas de codificação multicanal são definidas como uma escolha fixa que é comum para todo codificador de núcleo, independentemente de sua comutação interna dos princípios de codificação sendo ACELP ou TCX (“LPD”) ou AAC (“FD”). Portanto, se uma configuração de codec central comutada for desejada, o codec é limitado para utilizar a codificação multicanal paramétrica (PS) por todo o sinal. Entretanto, para codificação, por exemplo, de sinais de música, teria sido mais adequado utilizar em vez disso uma codificação conjunta de estéreo que pode comutar dinamicamente entre o esquema L/R (left/right | esquerdo/direito) e M/S (mid/side | meio/lateral) por banda de frequência e por estrutura.
[0008] Portanto, há uma necessidade de uma abordagem melhorada.
[0009] É um objeto da presente invenção fornecer um conceito melhorado para processamento de um sinal de áudio. Este objeto é solucionado pelo assunto das reivindicações independentes.
[0010] A presente invenção se baseia na constatação de que um decodificador paramétrico (domínio de tempo), utilizando um codificador multicanal, é vantajoso para a codificação de áudio multicanal paramétrica. O codificador multicanal pode ser um codificador residual multicanal que pode reduzir uma largura de banda para transmissão dos parâmetros de codificação em comparação com uma codificação separada para cada canal. Isto pode ser vantajosamente utilizado, por exemplo, em combinação com um codificador conjunto de áudio multicanal de domínio de frequência. O domínio de tempo e as técnicas de codificação multicanal conjunta de domínio de frequência podem ser combinados, de modo que, por exemplo, uma decisão com base na estrutura possa direcionar uma estrutura atual a um período de codificação com base no tempo ou na frequência. Em outras palavras, as aplicações mostram um conceito melhorado para combinar um codec de núcleo comutável utilizando a codificação multicanal conjunta e a codificação de áudio espacial paramétrica em um codec perceptual completamente comutável que permite utilizar diferentes técnicas de codificação multicanal na dependência da escolha de um codificador de núcleo. Isto é vantajoso, pois, em contrapartida dos métodos já existentes, as aplicações mostram uma técnica de codificação multicanal que pode ser comutada instantaneamente junto com um codificador de núcleo e, portanto, ser proximamente combinada e adaptada à escolha do codificador de núcleo. Portanto, os problemas representados que aparecem devido a uma escolha fixa das técnicas de codificação multicanal podem ser evitados. Além disso, uma combinação completamente comutável de um dado codificador de núcleo e sua técnica de codificação multicanal associada e adaptada é permitida. Tal codificador, por exemplo, uma AAC (Codificação de Áudio Avançada), utilizando a codificação de estéreo L/R ou M/S, é, por exemplo, capaz de codificar um sinal musical no codificador de núcleo de domínio de frequência (FD) utilizando uma codificação conjunta estéreo ou multicanal dedicada, por exemplo, M/S estéreo. Esta decisão pode ser aplicada separadamente para cada banda de frequência em cada estrutura de áudio. No caso de, por exemplo, um sinal de fala, o codificador de núcleo pode instantaneamente comutar em um codificador de núcleo de decodificação de previsão linear (LPD | linear predictive decoding) e suas técnicas associadas diferentes, por exemplo, das técnicas de codificação estéreo paramétrica.
[0011] As aplicações mostram um processamento estéreo que é único para a passagem mono LPD e um esquema de comutação contínuo com base no sinal estéreo que combina a saída da passagem de FD estéreo com a do codificador de núcleo LPD e sua codificação estéreo dedicada. Isto é vantajoso, pois uma comutação de codec contínuo livre de perturbação é permitida.
[0012] As aplicações se referem a um codificador para codificação de um sinal multicanal. O codificador compreende um codificador de domínio de previsão linear e um codificador de domínio de frequência. Além disso, o codificador compreende um controlador para comutação entre o codificador de domínio de previsão linear e o codificador de domínio de frequência. Além disso, o codificador de domínio de previsão linear pode compreender um downmixer [misturador/redutor de sinal] para fazer o downmix [reduzir] do sinal multicanal para obter um sinal de downmix, um codificador de núcleo de domínio de previsão linear para codificar o sinal de downmix e um primeiro codificador multicanal para gerar a primeira informação multicanal do sinal multicanal. O codificador de domínio de frequência compreende um segundo codificador multicanal conjunto para gerar a segunda informação multicanal do sinal multicanal, em que o segundo codificador multicanal é diferente do primeiro codificador multicanal. O controlador é configurado tal que uma parte do sinal multicanal seja representada por uma estrutura codificada do codificador de domínio de previsão linear ou por uma estrutura codificada do codificador de domínio de frequência. O codificador de domínio de previsão linear pode compreender um codificador e núcleo de ACELP e, por exemplo, um algoritmo de codificação estéreo paramétrica como um primeiro codificador multicanal conjunto. O codificador de domínio de frequência pode compreender, por exemplo, um codificador de núcleo de AAC utilizando, por exemplo, um processamento de L/R ou M/S como um segundo codificador multicanal conjunto. O controlador pode analisar o sinal multicanal referente, por exemplo, às características de estrutura, como por exemplo, fala ou música e para decidir para cada estrutura ou uma sequência de estruturas ou uma parte do sinal de áudio multicanal se o codificador de domínio de previsão linear ou o codificador de domínio de frequência deve ser utilizado para codificar esta parte do sinal de áudio multicanal.
[0013] As aplicações mostram, ainda, um decodificador de áudio para decodificação de um sinal de áudio codificado. O decodificador de áudio compreende um decodificador de domínio de previsão linear e um decodificador de domínio de frequência. Além disso, o decodificador de áudio compreende um primeiro decodificador multicanal conjunto para gerar uma primeira representação multicanal utilizando uma saída do decodificador de domínio de previsão linear e utilizando a informação multicanal e um segundo decodificador multicanal para gerar uma segunda representação multicanal utilizando uma saída do decodificador de domínio de frequência e uma segunda informação multicanal. Além disso, o decodificador de áudio compreende um primeiro combinador para combinar a primeira representação multicanal e a segunda representação multicanal para obter um sinal de áudio codificado. O combinador pode realizar a comutação livre de perturbação contínua entre a primeira representação multicanal sendo, por exemplo, um sinal de áudio multicanal previsto linear e a segunda representação multicanal sendo, por exemplo, um sinal de áudio multicanal decodificado de domínio de frequência.
[0014] As aplicações mostram uma combinação da Codificação de ACELP/TCX em uma passagem de LPD com uma codificação estéreo dedicada e codificação estéreo AAC independente em uma passagem de domínio de frequência dentro de um codificador de áudio comutável. Além disso, as aplicações mostram uma comutação instantânea contínua entre estéreo de LPD e FD, em que aplicações adicionais se refere a uma escolha independente da codificação multicanal conjunta para diferentes tipos de conteúdo de sinal. Por exemplo, para fala que é predominantemente codificada utilizando a passagem de LPD, um estéreo paramétrico é utilizado, enquanto que para música que é codificada na passagem de FD, uma codificação estéreo mais adaptativa é utilizada, o que pode comutar dinamicamente entre o esquema de L/R e M/S por banda de frequência e por estrutura.
[0015] De acordo com as aplicações, para fala que é predominantemente codificada utilizando a passagem de LPD e que está geralmente localizado no centro da imagem estéreo, um estéreo paramétrico simples é adequado, enquanto que a música que é codificada na passagem de FD geralmente tem uma distribuição espacial mais sofisticada e pode se beneficiar de uma codificação estéreo mais adaptativa, o que pode comutar dinamicamente entre o esquema L/R e M/S por banda de frequência e por estrutura.
[0016] Aplicações adicionais mostram o codificador de áudio, compreendendo um downmixer (12) para fazer o downmix do sinal multicanal para obter um sinal de downmix, um codificador de núcleo de domínio de previsão linear para codificar o sinal de downmix, um banco de filtro para gerar uma representação espectral do sinal multicanal e o codificador multicanal conjunto para gerar informação multicanal do sinal multicanal. O sinal de downmix tem uma banda baixa e uma banda alta, em que o codificador de núcleo de domínio de previsão linear é configurado para aplicar um processamento de extensão de largura de banda para parametricamente codificar a banda alta. Além disso, o codificador multicanal é configurado para processar a representação espectral compreendendo a banda baixa e a banda alta do sinal multicanal. Isto é vantajoso visto que cada codificação paramétrica pode utilizar sua decomposição de tempo-frequência ideal para atingir seus parâmetros. Isto pode ser implementado, por exemplo, utilizando uma combinação de ACELP (Previsão Linear Excitada por Código Algébrico) mais TDBWE (time domain bandwidth extension | extensão da largura de banda de domínio de tempo), onde ACELP pode codificar uma banda baixa do sinal de áudio e TDBWE pode codificar uma banda alta do sinal de áudio, e codificação multicanal paramétrica com um banco de filtro externo (por exemplo, DFT). Esta combinação é particularmente eficiente visto que, sabe-se que a melhor extensão de largura de banda para a fala deveria ser o domínio de tempo e o processamento no domínio de frequência multicanal. Visto que ACELP + TDBWE não têm qualquer conversor de tempo-frequência, um banco de filtro externo ou transformada como a DFT é vantajoso. Além disso, a estrutura do processador multicanal pode ser a mesma que a utilizada na ACELP. Mesmo se o processamento multicanal for feito no domínio de frequência, a resolução de tempo para computar seus parâmetros ou fazer o downmix deveria ser idealmente próxima a ou igual à estrutura de ACELP.
[0017] As aplicações descritas são benéficas, visto que uma escolha independente da codificação multicanal conjunta para diferentes tipos de conteúdo de sinal pode ser aplicada.
[0018] As aplicações da presente invenção serão discutidas a seguir com referência aos desenhos anexos, em que:
[0019] A Figura 1 mostra um diagrama de blocos esquemático de um codificador para codificar um sinal de áudio multicanal;
[0020] A Figura 2 mostra um diagrama de blocos esquemático de um codificador de domínio de previsão linear, de acordo com uma aplicação;
[0021] A Figura 3 mostra um diagrama de blocos esquemático de um codificador de domínio de frequência, de acordo com uma aplicação;
[0022] A Figura 4 mostra um diagrama de blocos esquemático de um codificador de áudio, de acordo com uma aplicação;
[0023] A Figura 5a mostra um diagrama de blocos esquemático de um downmixer ativo, de acordo com uma aplicação;
[0024] Figura 5b mostra um diagrama de blocos esquemático de um downmixer passivo, de acordo com uma aplicação;
[0025] A Figura 6 mostra um diagrama de blocos esquemático de um decodificador para decodificação de um sinal de áudio codificado;
[0026] A Figura 7 mostra um diagrama de blocos esquemático de um decodificador, de acordo com uma aplicação;
[0027] A Figura 8 mostra um diagrama de blocos esquemático de um método de codificação de um sinal multicanal;
[0028] A Figura 9 mostra um diagrama de blocos esquemático de um método para decodificação de um sinal de áudio codificado;
[0029] A Figura 10 mostra um diagrama de blocos esquemático de um codificador para codificação de um sinal multicanal, de acordo com um aspecto adicional;
[0030] A Figura 11 mostra um diagrama de blocos esquemático de um decodificador para decodificação de um sinal de áudio codificado, de acordo com um aspecto adicional;
[0031] A Figura 12 mostra um diagrama de blocos esquemático de um método de codificação de áudio para codificação de um sinal multicanal, de acordo com um aspecto adicional;
[0032] A Figura 13 mostra um diagrama de blocos esquemático de um método para decodificação de um sinal de áudio codificado, de acordo com um aspecto adicional;
[0033] A Figura 14 mostra um diagrama de tempo esquemático de uma comutação contínua a partir da codificação de domínio de frequência à codificação de LPD;
[0034] A Figura 15 mostra um diagrama de tempo esquemático de uma comutação contínua da decodificação de domínio de frequência à decodificação de domínio de LPD;
[0035] A Figura 16 mostra um diagrama de tempo esquemático de uma comutação contínua da codificação de LPD à codificação de domínio de frequência;
[0036] A Figura 17 mostra um diagrama de tempo esquemático de uma comutação contínua da decodificação de LPD à decodificação de domínio de frequência.
[0037] A Figura 18 mostra um diagrama de blocos esquemático de um codificador para codificação de um sinal multicanal, de acordo com um aspecto adicional;
[0038] A Figura 19 mostra um diagrama de blocos esquemático de um decodificador para decodificação de um sinal de áudio codificado, de acordo com um aspecto adicional;
[0039] A Figura 20 mostra um diagrama de blocos esquemático de um método de codificação de áudio para codificação de um sinal multicanal, de acordo com um aspecto adicional;
[0040] A Figura 21 mostra um diagrama de blocos esquemático de um método para decodificação de um sinal de áudio codificado, de acordo com um aspecto adicional;
[0041] A seguir, as aplicações da invenção serão descritas em maiores detalhes. Os elementos mostrados nas respectivas figuras, tendo a mesma funcionalidade ou similar, terão associados a eles os mesmos sinais de referência.
[0042] A Figura 1 mostra um diagrama de blocos esquemático de um codificador de áudio 2 para codificar um sinal de áudio multicanal 4. O codificador de áudio compreende um codificador de domínio de previsão linear 6, um codificador de domínio de frequência 8 e um controlador 10 para comutação entre o codificador de domínio de previsão linear 6 e o codificador de domínio de frequência 8. O controlador pode analisar o sinal multicanal e decidir pelas partes do sinal multicanal se uma codificação de domínio de previsão linear ou uma codificação de domínio de frequência é vantajosa. Em outras palavras, o controlador é configurado de modo que uma parte do sinal multicanal seja representada por uma estrutura codificada do codificador de domínio de previsão linear ou por uma estrutura codificada do codificador de domínio de frequência. O codificador de domínio de previsão linear compreende um downmixer 12 para fazer o downmix do sinal multicanal 4 para obter um sinal reduzido 14. O codificador de domínio de previsão linear compreende ainda um codificador de núcleo de domínio de previsão linear 16 para codificar o sinal de downmix e, além disso, o codificador de domínio de previsão linear compreende um primeiro codificador multicanal conjunto 18 para gerar a primeira informação multicanal 20, compreendendo, por exemplo, parâmetros ILD (interaural level difference | diferença de nível interaural) e/ou IPD (interaural phase difference | diferença de fase interaural) do sinal multicanal 4. O sinal multicanal pode ser, por exemplo, um sinal estéreo em que o downmixer converte o sinal estéreo em um sinal mono. O codificador de núcleo de domínio de previsão linear pode codificar o sinal mono, em que o primeiro codificador multicanal conjunto pode gerar a informação estéreo para o sinal mono codificado como primeira informação multicanal. O codificador de domínio de frequência e o controlador são opcionais quando comparados com um aspecto adicional descrito com relação à Figura 10 e à Figura 11. Entretanto, para a comutação adaptativa do sinal entre o domínio de tempo e a codificação de domínio de frequência, utilizar o codificador de domínio de frequência e o controlador é vantajoso.
[0043] Além disso, o codificador de domínio de frequência 8 compreende um segundo codificador multicanal conjunto 22 para gerar a segunda informação multicanal 24 do sinal multicanal 4, em que o segundo codificador multicanal conjunto 22 é diferente do primeiro codificador multicanal 18. Entretanto, o segundo processador multicanal conjunto 22 obtém a segunda informação multicanal permitindo uma segunda qualidade de reprodução que é mais alta do que a primeira qualidade de reprodução da primeira informação multicanal obtida pelo primeiro codificador multicanal para sinais que são melhor codificados pelo segundo codificador.
[0044] Em outras palavras, de acordo com as aplicações, o primeiro codificador multicanal conjunto 18 é configurado para gerar a primeira informação multicanal 20 permitindo uma primeira qualidade de reprodução, em que o segundo codificador multicanal conjunto 22 é configurado para gerar a segunda informação multicanal 24 permitindo uma segunda qualidade de reprodução, em que a segunda qualidade de reprodução é mais alta do que a primeira qualidade de reprodução. Isto é pelo menos, relevante para sinais, como, por exemplo, sinais de fala, que são mais bem codificados pelo segundo codificador multicanal.
[0045] Portanto, o primeiro codificador multicanal pode ser um codificador multicanal conjunto paramétrico compreendendo, por exemplo, um codificador de previsão estéreo, um codificador estéreo paramétrico ou um codificador estéreo paramétrico com base na rotação. Além disso, o segundo codificador multicanal conjunto pode ser conservador de forma de onda como, por exemplo, uma comutação seletiva de banda ao codificador estéreo meio/lateral ou esquerda/direita. Conforme representado na figura 1, o sinal de downmix codificado 26 pode ser transmitido a um decodificador de áudio e, opcionalmente, serve o primeiro processador multicanal conjunto onde, por exemplo, o sinal de downmix codificado pode ser decodificado e um sinal residual do sinal multicanal antes da codificação e após a decodificação do sinal codificado pode ser calculado para melhorar a qualidade de decodificação do sinal de áudio codificado no lado do decodificador. Além disso, o controlador 10 pode utilizar os sinais de controle 28a, 28b para controlar o codificador de domínio de previsão linear e o codificador de domínio de frequência, respectivamente, após determinar o esquema de codificação adequado para a parte do sinal multicanal da corrente.
[0046] A Figura 2 mostra um diagrama de blocos do codificador de domínio de previsão linear 6, de acordo com uma aplicação. Inserido no codificador de domínio de previsão linear 6 está o sinal de downmix 14 reduzido pelo downmixer 12. Além disso, o codificador de domínio de previsão linear compreende um processador de ACELP 30 e um processador de TCX 32. O processador de ACELP 30 é configurado para operar em um sinal de downmix com redução de taxa de amostragem 34 que pode ser reduzido na taxa de amostragem pelo redutor de taxa de amostragem 35. Além disso, um processador de extensão da largura de banda de domínio de tempo 36 pode parametricamente codificar uma banda de uma parte do sinal de downmix 14 que é removida do sinal de downmix com redução de taxa de amostragem 34, que é inserido ao processador de ACELP 30. O processador de extensão da largura de banda de domínio de tempo 36 pode emitir uma banda parametricamente codificada 38 de uma parte do sinal de downmix 14. Em outras palavras, o processador de extensão da largura de banda de domínio de tempo 36 pode calcular uma representação paramétrica das bandas de frequência do sinal de downmix 14 que podem compreender frequências mais altas em comparação à frequência de corte do redutor de taxa de amostragem 35. Portanto, o redutor de taxa de amostragem 35 pode ter a propriedade adicional para fornecer estas bandas de frequência mais altas do que a frequência de corte do redutor de taxa de amostragem ao processador de extensão da largura de banda de domínio de tempo 36 ou, para fornecer a frequência de corte ao processador de extensão da largura de banda de domínio de tempo (TD-BWE | time domain bandwidth extension) para permitir que o processador de TD-BWE 36 calcule os parâmetros 38 para a parte correta do sinal de downmix 14.
[0047] Além disso, o processador de TCX é configurado para operar no sinal de downmix que é, por exemplo, não reduzido na taxa de amostragem ou reduzido na taxa de amostragem por um grau menor do que a redução de taxa de amostragem para o processador de ACELP. Uma redução de taxa de amostragem por um grau menor do que a redução de taxa de amostragem do processador de ACELP pode ser uma redução de taxa de amostragem, utilizando uma frequência de corte mais alta, em que um número maior de bandas do sinal de downmix é fornecido ao processador de TCX quando comparado ao sinal de downmix com redução de taxa de amostragem 35 sendo inserido ao processador de ACELP 30. O processador de TCX pode compreender, ainda, um primeiro conversor de tempo- frequência 40, como, por exemplo, uma MDCT, uma DFT ou uma DCT. O processador de TCX 32 pode compreender, ainda, um primeiro gerador de parâmetro 42 e um primeiro codificador do quantizador 44. O primeiro gerador de parâmetro 42, por exemplo, um algoritmo de preenchimento de lacuna inteligente (IGF) pode calcular uma primeira representação paramétrica de um primeiro conjunto de bandas 46, em que o primeiro codificador do quantizador 44, por exemplo, utilizando um algoritmo de TCX para calcular um primeiro conjunto de linhas espectrais codificadas quantizadas 48 para um segundo conjunto de bandas. Em outras palavras, o primeiro codificador do quantizador pode parametricamente codificar as bandas relevantes, como, por exemplo, bandas tonais, do sinal de entrada em que o primeiro gerador de parâmetro aplicar, por exemplo, um algoritmo de IGF às bandas remanescentes do sinal de entrada para reduzir mais a largura de banda do sinal de áudio codificado.
[0048] O codificador de domínio de previsão linear 6 pode compreender, ainda, um decodificador de domínio de previsão linear 50 para decodificar o sinal de downmix 14, por exemplo, representado pelo sinal de downmix processado de ACELP com redução de taxa de amostragem 52 e/ou a primeira representação paramétrica de um primeiro conjunto de bandas 46 e/ou o primeiro conjunto de linhas espectrais codificadas quantizadas 48 para um segundo conjunto de bandas. A saída do decodificador de domínio de previsão linear 50 pode ser um sinal de downmix codificado e decodificado 54. Este sinal 54 pode ser inserido a um codificador residual multicanal 56, que pode calcular e codificar um sinal residual multicanal 58 utilizando o sinal reduzido codificado e decodificado 54, em que o sinal residual multicanal codificado representa um erro entre uma representação multicanal decodificada utilizando a primeira informação multicanal e o sinal multicanal antes do downmix. Portanto, o codificador residual multicanal 56 pode compreender um decodificador do lado do codificador conjunto de multicanal 60 e um processador de diferença 62. O decodificador do lado do codificador conjunto de multicanal 60 pode gerar um sinal multicanal decodificado utilizando a primeira informação multicanal 20 e o sinal de downmix codificado e decodificado 54, em que o processador de diferença pode formar uma diferença entre o sinal multicanal decodificado 64 e o sinal multicanal 4 antes do downmix para obter o sinal residual multicanal 58. Em outras palavras, o decodificador do lado do codificador conjunto de multicanal dentro do codificador de áudio pode realizar uma operação de decodificação, que é vantajosamente a mesma operação de decodificação realizada no lado do decodificador. Portanto, a primeira informação multicanal conjunta, que pode ser derivada pelo decodificador de áudio após a transmissão, é utilizada no decodificador do lado do codificador conjunto de multicanal para decodificar o sinal de downmix codificado. O processador de diferença 62 pode calcular a diferença entre o sinal multicanal conjunto decodificado e o sinal multicanal original 4. O sinal residual multicanal codificado 58 pode melhorar a qualidade da decodificação do decodificador de áudio, visto que a diferença entre o sinal decodificado e o sinal original devido a, por exemplo, a codificação paramétrica, pode ser reduzida pelo conhecimento da diferença entre estes dois sinais. Isto permite que o primeiro codificador multicanal conjunto opere de tal forma que a informação multicanal para uma largura de banda completa do sinal de áudio multicanal seja derivada.
[0049] Além disso, o sinal de downmix 14 pode compreender uma banda baixa e uma banda alta, em que o codificador de domínio de previsão linear 6 é configurado para aplicar um processamento de extensão de largura de banda, utilizando, por exemplo, o processador de extensão da largura de banda de domínio de tempo 36 para parametricamente codificar a banda alta, em que o decodificador de domínio de previsão linear 6 é configurado para obter, como o sinal de downmix codificado e decodificado 54, apenas um sinal de banda baixa que representa a banda baixa do sinal de downmix 14 e em que o sinal residual multicanal codificado tem apenas frequências dentro da banda baixa do sinal multicanal antes do downmix. Em outras palavras, o processador de extensão da largura de banda pode calcular os parâmetros de extensão da largura de banda para as bandas de frequência mais altas do que uma frequência de corte, em que o processador de ACELP codifica as frequências abaixo da frequência de corte. O decodificador é, portanto, configurado para reconstruir as frequências mais altas com base no sinal de banda baixa codificado e nos parâmetros da largura de banda 38.
[0050] De acordo com aplicações adicionais, o codificador residual multicanal 56 pode calcular um sinal lateral e em que o sinal de downmix é um sinal médio correspondente de um sinal de áudio multicanal M/S. Portanto, o codificador residual multicanal pode calcular e codificar uma diferença de um sinal lateral calculado, o que pode ser calculado a partir da representação espectral de banda completa do sinal de áudio multicanal obtido pelo banco de filtro 82 e um sinal lateral previsto de um múltiplo do sinal de downmix codificado e decodificado 54, em que o múltiplo pode ser representado por uma informação de previsão se torna parte da informação multicanal. Entretanto, o sinal de downmix compreende apenas o sinal de banda baixa. Portanto, o codificador residual pode ainda calcular um sinal residual (ou lateral) para a banda alta. Isto pode ser realizado, por exemplo, pela simulação da extensão da largura de banda de domínio de tempo, como é feito no codificador de núcleo de domínio de previsão linear ou pela previsão do sinal lateral como uma diferença entre o sinal lateral (banda completa) calculado e o sinal médio (banda completa) calculado, em que um fator de previsão é configurado para minimizar a diferença entre ambos os sinais.
[0051] A Figura 3 mostra um diagrama de blocos esquemático do codificador de domínio de frequência 8 de acordo com uma aplicação. O codificador de domínio de frequência compreende um segundo conversor de tempo- frequência 66, um segundo gerador de parâmetro 68 e um segundo codificador do quantizador 70. O segundo conversor de tempo-frequência 66 pode converter um primeiro canal 4a do sinal multicanal e um segundo canal 4b do sinal multicanal em uma representação espectral 72a, 72b. A representação espectral do primeiro canal e do segundo canal 72a, 72b pode ser analisada e cada divisão em um primeiro conjunto de bandas 74 e um segundo conjunto de bandas 76. Portanto, o segundo gerador de parâmetro 68 pode gerar uma segunda representação paramétrica 78 do segundo conjunto de bandas 76, em que o segundo codificador do quantizador pode gerar uma representação quantizada e codificada 80 do primeiro conjunto de bandas 74. O codificador de domínio de frequência ou mais especificamente, o segundo conversor de tempo- frequência 66 pode realizar, por exemplo, uma operação de MDCT para o primeiro canal 4a e o segundo canal 4b, em que o segundo gerador de parâmetro 68 pode realizar um algoritmo de preenchimento de lacuna inteligente e o segundo codificador do quantizador 70 pode realizar, por exemplo, uma operação de AAC. Portanto, conforme já descrito com relação aos codificadores de domínio de previsão linear, o codificador de domínio de frequência é ainda capaz de operar de tal modo que a informação multicanal para uma largura de banda completa do sinal de áudio multicanal seja derivada.
[0052] A Figura 4 mostra um diagrama de blocos esquemático do codificador de áudio 2, de acordo com uma aplicação preferida. A passagem de LPD 16 consiste em uma codificação conjunta de estéreo ou multicanal que contém um cálculo de downmix de “DMX ativo ou passivo” 12, indicando que o downmix LPD pode ser ativo (“seletivo de frequência”) ou passivo (“fatores de mistura constantes”), conforme representado nas Figuras 5. O downmix é codificado, ainda, por um núcleo de ACELP/TCX mono comutável que é suportado pelos módulos TD-BWE ou IGF. Observe que a ACELP opera nos dados de áudio de entrada reduzidos na taxa de amostragem 34. Qualquer inicialização de ACELP devido à comutação pode ser realizada na saída de TCX/IGF reduzida na taxa de amostragem.
[0053] Visto que a ACELP não contém qualquer decomposição de tempo-frequência interna, a codificação estéreo de LPD adiciona um banco de filtro modulado complexo extra, por meio de um banco de filtro de análise 82 antes da codificação de LP e um banco de filtro de síntese após a decodificação de LPD. Na aplicação preferida, uma DFT reduzida com uma região de baixa sobreposição é empregada. Entretanto, em outras aplicações, qualquer decomposição de tempo-frequência reduzida com resolução temporal similar pode ser utilizada. Os parâmetros estéreo podem, então, ser computados no domínio de frequência.
[0054] A codificação estéreo paramétrica é realizada pelo bloco de “codificação de parâmetro estéreo de LPD” 18 que emite os parâmetros estéreo de LPD 20 ao fluxo contínuo de dados. Opcionalmente, o seguinte bloco “codificação estéreo residual de LPD” adiciona um downmix residual de passa-baixa quantizado pelo vetor 58 ao fluxo contínuo de dados.
[0055] A passagem de FD 8 é configurada para ter sua própria codificação conjunta interna de multicanal ou estéreo. Para a codificação conjunta de estéreo, ela reutiliza seu próprio banco de filtro amostrado criticamente e com valor real 66, a saber, por exemplo, a MDCT.
[0056] Os sinais fornecidos ao decodificador podem ser, por exemplo, multiplexados em um único fluxo contínuo de dados. O fluxo contínuo de dados pode compreender o sinal de downmix codificado 26 que pode compreender, ainda, pelo menos um dentre a banda estendida da largura de banda de domínio de tempo parametricamente codificada 38, o sinal de downmix processado de ACELP com redução de taxa de amostragem 52, a primeira informação multicanal 20, o sinal residual multicanal codificado 58, a primeira representação paramétrica de um primeiro conjunto de bandas 46, o primeiro conjunto de linhas espectrais codificadas quantizadas para um segundo conjunto de bandas 48 e a segunda informação multicanal 24 compreendendo a representação quantizada e codificada do primeiro conjunto de bandas 80 e a segunda representação paramétrica do primeiro conjunto de bandas 78.
[0057] As aplicações mostram um método melhorado para combinar um codec de núcleo comutável, codificação multicanal conjunta e codificação de áudio espacial paramétrica em um codec perceptual completamente comutável que permite a utilização de diferentes técnicas de codificação multicanal na dependência da escolha do codificador de núcleo. Especificamente, dentro de um codificador de áudio comutável, a codificação nativa de estéreo de domínios de frequência é combinada com a codificação preditiva linear com base em ACELP/TCX tendo sua própria codificação estéreo paramétrica independente dedicada.
[0058] A Figura 5a e a Figura 5b mostram um downmixer ativo e um passivo, respectivamente, de acordo com as aplicações. O downmixer ativo opera no domínio de frequência utilizando, por exemplo, um conversor de frequência de tempo 82 para transformar o domínio de tempo sinal 4 em um sinal de domínio de frequência. Após o downmix, uma conversão de frequência-tempo, por exemplo, uma IDFT, pode converter o sinal reduzido do domínio de frequência ao sinal de downmix 14 no domínio de tempo.
[0059] A figura 5b mostra um downmixer passivo 12 de acordo com uma aplicação. O downmixer passivo 12 compreende um somador, em que o primeiro canal 4a e o primeiro canal 4b são combinados após ponderar utilizando um peso a 84a e a peso b 84b, respectivamente. Além disso, o primeiro canal para 4a e o segundo canal 4b podem ser inseridos ao conversor de tempo-frequência 82 antes da transmissão à codificação estéreo paramétrica de LPD.
[0060] Em outras palavras, o downmixer é configurado para converter o sinal multicanal em uma representação espectral, em que o downmix é realizado utilizando a representação espectral ou utilizando uma representação de domínio de tempo e em que o primeiro codificador multicanal é configurado para utilizar a representação espectral para gerar a primeira informação multicanal separada para bandas individuais da representação espectral.
[0061] A Figura 6 mostra um diagrama de blocos esquemático de um decodificador de áudio 102 para decodificação de um sinal de áudio codificado 103 de acordo com uma aplicação. O decodificador de áudio 102 compreende um decodificador de domínio de previsão linear 104, um decodificador de domínio de frequência 106, um primeiro decodificador multicanal conjunto 108, um segundo decodificador multicanal 110 e um primeiro combinador 112. O sinal de áudio codificado 103, que pode ser o fluxo contínuo de dados multiplexado das partes do codificador previamente descritas, como, por exemplo, estruturas do sinal de áudio, pode ser decodificado pelo decodificador multicanal conjunto 108 utilizando a primeira informação multicanal 20 ou pelo decodificador de domínio de frequência 106 e multicanal decodificado pelo segundo decodificador multicanal conjunto 110 utilizando a segunda informação multicanal 24. O primeiro decodificador multicanal conjunto pode emitir uma primeira representação multicanal 114 e a emissão do segundo decodificador multicanal conjunto 110 pode ser uma segunda representação multicanal 116.
[0062] Em outras palavras, o primeiro decodificador multicanal conjunto 108 gera uma primeira representação multicanal 114 utilizando uma saída do codificador de domínio de previsão linear e utilizando uma primeira informação multicanal 20. O segundo decodificador multicanal 110 gera uma segunda representação multicanal 116 utilizando uma saída do decodificador de domínio de frequência e uma segunda informação multicanal 24. Além disso, o primeiro combinador combina a primeira representação multicanal 114 e a segunda representação multicanal 116, por exemplo, com base na estrutura, para obter um sinal de áudio codificado 118. Além disso, o primeiro decodificador multicanal conjunto 108 pode ser um decodificador paramétrico conjunto de multicanal, por exemplo, utilizando uma previsão complexa, uma operação estéreo paramétrica ou uma operação de rotação. O segundo decodificador multicanal conjunto 110 pode ser um decodificador multicanal conjunto de preservação da forma de onda utilizando, por exemplo, uma comutação seletiva de banda ao algoritmo de decodificação estéreo meio/lateral ou esquerda/direita.
[0063] A Figura 7 mostra um diagrama de blocos esquemático de um decodificador 102, de acordo com uma aplicação adicional. Aqui, um decodificador de domínio de previsão linear 102 compreende um decodificador de ACELP 120, um sintetizador de banda baixa 122, um amplificador de taxa de amostragem 124, um processador de extensão da largura de banda de domínio de tempo 126 ou um segundo combinador 128 para combinar um sinal amplificado na taxa de amostragem e um sinal estendido pela largura de banda. Além disso, o decodificador de domínio de previsão linear pode compreender um decodificador de TCX 132 e um processador de preenchimento de lacuna inteligente 132 que são representados como um bloco na figura 7. Além disso, o decodificador de domínio de previsão linear 102 pode compreender um processador de síntese de banda completa 134 para combinar uma saída do segundo combinador 128 e o decodificador de TCX 130 e o processador de IGF 132. Conforme já mostrado com relação ao codificador, o processador de extensão da largura de banda de domínio de tempo 126, o decodificador de ACELP 120 e o decodificador de TCX 130 trabalham paralelamente para decodificar a respectiva informação de áudio transmitida.
[0064] Uma passagem cruzada 136 pode ser fornecida para inicializar o sintetizador de banda baixa utilizando informação derivada de uma conversão de espectro-tempo de banda baixa que utiliza, por exemplo, o conversor de frequência-tempo 138 do decodificador de TCX 130 e do processador de IGF 132. Com referência a um modelo do canal vocal, os dados de ACELP podem modelar o formato do canal vocal, em que os dados de TCX podem modelar uma excitação do canal vocal. A passagem cruzada 136 representada por um conversor de frequência-tempo de banda baixa, como, por exemplo, um decodificador de IMDCT, permite que o sintetizador de banda baixa 122 utilize o formato do canal vocal e a presente excitação para recalcular ou decodificar o sinal codificado de banda baixa. Além disso, a banda baixa sintetizada é amplificada pelo amplificador de taxa de amostragem 124 e combinada utilizando, por exemplo, o segundo combinador 128, com as bandas altas estendidas da largura de banda do domínio de tempo 140 para, por exemplo, reformatar as frequências amplificadas para recuperar, por exemplo, uma energia para cada banda amplificada.
[0065] O sintetizador de banda completa 134 pode utilizar o sinal de banda completa do segundo combinador 128 e a excitação do processador de TCX 130 para formar um sinal decodificado de downmix 142. O primeiro decodificador multicanal conjunto 108 pode compreender um conversor de tempo-frequência 144 para converter a saída do decodificador de domínio de previsão linear, por exemplo, o sinal decodificado de downmix 142, em uma representação espectral 145. Além disso, um upmixer, por exemplo, implementado em um decodificador estéreo 146, pode ser controlado pela primeira informação multicanal 20 para aumentar a representação espectral em um sinal multicanal. Além disso, um conversor de frequência-tempo 148 pode converter o resultado de upmix em uma representação de tempo 114. O conversor de tempo- frequência e/ou o conversor de frequência-tempo pode compreender uma operação complexa ou uma operação reduzida, como, por exemplo, uma DFT ou uma IDFT.
[0066] Além disso, o primeiro decodificador multicanal conjunto ou, mais especificamente, o decodificador estéreo 146 pode utilizar o sinal residual multicanal 58, por exemplo, fornecido pelo sinal de áudio codificado multicanal 103, para gerar a primeira representação multicanal. Além disso, o sinal residual multicanal pode compreender uma largura de banda inferior do que a primeira representação multicanal, em que o primeiro decodificador multicanal conjunto é configurado para reconstruir uma primeira representação multicanal intermediária utilizando a primeira informação multicanal e para adicionar o sinal residual multicanal à primeira representação multicanal intermediária. Em outras palavras, o decodificador estéreo 146 pode compreender uma decodificação multicanal utilizando a primeira informação multicanal 20, e, opcionalmente, uma melhoria do sinal multicanal reconstruído adicionando o sinal residual multicanal ao sinal multicanal reconstruído, após a representação espectral do sinal decodificado de downmix ter sido amplificada em um sinal multicanal. Portanto, a primeira informação multicanal e o sinal residual já podem operar em um sinal multicanal.
[0067] O segundo decodificador multicanal conjunto 110 pode utilizar, como uma entrada, uma representação espectral obtida pelo decodificador de domínio de frequência. A representação espectral compreende, pelo menos para uma pluralidade de bandas, um primeiro sinal de canal 150a e um segundo sinal de canal 150b. Além disso, o segundo processador multicanal conjunto 110 pode aplicar à pluralidade de bandas do primeiro sinal de canal 150a e do segundo sinal de canal 150b. Uma operação multicanal conjunta como, por exemplo, uma máscara indicando, para bandas individuais, uma codificação multicanal conjunta esquerda/direita ou meio/lateral e em que a operação multicanal conjunta é uma operação de conversão meio/lateral ou esquerda/direita para converter as bandas indicadas pela máscara de uma representação meio/lateral a uma representação esquerda/direita, que é uma conversão do resultado da operação multicanal conjunta em uma representação de tempo para obter a segunda representação multicanal. Além disso, o decodificador de domínio de frequência pode compreender um conversor de frequência-tempo 152 que é, por exemplo, uma operação de IMDCT ou uma operação particularmente amostrada. Em outras palavras, a máscara pode compreender bandeiras indicando, por exemplo, codificação estéreo L/R ou M/S, em que o segundo codificador multicanal conjunto aplica o algoritmo de codificação estéreo correspondente às respectivas estruturas de áudio. Opcionalmente, o preenchimento de lacuna inteligente pode ser aplicado aos sinais de áudio codificados para reduzir, ainda, a largura de banda do sinal de áudio codificado. Portanto, por exemplo, as bandas de frequência tonais podem ser codificadas em uma alta resolução utilizando os algoritmos de codificação estéreo previamente mencionados em que outras bandas de frequência podem ser parametricamente codificadas utilizando, por exemplo, um algoritmo de IGF.
[0068] Em outras palavras, na passagem de LPD 104, o sinal mono transmitido é reconstruído pelo decodificador comutável de ACELP/TCX 120/130 suportado, por exemplo, por TD-BWE 126 ou módulos de IGF 132. Qualquer inicialização de ACELP devido à comutação é realizada na saída de TCX/IGF reduzida na taxa de amostragem. A saída de ACELP é amplificada utilizando, por exemplo, o amplificador de taxa de amostragem 124, para taxa de amostragem completa. Todos os sinais são misturados utilizando, por exemplo, o mixer [misturador] 128 no domínio de tempo na alta taxa de amostragem e são processados, ainda, pelo decodificador estéreo LPD 146 para fornecer estéreo LPD.
[0069] A “decodificação estéreo” de LPD consiste em um upmix do downmix transmitido direcionado pela aplicação dos parâmetros estéreo transmitidos 20. Opcionalmente, também um downmix residual 58 está contido no fluxo contínuo de dados. Neste caso, o residual é decodificado e é incluído no cálculo de upmix pela “Decodificação Estéreo” 146.
[0070] A passagem de FD 106 é configurada para ter sua própria decodificação conjunta interna, independente de multicanal ou de estéreo. Para a decodificação conjunta de estéreo, ela reutiliza seu próprio banco de filtro amostrado criticamente e com valor real 152, por exemplo, a saber, a IMDCT.
[0071] A saída estéreo de LPD e a saída estéreo de FD são misturadas no domínio de tempo, utilizando, por exemplo, o primeiro combinador 112 para fornecer a saída final 118 do codificador completamente comutado.
[0072] Embora o multicanal seja descrito com relação a uma decodificação estéreo nas figuras relacionadas, o mesmo princípio também pode ser aplicado ao processamento multicanal com dois ou mais canais, no geral.
[0073] A Figura 8 mostra um diagrama de blocos esquemático de um método 800 para codificação de um sinal multicanal. O método 800 compreende uma etapa 805 de aplicação de uma codificação de domínio de previsão linear, uma etapa 810 para realizar uma codificação de domínio de frequência, uma etapa 815 para comutação entre a codificação de domínio de previsão linear e a codificação de domínio de frequência, em que a codificação de domínio de previsão linear compreende o downmix do sinal multicanal para obter um sinal de downmix, um núcleo de domínio de previsão linear que codifica o sinal de downmix e uma primeira codificação multicanal conjunta que gera a primeira informação multicanal do sinal multicanal, em que a codificação de domínio de frequência compreende uma segunda codificação multicanal conjunta que gera uma segunda informação multicanal do sinal multicanal, em que a segunda codificação multicanal conjunta é diferente da primeira codificação multicanal e em que a comutação é realizada de modo que uma parte do sinal multicanal seja representada por uma estrutura codificada da codificação de domínio de previsão linear ou por uma estrutura codificada da codificação de domínio de frequência.
[0074] A Figura 9 mostra um diagrama de blocos esquemático de um método 900 para decodificação de um sinal de áudio codificado. O método 900 compreende uma etapa 905 de uma decodificação de domínio de previsão linear, uma etapa 910 de uma decodificação de domínio de frequência, uma etapa 915 da primeira decodificação multicanal conjunta que gera uma primeira representação multicanal utilizando uma saída da decodificação de domínio de previsão linear e utilizando uma primeira informação multicanal, uma etapa 920 de uma segunda decodificação multicanal que gera uma segunda representação multicanal utilizando uma saída da decodificação de domínio de frequência e uma segunda informação multicanal, e uma etapa 925 que combina a primeira representação multicanal e a segunda representação multicanal para obter um sinal de áudio codificado, em que a segunda informação de decodificação multicanal é diferente da primeira decodificação multicanal.
[0075] A Figura 10 mostra um diagrama de blocos esquemático de um codificador de áudio para codificação de um sinal multicanal de acordo com um aspecto adicional. O codificador de áudio 2’ compreende um codificador de domínio de previsão linear 6 e um codificador residual multicanal 56. O codificador de domínio de previsão linear compreende um downmixer 12 para fazer o downmix do sinal multicanal 4 para obter um sinal de downmix 14, um codificador de núcleo de domínio de previsão linear 16 para codificar o sinal de downmix 14. O codificador de domínio de previsão linear 6 compreende ainda um codificador multicanal conjunto 18 para gerar a informação multicanal 20 do sinal multicanal 4. Além disso, o codificador de domínio de previsão linear compreende um decodificador de domínio de previsão linear 50 para decodificar o sinal de downmix codificado 26 para obter um sinal de downmix codificado e decodificado 54. O codificador residual multicanal 56 pode calcular e codificar o sinal residual multicanal utilizando o sinal de downmix codificado e decodificado 54. O sinal residual multicanal pode representar um erro entre uma representação multicanal decodificada 54 utilizando a informação multicanal 20 e o sinal multicanal 4 antes do downmix.
[0076] De acordo com uma aplicação, o sinal de downmix 14 compreende uma banda baixa e uma banda alta, em que o codificador de domínio de previsão linear pode utilizar um processador de extensão da largura de banda para aplicar um processamento de extensão de largura de banda para parametricamente codificar a banda alta, em que o decodificador de domínio de previsão linear é configurado para obter, como o sinal de downmix codificado e decodificado 54, apenas um sinal de banda baixa representando a banda baixa do sinal de downmix e em que o sinal residual multicanal codificado tem apenas uma banda correspondente à banda baixa do sinal multicanal antes do downmix. Além disso, a mesma descrição referente ao codificador de áudio 2 pode ser aplicada ao codificador de áudio 2’. Entretanto, a codificação de frequência adicional do codificador 2 é omitida. Isto simplifica a configuração do codificador e é, portanto, vantajoso, se o codificador for meramente utilizado para sinais de áudio que meramente compreendem os sinais, o que pode ser parametricamente codificado no domínio de tempo sem perda de qualidade notável ou onde a qualidade do sinal de áudio codificado ainda está dentro da especificação. Entretanto, uma codificação de estéreo residual dedicada é vantajosa para aumentar a qualidade de reprodução do sinal de áudio codificado. Mais especificamente, a diferença entre o sinal de áudio antes da decodificação e o sinal de áudio codificado é derivado e transmitido ao decodificador para aumentar a qualidade de reprodução do sinal de áudio codificado, visto que a diferença do sinal de áudio codificado ao sinal de áudio codificado é conhecida pelo decodificador.
[0077] A Figura 11 mostra um decodificador de áudio 102’ para decodificação de um sinal de áudio codificado 103, de acordo com um aspecto adicional. O decodificador de áudio 102’ compreende um decodificador de domínio de previsão linear 104 e um decodificador multicanal conjunto 108 para gerar uma representação multicanal 114 utilizando uma saída do decodificador de domínio de previsão linear 104 e uma informação multicanal conjunta 20. Além disso, o sinal de áudio codificado 103 pode compreender um sinal residual multicanal 58, que pode ser utilizado pelo decodificador multicanal para gerar a representação multicanal 114. Além disso, as mesmas explicações relacionadas ao decodificador de áudio 102 podem ser aplicadas ao decodificador de áudio 102’. Aqui, o sinal residual do sinal original de áudio ao sinal de áudio codificado é utilizado e aplicado ao sinal de áudio codificado para, pelo menos, quase atingir a mesma qualidade do sinal de áudio codificado em comparação ao sinal original de áudio, embora paramétrica e, portanto, a codificação com perdas é utilizada. Entretanto, a parte de decodificação de frequência mostrada com relação ao decodificador de áudio 102 é omitida no decodificador de áudio 102’.
[0078] A Figura 12 mostra um diagrama de blocos esquemático de um método de codificação de áudio 1200 para codificação de um sinal multicanal. O método 1200 compreende uma etapa 1205 de codificação de domínio de previsão linear compreendendo downmix do sinal multicanal para obter um sinal multicanal reduzido e um codificador de núcleo de domínio de previsão linear gerou a informação multicanal do sinal multicanal, em que o método compreende ainda a decodificação de domínio de previsão linear do sinal de downmix para obter um sinal de downmix codificado e decodificado e uma etapa 1210 de codificação multicanal residual que calcula um sinal residual multicanal codificado utilizando o sinal de downmix codificado e decodificado, o sinal residual multicanal representando um erro entre uma representação multicanal decodificada utilizando a primeira informação multicanal e o sinal multicanal antes do downmix.
[0079] A Figura 13 mostra um diagrama de blocos esquemático de um método 1300 para decodificação de um sinal de áudio codificado. O método 1300 compreende uma etapa 1305 de uma decodificação de domínio de previsão linear e uma etapa 1310 de uma decodificação multicanal conjunta que gera uma representação multicanal utilizando uma saída da decodificação de domínio de previsão linear e uma informação multicanal conjunta, em que o sinal codificado de áudio multicanal compreende um canal sinal residual, em que a decodificação multicanal conjunta utiliza o sinal residual multicanal para gerar a representação multicanal.
[0080] As aplicações descritas podem utilizar a distribuição de transmissão de todos os tipos de conteúdo de áudio estéreo ou multicanal (fala e música iguais com qualidade perceptual constante em uma dada taxa de bits baixa) como, por exemplo, com aplicações de rádio digital, transmissão por internet e comunicação de áudio.
[0081] As Figuras de 14 a 17 descrevem aplicações de como aplicar a comutação contínua proposta entre a codificação de LPD e a codificação de domínio de frequência e vice-versa. No geral, o janelamento ou processamento passado é indicado utilizando traços finos, e linhas em negrito indicam o janelamento ou processamento atual onde a comutação é aplicada e as linhas tracejadas indicam um processamento atual que é feito exclusivamente para a transição ou comutação. Uma comutação ou uma transição a partir da codificação de LPD à codificação de frequência.
[0082] A Figura 14 mostra um diagrama de tempo esquemático, indicando uma aplicação para comutação contínua entre a codificação de domínio de frequência à codificação de domínio de tempo. Isto pode ser relevante se, por exemplo, o controlador 10 indicar que uma estrutura atual é melhor codificada utilizando a codificação de LPD em vez da codificação de FD utilizada para a estrutura prévia. Durante a codificação de domínio de frequência, uma janela de parada 200a e 200b pode ser aplicada para cada sinal estéreo (que pode, opcionalmente, ser estendido para mais do que dois canais). A janela de parada difere da transição de sobreposição e adição de MDCT padrão no começo 202 da primeira estrutura 204. A parte esquerda da janela de parada pode ser a sobreposição e adição clássica para codificar a estrutura prévia utilizando, por exemplo, uma transformada de tempo-frequência MDCT. Portanto, a estrutura antes da comutação é ainda corretamente codificada. Para a estrutura atual 204, onde a comutação é aplicada, os parâmetros estéreos adicionais são calculados, embora uma primeira representação paramétrica do sinal médio para codificação de domínio de tempo seja calculada para a seguinte estrutura 206. Estas duas análises adicionais de estéreo são feitas para serem capazes de gerar o sinal médio 208 para a análise prévia de LPD. Além disso, os parâmetros estéreos são transmitidos (adicionalmente) para as primeiras duas janelas estéreo de LPD. Em casos normais, os parâmetros estéreos são enviados com duas estruturas estéreo de LPD de atraso. Para atualização das memórias de ACELP, tais como para análise de LPC ou cancelamento de distorção direta (FAC | forward aliasing cancellation), o sinal médio também se torna disponível para o passado. Assim, as janelas estéreo de LPD 210a-d para um primeiro sinal estéreo e 212a-d para um segundo sinal estéreo podem ser aplicadas no banco de filtro de análise 82 antes, por exemplo, de aplicar uma conversão de tempo-frequência utilizando uma DFT. O sinal médio pode compreender uma rampa de transição típica ao utilizar a codificação de TCX, resultando na janela de análise de LPD exemplar 214. Se a ACELP for utilizada para codificar o sinal de áudio como o sinal mono de banda baixa, escolhe-se simplesmente várias bandas de frequência onde a análise de LPC é aplicada, indicada pela janela de análise de LPD retangular 216.
[0083] Além disso, o tempo indicado pela linha vertical 218 mostra que a estrutura atual, onde a transição é aplicada, compreende a informação das janelas de análise de domínio de frequência 200a, 200b e o sinal médio computado 208 e a informação de estéreo correspondente. Durante a parte horizontal da janela de análise de frequência entre as linhas 202 e 218, a estrutura 204 é perfeitamente codificada utilizando a codificação de domínio de frequência. Da linha 218 à extremidade da janela de análise de frequência na linha 220, a estrutura 204 compreende a informação de ambas, a codificação de domínio de frequência e a codificação de LPD e da linha 220 à extremidade da estrutura 204 na linha vertical 222, apenas a codificação de LPD contribui para a codificação da estrutura. Mais atenção é dada na parte média da codificação, visto que a primeira e a última parte (terceira) são simplesmente a técnica de codificação derivada sem ter distorção. Para a parte média, entretanto, deve ser diferenciada entre a codificação de sinal mono ACELP e TCX. Visto que a codificação TCX utiliza uma transição conforme já aplicado com a codificação de domínio de frequência, uma simples diminuição gradual (fade out) do sinal de frequência codificado e um aumento gradual (fade in) do sinal médio de TCX codificado fornece informação completa para codificar a estrutura atual 204. Se a ACELP for utilizada para a codificação do sinal mono, um processamento mais sofisticado pode ser aplicado, visto que a área 224 pode não compreender a informação completa para codificar o sinal de áudio. Um método proposto é a correção de distorção direta (FAC | forward aliasing correction), por exemplo, descrito na especificação de USAC na seção 7.16.
[0084] De acordo com uma aplicação, o controlador 10 é configurado para comutação dentro de uma estrutura atual 204 de um sinal de áudio multicanal utilizando o codificador de domínio de frequência 8 para codificar uma estrutura prévia ao codificador de domínio de previsão linear para decodificar uma estrutura futura. O primeiro codificador multicanal conjunto 18 pode calcular parâmetros de multicanal sintéticos 210a, 210b, 212a, 212b do sinal de áudio multicanal para a estrutura atual, em que o segundo codificador multicanal conjunto 22 é configurado para ponderar o segundo sinal multicanal utilizando uma janela de parada.
[0085] A Figura 15 mostra um diagrama de tempo esquemático de um decodificador correspondente às operações do codificador da Figura 14. Aqui, a reconstrução da estrutura atual 204 é descrita de acordo com uma aplicação. Conforme já visto no diagrama de tempo do codificador da figura 14, os canais de domínio de frequência de estéreo são fornecidos da estrutura prévia tendo aplicada as janelas de parada 200a e 200b. As transições do modo FD a LPD são feitas primeiro no sinal médio decodificado, como no caso mono. Isso é obtido ao criar artificialmente um sinal médio 226 do sinal de domínio de tempo 116 decodificado no modo FD, onde ccfl é o comprimento da estrutura do código de núcleo e L_fac denota um comprimento da janela de cancelamento de distorção de frequência ou estrutura ou bloco ou transformada.
Figure img0001
[0086] Este sinal é, então, transportado ao decodificador de LPD 120 para atualizar as memórias e aplicar a decodificação de FAC, como é feito no caso mono para as transições do modo FD à ACELP. O processamento é descrito nas especificações de USAC [ISO/IEC DIS 23003-3, Usac] na seção 7.16. No caso do modo FD para TCX, uma adição por sobreposição convencional é realizada. O decodificador de LPD estéreo 146 recebe como sinal de entrada um sinal médio decodificado (no domínio de frequência após a conversão de tempo-frequência do conversor de tempo-frequência 144 ser aplicada), por exemplo, aplicando os parâmetros estéreos transmitidos 210 e 212 para processamento de estéreo, onde a transição já é realizada. O decodificador de estéreo emite então o sinal de canal esquerdo e direito 228, 230 que sobrepõe a estrutura prévia decodificada no modo FD. Os sinais, a saber, o sinal de domínio de tempo decodificado de FD e o sinal de domínio de tempo decodificado de LPD para a estrutura onde a transição é aplicada passam, então, por transição (no combinador 112) em cada canal para suavizar a transição nos canais esquerdo e direito:
Figure img0002
[0087] Na Figura 15, a transição é ilustrada esquematicamente utilizando M=ccfl/2. Além disso, o realizar uma transiçao em estruturas consecutivas sendo decodificadas utilizando apenas decodificaçao de LPD ou de FD sem uma transiçao entre estes modos.
[0088] Em outras palavras, o processo de sobreposiçao e adiçao da decodificaçao de FD, especialmente ao utilizar uma MDCT/IMDCT para conversao de tempo- frequência/conversao de frequência-tempo, é substituído por uma transiçao do sinal de áudio codificado de FD e do sinal de áudio codificado de LPD. Portanto, o decodificador deveria calcular um sinal de LPD para a parte de fade-out (diminuição gradual) do sinal de áudio codificado de FD para fade-in (aumento gradual) do sinal de áudio codificado de LPD. De acordo com uma aplicação, o decodificador de áudio 102 é configurado para comutação dentro de uma estrutura atual 204 de um sinal de áudio multicanal utilizando o decodificador de domínio de frequência 106 para decodificar uma estrutura prévia ao decodificador de domínio de previsão linear 104 para decodificar uma estrutura futura. O combinador 112 pode calcular um sinal médio sintético 226 da segunda representação multicanal 116 da estrutura atual. O primeiro decodificador multicanal conjunto 108 pode gerar a primeira representação multicanal 114 utilizando o sinal médio sintético 226 e uma primeira informação multicanal 20. Além disso, o combinador 112 é configurado para combinar a primeira representação multicanal e a segunda representação multicanal para obter uma estrutura atual decodificada do sinal de áudio multicanal.
[0089] A Figura 16 mostra um diagrama de tempo esquemático no codificador para realizar uma transição de uso da codificação de LPD ao uso da decodificação de FD em uma estrutura atual 232. Para comutar da codificação de LPD à FD, uma janela inicial 300a, 300b pode ser aplicada na codificação multicanal de FD. A janela inicial tem uma funcionalidade similar quando comparada à janela de parada 200a, 200b. Durante a fade-out do sinal mono de TCX codificado do codificador de LPD entre as linhas verticais 234 e 236, a janela inicial 300a, 300b realiza um fade-in. Ao utilizar a ACELP em vez de TCX, o sinal mono não realiza uma fade-out suave. Entretanto, o sinal de áudio correto pode ser reconstruído no decodificador utilizando, por exemplo, FAC. As janelas estéreo de LPD 238 e 240 são calculadas por padrão e se referem ao sinal mono de ACELP ou TCX codificado, indicado pela janela de análise de LPD 241.
[0090] A Figura 17 mostra um diagrama de tempo esquemático no decodificador correspondente ao diagrama de tempo do codificador descrito com relação à Figura 16.
[0091] Para transição do modo LPD ao modo FD, uma estrutura extra é decodificada pelo decodificador estéreo 146. O sinal médio dentro do decodificador do modo LPD é estendido com zero para o índice da estrutura i=ccfl/M.
Figure img0003
[0092] A decodificação estéreo, conforme previamente descrita, pode ser realizada mantendo os últimos parâmetros estéreos e deslizando a quantização inversa do sinal lateral ou seja code_mode é definido a 0. Além disso, o janelamento lateral direito após a DFT inversa não é aplicado, cujos resultados em uma margem acentuada 242a, 242b da janela de estéreo de LPD extra 244a, 244b. Pode ser claramente visto que a margem formada está localizada na seção plana 246a, 246b, onde toda a informação da parte correspondente da estrutura pode ser derivada do sinal de áudio codificado de FD. Portanto, um janelamento do lado direito (sem a margem acentuada) pode resultar em uma interferência indesejada da informação de LPD à informação de FD e é, portanto, não aplicada.
[0093] Os canais resultantes, esquerdo e direito, (decodificado de LPD) 250a, 250b (utilizando o sinal médio decodificado de LPD indicado pela janela de análise de LPD 248 e os parâmetros estéreos) são, então, combinados aos canais decodificados do modo de FD da próxima estrutura utilizando um processamento de adição por sobreposição no caso de TCX ao modo de FD ou utilizando um FAC para cada canal no caso de ACELP para o modo de FD. Uma ilustração esquemática das transições é representada na figure 17 onde M=ccfl/2.
[0094] De acordo com as aplicações, o decodificador de áudio 102 pode comutar dentro de uma estrutura atual 232 de um sinal de áudio multicanal da utilização do decodificador de domínio de previsão linear 104 para decodificar uma estrutura prévia ao decodificador de domínio de frequência 106 para decodificar uma estrutura futura. O decodificador estéreo 146 pode calcular um sinal de áudio multicanal sintético de um sinal mono decodificado do decodificador de domínio de previsão linear para uma estrutura atual utilizando a informação multicanal de uma estrutura prévia, em que o segundo decodificador multicanal conjunto 110 pode calcular a segunda representação multicanal para a estrutura atual e para ponderar a segunda representação multicanal utilizando uma janela inicial. O combinador 112 pode combinar o sinal de áudio multicanal sintético e a segunda representação multicanal ponderada para obter uma estrutura atual decodificada do sinal de áudio multicanal.
[0095] A Figura 18 mostra um diagrama de blocos esquemático de um codificador 2” para codificação de um sinal multicanal 4. O codificador de áudio 2” compreende um downmixer 12, um codificador de núcleo de domínio de previsão linear 16, um banco de filtro 82 e um codificador multicanal conjunto 18. O downmixer 12 é configurado para fazer o downmix do sinal multicanal 4 para obter um sinal de downmix 14. O sinal de downmix pode ser um sinal mono como, por exemplo, um sinal médio de um sinal de áudio multicanal M/S. O codificador de núcleo de domínio de previsão linear 16 pode codificar o sinal de downmix 14, em que o sinal de downmix 14 tem uma banda baixa e uma banda alta, em que o codificador de núcleo de domínio de previsão linear 16 é configurado para aplicar um processamento de extensão de largura de banda para parametricamente codificar a banda alta. Além disso, o banco de filtro 82 pode gerar a representação espectral do sinal multicanal 4 e o codificador multicanal conjunto 18 pode ser configurado para processar a representação espectral compreendendo a banda baixa e a banda alta do sinal multicanal para gerar a informação multicanal 20. A informação multicanal pode compreender parâmetros de ILD e/ou IPD e/ou IID (interaural intensity difference | diferença de intensidade interaural) que permitem um decodificador recalcular o sinal de áudio multicanal do sinal mono. Um desenho mais detalhado de outros aspectos das aplicações de acordo com este aspecto pode ser encontrado nas figuras anteriores, especialmente na Figura 4.
[0096] De acordo com as aplicações, o codificador de núcleo de domínio de previsão linear 16 pode compreender, ainda, um decodificador de domínio de previsão linear para decodificar o sinal de downmix codificado 26 para obter um sinal de downmix codificado e decodificado 54. Aqui, o codificador de núcleo de domínio de previsão linear pode formar um sinal médio de um sinal de áudio M/S que é codificado para transmissão a um decodificador. Além disso o codificador de áudio compreende ainda um codificador residual multicanal 56 para calcular um sinal residual multicanal codificado 58 utilizando o sinal de downmix codificado e decodificado 54. O sinal residual multicanal representa um erro entre uma representação multicanal decodificada utilizando a informação multicanal 20 e o sinal multicanal 4 antes do downmix. Em outras palavras, o sinal residual multicanal 58 pode ser um sinal lateral do sinal de áudio M/S, correspondente ao sinal médio calculado utilizando o codificador de núcleo de domínio de previsão linear.
[0097] De acordo com aplicações adicionais, o codificador de núcleo de domínio de previsão linear 16 é configurado para aplicar um processamento de extensão de largura de banda para parametricamente codificar a banda alta e para obter, como o sinal de downmix codificado e decodificado, apenas um sinal de banda baixa representando a banda baixa do sinal de downmix e em que o sinal residual multicanal codificado 58 tem apenas uma banda correspondente à banda baixa do sinal multicanal antes do downmix. De modo adicional ou alternativa, o codificador residual multicanal pode simular a extensão da largura de banda de domínio de tempo que é aplicada na banda alta do sinal multicanal no codificador de núcleo de domínio de previsão linear e para calcular um sinal residual ou sinal lateral para a banda alta permitir uma decodificação mais precisa do sinal mono ou sinal médio para derivar o sinal de áudio decodificado multicanal. A simulação pode compreender o mesmo ou cálculo similar, que é realizada no decodificador para decodificar a banda alta com largura de banda estendida. Uma abordagem alternativa ou adicional à simulação da extensão da largura de banda pode ser uma previsão do sinal lateral. Portanto, o codificador residual multicanal pode calcular um sinal de banda completa residual de uma representação paramétrica 83 do sinal de áudio multicanal 4 após a conversão de tempo- frequência no banco de filtro 82. Este sinal de banda completa lateral pode ser comparado com uma representação de frequência de um sinal médio de banda completa semelhantemente derivado da representação paramétrica 83. O sinal médio de banda completa pode ser, por exemplo, calculado como uma soma do canal esquerdo e direito da representação paramétrica 83 e do sinal de banda completa lateral como uma diferença respectiva. Além disso, a previsão pode, portanto, calcular um fator de previsão do sinal médio de banda completa minimizando uma diferença absoluta do sinal de banda completa lateral e do produto do fator de previsão e o sinal médio de banda completa.
[0098] Em outras palavras, o codificador de domínio de previsão linear pode ser configurado para calcular o sinal de downmix 14 como uma representação paramétrica de um sinal médio de um sinal de áudio multicanal M/S, em que o codificador residual multicanal pode ser configurado para calcular um sinal lateral correspondente ao sinal médio do sinal de áudio multicanal M/S, em que o codificador residual pode calcular uma banda alta do sinal médio utilizando a simulação da extensão da largura de banda de domínio de tempo ou em que o codificador residual pode prever a banda alta do sinal médio utilizando a constatação de uma informação de previsão que minimiza uma diferença entre um sinal lateral calculado e um sinal médio calculado de banda completa da estrutura prévia.
[0099] Outras aplicações mostram o codificador de núcleo de domínio de previsão linear 16 compreendendo um processador de ACELP 30. O processador de ACELP pode operar em um sinal de downmix com redução de taxa de amostragem 34. Além disso, um processador de extensão da largura de banda de domínio de tempo 36 é configurado para parametricamente codificar uma banda de uma parte do sinal de downmix removida do sinal de entrada ACELP por uma terceira redução de taxa de amostragem. De modo adicional ou alternativo, o codificador de núcleo de domínio de previsão linear 16 pode compreender um processador de TCX 32. O processador de TCX 32 pode operar no sinal de downmix 14 não reduzido na taxa de amostragem ou reduzido na taxa de amostragem por um grau menor do que a redução de taxa de amostragem para o processador de ACELP. Além disso, o processador de TCX pode compreender um primeiro conversor de tempo-frequência 40, um primeiro gerador de parâmetro 42 para gerar uma representação paramétrica 46 de um primeiro conjunto de bandas e um primeiro codificador do quantizador 44 para gerar um conjunto de linhas espectrais codificadas quantizadas 48 para um segundo conjunto de bandas. O processador de ACELP e o processador de TCX podem realizar separadamente, por exemplo, um primeiro número de estruturas é codificado utilizando ACELP e um segundo número de estruturas é codificado utilizando TCX ou em uma forma conjunta onde ambos, ACELP e TCX contribuem com a informação para decodificar uma estrutura.
[0100] Outras aplicações mostram o conversor de tempo-frequência 40 sendo diferente do banco de filtro 82. O banco de filtro 82 pode compreender parâmetros de filtro otimizados para gerar uma representação espectral 83 do sinal multicanal 4, em que o conversor de tempo-frequência 40 pode compreender parâmetros de filtro otimizados para gerar uma representação paramétrica 46 de um primeiro conjunto de bandas. Em uma etapa adicional, deve ser observado que o codificador de domínio de previsão linear utiliza diferente ou ainda nenhum banco de filtro no caso da extensão da largura de banda e/ou ACELP. Além disso, o banco de filtro 82 pode calcular parâmetros de filtro separados para gerar a representação espectral 83 sem ser dependentes de uma escolha de parâmetro anterior do codificador de domínio de previsão linear. Em outras palavras, a codificação multicanal no modo LPD pode utilizar um banco de filtro para o processamento multicanal (DFT) que não é o utilizado na extensão da largura de banda (domínio de tempo para ACELP e MDCT para TCX). Uma vantagem respectiva é que cada codificação paramétrica pode utilizar sua decomposição de tempo-frequência ideal para obter seus parâmetros. Por exemplo, uma combinação de ACELP + TDBWE e codificação multicanal paramétrica com banco de filtro externo (por exemplo, DFT) é vantajosa. Esta combinação é particularmente eficiente visto que sabe que a melhor extensão da largura de banda para fala deveria estar no domínio de tempo e no processamento no domínio de frequência multicanal. Visto que ACELP + TDBWE não têm qualquer conversor de tempo-frequência, um banco de filtro externo ou transformada como a DFT é preferida ou pode ser ainda necessária. Outros conceitos sempre utilizam o mesmo banco de filtro e, portanto, não utilizam bancos de filtro diferentes, como, por exemplo: - IGF e codificação conjunta de estéreo para AAC na MDCT; - SBR+PS para HeAACv2 em QMF; - SBR+MPS212 para USAC em QMF.
[0101] De acordo com aplicações adicionais, o codificador multicanal compreende um primeiro gerador de estrutura e o codificador de núcleo de domínio de previsão linear compreende um segundo gerador de estrutura, em que o primeiro e o segundo gerador de estrutura são configurados para formar uma estrutura do sinal multicanal 4, em que o primeiro e o segundo gerador de estrutura são configurados para formar uma estrutura de um comprimento similar. Em outras palavras, a estrutura do processador multicanal pode ser a mesma que a utilizada em ACELP. Mesmo se o processamento multicanal for feito no domínio de frequência, a resolução de tempo para computação de seus parâmetros ou downmix deve ser idealmente fechada a ou ainda igual à estrutura de ACELP. Um comprimento similar neste caso pode se referir à estrutura de ACELP que pode ser igual ou próxima à resolução de tempo para computar os parâmetros para processamento multicanal ou downmix.
[0102] De acordo com aplicações adicionais, o codificador de áudio compreende ainda um codificador de domínio de previsão linear 6 compreendendo o codificador de núcleo de domínio de previsão linear 16 e o codificador multicanal 18, um codificador de domínio de frequência 8 e a controlador 10 para comutação entre o codificador de domínio de previsão linear 6 e o codificador de domínio de frequência 8. O codificador de domínio de frequência 8 pode compreender um segundo codificador multicanal conjunto 22 para codificar a segunda informação multicanal 24 do sinal multicanal, em que o segundo codificador multicanal conjunto 22 é diferente do primeiro codificador multicanal conjunto 18. Além disso, o controlador 10 é configurado de modo que uma parte do sinal multicanal seja representada por uma estrutura codificada do codificador de domínio de previsão linear ou por uma estrutura codificada do codificador de domínio de frequência.
[0103] A Figura 19 mostra um diagrama de blocos esquemático de um decodificador 102” para decodificação de um sinal de áudio codificado 103, compreendendo um sinal central codificado, parâmetros de extensão da largura de banda e informação multicanal de acordo com um aspecto adicional. O decodificador de áudio compreende um decodificador de núcleo de domínio de previsão linear 104, um banco de filtro de análise 144, um decodificador multicanal 146 e um processador do banco de filtro de síntese 148. O decodificador de núcleo de domínio de previsão linear 104 pode decodificar o sinal central codificado para gerar um sinal mono. Isto pode ser um sinal médio (banda completa) de um sinal de áudio codificado M/S. O banco de filtro de análise 144 pode converter o sinal mono em uma representação espectral 145 em que o decodificador multicanal 146 pode gerar um primeiro espectro do canal e um segundo espectro do canal da representação espectral do sinal mono e a informação multicanal 20. Portanto, o decodificador multicanal pode utilizar a informação multicanal, por exemplo, compreendendo um sinal lateral correspondente ao sinal médio decodificado. Um processador do banco de filtro de síntese 148 configurado para a filtragem de síntese do primeiro espectro do canal para obter um primeiro sinal de canal e para filtragem de síntese do segundo espectro do canal para obter um segundo sinal de canal. Portanto, preferivelmente a operação inversa comparada ao banco de filtro de análise 144 pode ser aplicada ao primeiro e ao segundo sinal de canal, que pode ser uma IDFT se o banco de filtro de análise utilizar uma DFT. Entretanto, o processador do banco de filtro pode, por exemplo, processar os dois espectros do canal em paralelo ou em uma ordem consecutiva utilizando, por exemplo, o mesmo banco de filtro. Desenhos detalhados adicionais referente a este aspecto adicional podem ser vistos nas figuras anteriores, especialmente com a figura 7.
[0104] De acordo com aplicações adicionais, o decodificador de núcleo de domínio de previsão linear compreende um processador de extensão da largura de banda 126 para gerar uma parte de banda alta 140 dos parâmetros de extensão da largura de banda e o sinal mono de banda baixa ou o sinal central codificado para obter uma banda alta decodificada 140 do sinal de áudio, um processador do sinal de banda baixa configurado para decodificar o sinal mono de banda baixa e um combinador 128 configurado para calcular um sinal de banda completa mono utilizando o sinal mono de banda baixa decodificado e a banda alta do sinal de áudio decodificado. O sinal mono de banda baixa pode ser, por exemplo, uma representação de banda base de um sinal médio de um sinal de áudio multicanal M/S em que os parâmetros de extensão da largura de banda podem ser aplicados para calcular (no combinador 128) um sinal de banda completa mono do sinal mono de banda baixa.
[0105] De acordo com aplicações adicionais, o decodificador de domínio de previsão linear compreende um decodificador de ACELP 120, um sintetizador de banda baixa 122, um amplificador de taxa de amostragem 124, um processador de extensão da largura de banda de domínio de tempo 126 ou um segundo combinador 128, em que o segundo combinador 128 é configurado para combinar um sinal de banda baixa amplificado e um sinal de banda alta estendida da largura de banda 140 para obter um sinal mono decodificado de ACELP de banda completa. O decodificador de domínio de previsão linear pode compreender, ainda, um decodificador de TCX 130 e um processador de preenchimento de lacuna inteligente 132 para obter um sinal mono decodificado de TCX de banda completa. Portanto, um processador de síntese de banda completa 134 pode combinar o sinal mono decodificado de ACELP de banda completa e o sinal mono decodificado de TCX de banda completa. Adicionalmente, uma passagem cruzada 136 pode ser fornecida para inicializar o sintetizador de banda baixa utilizando a informação derivada por uma conversão de espectro-tempo de banda baixa do decodificador de TCX e o processador de IGF.
[0106] De acordo com aplicações adicionais, o decodificador de áudio compreende um decodificador de domínio de frequência 106, um segundo decodificador multicanal conjunto 110 para gerar uma segunda representação multicanal 116 utilizando uma saída do decodificador de domínio de frequência 106 e uma segunda informação multicanal 22, 24 e um primeiro combinador 112 para combinar o primeiro sinal de canal e o segundo sinal de canal com a segunda representação multicanal 116 para obter um sinal de áudio codificado 118, em que o segundo decodificador multicanal conjunto é diferente do primeiro decodificador multicanal conjunto. Portanto, o decodificador de áudio pode comutar entre uma decodificação multicanal paramétrica utilizando LPD ou uma decodificação de domínio de frequência. Esta abordagem já foi descrita em detalhes com relação às figuras anteriores.
[0107] De acordo com aplicações adicionais, o banco de filtro de análise 144 compreende uma DFT para converter o sinal mono em uma representação espectral 145 e em que o processador de síntese de banda completa 148 compreende uma IDFT para converter a representação espectral 145 ao primeiro e ao segundo sinal de canal. Além disso, o banco de filtro de análise pode aplicar uma janela na representação espectral convertida em DFT 145 de modo que uma parte direita da representação espectral de uma estrutura prévia e uma parte esquerda da representação espectral de uma estrutura atual estejam sobrepondo-se, em que a estrutura prévia e a estrutura atual são consecutivas. Em outras palavras, uma transição pode ser aplicada no bloco de DFT para outro para realizar uma leve transição entre os blocos de DFT consecutivos e/ou para reduzir as perturbações do bloco.
[0108] De acordo com aplicações adicionais, o decodificador multicanal 146 é configurado para obter o primeiro e o segundo sinal de canal do sinal mono, em que o sinal mono é um sinal médio de um sinal multicanal e em que o decodificador multicanal 146 é configurado para obter um sinal de áudio codificado de multicanal M/S, em que o decodificador multicanal é configurado para calcular o sinal lateral da informação multicanal. Além disso, o decodificador multicanal 146 pode ser configurado para calcular um sinal de áudio multicanal codificado L/R do sinal de áudio multicanal codificado M/S, em que o decodificador multicanal 146 pode calcular o sinal de áudio multicanal codificado L/R para uma banda baixa utilizando a informação multicanal e o sinal lateral. De modo adicional ou alternativo, o decodificador multicanal 146 pode calcular um sinal lateral previsto do sinal médio e em que o decodificador multicanal pode ser ainda configurado para calcular o sinal de áudio multicanal codificado L/R para uma banda alta utilizando o sinal lateral previsto e um valor de ILD da informação multicanal.
[0109] Além disso, o decodificador multicanal 146 pode ser configurado, ainda, para realizar uma operação complexa no sinal de áudio decodificado multicanal L/R, em que o decodificador multicanal pode calcular uma magnitude da operação complexa utilizando uma energia do sinal médio codificado e uma energia do sinal de áudio multicanal L/R decodificado para obter uma compensação de energia. Além disso, o decodificador multicanal é configurado para calcular uma fase da operação complexa utilizando um valor de IPD da informação multicanal. Após a decodificação, uma energia, um nível ou uma fase do sinal multicanal decodificado pode ser diferente do sinal mono decodificado. Portanto, a operação complexa pode ser determinada de modo que a energia, o nível ou a fase do sinal multicanal seja ajustado aos valores do sinal mono decodificado. Além disso, a fase pode ser ajustada a um valor de uma fase do sinal multicanal antes da codificação, utilizando, por exemplo, os parâmetros de IPD calculados da informação multicanal calculada no lado do codificador. Além disso, uma percepção humana do sinal multicanal decodificado pode ser adaptada a uma percepção humana do sinal original multicanal antes da codificação.
[0110] A Figura 20 mostra uma ilustração esquemática de um fluxograma de um método 2000 para codificação de um sinal multicanal. O método compreende uma etapa 2050 de redução do sinal multicanal para obter um sinal de downmix, uma etapa 2100 de codificação do sinal de downmix, em que o sinal de downmix tem uma banda baixa e uma banda alta, em que o codificador de núcleo de domínio de previsão linear é configurado para aplicar um processamento de extensão de largura de banda para parametricamente codificar a banda alta, uma etapa 2150 que gera uma representação espectral do sinal multicanal e uma etapa 2200 de processamento da representação espectral compreendendo a banda baixa e a banda alta do sinal multicanal para gerar a informação multicanal.
[0111] A Figura 21 mostra uma ilustração esquemática de um fluxograma de um método 2100 para decodificação de um sinal de áudio codificado, compreendendo um sinal central codificado, parâmetros de extensão da largura de banda e informação multicanal. O método compreende uma etapa 2105 para decodificar o sinal central codificado para gerar um sinal mono, uma etapa 2110 de conversão do sinal mono em uma representação espectral, uma etapa 2115 que gera um primeiro espectro do canal e um segundo espectro do canal da representação espectral do sinal mono e a informação multicanal e uma etapa 2120 de filtragem de síntese do primeiro espectro do canal para obter um primeiro sinal de canal e filtragem de síntese do segundo espectro do canal para obter um segundo sinal de canal.
[0112] Aplicações adicionais são descritas a seguir.
MUDANÇAS DE SINTAXE DO FLUXO CONTÍNUO DE DADOS
[0113] A Tabela 23 das especificações USAC [1], na seção 5.3.2 - Carga útil subsidiária, deve ser modificada, conforme segue: TABELA 1 — SINTAXE DE UsacCoreCoderData()
Figure img0004
[0114] A tabela a seguir deve ser adicionada: TABELA 1 — SINTAXE DE lpd_stereo_stream()
Figure img0005
Figure img0006
[0115] A descrição a seguir de carga útil deve ser adicionada na seção 6.2, Carga útil USAC. 6.2.x lpd_stereo_stream()
[0116] O procedimento detalhado da decodificação está descrito na seção de decodificação estéreo 7.x LPD. TERMOS E DEFINIÇÕES lpd_stereo_stream() Elemento de dados para decodificar os dados de estéreo para o modo LPD res_mode Bandeira que indica a resolução de frequência das bandas de parâmetro. q_mode Bandeira que indica a resolução de tempo das bandas de parâmetro. ipd_mode Campo de bit que define o máximo de bandas de parâmetro para o parâmetro IPD. pred_mode Bandeira que indica se a previsão é utilizada. cod_mode Campo de bit que define o máximo de bandas de parâmetro para o qual o sinal lateral é quantizado. Ild_idx[k][b] Índi ce de parâmetro ILD para a estrutura k e a banda b. Ipd_idx[k][b] Índi ce de parâmetro IPD para a estrutura k e banda b. pred_gain_idx[k][b] Índi ce de ganho de previsão para a estrutura k e a banda b. cod_gain_idx Índice de ganho global para o sinal lateral quantizado. ELEMENTOS DE AJUDA ccfl Comprimento da estrutura de código central. M Comprimento da estrutura de LPD de estéreo conforme definido na Tabela 7.x.1. band_config() Função que retorna o número de definida em bandas de parâmetro 7.x codificadas. A função é band_limits() Função que retorna o número de definida em bandas de parâmetro 7.x codificadas. A função é max_band() Função que retorna o número de bandas de parâmetro codificadas. A função é definida em 7.x ipd_max_band() Função que retorna o número de bandas de parâmetro codificadas. A função cod_max_band() Função que retorna o número de bandas de parâmetro codificadas. A função cod_L Número de linhas de DFT para o sinal lateral decodificado.
PROCESSO DE DECODIFICAÇÃO CODIFICAÇÃO DE ESTÉREO DE LPD DESCRIÇÃO DA FERRAMENTA
[0117] Estéreo de LPD é uma codificação discreta de estéreo M/S, onde o canal médio é codificado pelo codificador de núcleo mono de LPD e o sinal lateral codificado no domínio de DFT. O sinal médio decodificado é emitido ao decodificador mono de LPD e então processado pelo módulo de estéreo de LPD. A decodificação estéreo é feita no domínio de DFT onde os canais L e R são decodificados. Os dois canais decodificados são transformados de volta do Domínio de Tempo e podem ser, então, combinados neste domínio com os canais decodificados do modo FD. O modo de codificação de FD está utilizando suas próprias ferramentas de estéreo, ou seja, estéreo discreto com ou sem previsão complexa. ELEMENTOS DE DADOS res_mode Bandeira que indica a resolução de frequência das bandas de parâmetro. q_mode Bandeira que indica a resolução de tempo das bandas de parâmetro. ipd_mode Campo de bit que define o máximo de bandas de parâmetro para o parâmetro IPD. pred_mode Bandeira que indica se a previsão é utilizada. cod_mode Campo de bit que define o máximo de bandas de parâmetro para o qual o sinal lateral é quantizado. Ild_idx[k][b] Índi ce de parâmetro ILD para a estrutura k e banda b. Ipd_idx[k][b] Índi ce de parâmetro IPD para a estrutura k e banda b. pred_gain_idx[k][b] Índi ce de ganho de previsão para a estrutura k e banda b. cod_gain_idx Índice de ganho global para o sinal lateral quantizado. ELEMENTOS DE AJUDA ccfl Comprimento da estrutura de código central. M Comprimento da estrutura de LPD de estéreo conforme definido na Tabela 7.x.1. band_config() Função que retorna o número de bandas de parâmetro codificadas. A função é definida em 7.x band_limits() Função que retorna o número de bandas de parâmetro codificadas. A função é definida em 7.x max_band() Função que retorna o número de bandas de parâmetro codificadas. A função é definida em 7.x ipd_max_band() Função que retorna o número de bandas de parâmetro codificadas. A função cod_max_band() Função que retorna o número de bandas de parâmetro codificadas. A função cod_L Número de linhas de DFT para o sinal lateral decodificado.
PROCESSO DE DECODIFICAÇÃO
[0118] A decodificação estéreo é realizada no domínio de frequência. Ela age como um pós-processamento do decodificador de LPD. Ela recebe do decodificador de LPD a síntese do sinal mono médio. O sinal lateral é então decodificado ou previsto no domínio de frequência. Os espectros do canal são, então, reconstruídos no domínio de frequência antes de serem resintetizados no domínio de tempo. O estéreo LPD trabalha com um tamanho de estrutura fixa igual ao tamanho da estrutura de ACELP independentemente do modo de codificação utilizado no modo LPD.
ANÁLISE DE FREQUÊNCIA
[0119] O espectro de DFT do índice de índice de estrutura i é computado da estrutura decodificado x do comprimento M.
Figure img0007
[0120] onde N é o tamanho da análise do sinal, w é a janela de análise e x o sinal de tempo decodificado do decodificador de LPD no índice de estrutura i atrasado pelo tamanho da sobreposição L da DFT. M é igual ao tamanho da estrutura de ACELP na taxa de amostragem utilizada no modo FD. N é igual à estrutura de LPD de estéreo mais o tamanho da sobreposição da DFT. Os tamanhos estão dependendo da versão de LPD utilizada conforme reportado na Tabela 7.x.1. TABELA 7.X.1 — DFT E TAMANHOS DA ESTRUTURA DA LPD DE ESTÉREO
Figure img0008
[0121] A janela w é uma janela de seno definida como:
Figure img0009
CONFIGURAÇÃO DAS BANDAS DE PARÂMETRO
[0122] O espectro de DFT é dividido em bandas de frequência que não se sobrepõem, denominadas bandas de parâmetros. A divisão do espectro não é uniforme e simula a decomposição da frequência auditiva. Duas divisões diferentes do espectro são possíveis com largura de banda seguindo aproximadamente duas ou quatro vezes a largura de banda retangular equivalente (ERB | equivalent rectangular bandwidth).
[0123] A divisão do espectro é selecionada pelo elemento de dados res_mod e definida pelo seguinte pseudocódigo: function nbands=band_config(N,res_mod) band_limits [0]=1; nbands=0; while(band_limits[nbands++]<(N/2)){ if(stereo_lpd_res==0) band_limits[nbands]=band_limits_erb2[nbands]; else band_limits[nbands]=band_limits_erb4[nbands]; } nbands--; band_limits[nbands]=N/2; return nbands
[0124] onde nbands é o número total de bandas de parâmetro e N o tamanho da janela de análise de DFT. As tabelas band_limits_erb2 e band_limits_erb4 são definidas na Tabela 7.x.2. O decodificador pode mudar de forma adaptativa as resoluções das bandas de parâmetro do espectro a cada duas estruturas de LPD de estéreo. TABELA 7.X.2 — LIMITES DE BANDA DE PARÂMETRO DO ÍNDICE DE DFT K
Figure img0010
[0125] O número máximo de bandas de parâmetro para IPD é enviado dentro do elemento de dados do campo de 2 bits ipd_mod: ipd_max _band = max_band[res_mod][ipd_mod]
[0126] O número máximo de bandas de parâmetro para a codificação do sinal lateral é enviado dentro do elemento de dados do campo de 2 bits cod_mod: cod_max _band = max_band[res_mod][cod_mod]
[0127] A tabela max_band[][] é definida na Tabela 7.x.3.
[0128] O número de linhas decodificadas para esperar o sinal lateral é então computado como: cod_L = 2 ■ (band_limits[cod_max_band] — 1) TABELA 7.X.3 — NÚMERO MÁXIMO DE BANDAS PARA DIFERENTES MODOS DE CÓDIGO
Figure img0011
QUANTIZAÇÃO INVERSA DOS PARÂMETROS ESTÉREOS
[0129] Os parâmetros estéreos Diferenças de Nível Intercanal (ILD), Diferenças de Fase Intercanal (IPD) e ganhos de previsão são enviados a cada estrutura ou a cada duas estruturas, dependendo da bandeira q_mode. Se q_mode for igual a 0, os parâmetros são atualizados a cada estrutura. Caso contrário, os valores dos parâmetros só são atualizados para o índice ímpar i da estrutura de LPD de estéreo dentro da estrutura USAC. O índice i da estrutura de LPD de estéreo dentro da estrutura USAC pode ser entre 0 e 3 na LPD versão 0 e entre 0 e 1 na LPD versão 1.
[0130] A ILD é codificada, conforme segue:
Figure img0012
[0131] A IPD é decodificada para as bandas primárias ipd_max_band:
Figure img0013
[0132] Os ganhos de previsão são apenas decodificados da bandeira pred_mode e são definidos a um. Os ganhos decodificados sao, então:
Figure img0014
[0133] Se pred_mode for igual a zero, todos os ganhos são em zero.
[0134] Independentemente do valor de q_mode, a decodificação do sinal lateral é realizada a cada estrutura se code_mode for não zero. Ele primeiro decodifica um ganho global: _ iQCod_gain_idx[i]-20-127/<)0
[0135] O formato decodificado do sinal Lateral é a saída de AVQ descrita na especificação USAC [1], na seção
Figure img0015
TABELA DE QUANTIZAÇÃO INVERSA ILD_Q[]
Figure img0016
TABELA 7.X.5 - TABELA DE QUANTIZAÇÃO
Figure img0017
Figure img0018
MAPEAMENTO DE CANAL INVERSO
[0136] O sinal médio X e o sinal lateral S são primeiramente convertidos aos canais de esquerda e direita L e R, conforme segue:
Figure img0019
[0137] Onde o ganho g por banda de parâmetro é entregue a partir do parâmetro ILD:
Figure img0020
[0138] Para bandas de parâmetro abaixo cod_max_band, os dois canais são atualizados com o sinal lateral decodificado:
Figure img0021
[0139] Para bandas de parâmetro mais altas, o sinal lateral é previsto e os canais atualizados como:
Figure img0022
[0140] Finalmente, os canais são multiplicados por um valor complexo direcionado para recuperar a energia original e a fase intercanal dos sinais:
Figure img0023
Figure img0024
onde c é ligado para ser -12 e 12dB. e onde
Figure img0025
[0141] Onde atan2(x,y) é a tangente inversa de quadro-quadrante de x em y. SÍNTESE DE DOMÍNIO DE TEMPO
[0142] A partir dos dois espectros decodificados L e R, dois sinais de domínio de tempo l e r são sintetizados por uma DFT inversa:
Figure img0026
[0143] Finalmente, uma operação de sobreposição e adição permite a reconstrução de uma estrutura de amostras M:
Figure img0027
PÓS-PROCESSAMENTO
[0144] O pós-processamento de baixo é aplicado em dois canais separadamente. O processamento é para ambos os canais, o mesmo conforme descrito na seção 7.17 de [1].
[0145] Deve ser entendido que, no presente relatório descritivo, os sinais em linhas são às vezes nomeados pelos números de referência para as linhas ou às vezes são indicados pelos próprios números de referência que foram atribuídos às linhas. Portanto, a notação é tal que uma linha com um certo sinal está indicando o próprio sinal. Uma linha pode ser uma linha física em uma implementação conectada. Em uma implementação computadorizada, no entanto, uma linha física não existe, mas o sinal representado pela linha é transmitido a partir de um módulo de cálculo ao outro módulo de cálculo.
[0146] Embora a presente invenção tenha sido descrita no contexto de diagramas em blocos, em que os blocos representam componentes de hardware reais ou lógicos, a presente invenção também pode ser implementada por um método implementado por computador. Neste último caso, os blocos representam etapas do método correspondentes onde estas etapas representam as funcionalidades executadas pelos blocos de hardware lógico ou físico correspondentes.
[0147] Embora alguns aspectos tenham sido descritos no contexto de um aparelho, é evidente que estes aspectos também representam uma descrição do método correspondente, onde um bloco ou dispositivo corresponde a uma etapa do método ou característica de uma etapa do método. De forma análoga, aspectos descritos no contexto de uma etapa do método também representam uma descrição de um bloco ou item ou característica correspondente de um aparelho correspondente. Algumas ou todas as etapas do método podem ser executadas por (ou utilizando) um aparelho de hardware, tal como, por exemplo, um microprocessador, um computador programável ou um circuito eletrônico. Em algumas aplicações, uma ou mais da(s) etapa(s) mais importante(s) do método pode(m) ser executada(s) pelo referido aparelho.
[0148] O sinal codificado ou transmitido inventivo pode ser armazenado em um meio de armazenamento digital ou pode ser transmitido por um meio de transmissão, tal como um meio de transmissão sem frio ou um meio de transmissão cabeado, tal como a internet.
[0149] Dependendo de certas exigências de implementação, as aplicações da invenção podem ser implementadas em hardware ou em software. A implementação pode ser realizada utilizando um meio de armazenamento digital, por exemplo, um disquete, um DVD, um Blu-Ray, um CD, uma memória ROM, uma PROM, uma EPROM, uma EEPROM ou a memória flash, tendo sinais de controle eletronicamente legíveis armazenados nele, que cooperam (ou podem cooperar) com um sistema de computador programável, de modo que o respectivo método seja realizado. Portanto, o meio de armazenamento digital pode ser legível por computador.
[0150] Algumas aplicações de acordo com a invenção compreendem um transportador de dados, tendo sinais de controle eletronicamente legíveis, que podem cooperar com um sistema de computador programável, de modo que um dos métodos descritos aqui seja realizado.
[0151] Geralmente, as aplicações da presente invenção podem ser implementadas como um produto do programa de computador com um código de programa, o código de programa sendo operativo para realizar um dos métodos quando o produto do programa de computador é executado em um computador. O código de programa pode, por exemplo, ser armazenado em um transportador legível por máquina.
[0152] Outras aplicações compreendem o programa de computador para realizar um dos métodos descritos aqui, armazenado em um transportador legível por máquina.
[0153] Em outras palavras, uma aplicação do método inventivo é, portanto, um programa de computador tendo um código de programa para realizar um dos métodos descritos aqui, quando o programa de computador for executado em um computador.
[0154] Outra aplicação do método inventivo é, portanto, um transportador de dados (ou um meio de armazenamento não transitório, tal como um meio de armazenamento digital ou um meio legível por computador) compreendendo, gravado nele, o programa de computador para realizar um dos métodos descritos aqui. O transportador de dados, o meio de armazenamento digital ou o meio gravado são tipicamente tangíveis e/ou não transitórios.
[0155] Outra aplicação do método inventivo é, portanto, um fluxo de dados ou uma sequência de sinais representando o programa de computador para realizar um dos métodos descritos aqui. O fluxo de dados ou a sequência de sinais pode, por exemplo, ser configurado para ser transferido através de uma conexão de comunicação de dados, por exemplo, através da Internet.
[0156] Outra aplicação compreende um meio de processamento, por exemplo, um computador ou um dispositivo de lógica programável, configurado para ou adaptado para realizar um dos métodos descritos aqui.
[0157] Outra aplicação compreende um computador, tendo instalado nele o programa de computador para realizar um dos métodos descrito aqui.
[0158] Outra aplicação, de acordo com a invenção, compreende um aparelho ou um sistema configurado para transferir (por exemplo, eletrônica ou opticamente) um programa de computador para realizar um dos métodos descritos aqui a um receptor. O receptor pode, por exemplo, ser um computador, um dispositivo móvel, um dispositivo de memória ou semelhante. O aparelho ou sistema pode, por exemplo, compreender um servidor de arquivo para transferir o programa de computador ao receptor.
[0159] Em algumas aplicações, um dispositivo de lógica programável (por exemplo, um arranjo de portas programáveis de campo) pode ser utilizado para realizar algumas ou todas as funcionalidades dos métodos descritos aqui. Em algumas aplicações, um arranjo de portas programáveis de campo pode cooperar com um microprocessador, a fim de realizar um dos métodos descritos aqui. Geralmente, os métodos são preferivelmente realizados por qualquer aparelho de hardware.
[0160] As aplicações descritas acima são meramente ilustrativas para os princípios da presente invenção. Entende-se que modificações e variações das disposições e os detalhes descritos serão evidentes a outros especialistas na técnica. É intenção, portanto, ser limitada apenas pelo escopo das reivindicações de patente iminentes e não pelos detalhes específicos apresentados em forma de descrição e explicação das aplicações neste documento.

Claims (14)

1. Codificador de áudio (2”) para codificação de um sinal multicanal (4) compreendendo: um downmixer (12) para reduzir o sinal multicanal (4) para obter um sinal de downmix (14), um codificador central de domínio de previsão linear (16) para codificar o sinal de downmix (14), caracterizado pelo sinal de downmix (14) ter uma banda baixa e uma banda alta, em que o codificador central de domínio de previsão linear (16) é configurado para aplicar um processamento de extensão de largura de banda para parametricamente codificar a banda alta; um banco de filtro (82) para gerar uma representação espectral do sinal multicanal (4); e um codificador multicanal conjunto (18) configurado para processar a representação espectral compreendendo a banda baixa e a banda alta do sinal multicanal (4) para gerar a informação multicanal (20), em que o codificador central de domínio de previsão linear (16) compreende, ainda, um decodificador de domínio de previsão linear (50) para decodificar o sinal de downmix codificado (26) para obter um sinal de downmix codificado e decodificado (54); e em que o codificador de áudio (2”) compreende, ainda, um codificador multicanal residual (56) para calcular um sinal multicanal residual codificado (58), utilizando o sinal de downmix codificado e decodificado (54), o sinal multicanal residual codificado (58) representando um erro entre uma representação multicanal decodificada obtida utilizando-se a informação multicanal (20) e o sinal multicanal (4) antes de reduzir através do downmixer (12), em que o decodificador de domínio de previsão linear (50) é configurado para obter, como sinal de downmix codificado e decodificado (54), apenas um sinal de banda baixa representando a banda baixa do sinal de downmix (14), e em que o sinal multicanal residual codificado (58) tem apenas uma banda correspondente à banda baixa do sinal multicanal (4) antes de reduzir através do downmixer (12), ou em que o codificador central de domínio de previsão linear (16) compreende um processador de ACELP (30), em que o processador de ACELP (30) é configurado para operar em um sinal de downmix reduzido na taxa de amostragem (34) obtido pelo sinal de downmix (14), e em que um processador de extensão da largura de banda de domínio de tempo (36) é configurado para parametricamente codificar uma banda alta do sinal de downmix (14) removida do sinal de downmix (14) por meio da redução da taxa de amostragem usando o redutor de taxa de amostragem (35), e em que o codificador central de domínio de previsão linear (16) compreende um processador de TCX (32), em que o processador de TCX (32) é configurado para operar no sinal de downmix (14) não reduzido na taxa de amostragem ou reduzido na taxa de amostragem por um grau menor do que a redução da taxa de amostragem para o processador de ACELP realizada pelo redutor de taxa de amostragem (35), o processador de TCX (32) compreendendo um conversor de tempo-frequência (40), um gerador de parâmetro (42) para gerar uma representação paramétrica (46) de um primeiro conjunto de bandas e um primeiro codificador quantizador (44) para gerar um conjunto de linhas espectrais codificadas e quantizadas (48) para um segundo conjunto de bandas.
2. Codificador de áudio (2”), de acordo com a reivindicação 1, caracterizado pelo conversor de tempo- frequência (40) ser diferente do banco de filtro (82), em que o banco de filtro (82) compreende os parâmetros de filtro otimizados para gerar uma representação espectral do sinal multicanal (4) ou em que o conversor de tempo- frequência (40) compreende parâmetros de filtro otimizados para gerar uma representação paramétrica (46) de um primeiro conjunto de bandas.
3. Codificador de áudio (2”), de acordo com a reivindicação 1 ou 2, caracterizado pelo codificador multicanal conjunto (18) compreender um primeiro gerador de estrutura e em que o codificador central de domínio de previsão linear (16) compreende um segundo gerador de estrutura, em que o primeiro gerador de estrutura e o segundo gerador de estrutura são configurados para formar uma estrutura do sinal multicanal (4), em que o primeiro gerador de estrutura e o segundo gerador de estrutura são configurados para formar uma estrutura de comprimento similar.
4. Codificador de áudio (2”), de acordo com qualquer uma das reivindicações 1 a 3, compreendendo, ainda: um codificador de domínio de previsão linear (6) compreendendo o codificador central de domínio de previsão linear (16) e o codificador multicanal (18); um codificador de domínio de frequência (8); e um controlador (10) para comutar entre o codificador de domínio de previsão linear (6) e o codificador de domínio de frequência (8), caracterizado pelo codificador de domínio de frequência (8) compreender um segundo codificador multicanal conjunto (22) para codificar a segunda informação multicanal (24) do sinal multicanal, em que o segundo codificador multicanal conjunto (22) é diferente do primeiro codificador multicanal conjunto (18), e em que o controlador (10) é configurado tal que uma parte do sinal multicanal (4) seja representada por uma estrutura codificada do codificador de domínio de previsão linear (6) ou por uma estrutura codificada do codificador de domínio de frequência (8).
5. Codificador de áudio (2”), com qualquer uma das reivindicações 1 a 4, caracterizado pelo codificador central de domínio de previsão linear (16) ser configurado para calcular o sinal de downmix (14) como uma representação paramétrica de um sinal médio de um sinal de áudio multicanal M/S; em que o codificador multicanal residual (56) é configurado para calcular um sinal lateral correspondente ao sinal médio do sinal de áudio multicanal M/S, em que o codificador multicanal residual (56) é configurado para calcular uma banda alta do sinal médio, utilizando a simulação da extensão de largura de banda de domínio de tempo, ou em que o codificador multicanal residual (56) é configurado para prever a banda alta do sinal médio, utilizando a localização de uma informação de previsão que minimiza uma diferença entre um sinal lateral calculado e um sinal médio de banda completa calculada de uma estrutura prévia.
6. Decodificador de áudio (102”) para decodificação de um sinal de áudio codificado (103) compreendendo um sinal codificado central, parâmetros de extensão da largura de banda e informação multicanal (20), o decodificador de áudio (102”) caracterizado por compreender: um decodificador central de domínio de previsão linear (104) para decodificar o sinal codificado central para gerar um sinal mono (142); um banco de filtro de análise (144) para converter o sinal mono (142) em uma representação espectral (145); um decodificador multicanal (146) para gerar um primeiro espectro de canal e um segundo espectro de canal da representação espectral (145) do sinal mono (142) e da informação multicanal (20); e um processador de banco de filtro de síntese (148) para filtragem por síntese do primeiro espectro de canal para obter um primeiro sinal de canal e para filtragem por síntese do segundo espectro de canal para obter um segundo sinal de canal, em que o decodificador multicanal (146) é configurado para obter o primeiro sinal de canal e o segundo sinal de canal do sinal mono (142), em que o sinal mono (142) é um sinal médio de um sinal multicanal, para obter um sinal de áudio multicanal M/S (médio/lateral) decodificado, para calcular o sinal lateral da informação multicanal (20), e para calcular um sinal de áudio multicanal L/R (esquerda/direita) decodificado do sinal de áudio multicanal M/S decodificado e para calcular o sinal de áudio multicanal L/R decodificado para uma banda baixa utilizando a informação multicanal (20) e o sinal lateral; ou para calcular um sinal lateral previsto do sinal médio e para calcular o sinal de áudio multicanal L/R decodificado para uma banda alta utilizando o sinal lateral previsto e um valor ILD (diferença de nível intercanal) da informação multicanal (20), ou em que o decodificador central de domínio de previsão linear (104) compreende: um processador de extensão de largura de banda de domínio de tempo (126) para gerar um sinal de banda alta estendido pela largura de banda (140) dos parâmetros de extensão da largura de banda e do sinal mono de banda baixa ou do sinal codificado central, em que o sinal de banda alta estendido pela largura de banda (140) é uma banda alta decodificada (140) do sinal de áudio; um decodificador de ACELP (120), um sintetizador de banda baixa (122), um amplificador da taxa de amostragem (124) para emitir um sinal de banda baixa amplificado na taxa de amostragem que seja um sinal mono de banda baixa decodificado; um combinador (128) configurado para calcular um sinal mono decodificado de ACELP de banda completa utilizando o sinal mono de banda baixa decodificado e a banda alta decodificada (140) do sinal de áudio, um decodificador de TCX (130) e um processador de preenchimento de lacuna inteligente (132) para obter um sinal mono decodificado de TCX de banda completa; e um processador de síntese de banda completa (134) para combinar o sinal mono decodificado de ACELP de banda completa e o sinal mono decodificado de TCX de banda completa.
7. Decodificador de áudio (102”), de acordo com a reivindicação 6, caracterizado pela passagem cruzada (136) ser fornecida para inicializar o sintetizador de banda baixa (122) utilizando informação derivada de uma conversão de espectro-tempo de uma banda baixa de um sinal gerado pelo decodificador de TCX (130) e pelo processador de preenchimento de lacuna inteligente (132).
8. Decodificador de áudio (102”), de acordo com a reivindicação 6 ou 7, caracterizado por compreender, ainda: um decodificador de domínio de frequência (106); um segundo decodificador multicanal conjunto (110) para gerar uma segunda representação multicanal (116), utilizando uma saída do decodificador de domínio de frequência (106) e uma segunda informação multicanal (22, 24); e um primeiro combinador (112) para combinar o primeiro sinal de canal e o segundo sinal de canal com a segunda representação multicanal (116) para obter um sinal de áudio decodificado (118); em que o segundo decodificador multicanal conjunto (10) é diferente do decodificador multicanal (146).
9. Decodificador de áudio (102”), de acordo com a reivindicação 6, 7 ou 8, caracterizado pelo banco de filtro de análise (144) compreender uma DFT para converter o sinal mono (142) em uma representação espectral (145) e em que o processador de banco de filtro de síntese (148) compreende uma IDFT para converter o primeiro espectro de canal no primeiro sinal de canal e para converter o segundo espectro de canal no segundo sinal de canal.
10. Decodificador de áudio (102”), de acordo com a reivindicação 9, caracterizado pelo banco de filtro de análise (144) ser configurado para aplicar uma janela na representação espectral convertida em DFT (145), de modo que uma parte direita da representação espectral de uma estrutura prévia e uma parte esquerda da representação espectral de uma estrutura atual sejam sobrepostas, em que a estrutura prévia e a estrutura atual são consecutivas.
11. Decodificador de áudio (102”), de acordo com a reivindicação 6, caracterizado pelo decodificador multicanal (146) ser configurado, ainda para realizar uma operação complexa no sinal de áudio multicanal decodificado L/R; para calcular uma magnitude da operação complexa utilizando uma energia do sinal médio codificado e uma energia do sinal de áudio multicanal L/R decodificado para obter uma compensação de energia; e para calcular uma fase da operação complexa utilizando um valor IPD (diferença de fase intercanal) da informação multicanal.
12. Método (2000) para codificação de um sinal multicanal (4), o método compreendendo: reduzir o sinal multicanal (4) para obter um sinal de downmix (14), codificação central de domínio de previsão linear (16) do sinal de downmix (14) para obter um sinal de downmix codificado (14) caracterizado pelo sinal de downmix (14) ter uma banda baixa e uma banda alta, em que a codificação central de domínio de previsão linear (16) do sinal de downmix (14) compreende aplicar um processamento de extensão de largura de banda para parametricamente codificar a banda alta; gerar uma representação espectral do sinal multicanal (4); e processar a representação espectral compreendendo a banda baixa e a banda alta do sinal multicanal (4), para gerar a informação multicanal (20), em que codificar o sinal de downmix (14) compreende, ainda, decodificar o sinal de downmix codificado (26) para obter um sinal de downmix codificado e decodificado (54), em que o método (2000) compreende, ainda, calcular um sinal multicanal residual codificado (58), utilizando o sinal de downmix codificado e decodificado (54), o sinal multicanal residual codificado (58) representando um erro entre uma representação multicanal decodificada obtida utilizando-se a informação multicanal (20) e o sinal multicanal (4) antes de reduzir o sinal multicanal(14), em que a codificação do sinal de downmix (14) compreende aplicar um processamento de extensão de largura de banda para parametricamente codificar a banda alta, e em que a decodificação do sinal de downmix codificado (26) é configurada para obter, como sinal de downmix codificado e decodificado (54), apenas um sinal de banda baixa representando a banda baixa do sinal de downmix (14), e em que o sinal multicanal residual codificado (58) tem apenas uma banda correspondente à banda baixa do sinal multicanal (4) antes de reduzir o sinal multicanal(14), ou em que a codificação do sinal de downmix (14) compreende realizar um processamento de ACELP (30), em que o processamento de ACELP é configurado para operar em um sinal de downmix reduzido na taxa de amostragem (34), e em que um processamento de extensão da largura de banda de domínio de tempo (36) é configurado para parametricamente codificar a banda alta do sinal de downmix (14) removida do sinal de downmix (14) por meio da redução da taxa de amostragem, e em que a codificação do sinal de downmix (14) compreende um processamento de TCX (32), em que o processamento de TCX (32) é configurado para operar no sinal de downmix (14) não reduzido na taxa de amostragem ou reduzido na taxa de amostragem por um grau menor do que a redução da taxa de amostragem para o processamento de ACELP (30), o processamento de TCX compreendendo um conversor de tempo-frequência (40), um gerador de parâmetro (42) para gerar uma representação paramétrica (46) de um primeiro conjunto de bandas e um codificador quantizador (44) para gerar um conjunto de linhas espectrais codificadas e quantizadas (48) para um segundo conjunto de bandas.
13. Método (2100) para decodificação de um sinal de áudio codificado (103) compreendendo um sinal codificado central, parâmetros de extensão da largura de banda e a informação multicanal (20), o método (2100) é caracterizado por compreender: decodificação central de domínio de previsão linear (104) do sinal codificado central para gerar um sinal mono (142); conversão do sinal mono (142) em uma representação espectral (145); geração de um primeiro espectro de canal e de um segundo espectro de canal da representação espectral (145) do sinal mono (142) e da informação multicanal (20); e filtragem por síntese do primeiro espectro de canal para obter um primeiro sinal de canal e filtragem por síntese do segundo espectro de canal para obter um segundo sinal de canal, em que a geração do primeiro espectro de canal e do segundo espectro de canal compreende obter o primeiro sinal de canal e o segundo sinal de canal do sinal mono, em que o sinal mono (142) é um sinal médio de um sinal multicanal, para obter um sinal de áudio multicanal M/S decodificado, para calcular o sinal lateral da informação multicanal (20), e para calcular um sinal de áudio multicanal L/R decodificado do sinal de áudio multicanal M/S decodificado e para calcular o sinal de áudio multicanal L/R decodificado para uma banda baixa utilizando a informação multicanal (20) e o sinal lateral; ou para calcular um sinal lateral previsto do sinal médio e para calcular o sinal de áudio multicanal L/R decodificado para uma banda alta utilizando o sinal lateral previsto e um valor ILD (diferença de nível intercanal) da informação multicanal (20), ou em que a decodificação do sinal codificado central compreende: um processamento de extensão de largura de banda de domínio de tempo (126) para gerar um sinal de banda alta estendido pela largura de banda (140) dos parâmetros de extensão da largura de banda e do sinal mono de banda baixa ou do sinal codificado central, em que o sinal de banda alta estendido pela largura de banda (140) é uma banda alta decodificada (140) do sinal de áudio; decodificação de ACELP (120), sintetização de banda baixa (122), amplificação da taxa de amostragem (124) para gerar um sinal de banda baixa amplificado na taxa de amostragem que seja um sinal mono de banda baixa decodificado; calcular um sinal mono decodificado de ACELP de banda completa utilizando a combinação (128) do sinal mono de banda baixa decodificado e da banda alta decodificada (140) do sinal de áudio, decodificação de TCX (130) e processamento de preenchimento de lacuna inteligente (132) para obter um sinal mono decodificado de TCX de banda completa; e processamento de síntese de banda completa (134) compreendendo a combinação do sinal mono decodificado de ACELP de banda completa e do sinal mono decodificado de TCX de banda completa.
14. Método (2100), de acordo com a reivindicação 13, caracterizado pela passagem cruzada (136) ser fornecida para inicializar a sintetização de banda baixa (122) utilizando informação derivada de uma conversão de espectro-tempo de uma banda baixa de um sinal a partir da decodificação de TCX (130) e a partir do processamento de preenchimento de lacuna inteligente (132).
BR112017018441-9A 2015-03-09 2016-03-07 Codificador de áudio para codificação de um sinal multicanal e decodificador de áudio para decodificação de um sinal de áudio codificado BR112017018441B1 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP15158233.5 2015-03-09
EP15158233 2015-03-09
EP15172599.1 2015-06-17
EP15172599.1A EP3067887A1 (en) 2015-03-09 2015-06-17 Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
PCT/EP2016/054775 WO2016142336A1 (en) 2015-03-09 2016-03-07 Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal

Publications (2)

Publication Number Publication Date
BR112017018441A2 BR112017018441A2 (pt) 2018-04-17
BR112017018441B1 true BR112017018441B1 (pt) 2022-12-27

Family

ID=52682621

Family Applications (4)

Application Number Title Priority Date Filing Date
BR122022025643-0A BR122022025643B1 (pt) 2015-03-09 2016-03-07 Codificador de áudio para codificação de um sinal multicanal e decodificador de áudio para decodificação de um sinal de áudio codificado
BR112017018439-7A BR112017018439B1 (pt) 2015-03-09 2016-03-07 Codificador de áudio para codificação de um sinal multicanal e decodificador de áudio para decodificação de um sinal de áudio codificado
BR112017018441-9A BR112017018441B1 (pt) 2015-03-09 2016-03-07 Codificador de áudio para codificação de um sinal multicanal e decodificador de áudio para decodificação de um sinal de áudio codificado
BR122022025766-6A BR122022025766B1 (pt) 2015-03-09 2016-03-07 Codificador de áudio para codificação de um sinal multicanal e decodificador de áudio para decodificação de um sinal de áudio codificado

Family Applications Before (2)

Application Number Title Priority Date Filing Date
BR122022025643-0A BR122022025643B1 (pt) 2015-03-09 2016-03-07 Codificador de áudio para codificação de um sinal multicanal e decodificador de áudio para decodificação de um sinal de áudio codificado
BR112017018439-7A BR112017018439B1 (pt) 2015-03-09 2016-03-07 Codificador de áudio para codificação de um sinal multicanal e decodificador de áudio para decodificação de um sinal de áudio codificado

Family Applications After (1)

Application Number Title Priority Date Filing Date
BR122022025766-6A BR122022025766B1 (pt) 2015-03-09 2016-03-07 Codificador de áudio para codificação de um sinal multicanal e decodificador de áudio para decodificação de um sinal de áudio codificado

Country Status (19)

Country Link
US (7) US10388287B2 (pt)
EP (9) EP3067886A1 (pt)
JP (6) JP6606190B2 (pt)
KR (2) KR102151719B1 (pt)
CN (6) CN112634913B (pt)
AR (6) AR103881A1 (pt)
AU (2) AU2016231283C1 (pt)
BR (4) BR122022025643B1 (pt)
CA (2) CA2978814C (pt)
ES (6) ES2910658T3 (pt)
FI (1) FI3958257T3 (pt)
MX (2) MX366860B (pt)
MY (2) MY186689A (pt)
PL (6) PL3910628T3 (pt)
PT (3) PT3268957T (pt)
RU (2) RU2679571C1 (pt)
SG (2) SG11201707343UA (pt)
TW (2) TWI609364B (pt)
WO (2) WO2016142337A1 (pt)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3067886A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
KR102083200B1 (ko) 2016-01-22 2020-04-28 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 스펙트럼-도메인 리샘플링을 사용하여 멀티-채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법
CN107731238B (zh) * 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
US10573326B2 (en) * 2017-04-05 2020-02-25 Qualcomm Incorporated Inter-channel bandwidth extension
US10224045B2 (en) 2017-05-11 2019-03-05 Qualcomm Incorporated Stereo parameters for stereo decoding
JP7009509B2 (ja) 2017-05-18 2022-01-25 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ネットワーク装置の管理
US10431231B2 (en) * 2017-06-29 2019-10-01 Qualcomm Incorporated High-band residual prediction with time-domain inter-channel bandwidth extension
US10475457B2 (en) 2017-07-03 2019-11-12 Qualcomm Incorporated Time-domain inter-channel prediction
CN114898761A (zh) 2017-08-10 2022-08-12 华为技术有限公司 立体声信号编解码方法及装置
US10535357B2 (en) 2017-10-05 2020-01-14 Qualcomm Incorporated Encoding or decoding of audio signals
US10734001B2 (en) * 2017-10-05 2020-08-04 Qualcomm Incorporated Encoding or decoding of audio signals
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483882A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3729427A1 (en) * 2017-12-19 2020-10-28 Dolby International AB Methods and apparatus for unified speech and audio decoding qmf based harmonic transposer improvements
TWI812658B (zh) * 2017-12-19 2023-08-21 瑞典商都比國際公司 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統
TWI760593B (zh) * 2018-02-01 2022-04-11 弗勞恩霍夫爾協會 使用混成式編碼器/解碼器空間分析之音訊場景編碼器、音訊場景解碼器及相關方法
EP3550561A1 (en) * 2018-04-06 2019-10-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value
EP3588495A1 (en) * 2018-06-22 2020-01-01 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Multichannel audio coding
CN111819627A (zh) * 2018-07-02 2020-10-23 杜比实验室特许公司 用于对沉浸式音频信号进行编码及/或解码的方法及装置
AU2019298307A1 (en) * 2018-07-04 2021-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multisignal audio coding using signal whitening as preprocessing
WO2020094263A1 (en) 2018-11-05 2020-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs
EP3719799A1 (en) * 2019-04-04 2020-10-07 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation
WO2020216459A1 (en) * 2019-04-23 2020-10-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method or computer program for generating an output downmix representation
CN110267142B (zh) * 2019-06-25 2021-06-22 维沃移动通信有限公司 一种移动终端及控制方法
FR3101741A1 (fr) * 2019-10-02 2021-04-09 Orange Détermination de corrections à appliquer à un signal audio multicanal, codage et décodage associés
US11432069B2 (en) * 2019-10-10 2022-08-30 Boomcloud 360, Inc. Spectrally orthogonal audio component processing
CA3163373A1 (en) * 2020-02-03 2021-08-12 Vaclav Eksler Switching between stereo coding modes in a multichannel sound codec
CN111654745B (zh) * 2020-06-08 2022-10-14 海信视像科技股份有限公司 多声道的信号处理方法及显示设备
CN116324980A (zh) * 2020-09-25 2023-06-23 苹果公司 声道、对象和hoa音频内容的无缝可扩展解码
MX2023003965A (es) * 2020-10-09 2023-05-25 Fraunhofer Ges Forschung Aparato, metodo, o programa de computadora para procesar una escena de audio codificada utilizando una extension de ancho de banda.
JPWO2022176270A1 (pt) * 2021-02-16 2022-08-25
CN115881140A (zh) * 2021-09-29 2023-03-31 华为技术有限公司 编解码方法、装置、设备、存储介质及计算机程序产品
TW202334938A (zh) * 2021-12-20 2023-09-01 瑞典商都比國際公司 正交鏡像濾波器域中之沉浸式音訊及視訊服務空間重建濾波器庫

Family Cites Families (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1311059C (en) * 1986-03-25 1992-12-01 Bruce Allen Dautrich Speaker-trained speech recognizer having the capability of detecting confusingly similar vocabulary words
DE4307688A1 (de) 1993-03-11 1994-09-15 Daimler Benz Ag Verfahren zur Geräuschreduktion für gestörte Sprachkanäle
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP3593201B2 (ja) * 1996-01-12 2004-11-24 ユナイテッド・モジュール・コーポレーション オーディオ復号装置
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
CN1266674C (zh) * 2000-02-29 2006-07-26 高通股份有限公司 闭环多模混合域线性预测语音编解码器和处理帧的方法
SE519981C2 (sv) 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
KR20060131767A (ko) * 2003-12-04 2006-12-20 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 신호 코딩
US7742912B2 (en) * 2004-06-21 2010-06-22 Koninklijke Philips Electronics N.V. Method and apparatus to encode and decode multi-channel audio signals
US7391870B2 (en) 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
KR20070056081A (ko) * 2004-08-31 2007-05-31 마츠시타 덴끼 산교 가부시키가이샤 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법
KR20070092240A (ko) * 2004-12-27 2007-09-12 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
WO2007026763A1 (ja) * 2005-08-31 2007-03-08 Matsushita Electric Industrial Co., Ltd. ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法
WO2008035949A1 (en) 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
CN101067931B (zh) * 2007-05-10 2011-04-20 芯晟(北京)科技有限公司 一种高效可配置的频域参数立体声及多声道编解码方法与系统
WO2009007639A1 (fr) 2007-07-03 2009-01-15 France Telecom Quantification apres transformation lineaire combinant les signaux audio d'une scene sonore, codeur associe
CN101373594A (zh) * 2007-08-21 2009-02-25 华为技术有限公司 修正音频信号的方法及装置
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
AU2008326956B2 (en) * 2007-11-21 2011-02-17 Lg Electronics Inc. A method and an apparatus for processing a signal
KR20100086000A (ko) * 2007-12-18 2010-07-29 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US9659568B2 (en) * 2007-12-31 2017-05-23 Lg Electronics Inc. Method and an apparatus for processing an audio signal
ATE500588T1 (de) 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
JP5333446B2 (ja) 2008-04-25 2013-11-06 日本電気株式会社 無線通信装置
EP3002750B1 (en) 2008-07-11 2017-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding audio samples
CN102105930B (zh) * 2008-07-11 2012-10-03 弗朗霍夫应用科学研究促进协会 用于编码采样音频信号的帧的音频编码器和解码器
CA2871268C (en) * 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
JP5325293B2 (ja) * 2008-07-11 2013-10-23 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 符号化されたオーディオ信号を復号化するための装置および方法
EP2144231A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
JP5203077B2 (ja) 2008-07-14 2013-06-05 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
EP2146344B1 (en) * 2008-07-17 2016-07-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding/decoding scheme having a switchable bypass
WO2010013450A1 (ja) * 2008-07-29 2010-02-04 パナソニック株式会社 音響符号化装置、音響復号化装置、音響符号化復号化装置および会議システム
EP2224433B1 (en) * 2008-09-25 2020-05-27 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
TWI520128B (zh) * 2008-10-08 2016-02-01 弗勞恩霍夫爾協會 多解析度切換音訊編碼/解碼方案(一)
EP2345027B1 (en) 2008-10-10 2018-04-18 Telefonaktiebolaget LM Ericsson (publ) Energy-conserving multi-channel audio coding and decoding
MX2011009660A (es) * 2009-03-17 2011-09-30 Dolby Int Ab Codificacion estereo avanzada basada en una combinacion de codificacion izquierda/derecha o media/lateral seleccionable de manera adaptable y de codificacion estereo parametrica.
GB2470059A (en) * 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
RU2591661C2 (ru) * 2009-10-08 2016-07-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Многорежимный декодировщик аудио сигнала, многорежимный кодировщик аудио сигналов, способы и компьютерные программы с использованием кодирования с линейным предсказанием на основе ограничения шума
CA2778240C (en) * 2009-10-20 2016-09-06 Fraunhofer Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-mode audio codec and celp coding adapted therefore
KR101414305B1 (ko) * 2009-10-20 2014-07-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 저 지연 애플리케이션들에서 사용하기 위한 오디오 신호 인코더, 오디오 신호 디코더, 오디오 콘텐츠의 인코딩된 표현을 제공하는 방법, 오디오 콘텐츠의 디코딩된 표현을 제공하는 방법 및 컴퓨터 프로그램
EP4358082A1 (en) * 2009-10-20 2024-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
WO2011059254A2 (en) * 2009-11-12 2011-05-19 Lg Electronics Inc. An apparatus for processing a signal and method thereof
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
US8166830B2 (en) * 2010-07-02 2012-05-01 Dresser, Inc. Meter devices and methods
JP5499981B2 (ja) * 2010-08-02 2014-05-21 コニカミノルタ株式会社 画像処理装置
KR101468458B1 (ko) * 2010-11-12 2014-12-03 폴리콤 인코포레이티드 멀티 포인트 환경에서의 스케일러블 오디오
CN107516532B (zh) * 2011-03-18 2020-11-06 弗劳恩霍夫应用研究促进协会 音频内容的编码和解码方法以及介质
CN104364842A (zh) * 2012-04-18 2015-02-18 诺基亚公司 立体声音频信号编码器
US9489962B2 (en) * 2012-05-11 2016-11-08 Panasonic Corporation Sound signal hybrid encoder, sound signal hybrid decoder, sound signal encoding method, and sound signal decoding method
CN102779518B (zh) * 2012-07-27 2014-08-06 深圳广晟信源技术有限公司 用于双核编码模式的编码方法和系统
TWI618050B (zh) * 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
TWI579831B (zh) * 2013-09-12 2017-04-21 杜比國際公司 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統
US20150159036A1 (en) 2013-12-11 2015-06-11 Momentive Performance Materials Inc. Stable primer formulations and coatings with nano dispersion of modified metal oxides
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
EP3067886A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal

Also Published As

Publication number Publication date
ES2951090T3 (es) 2023-10-17
ES2958535T3 (es) 2024-02-09
CN112951248A (zh) 2021-06-11
PT3958257T (pt) 2023-07-24
PL3958257T3 (pl) 2023-09-18
EP3910628C0 (en) 2023-08-02
AR103881A1 (es) 2017-06-07
PT3268957T (pt) 2022-05-16
CN107430863A (zh) 2017-12-01
EP3268958B1 (en) 2021-11-10
CN112614497A (zh) 2021-04-06
AR123835A2 (es) 2023-01-18
PT3268958T (pt) 2022-01-07
JP2020074013A (ja) 2020-05-14
CA2978814A1 (en) 2016-09-15
US20220093112A1 (en) 2022-03-24
US11107483B2 (en) 2021-08-31
EP3268957A1 (en) 2018-01-17
US20170365263A1 (en) 2017-12-21
EP3879528C0 (en) 2023-08-02
BR122022025766B1 (pt) 2023-12-26
US20220139406A1 (en) 2022-05-05
TW201636999A (zh) 2016-10-16
ES2910658T3 (es) 2022-05-13
WO2016142336A1 (en) 2016-09-15
EP3067887A1 (en) 2016-09-14
CA2978812C (en) 2020-07-21
TW201637000A (zh) 2016-10-16
JP6606190B2 (ja) 2019-11-13
BR112017018441A2 (pt) 2018-04-17
EP3879528A1 (en) 2021-09-15
EP3910628A1 (en) 2021-11-17
CN112614496B (zh) 2024-04-09
JP2020038374A (ja) 2020-03-12
US20170365264A1 (en) 2017-12-21
AU2016231284B2 (en) 2019-08-15
JP2018511825A (ja) 2018-04-26
JP2018511827A (ja) 2018-04-26
FI3958257T3 (fi) 2023-06-27
AR103880A1 (es) 2017-06-07
CN107408389B (zh) 2021-03-02
CN112634913A (zh) 2021-04-09
MX2017011493A (es) 2018-01-25
US11238874B2 (en) 2022-02-01
ES2901109T3 (es) 2022-03-21
CN112634913B (zh) 2024-04-09
KR102151719B1 (ko) 2020-10-26
EP3879527A1 (en) 2021-09-15
EP4224470A1 (en) 2023-08-09
WO2016142337A1 (en) 2016-09-15
JP2023029849A (ja) 2023-03-07
MY186689A (en) 2021-08-07
EP3910628B1 (en) 2023-08-02
PL3910628T3 (pl) 2024-01-15
BR112017018439B1 (pt) 2023-03-21
EP3958257B1 (en) 2023-05-10
KR102075361B1 (ko) 2020-02-11
BR112017018439A2 (pt) 2018-04-17
JP6643352B2 (ja) 2020-02-12
EP3268957B1 (en) 2022-03-02
AU2016231283C1 (en) 2020-10-22
PL3268957T3 (pl) 2022-06-27
BR122022025643B1 (pt) 2024-01-02
RU2679571C1 (ru) 2019-02-11
MX366860B (es) 2019-07-25
KR20170126994A (ko) 2017-11-20
US20190221218A1 (en) 2019-07-18
US11881225B2 (en) 2024-01-23
KR20170126996A (ko) 2017-11-20
AU2016231284A1 (en) 2017-09-28
EP3268958A1 (en) 2018-01-17
JP7077290B2 (ja) 2022-05-30
AR123834A2 (es) 2023-01-18
EP3879527C0 (en) 2023-08-02
JP7469350B2 (ja) 2024-04-16
JP2022088470A (ja) 2022-06-14
AR123837A2 (es) 2023-01-18
PL3268958T3 (pl) 2022-03-21
EP3067886A1 (en) 2016-09-14
US10777208B2 (en) 2020-09-15
CA2978814C (en) 2020-09-01
US10388287B2 (en) 2019-08-20
ES2959910T3 (es) 2024-02-28
CA2978812A1 (en) 2016-09-15
JP7181671B2 (ja) 2022-12-01
SG11201707343UA (en) 2017-10-30
EP3958257A1 (en) 2022-02-23
TWI609364B (zh) 2017-12-21
US11741973B2 (en) 2023-08-29
AU2016231283A1 (en) 2017-09-28
CN107430863B (zh) 2021-01-26
SG11201707335SA (en) 2017-10-30
ES2959970T3 (es) 2024-02-29
PL3879527T3 (pl) 2024-01-15
AR123836A2 (es) 2023-01-18
CN112614496A (zh) 2021-04-06
EP3879528B1 (en) 2023-08-02
MY194940A (en) 2022-12-27
MX2017011187A (es) 2018-01-23
EP3879527B1 (en) 2023-08-02
RU2680195C1 (ru) 2019-02-18
CN107408389A (zh) 2017-11-28
PL3879528T3 (pl) 2024-01-22
US10395661B2 (en) 2019-08-27
MX364618B (es) 2019-05-02
US20190333525A1 (en) 2019-10-31
AU2016231283B2 (en) 2019-08-22
TWI613643B (zh) 2018-02-01
US20200395024A1 (en) 2020-12-17

Similar Documents

Publication Publication Date Title
US11881225B2 (en) Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal

Legal Events

Date Code Title Description
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 07/03/2016, OBSERVADAS AS CONDICOES LEGAIS