BR112016001141B1

BR112016001141B1 - Codificador de áudio, decodificador de áudio e métodos que usam sinais residuais codificados em conjunto

Info

Publication number: BR112016001141B1
Application number: BR112016001141-4A
Authority: BR
Inventors: Sascha DICK; Christian Ertel; Christian Helmrich; Johannes Hilpert; Andreas Hölzer; Achim Kuntz
Original assignee: Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority date: 2013-07-22
Filing date: 2014-07-11
Publication date: 2021-12-14

Abstract

CODIFICADOR DE ÁUDIO, DECODIFICADOR DE ÁUDIO, MÉTODOS E PROGRAMA DE COMPUTADOR QUE USAM SINAIS RESIDUAIS CODIFICADOS EM CONJUNTO. Trata-se de um decodificador de áudio para fornecer pelo menos quatro sinais de canal de áudio na base de uma representação codificada que é configurado para fornecer um primeiro sinal residual e um segundo sinal residual na base de uma representação codificada em conjunto do primeiro sinal residual e do segundo sinal residual com o uso de uma decodificação de múltiplos canais. O decodificador de áudio é configurado para fornecer um primeiro sinal de canal de áudio e um segundo sinal de canal de áudio na base de um primeiro sinal de mistura descendente e o primeiro sinal residual com o uso de uma decodificação de múltiplos canais assistida por sinal residual. O decodificador de áudio é configurado para fornecer um terceiro sinal de canal de áudio e um quarto sinal de canal de áudio na base de um segundo sinal de mistura descendente e o segundo sinal residual com o uso de uma decodificação de múltiplos canais assistida por sinal residual. Um codificador de áudio é baseado nas considerações correspondentes. Fig. 2

Description

DESCRIÇÃO CAMPO DA TÉCNICA

[001] As modalidades de acordo com a invenção referem-se a um decodificador de áudio para fornecer pelo menos quatro sinais de canal de áudio na base de uma representação codificada.

[002] As modalidades adicionais de acordo com a invenção se referem a um codificador de áudio para fornecer uma representação codificada na base de pelo menos quatro sinais de canal de áudio.

[003] As modalidades adicionais de acordo com a invenção se referem a um método para fornecer pelo menos quatro sinais de canal de áudio na base de uma representação codificada e a um método para fornecer uma representação codificada na base de pelo menos quatro sinais de canal de áudio.

[004] As modalidades adicionais de acordo com a invenção se referem a um programa de computador para realizar um dos ditos métodos.

[005] De um modo geral, as modalidades de acordo com a invenção se referem a uma codificação em conjunto de n canais.

ANTECEDENTES DA INVENÇÃO

[006] Nos últimos anos, uma demanda por armazenamento e transmissão de conteúdos de áudio aumentou cada vez mais. Ademais, os requisitos de qualidade para o armazenamento e a transmissão de conteúdos de áudio também aumentam cada vez mais. Consequentemente, os conceitos para a codificação e a decodificação de conteúdo de áudio melhoraram. Por exemplo, foi desenvolvida a chamada “codificação avançada de áudio“(AAC), que é descrita, por exemplo, no Padrão Internacional ISO/IEC 13818-7:2003. Ademais, foram criadas algumas extensões espaciais como, por exemplo, o chamado conceito “MPEG Surround”, que é descrito, por exemplo, no Padrão Internacional ISO/IEC 23003-1:2007. Ademais, as melhorias adicionais para a codificação e a decodificação de informações espaciais de sinais de áudio são descritas no Padrão Internacional ISO/IEC 23003-2:2010, que se refere à chamada codificação de objeto áudio-espacial (SAOC).

[007] Ademais, um conceito de codificação/decodificação de áudio flexível, que proporciona a possibilidade de codificar sinais de áudio geral e sinais de fala com boa eficiência de codificação e de manusear sinais de áudio de múltiplos canais, é definido no Padrão Internacional ISO/IEC 23003-3:2012, que descreve o chamado conceito de “codificação de fala e áudio unificados” (USAC).

[008] No MPEG USAC [1], a codificação de estéreo em conjunto de dois canais é realizada com o uso de previsão complexa, MPS 2-1-1 ou estéreo unificado com sinais residuais de banda limitada ou de banda completa.

[009] MPEG surround [2] combina hierarquicamente caixas de OTT e TTT para codificação em conjunto de áudio de múltiplos canais com ou sem transmissão de sinais residuais.

[010] No entanto, há um desejo de fornecer um conceito ainda mais avançado para uma codificação e decodificação eficiente de cenas de áudio tridimensional.

SUMÁRIO DA INVENÇÃO

[011] Uma modalidade de acordo com a invenção cria um decodificador de áudio para fornecer pelo menos quatro sinais de canal de áudio na base de uma representação codificada. O decodificador de áudio é configurado para fornecer um primeiro sinal residual e um segundo sinal residual na base de uma representação codificada em conjunto do primeiro sinal residual e do segundo sinal residual com o uso de uma decodificação de múltiplos canais. O decodificador de áudio também é configurado para fornecer um primeiro sinal de canal de áudio e um segundo sinal de canal de áudio na base de um primeiro sinal de mistura descendente e o primeiro sinal residual com o uso de uma decodificação de múltiplos canais assistida por sinal residual. O decodificador de áudio também é configurado para fornecer um terceiro sinal de canal de áudio e um quarto sinal de canal de áudio na base de um segundo sinal de mistura descendente e o segundo sinal residual com o uso de uma decodificação de múltiplos canais assistida por sinal residual.

[012] Essa modalidade de acordo com a invenção é baseada na constatação que dependências entre quatro ou ainda mais sinais de canal de áudio podem ser explorada mediante a derivação de dois sinais residuais, em que cada um dos mesmos é usado para fornecer dois ou mais sinais de canal de áudio com o uso de uma decodificação de múltiplos canais assistida por sinal residual, de uma representação codificada em conjunto dos sinais residuais. Em outras palavras, constatou-se que há tipicamente algumas similaridades dos ditos sinais residuais, de modo que uma taxa de bit para codificar os ditos sinais residuais, o que ajuda a aprimorar uma qualidade de áudio durante a decodificação dos pelo menos quatro sinais de canal de áudio, possa ser reduzida mediante a derivação dos dois sinais residuais de uma representação codificada em conjunto com o uso de uma decodificação de múltiplos canais, que explora similaridades e/ou dependências entre os sinais residuais.

[013] Em uma modalidade preferencial, o decodificador de áudio é configurado para fornecer o primeiro sinal de mistura descendente e o segundo sinal de mistura descendente na base de uma representação codificada em conjunto do primeiro sinal de mistura descendente e do segundo sinal de mistura descendente com o uso de uma decodificação de múltiplos canais. Consequentemente, é criada uma estrutura hierárquica de um decodificador de áudio, em que os sinais de mistura descendente e os sinais residuais, que são usados na decodificação de múltiplos canais assistida por sinal residual para fornecer os pelo menos quatro sinais de canal de áudio, são derivados com o uso de decodificação de múltiplos canais separados. Tal conceito é particularmente eficiente, visto que os dois sinais de mistura descendente compreendem tipicamente similaridades, que podem ser exploradas em uma codificação/decodificação de múltiplos canais e visto que os dois sinais residuais também compreendem tipicamente similaridades, que podem ser exploradas em uma codificação/decodificação de múltiplos canais. Dessa forma, uma boa eficiência de codificação pode ser tipicamente obtida com o uso desse conceito.

[014] Em uma modalidade preferencial, o decodificador de áudio é configurado para fornecer o primeiro sinal residual e o segundo sinal residual na base da representação codificada em conjunto do primeiro sinal residual e do segundo sinal residual com o uso de uma decodificação de múltiplos canais baseada em previsão. O uso de uma decodificação de múltiplos canais baseada em previsão tipicamente traz consigo uma qualidade de reconstrução comparativamente boa para os sinais residuais. Ou seja, por exemplo, vantajosamente se o primeiro sinal residual representa um lado esquerdo de uma cena de áudio e o segundo sinal residual representa um lado direito da cena de áudio, devido ao fato de que a audição humana é de modo tipicamente comparativo sensível para diferenças entre os lados esquerdo e direito da cena de áudio.

[015] Em uma modalidade preferencial, o decodificador de áudio é configurado para fornecer o primeiro sinal residual e o segundo sinal residual na base da representação codificada em conjunto do primeiro sinal residual e do segundo sinal residual com o uso de uma decodificação de múltiplos canais assistida por sinal residual. Constatou-se que uma qualidade particularmente boa dos primeiro e segundo sinais residuais pode ser alcançada se o primeiro sinal residual e o segundo sinal residual forem fornecidos com o uso de uma decodificação de múltiplos canais, que, por sua vez, recebe um sinal residual (e, tipicamente, também um sinal de mistura descendente, que combina o primeiro sinal residual e o segundo sinal residual). Dessa forma, há um efeito em cascata de estágios de decodificação, em que dois sinais residuais (o primeiro sinal residual, que é usado para fornecer o primeiro sinal de canal de áudio e o segundo sinal de canal de áudio, e o segundo sinal residual, que é usado para fornecer o terceiro sinal de canal de áudio e o quarto sinal de canal de áudio), são fornecidos na base de um sinal de mistura descendente de entrada e de um sinal residual de entrada, em o último também pode ser designado como um sinal residual comum) do primeiro sinal residual e do segundo sinal residual). Dessa forma, o primeiro sinal residual e o segundo sinal residual são realmente sinais residuais “intermédios”, que são derivados com o uso de uma decodificação de múltiplos canais de um sinal de mistura descendente correspondente e de um sinal residual “comum” correspondente.

[016] Em uma modalidade preferencial, a decodificação de múltiplos canais baseada em previsão é configurada para avaliar um parâmetro de previsão que descreve uma contribuição de um componente de sinal, que é derivado com o uso de um componente de sinal de um quadro anterior, para o fornecimento dos sinais residuais (isto é, o primeiro sinal residual e o segundo sinal residual) de um quadro atual. O uso de tal decodificação de múltiplos canais baseada em previsão traz consigo uma qualidade particularmente boa dos sinais residuais (primeiro sinal residual e segundo sinal residual).

[017] Em uma modalidade preferencial, a decodificação de múltiplos canais baseada em previsão é configurada para obter o primeiro sinal residual e o segundo sinal residual na base de um sinal de mistura descendente (correspondente) e um sinal residual “comum” (correspondente), em que a decodificação de múltiplos canais baseada em previsão é configurada para aplicar o sinal residual comum com um primeiro aviso, para obter o primeiro sinal residual, e para aplicar o sinal residual comum com um segundo aviso, que é oposto ao primeiro aviso, para obter o segundo sinal residual. Constatou-se que tal decodificação de múltiplos canais baseada em previsão traz consigo uma boa eficiência para reconstruir o primeiro sinal residual e o segundo sinal residual.

[018] Em uma modalidade preferencial, o decodificador de áudio é configurado para fornecer o primeiro sinal residual e o segundo sinal residual na base da representação codificada em conjunto do primeiro sinal residual e do segundo sinal residual com o uso de uma decodificação de múltiplos canais que é operativa no domínio de transformada de cosseno discreta modificada (domínio de MDCT). Constatou-se que tal conceito pode ser implantado de maneira eficiente, visto que uma decodificação de áudio, que pode ser usada para fornecer a representação codificada em conjunto do primeiro sinal residual e do segundo sinal residual, opera, de preferência, no domínio de MDCT. Consequentemente, as transformações intermediárias podem ser evitadas mediante a aplicação da decodificação de múltiplos canais para fornecer o primeiro sinal residual e o segundo sinal residual no domínio de MDCT.

[019] Em uma modalidade preferencial, o decodificador de áudio é configurado para fornecer o primeiro sinal residual e o segundo sinal residual na base da representação codificada em conjunto do primeiro sinal residual e do segundo sinal residual com o uso de uma previsão de estéreo complexo de USAC (por exemplo, conforme mencionado no padrão de USAC referido acima). Constatou-se que tal previsão de estéreo complexo de USAC traz consigo bons resultados para a decodificação do primeiro sinal residual e do segundo sinal residual. Ademais, o uso da previsão de estéreo complexo de USAC para a decodificação do primeiro sinal residual e do segundo sinal residual também permite uma implantação simples do conceito com o uso de blocos de decodificação que já estão disponíveis na codificação de fala e áudio unificados (USAC). Consequentemente, um decodificador de codificação de fala e áudio unificados pode ser facilmente reconfigurado para realizar o conceito de decodificação discutido no presente documento.

[020] Em uma modalidade preferencial, o decodificador de áudio é configurado para fornecer o primeiro sinal de canal de áudio e o segundo sinal de canal de áudio na base do primeiro sinal de mistura descendente e o primeiro sinal residual com o uso de uma decodificação de múltiplos canais assistida por sinal residual baseada em parâmetro. De modo similar, o decodificador de áudio é configurado para fornecer o terceiro sinal de canal de áudio e o quarto sinal de canal de áudio na base do segundo sinal de mistura descendente e do segundo sinal residual com o uso de uma decodificação de múltiplos canais assistida por sinal residual baseada em parâmetro. Constatou-se que tal decodificação de múltiplos canais é bem adequada para a derivação dos sinais de canal de áudio na base do primeiro sinal de mistura descendente, do primeiro sinal residual, do segundo sinal de mistura descendente e do segundo sinal residual. Ademais, constatou-se que tal decodificação de múltiplos canais assistida por sinal residual baseada em parâmetro pode ser implantada com pequeno esforço com o uso de blocos de processamento que já estão presentes em decodificadores de áudio de múltiplos canais típicos.

[021] Em uma modalidade preferencial, a decodificação de múltiplos canais assistida por sinal residual baseada em parâmetro é configurada para avaliar um ou mais parâmetros que descrevem uma correlação desejada entre dois canais e/ou diferenças de nível entre dois canais a fim de fornecer os dois ou mais sinais de canal de áudio na base de um respectivo sinal de mistura descendente e um respectivo sinal residual correspondente. Constatou-se que tal decodificação de múltiplos canais assistida por sinal residual baseada em parâmetro é bem adaptada para o segundo estágio de uma decodificação de múltiplos canais em cascata (em que, de preferência, o primeiro e o segundo sinais de mistura descendente e o primeiro e o segundo sinais residuais são fornecidos com o uso de uma decodificação de múltiplos canais baseada em previsão).

[022] Em uma modalidade preferencial, o decodificador de áudio é configurado para fornecer o primeiro sinal de canal de áudio e o segundo sinal de canal de áudio na base do primeiro sinal de mistura descendente e do primeiro sinal residual com o uso de uma decodificação de múltiplos canais assistida por sinal residual que é operativa no domínio de QMF. De modo similar, o decodificador de áudio é, de preferência, configurado para fornecer o terceiro sinal de canal de áudio e o quarto sinal de canal de áudio na base do segundo sinal de mistura descendente e do segundo sinal residual com o uso de uma decodificação de múltiplos canais assistida por sinal residual que é operativa no domínio de QMF. Consequentemente, o segundo estágio da decodificação de múltiplos canais hierárquica é operativo no domínio de QMF, que é bem adaptado a pós-processamento típico, que também é realizado, com frequência, no domínio de QMF, de modo que possam ser evitadas conversões intermediárias.

[023] Em uma modalidade preferencial, o decodificador de áudio é configurado para fornecer o primeiro sinal de canal de áudio e o segundo sinal de canal de áudio na base do primeiro sinal de mistura descendente e do primeiro sinal residual com o uso de uma decodificação MPEG Surround 2-1-2 ou uma decodificação de estéreo unificado. De modo similar, o decodificador de áudio é, de preferência, configurado para fornecer o terceiro sinal de canal de áudio e o quarto sinal de canal de áudio na base do segundo sinal de mistura descendente e do segundo sinal residual com o uso de uma decodificação MPEG Surround 2-1-2 ou de uma decodificação de estéreo unificado. Constatou- se que tais conceitos de decodificação são particularmente bem adequados para o segundo estágio de uma decodificação hierárquica.

[024] Em uma modalidade preferencial, o primeiro sinal residual e o segundo sinal residual são associado a diferentes posições horizontais (ou, equivalentemente, posições azimutais) de uma cena de áudio. Constatou-se que é de modo particularmente vantajoso separar sinais residuais, que são associados a diferentes posições horizontais (ou posições azimutais), em um primeiro estágio do processamento de múltiplos canais hierárquico devido ao fato de que pode ser obtida uma impressão de audição particularmente boa se a separação entre esquerda e direita de modo perceptivo importante é realizada em um primeiro estágio da decodificação de múltiplos canais hierárquica.

[025] Em uma modalidade preferencial, o primeiro sinal de canal de áudio e o segundo sinal de canal são associados a posições verticalmente adjacentes da cena de áudio (ou, equivalentemente, a posições de elevação adjacentes da cena de áudio). Além disso, o terceiro sinal de canal de áudio e o quarto sinal de canal de áudio são, de preferência, associados a posições verticalmente adjacentes da cena de áudio (ou, equivalentemente, a posições de elevação adjacentes da cena de áudio). Constatou-se que bons resultados de decodificação podem ser alcançados se a separação entre sinais superior e inferior é realizada em um segundo estágio da decodificação de áudio hierárquica (que compreende tipicamente uma precisão de separação de alguma forma menos do que no primeiro estágio), visto que o sistema auditivo humano é menos sensível em relação a uma posição vertical de uma fonte de áudio em comparação com uma posição horizontal da fonte de áudio.

[026] Em uma modalidade preferencial, o primeiro sinal de canal de áudio e o segundo sinal de canal de áudio são associados a uma primeira posição horizontal de uma cena de áudio (ou, equivalentemente, posição azimutal), e o terceiro sinal de canal de áudio e o quarto sinal de canal de áudio são associados a uma segunda posição horizontal da cena de áudio (ou, equivalentemente, posição azimutal), que é diferente da primeira posição horizontal (ou, equivalentemente, posição azimutal).

[027] De preferência, o primeiro sinal residual é associado a um lado esquerdo de uma cena de áudio e o segundo sinal residual é associado a um lado direito da cena de áudio. Consequentemente, a separação entre esquerdo e direito é realizada em um primeiro estágio da decodificação de áudio hierárquica.

[028] Em uma modalidade preferencial, o primeiro sinal de canal de áudio e o segundo sinal de canal de áudio são associado ao lado esquerdo da cena de áudio, e o terceiro sinal de canal de áudio e o quarto sinal de canal de áudio são associados a um lado direito da cena de áudio.

[029] Em outra modalidade preferencial, o primeiro sinal de canal de áudio é associado a um lado esquerdo inferior da cena de áudio, o segundo sinal de canal de áudio é associado a um lado esquerdo superior da cena de áudio, o terceiro sinal de canal de áudio é associado a um lado direito inferior da cena de áudio, e o quarto sinal de canal de áudio é associado a um lado direito inferior da cena de áudio. Tal associação dos sinais de canal de áudio traz consigo resultados de codificação particularmente bons.

[030] Em uma modalidade preferencial, o decodificador de áudio é configurado para fornecer o primeiro sinal de mistura descendente e o segundo sinal de mistura descendente na base de uma representação codificada em conjunto do primeiro sinal de mistura descendente e do segundo sinal de mistura descendente com o uso de uma decodificação de múltiplos canais, em que o primeiro sinal de mistura descendente é associado ao lado esquerdo de uma cena de áudio e o segundo sinal de mistura descendente é associado ao lado direito da cena de áudio. Constatou-se que os sinais de mistura descendente também podem ser codificados com boa eficiência de codificação com o uso de uma codificação de múltiplos canais, mesmo se os sinais de mistura descendente são associados a diferentes lados da cena de áudio.

[031] Em uma modalidade preferencial, o decodificador de áudio é configurado para fornecer o primeiro sinal de mistura descendente e o segundo sinal de mistura descendente na base da representação codificada em conjunto do primeiro sinal de mistura descendente e do segundo sinal de mistura descendente com o uso de uma decodificação de múltiplos canais baseada em previsão ou mesmo com o uso de uma decodificação de múltiplos canais baseada em previsão assistida por sinal residual. Constatou-se que o uso de tal decodificação de múltiplos canais conceitos fornece um resultado de decodificação particularmente bom. Além disso, as funções de decodificação existentes podem ser reutilizadas em alguns decodificadores de áudio.

[032] Em uma modalidade preferencial, o decodificador de áudio é configurado para realizar uma primeira extensão de largura de banda de múltiplos canais na base do primeiro sinal de canal de áudio e do terceiro sinal de canal de áudio. Além disso, o decodificador de áudio pode ser configurado para realizar uma segunda (tipicamente separada) extensão de largura de banda de múltiplos canais na base do segundo sinal de canal de áudio e do quarto sinal de canal de áudio. Constatou-se que é vantajoso realizar uma extensão de largura de banda possível na base de dois sinais de canal de áudio que são associados a diferentes lados de uma cena de áudio (em que diferentes sinais residuais são tipicamente associados a diferentes lados da cena de áudio).

[033] Em uma modalidade preferencial, o decodificador de áudio é configurado para realizar a primeira extensão de largura de banda de múltiplos canais a fim de obter dois ou mais sinais de canal de áudio de largura de banda estendida associado a um primeiro plano horizontal comum (ou, equivalentemente, a uma primeira elevação comum) de uma cena de áudio na base do primeiro sinal de canal de áudio e do terceiro sinal de canal de áudio e um ou mais parâmetros de extensão de largura de banda. Ademais, o decodificador de áudio é, de preferência, configurado para realizar uma segunda extensão de largura de banda de múltiplos canais a fim de obter dois ou mais sinais de canal de áudio de largura de banda estendida associado a um segundo plano horizontal comum (ou, equivalentemente, uma segunda elevação comum) da cena de áudio na base do segundo sinal de canal de áudio e do quarto sinal de canal de áudio e um ou mais parâmetros de extensão de largura de banda. Constatou-se que tal esquema de decodificação resulta em boa qualidade de áudio, visto que a extensão de largura de banda de múltiplos canais pode considerar características de estéreo, que são importantes para a impressão auditiva, em tal disposição.

[034] Em uma modalidade preferencial, a representação codificada em conjunto do primeiro sinal residual e do segundo sinal residual compreende um elemento de par de canais que compreende um sinal de mistura descendente do primeiro e do segundo sinais residuais e um sinal residual comum do primeiro e do segundo sinais residuais. Constatou-se que a codificação do sinal de mistura descendente do primeiro e do segundo sinais residuais e do sinal residual comum do primeiro e do segundo sinais residuais com o uso de um elemento de par de canais é vantajoso visto que o sinal de mistura descendente do primeiro e do segundo sinais residuais e do sinal residual comum do primeiro e do segundo sinais residuais tipicamente compartilham inúmeras características. Consequentemente, o uso de um elemento de par de canais reduz tipicamente uma sobrecarga de sinalização e, consequentemente, permite uma codificação eficiente.

[035] Em outra modalidade preferencial, o decodificador de áudio é configurado para fornecer o primeiro sinal de mistura descendente e o segundo sinal de mistura descendente na base de uma representação codificada em conjunto do primeiro sinal de mistura descendente e do segundo sinal de mistura descendente com o uso de uma decodificação de múltiplos canais, em que a representação codificada em conjunto do primeiro sinal de mistura descendente e do segundo sinal de mistura descendente compreende um elemento de par de canais. O elemento de par de canais que compreende um sinal de mistura descendente do primeiro e do segundo sinais de mistura descendente e um sinal residual comum do primeiro e do segundo sinais de mistura descendente. Essa modalidade se baseia nas mesmas considerações que a modalidade descrita anteriormente.

[036] Outra modalidade de acordo com a invenção cria um codificador de áudio para fornecer uma representação codificada na base de pelo menos quatro sinais de canal de áudio. O codificador de áudio é configurado para codificar em conjunto pelo menos um primeiro sinal de canal de áudio e um segundo sinal de canal de áudio com o uso de uma codificação de múltiplos canais assistida por sinal residual, para obter um primeiro sinal de mistura descendente e um primeiro sinal residual. O codificador de áudio é configurado para codificar em conjunto pelo menos um terceiro sinal de canal de áudio e um quarto sinal de canal de áudio com o uso de uma codificação de múltiplos canais assistida por sinal residual, para obter um segundo sinal de mistura descendente e um segundo sinal residual. Ademais, o codificador de áudio é configurado para codificar em conjunto o primeiro sinal residual e o segundo sinal residual com o uso de uma codificação de múltiplos canais, para obter uma representação codificada em conjunto dos sinais residuais. Esse codificador de áudio se baseia nas mesmas considerações que o decodificador de áudio descrito acima.

[037] Ademais, os aprimoramentos opcionais desse codificador de áudio e as configurações preferenciais do codificador de áudio, estão substancialmente em paralelo aos aprimoramentos e configurações preferenciais do decodificador de áudio discutidos acima. Consequentemente, faz-se referência à discussão acima.

[038] Outra modalidade de acordo com a invenção cria um método para fornecer pelo menos quatro sinais de canal de áudio na base de uma representação codificada, que realiza substancialmente a funcionalidade do codificador de áudio descrito acima, e que pode ser suplementado por qualquer um dos recursos e funcionalidades discutidos acima.

[039] Outra modalidade de acordo com a invenção cria um método para fornecer uma representação codificada na base de pelo menos quatro sinais de canal de áudio, que cumpre substancialmente a funcionalidade do decodificador de áudio descrito acima.

[040] Outra modalidade de acordo com a invenção cria um programa de computador para realizar os métodos mencionados acima.

[041] Breve descrição das figuras

[042] As modalidades de acordo com a presente invenção serão descritas subsequentemente com referência às Figuras anexas, em que:

[043] A Figura 1 mostra um diagrama esquemático em bloco de um codificador de áudio, de acordo com uma modalidade da presente invenção;

[044] A Figura 2 mostra um diagrama esquemático em bloco de um decodificador de áudio, de acordo com uma modalidade da presente invenção;

[045] A Figura 3 mostra um diagrama esquemático em bloco de um decodificador de áudio, de acordo com outra modalidade da presente invenção;

[046] A Figura 4 mostra um diagrama esquemático em bloco de um codificador de áudio, de acordo com uma modalidade da presente invenção;

[047] A Figura 5 mostra um diagrama esquemático em bloco de um decodificador de áudio, de acordo com uma modalidade da presente invenção;

[048] A Figura 6 mostra um diagrama esquemático em bloco de um decodificador de áudio, de acordo com outra modalidade da presente invenção;

[049] A Figura 7 mostra um fluxograma de um método para fornecer uma representação codificada na base de pelo menos quatro sinais de canal de áudio, de acordo com uma modalidade da presente invenção;

[050] A Figura 8 mostra um fluxograma de um método para fornecer pelo menos quatro sinais de canal de áudio na base de uma representação codificada, de acordo com uma modalidade da invenção;

[051] A Figura 9 mostra um fluxograma de um método para fornecer uma representação codificada na base de pelo menos quatro sinais de canal de áudio, de acordo com uma modalidade da invenção; e

[052] A Figura 10 mostra um fluxograma de um método para fornecer pelo menos quatro sinais de canal de áudio na base de uma representação codificada, de acordo com uma modalidade da invenção;

[053] A Figura 11 mostra um diagrama esquemático em bloco de um codificador de áudio, de acordo com uma modalidade da invenção;

[054] A Figura 12 mostra um diagrama esquemático em bloco de um codificador de áudio, de acordo com outra modalidade da invenção;

[055] A Figura 13 mostra um diagrama esquemático em bloco de um decodificador de áudio, de acordo com uma modalidade da invenção;

[056] A Figura 14a mostra uma representação de sintaxe de uma corrente de bits, que pode ser usada com o codificador de áudio de acordo com a Figura 13;

[057] A Figura 14b mostra uma representação de tabela de valores diferentes do parâmetro qceIndex;

[058] A Figura 15 mostra um diagrama esquemático em bloco de um codificador de áudio em 3D em que os conceitos de acordo com a presente invenção podem ser usados;

[059] A Figura 16 mostra um diagrama esquemático em bloco de um decodificador de áudio em 3D em que os conceitos de acordo com a presente invenção podem ser usados; e

[060] A Figura 17 mostra um diagrama esquemático em bloco de um conversor de formato.

[061] A Figura 18 mostra uma representação gráfica de uma estrutura topológica de um Elemento de Canal Quádruplo (QCE), de acordo com uma modalidade da presente invenção;

[062] A Figura 19 mostra um diagrama esquemático em bloco de um decodificador de áudio, de acordo com uma modalidade da presente invenção;

[063] A Figura 20 mostra um diagrama esquemático em bloco detalhado de um Decodificador de QCE, de acordo com uma modalidade da presente invenção; e

[064] A Figura 21 mostra um diagrama esquemático em bloco detalhado de um Codificador de Canal Quádruplo, de acordo com uma modalidade da presente invenção.

Descrição detalhada das modalidades 1. Codificador de áudio de acordo com a Figura 1

[065] A Figura 1 mostra um diagrama esquemático em bloco de um codificador de áudio, que é designado em sua totalidade com 100. O codificador de áudio 100 é configurado para fornecer uma representação codificada na base de pelo menos quatro sinais de canal de áudio. O codificador de áudio 100 é configurado para receber um primeiro sinal de canal de áudio 110, um segundo sinal de canal de áudio 112, um terceiro sinal de canal de áudio 114 e um quarto sinal de canal de áudio 116. Ademais, o codificador de áudio 100 é configurado para fornecer uma representação codificada de um primeiro sinal de mistura descendente 120 e de um segundo sinal de mistura descendente 122, bem como uma representação codificada em conjunto 130 de sinais residuais. O codificador de áudio 100 compreende um codificador de múltiplos canais assistido por sinal residual 140, que é configurado para codificar em conjunto o primeiro sinal de canal de áudio 110 e o segundo sinal de canal de áudio 112 com o uso de uma codificação de múltiplos canais assistida por sinal residual, para obter o primeiro sinal de mistura descendente 120 e um primeiro sinal residual 142. O codificador de sinal de áudio 100 também compreende um codificador de múltiplos canais assistido por sinal residual 150, que é configurado para codificar em conjunto pelo menos o terceiro sinal de canal de áudio 114 e o segundo sinal de canal de áudio 116 com o uso de uma codificação de múltiplos canais assistida por sinal residual, para obter o segundo sinal de mistura descendente 122 e um segundo sinal residual 152. O decodificador de áudio 100 também compreende um codificador de múltiplos canais 160, que é configurado para codificar em conjunto o primeiro sinal residual 142 e o segundo sinal residual 152 com o uso de uma codificação de múltiplos canais, para obter a representação codificada em conjunto 130 dos sinais residuais 142, 152.

[066] Em relação à funcionalidade do codificador de áudio 100, deveria ser observado que o codificador de áudio 100 realiza uma codificação hierárquica, em que o primeiro sinal de canal de áudio 110 e o segundo sinal de canal de áudio 112 são codificados em conjunto com o uso da codificação de múltiplos canais assistida por sinal residual 140, em que o primeiro sinal de mistura descendente 120 e o primeiro sinal residual 142 são fornecidos. O primeiro sinal residual 142 pode, por exemplo, descrever diferenças entre o primeiro sinal de canal de áudio 110 e o segundo sinal de canal de áudio 112 e/ou pode descrever algum ou qualquer recurso de sinal que não pode ser representado pelo primeiro sinal de mistura descendente 120 e parâmetros opcionais, que podem ser fornecidos pelo codificador de múltiplos canais assistido por sinal residual 140. Em outras palavras, o primeiro sinal residual 142 pode ser um sinal residual que permite um refinamento de um resultado de decodificação que pode ser obtido na base do primeiro sinal de mistura descendente 120 e quaisquer parâmetros possíveis que podem ser fornecidos pelo codificador de múltiplos canais assistido por sinal residual 140. Por exemplo, o primeiro sinal residual 142 pode permitir pelo menos uma reconstrução de forma de onda parcial do primeiro sinal de canal de áudio 110 e do segundo sinal de canal de áudio 112 no lado de um decodificador de áudio em comparação a uma mera reconstrução de características de sinal de alto nível (como, por exemplo, características de correlação, características de covariância, características de diferença de nível e similares). De modo similar, o codificador de múltiplos canais assistido por sinal residual 150 fornece o segundo sinal de mistura descendente 122 e o segundo sinal residual 152 na base do terceiro sinal de canal de áudio 114 e do quarto sinal de canal de áudio 116, de modo que o segundo sinal residual permita um refinamento de uma reconstrução de sinal do terceiro sinal de canal de áudio 114 e do quarto sinal de canal de áudio 116 no lado de um decodificador de áudio. O segundo sinal residual 152 pode apresentar, consequentemente, a mesma funcionalidade que o primeiro sinal residual 142. No entanto, se os sinais de canal de áudio 110, 112, 114, 116 compreendem alguma correlação, o primeiro sinal residual 142 e o segundo sinal residual 152 também são tipicamente correlacionados em algum grau. Consequentemente, a codificação em conjunto do primeiro sinal residual 142 e do segundo sinal residual 152 com o uso do codificador de múltiplos canais 160 compreende tipicamente uma alta eficiência visto que uma codificação de múltiplos canais de sinais correlacionados reduz tipicamente a taxa de bit explorando-se as dependências. Consequentemente, o primeiro sinal residual 142 e o segundo sinal residual 152 podem ser codificados com boa precisão enquanto mantêm a taxa de bit da representação codificada em conjunto 130 dos sinais residuais razoavelmente pequena.

[067] Em suma, uma modalidade de acordo com a Figura 1 fornece uma codificação de múltiplos canais hierárquica, em que uma boa qualidade de reprodução pode ser alcançada mediante o uso dos codificadores de múltiplos canais assistidos por sinal residual 140, 150, e em que uma demanda de taxa de bit pode ser mantida moderada mediante a codificação em conjunto de um primeiro sinal residual 142 e de um segundo sinal residual 152.

[068] É possível um aprimoramento opcional adicional do codificador de áudio 100. Alguns desses aprimoramentos serão descritos com referência às Figuras 4, 11 e 12. No entanto, deveria ser observado que o codificador de áudio 100 também pode ser adaptado em paralelo com os decodificadores de áudio descritos no presente documento, em que a funcionalidade do codificador de áudio é tipicamente inversa à funcionalidade do decodificador de áudio.

[069] 2. Decodificador de áudio de acordo com a Figura 2

[070] A Figura 2 mostra um diagrama esquemático em bloco de um decodificador de áudio, que é designado em sua totalidade com 200.

[071] O decodificador de áudio 200 é configurado para receber uma representação codificada que compreende uma representação codificada em conjunto 210 de um primeiro sinal residual e de um segundo sinal residual. O decodificador de áudio 200 também recebe uma representação de um primeiro sinal de mistura descendente 212 e de um segundo sinal de mistura descendente 214. O decodificador de áudio 200 é configurado para fornecer um primeiro sinal de canal de áudio 220, um segundo sinal de canal de áudio 222, um terceiro sinal de canal de áudio 224 e um quarto sinal de canal de áudio 226.

[072] O decodificador de áudio 200 compreende um decodificador de múltiplos canais 230, que é configurado para fornecer um primeiro sinal residual 232 e um segundo sinal residual 234 na base da representação codificada em conjunto 210 do primeiro sinal residual 232 e do segundo sinal residual 234. O decodificador de áudio 200 também compreende um (primeiro) decodificador de múltiplos canais assistido por sinal residual 240 que é configurado para fornecer o primeiro sinal de canal de áudio 220 e o segundo sinal de canal de áudio 222 na base do primeiro sinal de mistura descendente 212 e do primeiro sinal residual 232 com o uso de uma decodificação de múltiplos canais. O decodificador de áudio 200 também compreende um (segundo) decodificador de múltiplos canais assistido por sinal residual 250, que é configurado para fornecer o terceiro sinal de canal de áudio 224 e o quarto sinal de canal de áudio 226 na base do segundo sinal de mistura descendente 214 e do segundo sinal residual 234.

[073] Em relação à funcionalidade do decodificador de áudio 200, deveria ser observado que o decodificador de sinal de áudio 200 fornece o primeiro sinal de canal de áudio 220 e o segundo sinal de canal de áudio 222 na base de uma (primeira) decodificação de múltiplos canais assistida por sinal residual comum 240, em que a qualidade de decodificação da decodificação de múltiplos canais é aumentada pelo primeiro sinal residual 232 (em comparação a uma decodificação não assistida por sinal residual). Em outras palavras, o primeiro sinal de mistura descendente 212 fornece informações “de baixa resolução” sobre o primeiro sinal de canal de áudio 220 e o segundo sinal de canal de áudio 222, em que, por exemplo, diferenças entre o primeiro sinal de canal de áudio 220 e o segundo sinal de canal de áudio 222 podem ser descritas por parâmetros (opcional), que podem ser recebidos pelo decodificador de múltiplos canais assistido por sinal residual 240 e pelo primeiro sinal residual 232. Consequentemente, o primeiro sinal residual 232 pode, por exemplo, permitir uma reconstrução de forma de onda parcial do primeiro sinal de canal de áudio 220 e do segundo sinal de canal de áudio 222.

[074] De modo similar, o (segundo) decodificador de múltiplos canais assistido por sinal residual 250 fornece o terceiro sinal de canal de áudio 224 e o quarto sinal de canal de áudio 226 na base do segundo sinal de mistura descendente 214, em que o segundo sinal de mistura descendente 214 pode, por exemplo, descrever “com baixa resolução” o terceiro sinal de canal de áudio 224 e o quarto sinal de canal de áudio 226. Ademais, as diferenças entre o terceiro sinal de canal de áudio 224 e o quarto sinal de canal de áudio 226 podem, por exemplo, ser descritas por parâmetros (opcional), que podem ser recebidos pelo (segundo) decodificador de múltiplos canais assistido por sinal residual 250 e pelo segundo sinal residual 234. Consequentemente, a avaliação do segundo sinal residual 234 pode, por exemplo, permitir uma reconstrução de forma de onda parcial do terceiro sinal de canal de áudio 224 e do quarto sinal de canal de áudio 226. Consequentemente, o segundo sinal residual 234 pode permitir uma melhora da qualidade de reconstrução do terceiro sinal de canal de áudio 224 e do quarto sinal de canal de áudio 226.

[075] No entanto, o primeiro sinal residual 232 e o segundo sinal residual 234 são derivados de uma representação codificada em conjunto 210 do primeiro sinal residual e do segundo sinal residual. Tal decodificação de múltiplos canais, que é realizada pelo decodificador de múltiplos canais 230, permite uma alta eficiência de decodificação visto que o primeiro sinal de canal de áudio 220, o segundo sinal de canal de áudio 222, o terceiro sinal de canal de áudio 224 e o quarto sinal de canal de áudio 226 são tipicamente similares ou “correlacionados”. Consequentemente, o primeiro sinal residual 232 e o segundo sinal residual 234 também são tipicamente similares ou “correlacionados”, o que pode ser explorado mediante a derivação do primeiro sinal residual 232 e do segundo sinal residual 234 de uma representação codificada em conjunto 210 com o uso de uma decodificação de múltiplos canais.

[076] Consequentemente, é possível obter uma alta qualidade de decodificação com taxa de bit moderada mediante a decodificação dos sinais residuais 232, 234 na base de uma representação codificada em conjunto 210 dos mesmos, e por meio do uso de cada um dos sinais residuais para a decodificação de dois ou mais sinais de canal de áudio.

[077] Para concluir, o decodificador de áudio 200 permite uma alta eficiência de codificação mediante o fornecimento de sinais de canal de áudio de alta qualidade 220, 222, 224, 226.

[078] Deveria ser observado que recursos e funcionalidades adicionais, que podem ser implantados opcionalmente no decodificador de áudio 200, serão descritos subsequentemente com referência às Figuras 3, 5, 6 e 13. No entanto, deveria ser observado que o codificador de áudio 200 pode compreender as vantagens mencionadas acima sem nenhuma modificação adicional.

[079] 3. Decodificador de áudio de acordo com a Figura 3

[080] A Figura 3 mostra um diagrama esquemático em bloco de um decodificador de áudio de acordo com outra modalidade da presente invenção. O decodificador de áudio da Figura 3 designado em sua totalidade com 300. O decodificador de áudio 300 é similar ao decodificador de áudio 200 de acordo com a Figura 2, de modo que as explicações acima também se apliquem. No entanto, o decodificador de áudio 300 é suplementado com recursos e funcionalidades adicionais em comparação ao decodificador de áudio 200, conforme será explicado a seguir.

[081] O decodificador de áudio 300 é configurado para receber uma representação codificada em conjunto 310 de um primeiro sinal residual e de um segundo sinal residual. Ademais, o decodificador de áudio 300 é configurado para receber uma representação codificada em conjunto 360 de um primeiro sinal de mistura descendente e de um segundo sinal de mistura descendente. Ademais, o decodificador de áudio 300 é configurado para fornecer um primeiro sinal de canal de áudio 320, um segundo sinal de canal de áudio 322, um terceiro sinal de canal de áudio 324 e um quarto sinal de canal de áudio 326. O decodificador de áudio 300 compreende um decodificador de múltiplos canais 330 que é configurado para receber a representação codificada em conjunto 310 do primeiro sinal residual e do segundo sinal residual e para fornecer, na base dos mesmos, um primeiro sinal residual 332 e um segundo sinal residual 334. O decodificador de áudio 300 também compreende uma (primeira) decodificação de múltiplos canais assistida por sinal residual 340, que recebe o primeiro sinal residual 332 e um primeiro sinal de mistura descendente 312, e fornece o primeiro sinal de canal de áudio 320 e o segundo sinal de canal de áudio 322. O decodificador de áudio 300 também compreende uma (segunda) decodificação de múltiplos canais assistida por sinal residual 350, que é configurada para receber o segundo sinal residual 334 e um segundo sinal de mistura descendente 314, e para fornecer o terceiro sinal de canal de áudio 324 e o quarto sinal de canal de áudio 326.

[082] O decodificador de áudio 300 também compreende outro decodificador de múltiplos canais 370, que é configurado para receber a representação codificada em conjunto 360 do primeiro sinal de mistura descendente e do segundo sinal de mistura descendente, e para fornecer, na base dos mesmos, o primeiro sinal de mistura descendente 312 e o segundo sinal de mistura descendente 314.

[083] A seguir, serão descritos alguns detalhes específicos do decodificador de áudio 300. No entanto, deveria ser observado que um decodificador de áudio real não precisa implantar uma combinação de todos esses recursos e funcionalidades adicionais. Ao invés disso, os recursos e funcionalidades descritas a seguir podem ser individualmente adicionados ao decodificador de áudio 200 (ou qualquer outro decodificador de áudio), para aprimorar gradualmente o decodificador de áudio 200 (ou qualquer outro decodificador de áudio).

[084] Em uma modalidade preferencial, o decodificador de áudio 300 recebe uma representação codificada em conjunto 310 do primeiro sinal residual e do segundo sinal residual, em que essa representação codificada em conjunto 310 pode compreender um sinal de mistura descendente do primeiro sinal residual 332 e do segundo sinal residual 334, e um sinal residual comum do primeiro sinal residual 332 e do segundo sinal residual 334. Além disso, a representação codificada em conjunto 310 pode, por exemplo, compreender um ou mais parâmetros de previsão. Consequentemente, o decodificador de múltiplos canais 330 pode ser um decodificador de múltiplos canais assistido por sinal residual baseado em previsão. Por exemplo, o decodificador de múltiplos canais 330 pode ser uma previsão de estéreo complexo de USAC, conforme descrito, por exemplo, na seção “Previsão de Estéreo Complexo” do Padrão Internacional ISO/IEC 23003-3:2012. Por exemplo, o decodificador de múltiplos canais 330 pode ser configurado para avaliar um parâmetro de previsão que descreve uma contribuição de um componente de sinal, que é derivado com o uso de um componente de sinal de um quadro anterior, para um fornecimento do primeiro sinal residual 332 e do segundo sinal residual 334 para um quadro atual. Ademais, o decodificador de múltiplos canais 330 pode ser configurado para aplicar o sinal residual comum (que é incluído na representação codificada em conjunto 310) com um primeiro aviso, para obter o primeiro sinal residual 332, e para aplicar o sinal residual comum (que é incluído na representação codificada em conjunto 310) com um segundo aviso, que é oposto ao primeiro aviso, para obter o segundo sinal residual 334. Dessa forma, o sinal residual comum pode, pelo menos parcialmente, descrever as diferenças entre o primeiro sinal residual 332 e o segundo sinal residual 334. No entanto, o decodificador de múltiplos canais 330 pode avaliar o sinal de mistura descendente, o sinal residual comum e o um ou mais parâmetros de previsão, que são todos incluídos na representação codificada em conjunto 310, para obter o primeiro sinal residual 332 e o segundo sinal residual 334 conforme descrito no Padrão Internacional referido acima ISO/IEC 23003-3:2012. Ademais, deveria ser observado que o primeiro sinal residual 332 pode ser associado a uma primeira posição horizontal (ou posição azimutal), por exemplo, uma posição horizontal esquerda, e que o segundo sinal residual 334 pode ser associado a uma segunda posição horizontal (ou posição azimutal), por exemplo, uma posição horizontal direita, de uma cena de áudio.

[085] A representação codificada em conjunto 360 do primeiro sinal de mistura descendente e do segundo sinal de mistura descendente compreende, de preferência, um sinal de mistura descendente do primeiro sinal de mistura descendente e do segundo sinal de mistura descendente, um sinal residual comum do primeiro sinal de mistura descendente e do segundo sinal de mistura descendente, e um ou mais parâmetros de previsão. Em outras palavras, há um sinal de mistura descendente “comum”, no qual o primeiro sinal de mistura descendente 312 e o segundo sinal de mistura descendente 314 são misturados de modo descendente, e há um sinal residual “comum” que pode descrever, pelo menos parcialmente, diferenças entre o primeiro sinal de mistura descendente 312 e o segundo sinal de mistura descendente 314. O decodificador de múltiplos canais 370 é, de preferência, um decodificador de múltiplos canais assistido por sinal residual baseado em previsão, por exemplo, um decodificador de previsão de estéreo complexo de USAC. Em outras palavras, o decodificador de múltiplos canais 370, que fornece o primeiro sinal de mistura descendente 312 e o segundo sinal de mistura descendente 314 pode ser substancialmente idêntico ao decodificador de múltiplos canais 330, que fornece o primeiro sinal residual 332 e o segundo sinal residual 334, de modo que as explicações e referências acima também se apliquem. Ademais, deveria ser observado que o primeiro sinal de mistura descendente 312 é, de preferência, associado a uma primeira posição horizontal ou posição azimutal (por exemplo, posição horizontal esquerda ou posição azimutal) da cena de áudio, e que o segundo sinal de mistura descendente 314 é, de preferência, associado a uma segunda posição horizontal ou posição azimutal (por exemplo, posição horizontal direita ou posição azimutal) da cena de áudio. Consequentemente, o primeiro sinal de mistura descendente 312 e o primeiro sinal residual 332 podem ser associados à mesma primeira posição horizontal ou posição azimutal (por exemplo, posição horizontal esquerda), e o segundo sinal de mistura descendente 314 e o segundo sinal residual 334 podem ser associados à mesma segunda posição horizontal ou posição azimutal (por exemplo, posição horizontal direita). Consequentemente, o decodificador de múltiplos canais 370 e o decodificador de múltiplos canais 330 podem realizar uma divisão horizontal (ou separação horizontal ou distribuição horizontal).

[086] O decodificador de múltiplos canais assistido por sinal residual 340 pode ser, de preferência, baseado em parâmetro e pode, consequentemente, receber um ou mais parâmetros 342 que descrevem uma correlação desejada entre dois canais (por exemplo, entre o primeiro sinal de canal de áudio 320 e o segundo sinal de canal de áudio 322) e/ou diferenças de nível entre os ditos dois canais. Por exemplo, a decodificação de múltiplos canais assistida por sinal residual 340 pode ser baseada em uma codificação de MPEG-Surround (conforme descrito, por exemplo, em ISO/IEC 23003-1:2007) com uma extensão de sinal residual ou um decodificador de “decodificação de estéreo unificado” (conforme descrito, por exemplo, em ISO/IEC 23003-3, capítulo 7.11 (Decoder) & Anexo B.21 (Description of the Encoder & Definition of the Term "Unified Stereo")). Consequentemente, o decodificador de múltiplos canais assistido por sinal residual 340 pode fornecer o primeiro sinal de canal de áudio 320 e o segundo sinal de canal de áudio 322, em que o primeiro sinal de canal de áudio 320 e o segundo sinal de canal de áudio 322 são associados a posições verticalmente adjacentes da cena de áudio. Por exemplo, o primeiro sinal de canal de áudio pode ser associado a uma posição esquerda inferior da cena de áudio e o segundo sinal de canal de áudio pode ser associado a uma posição esquerda superior da cena de áudio (de modo que o primeiro sinal de canal de áudio 320 e o segundo sinal de canal de áudio 322 sejam, por exemplo, associado a posições horizontais ou posições azimutais idênticas da cena de áudio, ou com posições azimutais separadas em não mais que 30 graus). Em outras palavras, o decodificador de múltiplos canais assistido por sinal residual 340 pode realizar uma divisão vertical (ou distribuição, ou separação).

[087] A funcionalidade do decodificador de múltiplos canais assistido por sinal residual 350 pode ser idêntica à funcionalidade do decodificador de múltiplos canais assistido por sinal residual 340, em que o terceiro sinal de canal de áudio pode, por exemplo, ser associado a uma posição direita inferior da cena de áudio, e em que o quarto sinal de canal de áudio pode, por exemplo, ser associado a uma posição direita superior da cena de áudio. Em outras palavras, o terceiro sinal de canal de áudio e o quarto sinal de canal de áudio podem ser associados a posições verticalmente adjacentes da cena de áudio e podem ser associados à mesma posição horizontal ou posição azimutal da cena de áudio, em que o decodificador de múltiplos canais assistido por sinal residual 350 realiza uma divisão vertical (ou separação, ou distribuição).

[088] Em suma, o decodificador de áudio 300 de acordo com a Figura 3 realiza uma decodificação de áudio hierárquica, em que uma divisão entre esquerda e direita é realizada nos primeiros estágios (decodificador de múltiplos canais 330, decodificador de múltiplos canais 370), e em que uma divisão entre superior e inferior é realizada no segundo estágio (decodificadores de múltiplos canais assistidos por sinal residual 340, 350). Ademais, os sinais residuais 332, 334 também são codificados com o uso de uma representação codificada em conjunto 310, bem como os sinais de mistura descendente 312, 314 (representação codificada em conjunto 360). Dessa forma, as correlações entre os diferentes canais são exploradas para a codificação (e decodificação) dos sinais de mistura descendente 312, 314 e para a codificação (e decodificação) dos sinais residuais 332, 334. Consequentemente, uma alta eficiência de codificação é alcançada e as correlações entre os sinais são bem exploradas.

[089] 4. Codificador de áudio de acordo com a Figura 4

[090] A Figura 4 mostra um diagrama esquemático em bloco de um codificador de áudio, de acordo com outra modalidade da presente invenção. O codificador de áudio de acordo com a Figura 4 é designado em sua totalidade com 400. O codificador de áudio 400 é configurado para receber quatro sinais de canal de áudio, a saber, um primeiro sinal de canal de áudio 410, um segundo sinal de canal de áudio 412, um terceiro sinal de canal de áudio 414 e um quarto sinal de canal de áudio 416. Ademais, o codificador de áudio 400 é configurado para fornecer uma representação codificada na base dos sinais de canal de áudio 410, 412, 414 e 416, em que a dita representação codificada compreende uma representação codificada em conjunto 420 de dois sinais de mistura descendente, bem como uma representação codificada de um primeiro conjunto 422 de parâmetros de extensão de largura de banda comuns e de um segundo conjunto 424 de parâmetros de extensão de largura de banda comuns. O codificador de áudio 400 compreende um primeiro extrator de parâmetro de extensão de largura de banda 430, que é configurado para obter o primeiro conjunto 422 de parâmetros de extração de largura de banda comuns na base do primeiro sinal de canal de áudio 410 e do terceiro sinal de canal de áudio 414. O codificador de áudio 400 também compreende um segundo extrator de parâmetro de extensão de largura de banda 440, que é configurado para obter o segundo conjunto 424 de parâmetros de extensão de largura de banda comuns na base do segundo sinal de canal de áudio 412 e do quarto sinal de canal de áudio 416.

[091] Ademais, o codificador de áudio 400 compreende um (primeiro) codificador de múltiplos canais 450, que é configurado para codificar em conjunto pelo menos o primeiro sinal de canal de áudio 410 e o segundo sinal de canal de áudio 412 com o uso de uma codificação de múltiplos canais, para obter um primeiro sinal de mistura descendente 452. Adicionalmente, o codificador de áudio 400 também compreende um (segundo) codificador de múltiplos canais 460, que é configurado para codificar em conjunto pelo menos o terceiro sinal de canal de áudio 414 e o quarto sinal de canal de áudio 416 com o uso de uma codificação de múltiplos canais, para obter um segundo sinal de mistura descendente 462. Adicionalmente, o codificador de áudio 400 também compreende um (terceiro) codificador de múltiplos canais 470, que é configurado para codificar em conjunto o primeiro sinal de mistura descendente 452 e o segundo sinal de mistura descendente 462 com o uso de uma codificação de múltiplos canais, para obter uma representação codificada em conjunto 420 dos sinais de mistura descendente.

[092] Em relação à funcionalidade do codificador de áudio 400, deveria ser observado que o codificador de áudio 400 realiza uma codificação de múltiplos canais hierárquica, em que o primeiro sinal de canal de áudio 410 e o segundo sinal de canal de áudio 412 são combinados em um primeiro estágio, e em que o terceiro sinal de canal de áudio 414 e o quarto sinal de canal de áudio 416 também são combinado no primeiro estágio, para obter, assim, o primeiro sinal de mistura descendente 452 e o segundo sinal de mistura descendente 462. O primeiro sinal de mistura descendente 452 e o segundo sinal de mistura descendente 462 são, então, codificados em conjunto em um segundo estágio. No entanto, deveria ser observado que o primeiro extrator de parâmetro de extensão de largura de banda 430 fornece o primeiro conjunto 422 de parâmetros de extração de largura de banda comuns na base de sinais de canal de áudio 410, 414 que são manuseados por diferentes codificadores de múltiplos canais 450, 460 no primeiro estágio da codificação de múltiplos canais hierárquica. De modo similar, o segundo extrator de parâmetro de extensão de largura de banda 440 fornece um segundo conjunto 424 de parâmetros de extração de largura de banda comuns na base de diferentes sinais de canal de áudio 412, 416, que são manuseados por diferentes codificadores de múltiplos canais 450, 460 no primeiro estágio de processamento. Essa ordem de processamento específica traz consigo a vantagem que os conjuntos 422, 424 de parâmetros de extensão de largura de banda são baseados em canais que são apenas combinados no segundo estágio da codificação hierárquica (isto é, no codificador de múltiplos canais 470). Isso é vantajoso, visto que é desejável combinar tais canais de áudio no primeiro estágio da codificação hierárquica, a relação dos mesmos não é altamente relevante em relação a uma percepção de posição de fonte de som. Ao invés disso, é recomendável que a relação entre o primeiro sinal de mistura descendente e o segundo sinal de mistura descendente determine principalmente uma percepção de local de fonte de som, devido ao fato de que a relação entre o primeiro sinal de mistura descendente 452 e o segundo sinal de mistura descendente 462 podem ser mais bem mantida que a relação entre os sinais de canal de áudio individuais 410, 412, 414, 416. Em outras palavras, constatou-se que é desejável que o primeiro conjunto 422 de parâmetros de extensão de largura de banda comuns seja baseado em dois canais de áudio (sinais de canal de áudio) que contribuem para um diferente dos sinais de mistura descendente 452, 462, e que o segundo conjunto 424 de parâmetros de extensão de largura de banda comuns seja fornecido na base de sinais de canal de áudio 412, 416, que também contribuem para um diferente dos sinais de mistura descendente 452, 462, que é alcançado por meio do processamento descrito acima dos sinais de canal de áudio na codificação de múltiplos canais hierárquica. Consequentemente, o primeiro conjunto 422 de parâmetros de extensão de largura de banda comuns é baseado em uma relação de canal similar em comparação à relação de canal entre o primeiro sinal de mistura descendente 452 e o segundo sinal de mistura descendente 462, em que o último domina tipicamente a impressão espacial gerada no lado de um decodificador de áudio. Consequentemente, o fornecimento do primeiro conjunto 422 de parâmetros de extensão de largura de banda e também o fornecimento do segundo conjunto 424 de parâmetros de extensão de largura de banda são bem adaptados a uma impressão auditiva espacial que é gerada no lado de um decodificador de áudio.

[093] 5. Decodificador de áudio de acordo com a Figura 5

[094] A Figura 5 mostra um diagrama esquemático em bloco de um decodificador de áudio, de acordo com outra modalidade da presente invenção. O decodificador de áudio de acordo com a Figura 5 é designado em sua totalidade com 500.

[095] O decodificador de áudio 500 é configurado para receber uma representação codificada em conjunto 510 de um primeiro sinal de mistura descendente e de um segundo sinal de mistura descendente. Ademais, o decodificador de áudio 500 é configurado para fornecer um primeiro sinal de canal de largura de banda estendida 520, um segundo sinal de canal de largura de banda estendida 522, um terceiro sinal de canal de largura de banda estendida 524 e um quarto sinal de canal de largura de banda estendida 526.

[096] O decodificador de áudio 500 compreende um (primeiro) decodificador de múltiplos canais 530, que é configurado para fornecer u primeiro sinal de mistura descendente 532 e um segundo sinal de mistura descendente 534 na base da representação codificada em conjunto 510 do primeiro sinal de mistura descendente e do segundo sinal de mistura descendente com o uso de uma decodificação de múltiplos canais. O decodificador de áudio 500 também compreende um (segundo) decodificador de múltiplos canais 540, que é configurado para fornecer pelo menos um primeiro sinal de canal de áudio 542 e um segundo sinal de canal de áudio 544 na base do primeiro sinal de mistura descendente 532 com o uso de uma decodificação de múltiplos canais. O decodificador de áudio 500 também compreende um (terceiro) decodificador de múltiplos canais 550, que é configurado para fornecer pelo menos um terceiro sinal de canal de áudio 556 e um quarto sinal de canal de áudio 558 na base do segundo sinal de mistura descendente 544 com o uso de uma decodificação de múltiplos canais. Ademais, o decodificador de áudio 500 compreende uma (primeira) extensão de largura de banda de múltiplos canais 560, que é configurada para realizar uma extensão de largura de banda de múltiplos canais na base do primeiro sinal de canal de áudio 542 e do terceiro sinal de canal de áudio 556, para obter um primeiro sinal de canal de largura de banda estendida 520 e o terceiro sinal de canal de largura de banda estendida 524. Ademais, o decodificador de áudio compreende uma (segunda) extensão de largura de banda de múltiplos canais 570, que é configurada para realizar uma extensão de largura de banda de múltiplos canais na base do segundo sinal de canal de áudio 544 e do quarto sinal de canal de áudio 558, para obter o segundo sinal de canal de largura de banda estendida 522 e o quarto sinal de canal de largura de banda estendida 526.

[097] Em relação à funcionalidade do decodificador de áudio 500, deveria ser observado que o decodificador de áudio 500 realiza uma decodificação de múltiplos canais hierárquica, em que uma divisão entre um primeiro sinal de mistura descendente 532 e um segundo sinal de mistura descendente 534 é realizada em um primeiro estágio da decodificação hierárquica, e em que o primeiro sinal de canal de áudio 542 e o segundo sinal de canal de áudio 544 são derivados do primeiro sinal de mistura descendente 532 em um segundo estágio da decodificação hierárquica, e em que o terceiro sinal de canal de áudio 556 e o quarto sinal de canal de áudio 558 são derivados do segundo sinal de mistura descendente 550 no segundo estágio da decodificação hierárquica. No entanto, a primeira extensão de largura de banda de múltiplos canais 560 e a segunda extensão de largura de banda de múltiplos canais 570 recebem, cada uma, um sinal de canal de áudio que é derivado do primeiro sinal de mistura descendente 532 e um sinal de canal de áudio que é derivado do segundo sinal de mistura descendente 534. Visto que uma melhor separação de canal é tipicamente alcançada pela (primeira) decodificação de múltiplos canais 530, que é realizada como um primeiro estágio da decodificação de múltiplos canais hierárquica, em comparação ao segundo estágio da decodificação hierárquica, pode ser observado que cada extensão de largura de banda de múltiplos canais 560, 570 recebe sinais de entrada que são bem separados (devido ao fato de que originam do primeiro sinal de mistura descendente 532 e do segundo sinal de mistura descendente 534, que são bem separados por canal). Dessa forma, a extensão de largura de banda de múltiplos canais 560, 570 pode considerar características de estéreo, que são importantes para uma impressão auditiva e que são bem representados pela relação entre o primeiro sinal de mistura descendente 532 e o segundo sinal de mistura descendente 534 e podem, portanto, fornecer uma boa impressão auditiva.

[098] Em outras palavras, a estrutura "transversal" do decodificador de áudio, em que cada um dos estágios de extensão de largura de banda de múltiplos canais 560, 570 recebe sinais de entrada de ambos os (segundo estágio) decodificadores de múltiplos canais 540, 550 permite uma boa extensão de largura de banda de múltiplos canais, que considera uma relação de estéreo entre os canais.

[099] No entanto, deveria ser observado que o decodificador de áudio 500 pode ser suplementado por qualquer um dos recursos e funcionalidades descritas no presente documento em relação aos decodificadores de áudio de acordo com as Figuras 2, 3, 6 e 13, em que é possível introduzir recursos individuais no decodificador de áudio 500 para aprimorar gradualmente o desempenho do decodificador de áudio.

[100] 6. Decodificador de áudio de acordo com a Figura 6

[101] A Figura 6 mostra um diagrama esquemático em bloco de um decodificador de áudio de acordo com outra modalidade da presente invenção. O decodificador de áudio de acordo com a Figura 6 é designado em sua totalidade com 600. O decodificador de áudio 600 de acordo com a Figura 6 é similar ao decodificador de áudio 500 de acordo com a Figura 5, de modo que as explicações acima também se apliquem. No entanto, o decodificador de áudio 600 foi suplementado por alguns recursos e funcionalidades, que também podem ser introduzidos, individualmente ou em combinação, no decodificador de áudio 500 para aprimoramento.

[102] O decodificador de áudio 600 é configurado para receber uma representação codificada em conjunto 610 de um primeiro sinal de mistura descendente e de um segundo sinal de mistura descendente e para fornecer um primeiro sinal de largura de banda estendida 620, um segundo sinal de largura de banda estendida 622, um terceiro sinal de largura de banda estendida 624 e um quarto sinal de largura de banda estendida 626. O decodificador de áudio 600 compreende um decodificador de múltiplos canais 630, que é configurado para receber a representação codificada em conjunto 610 do primeiro sinal de mistura descendente e do segundo sinal de mistura descendente, e para fornecer, na base dos mesmos, o primeiro sinal de mistura descendente 632 e o segundo sinal de mistura descendente 634. O decodificador de áudio 600 compreende adicionalmente um decodificador de múltiplos canais 640, que é configurado para receber o primeiro sinal de mistura descendente 632 e para fornecer, na base dos mesmos, um primeiro sinal de canal de áudio 542 e um segundo sinal de canal de áudio 544. O decodificador de áudio 600 também compreende um decodificador de múltiplos canais 650, que é configurado para receber o segundo sinal de mistura descendente 634 e para fornecer um terceiro sinal de canal de áudio 656 e um quarto sinal de canal de áudio 658. O decodificador de áudio 600 também compreende uma (primeira) extensão de largura de banda de múltiplos canais 660, que é configurada para receber o primeiro sinal de canal de áudio 642 e o terceiro sinal de canal de áudio 656 e para fornecer, na base dos mesmos, o primeiro sinal de canal de largura de banda estendida 620 e o terceiro sinal de canal de largura de banda estendida 624. Além disso, uma (segunda) extensão de largura de banda de múltiplos canais 670 recebe o segundo sinal de canal de áudio 644 e o quarto sinal de canal de áudio 658 e fornece, na base dos mesmos, o segundo sinal de canal de largura de banda estendida 622 e o quarto sinal de canal de largura de banda estendida 626.

[103] O decodificador de áudio 600 também compreende um decodificador de múltiplos canais adicional 680, que é configurado para receber uma representação codificada em conjunto 682 de um primeiro sinal residual e de um segundo sinal residual e que fornece, na base dos mesmos, um primeiro sinal residual 684 para uso pelo decodificador de múltiplos canais 640 e um segundo sinal residual 686 para uso pelo decodificador de múltiplos canais 650.

[104] O decodificador de múltiplos canais 630 é, de preferência, um decodificador de múltiplos canais assistido por sinal residual baseado em previsão. Por exemplo, o decodificador de múltiplos canais 630 pode ser substancialmente idêntico ao decodificador de múltiplos canais 370 descrito acima. Por exemplo, o decodificador de múltiplos canais 630 pode ser um decodificador de previsão de estéreo complexo de USAC, conforme mencionado acima, e conforme descrito no padrão de USAC referido acima. Consequentemente, a representação codificada em conjunto 610 do primeiro sinal de mistura descendente e do segundo sinal de mistura descendente pode, por exemplo, compreender um sinal de mistura descendente (comum) do primeiro sinal de mistura descendente e do segundo sinal de mistura descendente, u sinal residual (comum) do primeiro sinal de mistura descendente e do segundo sinal de mistura descendente e um ou mais parâmetros de previsão, que são avaliados pelo decodificador de múltiplos canais 630.

[105] Ademais, deveria ser observado que o primeiro sinal de mistura descendente 632 pode, por exemplo, ser associado a uma primeira posição horizontal ou posição azimutal (por exemplo, uma posição horizontal esquerda) de uma cena de áudio e que o segundo sinal de mistura descendente 634 pode, por exemplo, ser associado a uma segunda posição horizontal ou posição azimutal (por exemplo, uma posição horizontal direita) da cena de áudio.

[106] Ademais, o decodificador de múltiplos canais 680 pode, por exemplo, ser um decodificador de múltiplos canais associado a sinal residual baseado em previsão. O decodificador de múltiplos canais 680 pode ser substancialmente idêntico ao decodificador de múltiplos canais 330 descrito acima. Por exemplo, o decodificador de múltiplos canais 680 pode ser um decodificador de previsão de estéreo complexo de USAC, conforme mencionado acima. Consequentemente, a representação codificada em conjunto 682 do primeiro sinal residual e do segundo sinal residual pode compreender um sinal de mistura descendente (comum) do primeiro sinal residual e do segundo sinal residual, um sinal residual (comum) do primeiro sinal residual e do segundo sinal residual e um ou mais parâmetros de previsão, que são avaliados pelo decodificador de múltiplos canais 680. Ademais, deveria ser observado que o primeiro sinal residual 684 pode ser associado a uma primeira posição horizontal ou posição azimutal (por exemplo, uma posição horizontal esquerda) da cena de áudio, e que o segundo sinal residual 686 pode ser associado a uma segunda posição horizontal ou posição azimutal (por exemplo, uma posição horizontal direita) da cena de áudio.

[107] O decodificador de múltiplos canais 640 pode, por exemplo, ser uma decodificação de múltiplos canais baseada em parâmetro como, por exemplo, uma decodificação de múltiplos canais de MPEG surround, conforme descrito acima e no padrão referido. No entanto, na presença do decodificador de múltiplos canais (opcional) 680 e do primeiro sinal residual (opcional) 684, o decodificador de múltiplos canais 640 pode ser um decodificador de múltiplos canais assistido por sinal residual baseado em parâmetro, como, por exemplo, um decodificador de estéreo unificado. Dessa forma, o decodificador de múltiplos canais 640 pode ser substancialmente idêntico ao decodificador de múltiplos canais 340 descrito acima e o decodificador de múltiplos canais 640 pode, por exemplo, receber os parâmetros 342 descritos acima.

[108] De modo similar, o decodificador de múltiplos canais 650 pode ser substancialmente idêntico ao decodificador de múltiplos canais 640. Consequentemente, o decodificador de múltiplos canais 650 pode, por exemplo, ser baseado em parâmetro e pode ser, opcionalmente, assistido por sinal residual (na presença do decodificador de múltiplos canais opcional 680).

[109] Ademais, deveria ser observado que o primeiro sinal de canal de áudio 642 e o segundo sinal de canal de áudio 644 são, de preferência, associados a posições espaciais verticalmente adjacentes da cena de áudio. Por exemplo, o primeiro sinal de canal de áudio 642 é associado a uma posição esquerda inferior da cena de áudio e o segundo sinal de canal de áudio 644 é associado a uma posição esquerda superior da cena de áudio. Consequentemente, o decodificador de múltiplos canais 640 realiza uma divisão vertical (ou separação ou distribuição) do conteúdo de áudio descrito pelo primeiro sinal de mistura descendente 632 (e, opcionalmente, pelo primeiro sinal residual 684). De modo similar, o terceiro sinal de canal de áudio 656 e o quarto sinal de canal de áudio 658 são associados a posições verticalmente adjacentes da cena de áudio e são, de preferência, associados à mesma posição horizontal ou posição azimutal da cena de áudio. Por exemplo, o terceiro sinal de canal de áudio 656 é, de preferência, associado a uma posição direita inferior da cena de áudio e o quarto sinal de canal de áudio 658 é, de preferência, associado a uma posição direita superior da cena de áudio. Dessa forma, o decodificador de múltiplos canais 650 realiza uma divisão vertical (ou separação, ou distribuição) do conteúdo de áudio descrito pelo segundo sinal de mistura descendente 634 (e, opcionalmente, o segundo sinal residual 686).

[110] No entanto, a primeira extensão de largura de banda de múltiplos canais 660 recebe o primeiro sinal de canal de áudio 642 e o terceiro canal de áudio 656, que são associados à posição esquerda inferior e a uma posição direita inferior da cena de áudio. Consequentemente, a primeira extensão de largura de banda de múltiplos canais 660 realiza uma extensão de largura de banda de múltiplos canais na base de dois sinais de canal de áudio que são associados ao mesmo plano horizontal (por exemplo, plano horizontal inferior) ou elevação da cena de áudio e lados diferentes (esquerdo/direito) da cena de áudio. Consequentemente, a extensão de largura de banda de múltiplos canais pode considerar características de estéreo (por exemplo, a percepção de estéreo humana) durante a realização da extensão de largura de banda. De modo similar, a segunda extensão de largura de banda de múltiplos canais 670 também pode considerar características de estéreo, visto que a segunda extensão de largura de banda de múltiplos canais opera em sinais de canal de áudio do mesmo plano horizontal (por exemplo, plano horizontal superior) ou elevação, mas em posições horizontais diferentes (lados diferentes) (esquerdo/direito) da cena de áudio.

[111] Para concluir adicionalmente, o decodificador de áudio hierárquico 600 compreende uma estrutura em que uma divisão entre esquerdo e direito (ou separação, ou distribuição) é realizada em um primeiro estágio (decodificação de múltiplos canais 630, 680), em que uma divisão vertical (separação ou distribuição) é realizada em um segundo estágio (decodificação de múltiplos canais 640, 650), e em que a extensão de largura de banda de múltiplos canais opera em um par de sinais esquerdo/direito (extensão de largura de banda de múltiplos canais 660, 670). Esse “cruzamento” das trajetórias de codificação permite essa separação entre esquerdo/direito, que é particularmente importante para a impressão auditiva (por exemplo, mais importante que a divisão superior/inferior) pode ser realizada no primeiro estágio de processamento do decodificador de áudio hierárquico e que a extensão de largura de banda de múltiplos canais também pode ser realizada em um par de sinais de canal de áudio esquerdo-direito, que, novamente, resulta em uma impressão de audição particularmente boa. A divisão superior/inferior é realizada como um estágio intermédio entre a separação entre esquerdo e direito e a extensão de largura de banda de múltiplos canais, que permite derivar quatro sinais de canal de áudio (ou sinais de canal de largura de banda estendida) sem degradar significativamente a impressão auditiva.

[112] 7. Método de acordo com a Figura 7

[113] A Figura 7 mostra um fluxograma de um método 700 para fornecer uma representação codificada na base de pelo menos quatro sinais de canal de áudio.

[114] O método 700 compreende codificar em conjunto 710 pelo menos um primeiro sinal de canal de áudio e um segundo sinal de canal de áudio com o uso de uma codificação de múltiplos canais assistida por sinal residual, para obter um primeiro sinal de mistura descendente e um primeiro sinal residual. O método também compreende codificar em conjunto 720 pelo menos um terceiro sinal de canal de áudio e um quarto sinal de canal de áudio com o uso de uma codificação de múltiplos canais assistida por sinal residual, para obter um segundo sinal de mistura descendente e um segundo sinal residual. O método compreende adicionalmente codificar em conjunto 730 o primeiro sinal residual e o segundo sinal residual com o uso de uma codificação de múltiplos canais, para obter uma representação codificada dos sinais residuais. No entanto, deveria ser observado que o método 700 pode ser suplementado por qualquer um dos recursos e funcionalidades descritas no presente documento em relação aos codificadores de áudio e aos decodificadores de áudio.

[115] 8. Método de acordo com a Figura 8

[116] A Figura 8 mostra um fluxograma de um método 800 para fornecer pelo menos quatro sinais de canal de áudio na base de uma representação codificada.

[117] O método 800 compreende fornecer 810 um primeiro sinal residual e um segundo sinal residual na base de uma representação codificada em conjunto do primeiro sinal residual e o segundo sinal residual com o uso de uma decodificação de múltiplos canais. O método 800 também compreende fornecer 820 um primeiro sinal de canal de áudio e um segundo sinal de canal de áudio na base de um primeiro sinal de mistura descendente e o primeiro sinal residual com o uso de uma decodificação de múltiplos canais assistida por sinal residual. O método também compreende fornecer 830 um terceiro sinal de canal de áudio e um quarto sinal de canal de áudio na base de um segundo sinal de mistura descendente e o segundo sinal residual com o uso de uma decodificação de múltiplos canais assistida por sinal residual.

[118] Ademais, deveria ser observado que o método 800 pode ser suplementado por qualquer um dos recursos e funcionalidades descritas no presente documento em relação aos decodificadores de áudio e aos codificadores de áudio.

[119] 9. Método de acordo com a Figura 9

[120] A Figura 9 mostra um fluxograma de um método 900 para fornecer uma representação codificada na base de pelo menos quatro sinal de canal de áudio.

[121] O método 900 compreende obter 910 um primeiro conjunto de parâmetros de extensão de largura de banda comuns na base de um primeiro sinal de canal de áudio e um terceiro sinal de canal de áudio. O método 900 também compreende obter 920 um segundo conjunto de parâmetros de extensão de largura de banda comuns na base de um segundo sinal de canal de áudio e um quarto sinal de canal de áudio. O método também compreende codificar em conjunto pelo menos o primeiro sinal de canal de áudio e o segundo sinal de canal de áudio com o uso de uma codificação de múltiplos canais, para obter um primeiro sinal de mistura descendente e codificar em conjunto 940 pelo menos o terceiro sinal de canal de áudio e o quarto sinal de canal de áudio com o uso de uma codificação de múltiplos canais para obter um segundo sinal de mistura descendente. O método também compreende codificar em conjunto 950 o primeiro sinal de mistura descendente e o segundo sinal de mistura descendente com o uso de uma codificação de múltiplos canais, para obter uma representação codificada dos sinais de mistura descendente.

[122] Deveria ser observado que algumas das etapas do método 900, que não compreendem interdependências específicas, podem ser realizadas em ordem arbitrária em paralelo. Ademais, deveria ser observado que o método 900 pode ser suplementado por qualquer um dos recursos e funcionalidades descritas no presente documento em relação aos codificadores de áudio e aos decodificadores de áudio.

[123] 10. Método de acordo com a Figura 10

[124] A Figura 10 mostra um fluxograma de um método 1000 para fornecer pelo menos quatro sinais de canal de áudio na base de uma representação codificada.

[125] O método 1000 compreende fornecer 1010 um primeiro sinal de mistura descendente e um segundo sinal de mistura descendente na base de uma representação codificada em conjunto do primeiro sinal de mistura descendente e o segundo sinal de mistura descendente com o uso de uma decodificação de múltiplos canais, fornecer 1020 pelo menos um primeiro sinal de canal de áudio e um segundo sinal de canal de áudio na base do primeiro sinal de mistura descendente com o uso de uma decodificação de múltiplos canais, fornecer 1030 pelo menos um terceiro sinal de canal de áudio e um quarto sinal de canal de áudio na base do segundo sinal de mistura descendente com o uso de uma decodificação de múltiplos canais, realizar 1040 uma extensão de largura de banda de múltiplos canais na base do primeiro sinal de canal de áudio e do terceiro sinal de canal de áudio, para obter um primeiro sinal de canal de largura de banda estendida e um terceiro sinal de canal de largura de banda estendida, e realizar 1050 uma extensão de largura de banda de múltiplos canais na base do segundo sinal de canal de áudio e do quarto sinal de canal de áudio, para obter um segundo sinal de canal de largura de banda estendida e um quarto sinal de canal de largura de banda estendida.

[126] Deveria ser observado que algumas das etapas do método 1000 podem ser realizadas em paralelo ou em uma ordem diferente. Ademais, deveria ser observado que o método 1000 pode ser suplementado por qualquer um dos recursos e funcionalidades descritas no presente documento em relação ao codificador de áudio e ao decodificador de áudio.

[127] 11. As modalidades de acordo com as Figuras 11, 12 e 13

[128] A seguir, serão descritas algumas modalidades adicionais de acordo com a presente invenção e as considerações subjacentes.

[129] A Figura 11 mostra um diagrama esquemático em bloco de um codificador de áudio 1100 de acordo com uma modalidade da invenção. O codificador de áudio 1100 é configurado para receber um sinal de canal inferior esquerdo 1110, um sinal de canal superior esquerdo 1112, um sinal de canal inferior direito 1114 e um sinal de canal superior direito 1116.

[130] O codificador de áudio 1100 compreende um primeiro codificador (ou codificação) de áudio de múltiplos canais 1120, que é um codificador (ou codificação) de áudio de MPEG surround 2-1-2 ou um codificador (ou codificação) de áudio de estéreo unificado e que recebe o sinal de canal inferior esquerdo 1110 e o sinal de canal superior esquerdo 1112. O primeiro codificador de áudio de múltiplos canais 1120 fornece um sinal de mistura descendente esquerdo 1122 e, opcionalmente, um sinal residual esquerdo 1124. Ademais, o codificador de áudio 1100 compreende um segundo codificador (ou codificação) de múltiplos canais 1130, que é um codificador (ou codificação) de MPEG- surround 2-1-2 ou um codificador (ou codificação) de estéreo unificado que recebe o sinal de canal inferior direito 1114 e o sinal de canal superior direito 1116. O segundo codificador de áudio de múltiplos canais 1130 fornece um sinal de mistura descendente direito 1132 e, opcionalmente, um sinal residual direito 1134. O codificador de áudio 1100 também compreende um codificador (ou codificação) de estéreo 1140, que recebe o sinal de mistura descendente esquerdo 1122 e o sinal de mistura descendente direito 1132. Ademais, a primeira codificação de estéreo 1140, que é uma codificação de estéreo de previsão complexa, recebe informações de modelo psicoacústico 1142 de um modelo psicoacústico. Por exemplo, as informações de psicomodelo 1142 podem descrever a relevância psicoacústica de diferentes bandas de frequência ou sub-bandas de frequência, efeitos de mascaramento psicoacústico e similares. A codificação de estéreo 1140 fornece um elemento de par de canais (CPE) “misturado de modo descendente”, que é designado com 1144 e que descreve o sinal de mistura descendente esquerdo 1122 e o sinal de mistura descendente direito 1132 em uma forma codificada em conjunto. Ademais, o codificador de áudio 1100 opcionalmente compreende um segundo codificador (ou codificação) de estéreo 1150, que é configurado para receber o sinal residual esquerdo opcional 1124 e o sinal residual direito opcional 1134, bem como as informações de modelo psicoacústico 1142. A segunda codificação de estéreo 1150, que é uma codificação de estéreo de previsão complexa, é configurado para fornecer um elemento de par de canais (CPE) “residual”, que representa o sinal residual esquerdo 1124 e o sinal residual direito 1134 em uma forma codificada em conjunto.

[131] O codificador 1100 (bem como os outros codificadores de áudio descritos no presente documento) é baseado na ideia que as dependências de sinal horizontal e vertical são exploradas mediante a combinação hierárquica de ferramentas de estéreo de USAC disponíveis (isto é, conceitos de codificação que estão disponíveis na codificação de USAC). Os pares de canais verticalmente adjacentes são combinados com o uso de estéreo MPEG surround 2-1-2 ou unificado (designado com 1120 e 1130) com um sinal residual de banda limitada ou de banda completa (designado com 1124 e 1134). A saída de cada par de canais verticais é um sinal de mistura descendente 1122, 1132 e, para o estéreo unificado, um sinal residual 1124, 1134. A fim de satisfazer requisitos perceptivos para desmascaramento binaural, ambos os sinais de mistura descendente 1122, 1132 são combinados horizontalmente e codificados em conjunto por meio do uso de previsão complexa (codificador 1140) no domínio de MDCT, que inclui a possibilidade de codificação de lado intermédio esquerda e direita. O mesmo método pode ser aplicado aos sinais residuais horizontalmente combinados 1124, 1134. Esse conceito é ilustrado na Figura 11.

[132] A estrutura hierárquica explicada com referência à Figura 11 pode ser alcançada permitindo-se ferramentas de estéreo (por exemplo, ambas as ferramentas de estéreo de USAC) e reclassificando-se canais entre as mesmas. Dessa forma, não é necessária nenhuma etapa de pré/pós-processamento e a sintaxe de corrente de bits para a transmissão das cargas da ferramenta permanece inalterada (por exemplo, substancialmente inalterada em comparação ao padrão de USAC). Essa ideia resulta no codificador estrutura mostrado na Figura 12.

[133] A Figura 12 mostra um diagrama esquemático em bloco de um codificador de áudio 1200, de acordo com uma modalidade da invenção. O codificador de áudio 1200 é configurado para receber um primeiro sinal de canal 1210, um segundo sinal de canal 1212, um terceiro sinal de canal 1214 e um quarto sinal de canal 1216. O codificador de áudio 1200 é configurado para fornecer uma corrente de bits 1220 para um primeiro elemento de par de canais e uma corrente de bits 1222 para um segundo elemento de par de canais.

[134] O codificador de áudio 1200 compreende um primeiro codificador de múltiplos canais 1230, que é um codificador de MPEG-surround 2-1-ou de estéreo unificado, e que recebe o primeiro sinal de canal 1210 e o segundo sinal de canal 1212. Ademais, o primeiro codificador de múltiplos canais 1230 fornece um primeiro sinal de mistura descendente 1232, uma carga de MPEG surround 1236 e, opcionalmente, um primeiro sinal residual 1234. O codificador de áudio 1200 também compreende um segundo codificador de múltiplos canais 1240 que é um codificador de MPEG surround 2-1-2 ou um codificador estéreo unificado e que recebe o terceiro sinal de canal 1214 e o quarto sinal de canal 1216. O segundo codificador de múltiplos canais 1240 fornece um primeiro sinal de mistura descendente 1242, uma carga de MPEG surround 1246 e, opcionalmente, um segundo sinal residual 1244.

[135] O codificador de áudio 1200 também compreende primeira codificação de estéreo 1250, que é uma codificação de estéreo de previsão complexa. A primeira codificação de estéreo 1250 recebe o primeiro sinal de mistura descendente 1232 e o segundo sinal de mistura descendente 1242. A primeira codificação de estéreo 1250 fornece uma representação codificada em conjunto 1252 do primeiro sinal de mistura descendente 1232 e do segundo sinal de mistura descendente 1242, em que a representação codificada em conjunto 1252 pode compreender uma representação de um sinal de mistura descendente (comum) (do primeiro sinal de mistura descendente 1232 e do segundo sinal de mistura descendente 1242) e de um sinal residual comum (do primeiro sinal de mistura descendente 1232 e do segundo sinal de mistura descendente 1242). Ademais, a (primeira) codificação de estéreo de previsão complexa 1250 fornece uma carga de previsão complexa 1254, que compreende tipicamente um ou mais coeficientes de previsão complexa. Ademais, o codificador de áudio 1200 também compreende uma segunda codificação de estéreo 1260, que é uma codificação de estéreo de previsão complexa. A segunda codificação de estéreo 1260 recebe o primeiro sinal residual 1234 e o segundo sinal residual 1244 (ou valores de entrada zero, se não houver sinal residual fornecido pelos codificadores de múltiplos canais 1230, 1240). A segunda codificação de estéreo 1260 fornece uma representação codificada em conjunto 1262 do primeiro sinal residual 1234 e do segundo sinal residual 1244, que pode, por exemplo, compreender um sinal de mistura descendente (comum) (do primeiro sinal residual 1234 e do segundo sinal residual 1244) e um sinal residual comum (do primeiro sinal residual 1234 e do segundo sinal residual 1244). Ademais, a codificação de estéreo de previsão complexa 1260 fornece uma carga de previsão complexa 1264 que compreende tipicamente um ou mais coeficientes de previsão.

[136] Ademais, o codificador de áudio 1200 compreende um modelo psicoacústico 1270, que fornece informações que controlam a primeira codificação de estéreo de previsão complexa 1250 e a segunda codificação de estéreo de previsão complexa 1260. Por exemplo, as informações fornecidas pelo modelo psicoacústico 1270 podem descrever quais bandas de frequência ou intervalos de frequência são de alta relevância psicoacústica e deveriam ser codificados com alta precisão. No entanto, deveria ser observado que o uso das informações fornecidas pelo modelo psicoacústico 1270 é opcional.

[137] Ademais, o codificador de áudio 1200 compreende um primeiro codificador e multiplexador 1280 que recebe a representação codificada em conjunto 1252 da primeira codificação de estéreo de previsão complexa 1250, a carga de previsão complexa 1254 da primeira codificação de estéreo de previsão complexa 1250 e a carga de MPEG surround 1236 do primeiro codificador de áudio de múltiplos canais 1230. Ademais, a primeira codificação e multiplexação 1280 pode receber informações do modelo psicoacústico 1270, que descreve, por exemplo, qual precisão de codificação deveria ser aplicada a quais bandas de frequência ou sub-bandas de frequência, considerando efeitos de mascaramento psicoacústico e similares. Consequentemente, a primeira codificação e multiplexação 1280 fornece o primeiro elemento de par de canais corrente de bits 1220.

[138] Ademais, o codificador de áudio 1200 compreende uma segunda codificação e multiplexação 1290, que é configurado para receber a representação codificada em conjunto 1262 fornecida pela segunda codificação de estéreo de previsão complexa 1260, a carga de previsão complexa 1264 fornecida pela segunda codificação de estéreo de previsão complexa 1260 e a carga de MPEG surround 1246 fornecida pelo segundo codificador de áudio de múltiplos canais 1240. Ademais, a segunda codificação e multiplexação 1290 pode receber informações do modelo psicoacústico 1270. Consequentemente, a segunda codificação e multiplexação 1290 fornece o segundo elemento de par de canais corrente de bits 1222.

[139] Em relação à funcionalidade do codificador de áudio 1200, faz-se referência às explicações acima e também às explicações em relação aos codificadores de áudio de acordo com as Figuras 2, 3, 5 e 6.

[140] Ademais, deveria ser observado que esse conceito pode ser estendido ao uso de múltiplas caixas de MPEG surround para codificação em conjunto de canais horizontal, vertical ou de outro modo geometricamente relacionados e combinar os sinais de mistura descendente ou residuais a pares de estéreo de previsão complexa, considerando suas propriedades geométricas e perceptivas. Isso leva a uma estrutura de decodificador generalizada.

[141] A seguir, será descrita a implantação de um elemento de canal quádruplo. Em um sistema de codificação de áudio tridimensional, é usada a combinação hierárquica de quatro canais para formar um elemento de canal quádruplo (QCE). Um QCE consiste em dois elementos de par de canais (CPE) de USAC (ou fornece dois elementos de par de canais de USAC ou recebe dois elementos de par de canais de USAC). Os pares de canais verticais são combinados com o uso de estéreo de MPS 2-1-2 ou unificado. Os canais de mistura descendente são codificados em conjunto no primeiro elemento de par de canais CPE. Se for aplicada codificação residual, os sinais residuais são codificados em conjunto no segundo elemento de par de canais CPE, do contrário, o sinal no segundo CPE é definido em zero. Ambos os elementos de par de canais CPEs usam previsão complexa para codificação de estéreo em conjunto, incluindo a possibilidade de codificação de lado intermédio e esquerda e direita. Para preservar as propriedades de estéreo perceptivo da parte de alta frequência do sinal, é aplicada SBR (replicação de largura de banda espectral) de estéreo entre o par de canais esquerdo/direito superior e o par de canais esquerdo/direito inferior, por uma etapa de reclassificação adicional antes da aplicação de SBR.

[142] Será descrita uma estrutura de decodificador possível com referência à Figura 13 que mostra um diagrama esquemático em bloco de um decodificador de áudio de acordo com uma modalidade da invenção. O decodificador de áudio 1300 é configurado para receber uma primeira corrente de bits 1310 que representa um primeiro elemento de par de canais e uma segunda corrente de bits 1312 que representa um segundo elemento de par de canais. No entanto, a primeira corrente de bits 1310 e a segunda corrente de bits 1312 podem ser incluídas em uma corrente de bits geral comum.

[143] O decodificador de áudio 1300 é configurado para fornecer um primeiro sinal de canal de largura de banda estendida 1320, que pode, por exemplo, representar uma posição esquerda inferior de uma cena de áudio, um segundo sinal de canal de largura de banda estendida 1322, que pode, por exemplo, representar uma posição esquerda superior da cena de áudio, um terceiro sinal de canal de largura de banda estendida 1324, que pode, por exemplo, ser associado a uma posição direita inferior da cena de áudio e um quarto sinal de canal de largura de banda estendida 1326, que pode, por exemplo, ser associado a uma posição direita superior da cena de áudio.

[144] O decodificador de áudio 1300 compreende uma primeira decodificação de corrente de bits 1330, que é configurada para receber a corrente de bits 1310 para o primeiro elemento de par de canais e para fornecer, na base dos mesmos, uma representação codificada em conjunto de dois sinais de mistura descendente, uma carga de previsão complexa 1334, uma carga de MPEG surround 1336 e uma carga de replicação de largura de banda espectral 1338. O decodificador de áudio 1300 também compreende uma primeira decodificação de estéreo de previsão complexa 1340, que é configurada para receber a representação codificada em conjunto 1332 e a carga de previsão complexa 1334 e para fornecer, na base dos mesmos, um primeiro sinal de mistura descendente 1342 e um segundo sinal de mistura descendente 1344. De modo similar, o decodificador de áudio 1300 compreende uma segunda decodificação de corrente de bits 1350 que é configurada para receber a corrente de bits 1312 para o segundo elemento de canal e para fornecer, na base dos mesmos, uma representação codificada em conjunto 1352 de dois sinais residuais, uma carga de previsão complexa 1354, uma carga de MPEG surround 1356 e uma carga de replicação de largura de banda espectral 1358. O decodificador de áudio também compreende uma segunda decodificação de estéreo de previsão complexa 1360, que fornece um primeiro sinal residual 1362 e um segundo sinal residual 1364 na base da representação codificada em conjunto 1352 e a carga de previsão complexa 1354.

[145] Ademais, o decodificador de áudio 1300 compreende uma primeira decodificação de múltiplos canais do tipo MPEG surround1370, que é uma decodificação de MPEG surround 2-1-2 ou uma decodificação de estéreo unificado. A primeira decodificação de múltiplos canais do tipo MPEG surround 1370 recebe o primeiro sinal de mistura descendente 1342, o primeiro sinal residual 1362 (opcional) e a carga de MPEG surround 1336 e fornece, na base dos mesmos, um primeiro sinal de canal de áudio 1372 e um segundo sinal de canal de áudio 1374. O decodificador de áudio 1300 também compreende uma segunda decodificação de múltiplos canais do tipo MPEG surround 1380, que é uma decodificação de múltiplos canais de MPEG surround 2-1-2 ou uma decodificação de múltiplos canais de estéreo unificado. A segunda decodificação de múltiplos canais do tipo MPEG surround 1380 recebe o segundo sinal de mistura descendente 1344 e o segundo sinal residual 1364 (opcional), bem como a carga de MPEG surround 1356, e fornece, na base dos mesmos, um terceiro sinal de canal de áudio 1382 e quarto sinal de canal de áudio 1384. O decodificador de áudio 1300 também compreende uma primeira replicação de largura de banda espectral de estéreo 1390, que é configurado para receber o primeiro sinal de canal de áudio 1372 e o terceiro sinal de canal de áudio 1382, bem como a carga de replicação de largura de banda espectral 1338, e para fornecer, na base dos mesmos, o primeiro sinal de canal de largura de banda estendida 1320 e o terceiro sinal de canal de largura de banda estendida 1324. Ademais, o decodificador de áudio compreende uma segunda replicação de largura de banda espectral de estéreo 1394, que é configurada para receber o segundo sinal de canal de áudio 1374 e o quarto sinal de canal de áudio 1384, bem como a carga de replicação de largura de banda espectral 1358 e para fornecer, na base dos mesmos, o segundo sinal de canal de largura de banda estendida 1322 e o quarto sinal de canal de largura de banda estendida 1326.

[146] Em relação à funcionalidade do decodificador de áudio 1300, faz-se referência à discussão acima e, também, à discussão do decodificador de áudio de acordo com as Figuras 2, 3, 5 e 6.

[147] A seguir, será descrito um exemplo de uma corrente de bits que pode ser usada para a codificação/decodificação de áudio descrita no presente documento com referência às Figuras 14a e 14b. Deveria ser observado que a corrente de bits pode, por exemplo, ser uma extensão da corrente de bits usada na codificação de fala e áudio unificados (USAC), que é descrita no padrão mencionado acima (ISO/IEC 23003-3:2012). Por exemplo, as cargas de MPEG surround 1236, 1246, 1336, 1356 e as cargas de previsão complexa 1254, 1264, 1334, 1354 podem ser transmitidas como para elementos de par de canais legados (isto é, para elementos de par de canais de acordo com o padrão de USAC). Para sinalizar o uso de um elemento de canal quádruplo QCE, a configuração de par de canais de USAC pode ser estendida em dois bits, conforme mostrado na Figura 14a. Em outras palavras, dois bits designados com “qceIndex” podem ser adicionados ao elemento de corrente de bits de USAC “UsacChannelPairElementConfig()”. O significado do parâmetro representado pelos bits “qceIndex” pode ser definido, por exemplo, conforme mostrado na Tabela da Figura 14b.

[148] Por exemplo, dois elementos de par de canais que formam um QCE podem ser transmitidos como elementos consecutivos, primeiro o CPE contendo os canais de mistura descendente e a carga de MPS para a primeira caixa de MPS, segundo o CPE contendo o sinal residual (ou sinal de áudio zero para codificação de MPS 2-1-2) e a carga de MPS para a segunda caixa de MPS.

[149] Em outras palavras, há apenas uma sobrecarga de sinalização em comparação à corrente de bits de USAC convencional para transmitir um elemento de canal quádruplo QCE.

[150] No entanto, também podem ser naturalmente usados diferentes formatos de corrente de bits.

[151] 12. Ambiente de codificação/decodificação

[152] A seguir, será descrito um ambiente de codificação/decodificação de áudio no qual conceitos de acordo com a presente invenção podem ser aplicados.

[153] Um sistema de codec de áudio 3D, no qual os conceitos de acordo com a presente invenção podem ser usados, é baseado em um codec de MPEG- D USAC para decodificação de sinais de canal e objeto. Para aumentar a eficiência a fim de codificar uma grande quantidade de objetos, foi adaptada tecnologia MPEG SAOC. Três tipos de renderizadores realizam as tarefas de renderização de objetos para canais, renderização de canais para fones de ouvido ou renderização de canais para uma definição de alto-falante diferente. Quando sinais de objeto são explicitamente transmitidos ou parametricamente codificados com o uso de SAOC, as informações de metadados de objeto correspondentes são compactadas e multiplexadas na corrente de bits de áudio 3D.

[154] A Figura 15 mostra um diagrama esquemático em bloco de tal codificador de áudio e a Figura 16 mostra um diagrama esquemático em bloco de tal decodificador de áudio. Em outras palavras, as Figuras 15 e 16 mostram os diferentes blocos algorítmico do sistema de áudio 3D.

[155] Agora com referência à Figura 15, que mostra um diagrama esquemático em bloco de um codificador de áudio em 3D 1500, serão explicados alguns detalhes. O codificador 1500 compreende um pré- renderizador/misturador opcional 1510, que recebe um ou mais sinais de canal 1512 e um ou mais sinais de objeto 1514 e fornece, na base dos mesmos, um ou mais sinais de canal 1516 bem como um ou mais sinais de objeto 1518, 1520. O codificador de áudio também compreende um codificador de USAC 1530 e, opcionalmente, um codificador de SAOC 1540. O codificador de SAOC 1540 é configurado para fornecer um ou mais canais de transporte de SAOC 1542 e informações de lado de SAOC 1544 na base de um ou mais objetos 1520 fornecidos para o codificador de SAOC. Ademais, o codificador de USAC 1530 é configurado para receber os sinais de canal 1516 que compreendem canais e objetos pré-renderizados do pré-renderizador/misturador, para receber um ou mais sinais de objeto 1518 do pré-renderizador/misturador e para receber um ou mais canais de transporte de SAOC 1542 e informações de lado de SAOC 1544, e fornece, na base dos mesmos, uma representação codificada 1532. Ademais, o codificador de áudio 1500 também compreende um codificador de metadados de objeto 1550 que é configurado para receber metadados de objeto 1552 (que podem ser avaliados pelo pré-renderizador/misturador 1510) e para codificar os metadados de objeto para obter metadados de objeto codificados 1554. Os metadados codificados também são recebidos pelo codificador de USAC 1530 e usados para fornecer a representação codificada 1532.

[156] Serão descritos abaixo alguns detalhes relacionados aos componentes individuais do codificador de áudio 1500.

[157] Agora com referência à Figura 16, será descrito um decodificador de áudio 1600. O decodificador de áudio 1600 é configurado para receber uma representação codificada 1610 e para fornecer, na base dos mesmos, sinais de alto-falante de múltiplos canais 1612, sinais de fone de ouvido 1614 e/ou sinais de alto-falante 1616 em um formato alternativo (por exemplo, em um formato 5.1).

[158] O decodificador de áudio 1600 compreende um decodificador de USAC 1620 e fornece um ou mais sinais de canal 1622, um ou mais sinais de objeto pré-renderizados 1624, um ou mais sinais de objeto 1626, um ou mais canais de transporte de SAOC 1628, informações de lado de SAOC 1630 e informações de metadados de objeto compactadas 1632 na base da representação codificada 1610. O decodificador de áudio 1600 também compreende um renderizador de objeto 1640 que é configurado para fornecer um ou mais sinais de objeto renderizados 1642 na base do sinal de objeto 1626 e informações de metadados de objeto 1644, em que as informações de metadados de objeto 1644 são fornecidas por um decodificador de metadados de objeto 1650 na base das informações de metadados de objeto compactadas 1632. O decodificador de áudio 1600 também compreende, opcionalmente, um decodificador de SAOC 1660, que é configurado para receber o canal de transporte de SAOC 1628 e as informações de lado de SAOC 1630, e para fornecer, na base dos mesmos, um ou mais sinais de objeto renderizados 1662. O decodificador de áudio 1600 também compreende um misturador 1670, que é configurado para receber os sinais de canal 1622, os sinais de objeto pré- renderizados 1624, os sinais de objeto renderizados 1642 e os sinais de objeto renderizados 1662, e para fornecer, na base dos mesmos, uma pluralidade de sinais de canal misturados 1672 que podem, por exemplo, constituir os sinais de alto-falante de múltiplos canais 1612. O decodificador de áudio 1600 também pode, por exemplo, compreender um renderizador binaural 1680, que é configurado para receber os sinais de canal misturados 1672 e para fornecer, na base dos mesmos, os sinais de fone de ouvido 1614. Ademais, o decodificador de áudio 1600 pode compreender uma conversão de formato 1690, que é configurada para receber os sinais de canal misturados 1672 e informações de esboço de reprodução 1692 e para fornecer, na base dos mesmos, um sinal de alto-falante 1616 para uma definição de alto-falante alternativa.

[159] A seguir, serão descritos alguns detalhes relacionados aos componentes do codificador de áudio 1500 e do decodificador de áudio 1600.

[160] Pré-renderizador/misturador

[161] O pré-renderizador/misturador 1510 pode ser opcionalmente usado para converter uma cena de entrada de objeto mais canal em uma cena de canal antes da codificação. Funcionalmente, o mesmo pode, por exemplo, ser idêntico ao renderizador/misturador de objeto descrito abaixo. A pré-renderização de objetos pode, por exemplo, assegurar uma entropia de sinal determinística na entrada de codificador que é basicamente independente do número de sinais de objeto simultaneamente ativos. Na pré-renderização de objetos, não é exigida transmissão de metadados de objeto. Os sinais de objeto distintos são renderizados no esboço de canal que o codificador é configurado para usar. Os pesos dos objetos para cada canal são obtidos juntos aos metadados de objeto associado (OAM) 1552.

[162] Codec de núcleo de USAC

[163] O codec de núcleo 1530, 1620 para sinais de canal de alto-falante, sinais de objeto distinto, sinais de mistura descendente de objeto e sinais pré- renderizados é baseado em tecnologia de MPEG-D USAC. O mesmo manuseia a codificação da multitude de sinais mediante a criação de informações de mapeamento de canal e objeto com base nas informações geométricas e semânticas da atribuição de canal e objeto da entrada. Essas informações de mapeamento descrevem como canais e objetos de entrada são mapeados para elementos de canais de USAC (CPEs, SCEs, LFEs) e as informações correspondentes são transmitidas para o decodificador. Todas as cargas adicionais como dados de SAOC ou metadados de objeto atravessaram elementos de extensão e foram consideradas no controle de taxa de codificadores.

[164] A codificação de objetos é possível de formas diferentes, dependendo dos requisitos de distorção/taxa e nos requisitos de interatividade para o renderizador. As seguintes variantes de codificação de objeto são possíveis:

[165] Objetos pré-renderizados: os sinais de objeto são pré-renderizados e misturados aos sinais de canal de 22.2 antes da codificação. A cadeia de codificação subsequente nota sinais de canal de 22.2.

[166] Formas de onda de objeto distintas: os objetos são supridos como formas de onda monofônica para o codificador. O codificador usa elementos de canal simples SCEs para transferir os objetos além dos sinais de canal. Os objetos decodificados são renderizados e misturado no lado de receptor. As informações de metadados de objeto compactadas são transmitidas para o receptor/renderizador em conjunto.

[167] Formas de onda de objeto paramétrico: as propriedades de objeto e sua relação entre si são descritas por meio de parâmetros de SAOC. A mistura descendente dos sinais de objeto é codificada com USAC. As informações paramétricas são transmitidas em conjunto. O número de canais de mistura descendente é escolhido dependendo do número de objetos e da taxa de dados geral. As informações de metadados de objeto compactadas são transmitidas para o renderizador de SAOC.

[168] SAOC

[169] O codificador de SAOC 1540 e o decodificador de SAOC 1660 para sinais de objeto são baseados em tecnologia MPEG SAOC. O sistema tem a capacidade de recriar, modificar e renderizar inúmeros objetos de áudio com base em um número menor de canais transmitidos e dados paramétricos adicionais (diferenças de nível de objeto OLDs, correlações entre objetos IOCs, ganhos de mistura descendente DMGs). Os dados paramétricos adicionais exibem uma taxa de dados significativamente inferior do que é exigido para transmitir todos os objetos individualmente, tornando a codificação muito eficiente. O codificador de SAOC toma, como entrada, os sinais de objeto/canal como formas de onda monofônica e emite as informações paramétricas (que são empacotadas na corrente de bits de áudio 3D 1532, 1610) e os canais de transporte de SAOC (que são codificados com o uso de elementos de canal simples e transmitidos).

[170] O decodificador de SAOC 1600 reconstrói os sinais de objeto/canal dos canais de transporte de SAOC decodificados 1628 e informações paramétricas 1630 e gera a cena de áudio de saída com base no esboço de reprodução, as informações de metadados de objeto descompactadas e, opcionalmente, nas informações de interação de usuário.

[171] Codec de Metadados de Objeto

[172] Para cada objeto, os metadados associados que especificam a posição geométrica e o volume do objeto no espaço 3D são codificados de modo eficiente por meio de quantização das propriedades de objeto no tempo e espaço. Os metadados de objeto compactados cOAM 1554, 1632 são transmitidos para o receptor como informações de lado.

[173] Renderizador/Misturador de Objeto

[174] O renderizador de objeto utiliza os metadados de objeto compactados para gerar formas de onda de objeto de acordo com o dado formato de reprodução. Cada objeto é renderizado para certos canais de saída de acordo com seus metadados. A saída desse bloco resulta da soma dos resultados parciais. Se o conteúdo baseado em canal bem como objetos paramétricos/distintos são decodificados, as formas de onda baseadas em canal e as formas de onda de objeto renderizado são misturadas antes da emissão das formas de onda resultantes (ou antes da alimentação das mesmas para um módulo de pós-processador como o renderizador binaural ou o módulo de renderizador de alto-falante).

[175] Renderizador Binaural

[176] O módulo de renderizador binaural 1680 produz uma mistura descendente binaural do material de áudio de múltiplos canais, de modo que cada canal de entrada seja representada por uma fonte de sim virtual. O processamento é conduzido ao longo do quadro em domínio de QMF. A binauralização é baseada em respostas de impulso de ambiente binaural medido.

[177] Conversão de Formato/Renderizador de Alto-Falante

[178] O renderizador de alto-falante 1690 converte entre a configuração de canal transmitido e o formato de reprodução desejado. O mesmo é, dessa forma, chamado de “conversor de formato” a seguir. O conversor de formato realiza conversões em números inferiores de canais de saída, isto é, cria misturas descendentes. O sistema gera automaticamente matrizes de mistura descendente otimizada para a dada combinação de formatos de entrada e saída e aplica essas matrizes em um processo de mistura descendente. O conversor de formato permite configurações de alto-falante padrão bem como configurações aleatórias com posições de alto-falante não padrão.

[179] A Figura 17 mostra um diagrama esquemático em bloco do conversor de formato. Como pode ser observado, o conversor de formato 1700 recebe sinais de saída de misturador 1710, por exemplo, os sinais de canal misturados 1672 e fornece sinais de alto-falante 1712, por exemplo, os sinais de alto-falante 1616. O conversor de formato compreende um processo de mistura descendente 1720 no domínio de QMF e um configurador de mistura descendente 1730, em que o configurador de mistura descendente fornece informações de configuração para o processo de mistura descendente 1720 na base de informações de esboço de saída de misturador 1732 e informações de esboço de reprodução 1734.

[180] Ademais, deveria ser observado que os conceitos descritos acima, por exemplo, o codificador de áudio 100, o decodificador de áudio 200 ou 300, o codificador de áudio 400, o decodificador de áudio 500 ou 600, os métodos 700, 800, 900 ou 1000, o codificador de áudio 1100 ou 1200 e o decodificador de áudio 1300 podem ser usados no codificador de áudio 1500 e/ou no decodificador de áudio 1600. Por exemplo, os codificadores de áudio/decodificadores mencionados anteriormente podem ser usados para codificar ou decodificar sinais de canal que são associados a diferentes posições espaciais.

[181] 13. Modalidades alternativas

[182] A seguir, serão descritas algumas modalidades adicionais.

[183] Agora com referência às Figuras 18 a 21, serão explicadas modalidades adicionais de acordo com a invenção.

[184] Deveria ser observado que um chamado “Elemento de Canal Quádruplo” (QCE) pode ser considerado como uma ferramenta de um decodificador de áudio, que pode ser usado, por exemplo, para decodificar conteúdo de áudio tridimensional.

[185] Em outras palavras, o Elemento de Canal Quádruplo (QCE) é um método para codificação em conjunto de quatro canais para codificação mais eficiente de canais horizontal e verticalmente distribuídos. Um QCE consiste em dois CPEs consecutivos e é formado mediante a combinação hierárquica que compreende a Ferramenta de Estéreo Conjunto com possibilidade de Ferramenta de Previsão de Estéreo Complexo na direção horizontal e a ferramenta de estéreo baseado em MPEG Surround na direção vertical. Isso é alcançado permitindo ambas as ferramentas de estéreo e trocando canais de saída entre a aplicação das ferramentas. A SBR de Estéreo é realizada na direção horizontal para preservar as relações esquerda-direita de altas frequências.

[186] A Figura 18 mostra uma estrutura topológica de um QCE. Deveria ser observado que o QCE da Figura 18 é muito similar ao QCE da Figura 11, de modo que se faça referência às explicações acima. No entanto, deveria ser observado que, no QCE da Figura 18, não é necessário fazer uso do modelo psicoacústico durante a realização de previsão de estéreo complexo (enquanto tal uso é naturalmente possível, opcionalmente). Ademais, pode ser observado que a primeira replicação de largura de banda espectral de estéreo (SBR de Estéreo) é realizada na base do canal inferior esquerdo e o canal inferior direito, e que a segunda replicação de largura de banda espectral de estéreo (SBR de Estéreo) é realizada na base do canal superior esquerdo e do canal superior direito.

[187] A seguir, serão fornecidos alguns termos e definições, que podem se aplicar em algumas modalidades.

[188] Um elemento de dados qceIndex indica um modo de QCE de um CPE. Em relação ao significado da variável de corrente de bits qceIndex, faz-se referência à Figura 14b. Deveria ser observado que qceIndex descreve se dois elementos subsequentes de tipo UsacChannelPairElement() são tratados como um Elemento de Canal Quádruplo (QCE). Os diferentes modos de QCE são dados na Figura 14b. O qceIndex deve ser igual para os dois elementos subsequentes que formam um QCE.

[189] A seguir, serão definidos alguns elementos de ajuda, que podem ser usados em algumas modalidades de acordo com a invenção:

[190]

primeiro canal de primeiro CPE após a decodificação de estéreo de previsão complexa

[191]

segundo canal de primeiro CPE após a decodificação de estéreo de previsão complexa

[192]

segundo CPE após a decodificação de estéreo de previsão complexa (zero se qceIndex = 1)

[193]

segundo canal de segundo CPE após a decodificação de estéreo de previsão complexa (zero se qceIndex = 1)

[194]

primeiro canal de saída de primeira caixa de MPS

[195]

segundo canal de saída de primeira caixa de MPS

[196]

primeiro canal de saída de segunda caixa de MPS

[197]

segundo canal de saída de segunda caixa de MPS

[198]

primeiro canal de saída de primeira caixa de SBR de Estéreo

[199]

segundo canal de saída de primeira caixa de SBR de Estéreo

[200]

primeiro canal de saída de segunda caixa de SBR de Estéreo

[201]

segundo canal de saída de segunda caixa de SBR de Estéreo

[202] A seguir, será explicado um processo de decodificação, que é realizado em uma modalidade de acordo com a invenção.

[203] O elemento de sintaxe (ou elemento de corrente de bits ou elemento de dados) qceIndex em UsacChannelPairElementConfig() indica se um CPE pertence a um QCE e se é usada codificação residual. No caso em que qceIndex é diferente de 0, o CPE atual forma um QCE junto com seu elemento subsequente, que deve ser um CPE que tem o mesmo qceIndex. SBR de Estéreo é sempre usada para o QCE, dessa forma, a o item de sintaxe stereoConfigIndex deve ser 3 e bsStereoSbr deve ser 1.

[204] No caso em que qceIndex == 1, apenas as cargas para MPEG Surround e SBR e dados de sinal de áudio não relevantes estão contidos no segundo CPE e o elemento de sintaxe bsResidualCoding é definido em 0.

[205] A presença de um sinal residual no segundo CPE é indicada por qceIndex == 2. Nesse caso, o elemento de sintaxe bsResidualCoding é definido em 1.

[206] No entanto, também podem ser usados alguns esquemas de sinalização simplificados diferentes e possíveis.

[207] A decodificação de Estéreo Conjunto com possibilidade de Previsão de Estéreo Complexo é realizada conforme descrito em ISO/IEC 23003-3, sub- cláusula 7.7. A saída resultante do primeiro CPE são os sinais de mistura descendente de MPS cplx_out_dmx_L[] e cplx_out_dmx_R[]. Se é usada codificação residual (isto é, qceIndex == 2), a saída do segundo CPE são os sinais residuais de MPS cplx_out_res_L[], cplx_out_res_R[], se não foi transmitido nenhum sinal residual (isto é, qceIndex == 1), são inseridos sinais zero.

[208] Antes da aplicação da decodificação de MPEG Surround, o segundo canal do primeiro elemento (cplx_out_dmx_R[]) e o primeiro canal do segundo elemento (cplx_out_res_L[]) são trocados.

[209] A decodificação de MPEG Surround é realizada conforme descrito em ISO/IEC 23003-3, sub-cláusula 7.11. Se é usada codificação residual, a decodificação pode ser, no entanto, modificada em comparação à decodificação de MPEG surround convencional em algumas modalidades. A decodificação de MPEG Surround sem residual com o uso de SBR conforme definido em ISO/IEC 23003-3, sub-cláusula 7.11.2.7 (Figura 23) é modificada de modo que SBR de Estéreo também seja usada para bsResidualCoding == 1, resultando na esquemática de decodificador mostrada na Figura 19. A Figura 19 mostra um diagrama esquemático em bloco de um codificador de áudio para bsResidualCoding ==0 e bsStereoSbr ==1.

[210] Como pode ser observado na Figura 19, um decodificador de núcleo de USAC 2010 fornece um sinal de mistura descendente (DMX) 2012 para um decodificador de MPS (MPEG Surround) 2020, que fornece um primeiro sinal de áudio codificado 2022 e um segundo sinal de áudio codificado 2024. Um decodificador de SBR de Estéreo 2030 recebe o primeiro sinal de áudio codificado 2022 e o segundo sinal de áudio codificado 2024 e fornece, na base dos mesmos, um sinal de áudio de largura de banda estendida esquerdo 2032 e um sinal de áudio de largura de banda estendida direito 2034.

[211] Antes da aplicação de SBR de Estéreo, o segundo canal do primeiro element

e o primeiro canal do segundo elemento

são trocados para permitir SBR de Estéreo direita-esquerda. Após a aplicação de SBR de Estéreo, o segundo canal de saída do primeiro elemento

e o primeiro canal do segundo elemento

são novamente trocados para restaurar a ordem de canal de entrada.

[212] Uma estrutura de decodificador de QCE é ilustrada na Figura 20, que mostra uma esquemática de decodificador de QCE.

[213] Deveria ser observado que o diagrama esquemático em bloco da Figura 20 é muito similar ao diagrama esquemático em bloco da Figura 13, de modo que também seja feita referência às explicações acima. Ademais, deveria ser observado que foi adicionada alguma marcação de sinal na Figura 20, em que se faz referência às definições nessa seção. Ademais, é mostrada uma reclassificação final dos canais, que é realizada após a SBR de Estéreo.

[214] A Figura 21 mostra um diagrama esquemático em bloco de um Codificador de Canal Quádruplo 2200, de acordo com uma modalidade da presente invenção. Em outras palavras, um Codificador de Canal Quádruplo (Elemento de Canal Quádruplo), que pode ser considerado uma Ferramenta de Codificador de Núcleo, é ilustrado na Figura 21.

[215] O Codificador de Canal Quádruplo 2200 compreende uma primeira SBR de Estéreo 2210, que recebe um primeiro sinal de entrada de canal esquerdo 2212 e um segundo sinal de entrada de canal esquerdo 2214, e que fornece, na base dos mesmos, uma primeira carga de SBR 2215, um primeiro sinal de saída de SBR de canal esquerdo 2216 e um primeiro sinal de saída de SBR de canal direito 2218. Ademais, o Codificador de Canal Quádruplo 2200 compreende uma segunda SBR de Estéreo, que recebe um segundo sinal de entrada de canal direito 2222 e um segundo sinal de entrada de canal esquerdo 2224, e que fornece, na base dos mesmos, uma primeira carga de SBR 2225, um primeiro sinal de saída de SBR de canal esquerdo 2226 e um primeiro sinal de saída de SBR de canal direito 2228.

[216] O Codificador de Canal Quádruplo 2200 compreende um primeiro codificador de múltiplos canais tipo MPEG-Surround (MPS 2-1-2 ou Estéreo Unificado) 2230 que recebe o primeiro sinal de saída de SBR de canal esquerdo 2216 e o segundo sinal de saída de SBR de canal esquerdo 2226, e que fornece, na base dos mesmos, uma primeira carga de MPS 2232, um sinal de mistura descendente de MPEG Surround de canal esquerdo 2234 e, opcionalmente, um sinal residual de MPEG Surround de canal esquerdo 2236. O Codificador de Canal Quádruplo 2200 também compreende um primeiro codificador de múltiplos canais tipo MPEG-Surround (MPS 2-1-2 ou Estéreo Unificado) 2240 que recebe o primeiro sinal de saída de SBR de canal direito 2218 e o segundo sinal de saída de SBR de canal direito 2228, e que fornece, na base dos mesmos, uma primeira carga de MPS 2242, um sinal de mistura descendente de MPEG Surround de canal direito 2244 e, opcionalmente, um sinal residual de MPEG Surround de canal direito 2246.

[217] O Codificador de Canal Quádruplo 2200 compreende uma primeira codificação de estéreo de previsão complexa 2250, que recebe o sinal de mistura descendente de MPEG Surround de canal esquerdo 2234 e o sinal de mistura descendente de MPEG Surround de canal direito 2244, e que fornece, na base dos mesmos, uma carga de previsão complexa 2252 e uma representação codificada em conjunto 2254 do sinal de mistura descendente de MPEG Surround de canal esquerdo 2234 e do sinal de mistura descendente de MPEG Surround de canal direito 2244. O Codificador de Canal Quádruplo 2200 compreende uma segunda codificação de estéreo de previsão complexa 2260, que recebe o sinal residual de MPEG Surround de canal esquerdo 2236 e o sinal residual de MPEG Surround de canal direito 2246, e que fornece, na base dos mesmos, uma carga de previsão complexa 2262 e uma representação codificada em conjunto 2264 do sinal de mistura descendente de MPEG Surround de canal esquerdo 2236 e do sinal de mistura descendente de MPEG Surround de canal direito 2246.

[218] O Codificador de Canal Quádruplo também compreende uma primeira codificação de corrente de bits 2270, que recebe a representação codificada em conjunto 2254, a carga de previsão complexa 2252, a carga de MPS 2232 e a carga de SBR 2215 e fornece, na base dos mesmos, uma porção de corrente de bits que representa um primeiro elemento de par de canais. O Codificador de Canal Quádruplo também compreende uma segunda codificação de corrente de bits 2280, que recebe a representação codificada em conjunto 2264, a carga de previsão complexa 2262, a carga de MPS 2242 e a carga de SBR 2225 e fornece, na base dos mesmos, uma porção de corrente de bits que representa um primeiro elemento de par de canais.

[219] 14. Alternativas de Implantação

[220] Embora alguns aspectos tenham sido descritos no contexto de um aparelho, é evidente que esses aspectos também representam uma descrição do método correspondente, em que um bloco ou dispositivo corresponde a uma etapa de método ou a um recurso de uma etapa de método. De maneira análoga, os aspectos descritos no contexto de uma etapa de método também representam uma descrição de um bloco ou item ou recurso de um aparelho correspondente. Parte ou a totalidade das etapas de método pode ser executada por (ou com o uso de) um aparelho de hardware, como, por exemplo, um microprocessador, um computador programável ou um circuito eletrônico. Em algumas modalidades, um ou mais dentre as etapas de método mais importantes podem ser executadas por tal aparelho.

[221] O sinal de áudio codificado da invenção pode ser armazenado em um meio de armazenamento digital ou pode ser transmitido em um meio de transmissão como um meio de transmissão sem fio ou um meio de transmissão com fio como a Internet.

[222] Dependendo de certos requisitos de implantação, as modalidades da invenção podem ser implantadas em hardware ou em software. A implantação pode ser realizada com o uso de um meio de armazenamento digital, por exemplo, um disquete, um DVD, um Blu-Ray, um CD, uma ROM, uma PROM, uma EPROM, uma EEPROM ou uma memória FLASH, que tem sinais de controle eletronicamente legíveis armazenados no mesmo, que cooperam (ou têm a capacidade de cooperar) com um sistema de computador programável de modo que o respectivo método seja realizado. Portanto, o meio de armazenamento digital pode ser legível por computador.

[223] Algumas modalidades de acordo com a invenção compreendem um suporte de dados que tem sinais de controle eletronicamente legíveis, que têm a capacidade de cooperar com um sistema de computador programável, de modo que um dos métodos descritos no presente documento seja realizado.

[224] De modo geral, as modalidades da presente invenção podem ser implantadas como um produto de programa de computador com um código de programa, em que o código de programa é operativo para realizar um dos métodos quando o produto de programa de computador for executado em um computador. O código de programa pode ser, por exemplo, armazenado em um suporte legível por máquina.

[225] Outras modalidades compreendem o programa de computador para realizar um dos métodos descritos no presente documento, armazenado em um suporte legível por máquina.

[226] Em outras palavras, uma modalidade do método da invenção é, portanto, um programa de computador que tem um código de programa para realizar um dos métodos descritos no presente documento, quando o programa de computador é executado em um computador.

[227] Uma modalidade adicional dos métodos da invenção é, portanto, um suporte de dados (ou um meio de armazenamento digital, ou um meio legível por computador) que compreende, gravado no mesmo, o programa de computador para realizar um dos métodos descritos no presente documento. O suporte de dados, o meio de armazenamento digital ou o meio gravado é tipicamente tangível e/ou não transitório.

[228] Uma modalidade adicional do método da invenção é, portanto, uma corrente de dados ou uma sequência de sinais que representa o programa de computador para realizar um dos métodos descritos no presente documento. A corrente de dados ou a sequência de sinais pode ser, por exemplo, configurada para ser transferida através de uma conexão de comunicação de dados, por exemplo, através da Internet.

[229] Uma modalidade adicional compreende um meio de processamento, por exemplo, um computador, ou um dispositivo de lógica programável, configurado para ou adaptado para realizar um dos métodos descritos no presente documento.

[230] Uma modalidade adicional compreende um computador que tem, instalado no mesmo, o programa de computador para realizar um dos métodos descritos no presente documento.

[231] Uma modalidade adicional de acordo com a invenção compreende um aparelho ou um sistema configurado para transferir (por exemplo, eletrônica ou opticamente) um programa de computador para realizar um dos métodos descritos no presente documento para um receptor. O receptor pode, por exemplo, ser um computador, um dispositivo móvel, um dispositivo de memória ou similares. O aparelho ou sistema pode, por exemplo, compreender um servidor de arquivo para transferir o programa de computador para o receptor.

[232] Em algumas modalidades, um dispositivo de lógica programável (por exemplo, um arranjo de porta programável em campo) pode ser usado para realizar parte ou a totalidade das funcionalidades dos métodos descritos no presente documento. Em algumas modalidades, um arranjo de porta programável em campo pode cooperar com um microprocessador a fim de realizar um dos métodos descritos no presente documento. De modo geral, os métodos são, de preferência, realizados por qualquer aparelho de hardware.

[233] As modalidades descritas acima são meramente ilustrativas para os princípios da presente invenção. Entende-se que modificações e variações das disposições e os detalhes descritos no presente documento se tornarão evidentes para os versados na técnica. Portanto, é previsto que a mesmas sejam limitadas apenas pelo escopo das reivindicações de patente iminente e não pelos detalhes específicos apresentados a título de descrição e explicação das modalidades no presente documento.

[234] 15. Conclusões

[235] A seguir, serão fornecidas algumas conclusões.

[236] As modalidades de acordo com a invenção são baseadas na consideração que, considerando as dependências de sinal entre canais vertical e horizontalmente distribuídos, quatro canais podem ser codificados em conjunto por meio da combinação hierárquica de ferramentas de codificação de estéreo em conjunto. Por exemplo, os pares de canais verticais são combinados com o uso de estéreo de MPS 2-1-2 e/ou unificado com codificação residual de banda limitada ou banda completa. A fim de satisfazer os requisitos perceptivos para desmascaramento binaural, as misturas descendentes de saída são, por exemplo, codificadas em conjunto por meio do uso de previsão complexa no domínio de MDCT, que inclui a possibilidade de codificação de lado intermédio e esquerdo e direito. Se estiverem presentes sinais residuais, os mesmos são horizontalmente combinados com o uso do mesmo método.

[237] Ademais, deveria ser observado que as modalidades de acordo com a invenção superam algumas ou todas as desvantagens da técnica anterior. As modalidades de acordo com a invenção são adaptadas ao contexto de áudio 3D, em que os canais de alto-falante são distribuídos em diversas camadas de altura, resultando pares de canais a horizontais e verticais. Constatou-se que a codificação em conjunto de apenas dois canais conforme definido em USAC não é suficiente para considerar as relações espaciais e perceptivas entre canais. No entanto, esse problema é superado por modalidades de acordo com a invenção.

[238] Ademais, o MPEG surround convencional é aplicado em uma etapa de pré/pós-processamento adicional, de modo que sinais residuais sejam transmitidos individualmente sem a possibilidade de codificação de estéreo em conjunto, por exemplo, para explorar dependências entre sinais residuais de radical esquerdo e direito. Em contrapartida, as modalidades de acordo com a invenção permitem uma codificação/decodificação eficiente fazendo uso de tais dependências.

[239] Para concluir, adicionalmente, as modalidades de acordo com a invenção criam um aparelho, um método ou um programa de computador para codificar e decodificar conforme descrito no presente documento.

[240] Referências

[241] [1] ISO/IEC 23003-3: 2012 - Information Technology - MPEG Audio Technologies, Parte 3: Unified Speech and Audio Coding;

[242] [2] ISO/IEC 23003-1: 2007 - Information Technology - MPEG Audio Technologies, Parte 1: MPEG Surround

Claims

1. Decodificador de áudio (200; 300; 600; 1300; 1600; 2000) para fornecer pelo menos quatro sinais de canal de áudio (220, 222, 224, 226; 320, 322, 324, 326; 620, 622, 624, 626; 1320, 1322, 1324, 1326) na base de uma representação codificada (210; 310, 360; 610, 682; 1310,1312; 1610), caracterizado em que o decodificador de áudio é configurado para fornecer um primeiro sinal residual (232; 332; 684; 1362) e um segundo sinal residual (234; 334; 686; 1364) na base de uma representação codificada em conjunto (210; 310; 682; 1312) do primeiro sinal residual e do segundo sinal residual com o uso de uma decodificação de múltiplos canais (230; 330; 680; 1360) que explora similaridades e/ou dependências entre os sinais residuais; em que o decodificador de áudio é configurado para fornecer um primeiro sinal de canal de áudio (220; 320; 642; 1372) e um segundo sinal de canal de áudio (222; 322; 644; 1374) na base de um primeiro sinal de mistura descendente (212; 312; 632; 1342) e o primeiro sinal residual com o uso de uma decodificação de múltiplos canais assistida por sinal residual (240; 340; 640; 1370); e em que o decodificador de áudio é configurado para fornecer um terceiro sinal de canal de áudio (224; 324; 656; 1382) e um quarto sinal de canal de áudio (226; 326; 658; 1384) na base de um segundo sinal de mistura descendente (214; 314; 634; 1344) e o segundo sinal residual com o uso de uma decodificação de múltiplos canais assistida por sinal residual (250; 350; 650; 1380).

2. Decodificador de áudio, de acordo com a reivindicação 1, em que o decodificador de áudio é caracterizado porser configurado para fornecer o primeiro sinal de mistura descendente (212; 312; 632; 1342) e o segundo sinal de mistura descendente (214; 314; 634; 1344) na base de uma representação codificada em conjunto (360; 610; 1310) do primeiro sinal de mistura descendente e do segundo sinal de mistura descendente com o uso de uma decodificação de múltiplos canais (370; 630; 1340).

3. Decodificador de áudio, de acordo com a reivindicação 1 ou 2, em que o decodificador de áudio é caracterizado porser configurado para fornecer o primeiro sinal residual e o segundo sinal residual na base da representação codificada em conjunto do primeiro sinal residual e do segundo sinal residual com o uso de uma decodificação de múltiplos canais baseada em previsão.

4. Decodificador de áudio, de acordo com qualquer uma das reivindicações 1 a 3, em que o decodificador de áudio é caracterizado porser configurado para fornecer o primeiro sinal residual e o segundo sinal residual na base da representação codificada em conjunto do primeiro sinal residual e do segundo sinal residual com o uso de uma decodificação de múltiplos canais assistida por sinal residual.

5. Decodificador de áudio, de acordo com a reivindicação 3, caracterizado pora decodificação de múltiplos canais baseada em previsão ser configurada para avaliar um parâmetro de previsão que descreve uma contribuição de um componente de sinal, que é derivado usando um componente de sinal de um quadro anterior, para o fornecimento dos sinais residuais do quadro atual.

6. Decodificador de áudio, de acordo com qualquer uma das reivindicações 3 a 5, caracterizado pora decodificação de múltiplos canais baseada em previsão ser configurada para obter o primeiro sinal residual e o segundo sinal residual na base de um sinal de mistura descendente do primeiro sinal residual e do segundo sinal residual e na base de um sinal residual comum do primeiro sinal residual e do segundo sinal residual.

7. Decodificador de áudio, de acordo com a reivindicação 6, caracterizado pora decodificação de múltiplos canais baseada em previsão ser configurada para aplicar o sinal residual comum com um primeiro aviso, para obter o primeiro sinal residual, e para aplicar o sinal residual comum com um segundo aviso, que é oposto ao primeiro aviso, para obter o segundo sinal residual.

8. Decodificador de áudio, de acordo com qualquer uma das reivindicações 1 a 7, em que o decodificador de áudio é caracterizado porser configurado para fornecer o primeiro sinal residual e o segundo sinal residual na base da representação codificada em conjunto do primeiro sinal residual e do segundo sinal residual com o uso de uma decodificação de múltiplos canais que é operativa em um domínio de MDCT.

9. Decodificador de áudio, de acordo com qualquer uma das reivindicações 1 a 8, em que o decodificador de áudio é caracterizado porser configurado para fornecer o primeiro sinal residual e o segundo sinal residual na base da representação codificada em conjunto do primeiro sinal residual e do segundo sinal residual com o uso de uma Previsão de Estéreo Complexo de USAC.

10. Decodificador de áudio, de acordo com qualquer uma das reivindicações 1 a 9, em que o decodificador de áudio é caracterizado porser configurado para fornecer o primeiro sinal de canal de áudio e o segundo sinal de canal de áudio na base do primeiro sinal de mistura descendente e o primeiro sinal residual com o uso de uma decodificação de múltiplos canais assistida por sinal residual baseada em parâmetro, em que o decodificador de áudio é configurado para fornecer o terceiro sinal de canal de áudio e o quarto sinal de canal de áudio na base do segundo sinal de mistura descendente e do segundo sinal residual com o uso de uma decodificação de múltiplos canais assistida por sinal residual baseada em parâmetro.

11. Decodificador de áudio, de acordo com a reivindicação 10, caracterizado pora decodificação de múltiplos canais assistida por sinal residual baseada em parâmetro ser configurada para avaliar um ou mais parâmetros que descrevem uma correlação desejada entre dois canais e/ou diferenças de nível entre dois canais a fim de fornecer os dois ou mais sinais de canal de áudio na base de um respectivo dentre os sinais de mistura descendente e um sinal correspondente dentre os sinais residuais.

12. Decodificador de áudio, de acordo com qualquer uma das reivindicações 1 a 11, em que o decodificador de áudio é caracterizado porser configurado para fornecer o primeiro sinal de canal de áudio e o segundo sinal de canal de áudio na base do primeiro sinal de mistura descendente e do primeiro sinal residual com o uso de uma decodificação de múltiplos canais assistida por sinal residual que é operativa em um domínio de QMF; e em que o decodificador de áudio é configurado para fornecer o terceiro sinal de canal de áudio e o quarto sinal de canal de áudio na base do segundo sinal de mistura descendente e do segundo sinal residual com o uso de uma decodificação de múltiplos canais assistida por sinal residual que é operativa no domínio de QMF.

13. Decodificador de áudio, de acordo com qualquer uma das reivindicações 1 a 12, em que o decodificador de áudio é caracterizado porser configurado para fornecer o primeiro sinal de canal de áudio e o segundo sinal de canal de áudio na base do primeiro sinal de mistura descendente e do primeiro sinal residual com o uso de uma decodificação MPEG Surround 2-1-2 ou uma Decodificação de Estéreo Unificado; e em que o decodificador de áudio é configurado para fornecer o terceiro sinal de canal de áudio e o quarto sinal de canal de áudio na base do segundo sinal de mistura descendente e do segundo sinal residual com o uso de uma decodificação MPEG Surround 2-1-2 ou de uma Decodificação de Estéreo Unificado.

14. Decodificador de áudio, de acordo com qualquer uma das reivindicações 1 a 13, caracterizado poro primeiro sinal residual e o segundo sinal residual serem associados a diferentes posições horizontais de uma cena de áudio ou a diferentes posições azimutais da cena de áudio.

15. Decodificador de áudio, de acordo com qualquer uma das reivindicações 1 a 14, caracterizado poro primeiro sinal de canal de áudio e o segundo sinal de canal de áudio serem associados a posições verticalmente adjacentes de uma cena de áudio, e em que o terceiro sinal de canal de áudio e o quarto sinal de canal de áudio são associados a posições verticalmente adjacentes da cena de áudio.

16. Decodificador de áudio, de acordo com qualquer uma das reivindicações 1 a 15, caracterizado poro primeiro sinal de canal de áudio e o segundo sinal de canal de áudio serem associados a uma primeira posição horizontal ou posição azimutal de uma cena de áudio, e em que o terceiro sinal de canal de áudio e o quarto sinal de canal de áudio são associados a uma segunda posição horizontal ou posição azimutal da cena de áudio, que é diferente da primeira posição horizontal ou da primeira posição azimutal.

17. Decodificador de áudio, de acordo com qualquer uma das reivindicações 1 a 16, caracterizado poro primeiro sinal residual ser associado a um lado esquerdo de uma cena de áudio, e em que o segundo sinal residual é associado a um lado direito de uma cena de áudio.

18. Codificador de áudio, de acordo com a reivindicação 17, caracterizado poro primeiro sinal de canal de áudio e o segundo sinal de canal de áudio serem associados ao lado esquerdo da cena de áudio, e em que o terceiro sinal de canal de áudio e o quarto sinal de canal de áudio são associados ao lado direito da cena de áudio.

19. Decodificador de áudio, de acordo com a reivindicação 18, caracterizado poro primeiro sinal de canal de áudio ser associado a uma posição esquerda inferior da cena de áudio, em que o segundo sinal de canal de áudio é associado a uma posição esquerda superior da cena de áudio, em que o terceiro sinal de canal de áudio é associado a uma posição direita inferior da cena de áudio, e em que o quarto sinal de canal de áudio é associado a uma posição direita superior da cena de áudio.

20. Decodificador de áudio, de acordo com qualquer uma das reivindicações 1 a 19, em que o decodificador de áudio é caracterizado porser configurado para fornecer o primeiro sinal de mistura descendente e o segundo sinal de mistura descendente na base de uma representação codificada em conjunto do primeiro sinal de mistura descendente e do segundo sinal de mistura descendente com o uso de uma decodificação de múltiplos canais, em que o primeiro sinal de mistura descendente é associado a um lado esquerdo de uma cena de áudio e o segundo sinal de mistura descendente é associado a um lado direito da cena de áudio.

21. Decodificador de áudio, de acordo com qualquer uma das reivindicações 1 a 20, em que o decodificador de áudio é caracterizado porser configurado para fornecer o primeiro sinal de mistura descendente e o segundo sinal de mistura descendente na base de uma representação codificada em conjunto do primeiro sinal de mistura descendente e do segundo sinal de mistura descendente com o uso de uma decodificação de múltiplos canais baseada em previsão.

22. Decodificador de áudio, de acordo com qualquer uma das reivindicações 1 a 21, em que o decodificador de áudio é caracterizado porser configurado para fornecer o primeiro sinal de mistura descendente e o segundo sinal de mistura descendente na base de uma representação codificada em conjunto do primeiro sinal de mistura descendente e do segundo sinal de mistura descendente com o uso de uma decodificação de múltiplos canais baseada em previsão assistida por sinal residual.

23. Decodificador de áudio, de acordo com qualquer uma das reivindicações 1 a 22, em que o decodificador de áudio é caracterizado porser configurado para realizar uma primeira extensão de largura de banda de múltiplos canais (660; 1390) na base do primeiro sinal de canal de áudio e do terceiro sinal de canal de áudio, e em que o decodificador de áudio é configurado para realizar uma segunda extensão de largura de banda de múltiplos canais (670; 1394) na base do segundo sinal de canal de áudio e do quarto sinal de canal de áudio.

24. Decodificador de áudio, de acordo com a reivindicação 23, em que o decodificador de áudio é caracterizado porser configurado para realizar a primeira extensão de largura de banda de múltiplos canais a fim de obter dois ou mais sinais de canal de áudio de largura de banda estendida (620, 624;1320, 1324) associados a um primeiro plano horizontal comum ou uma primeira elevação comum de uma cena de áudio na base do primeiro sinal de canal de áudio e do terceiro sinal de canal de áudio e um ou mais parâmetros de extensão de largura de banda (1338), e em que o decodificador de áudio é configurado para realizar a segunda extensão de largura de banda de múltiplos canais a fim de obter dois ou mais sinais de canal de áudio de largura de banda estendida (622, 626, 1322, 1326) associados a um segundo plano horizontal comum ou uma segunda elevação comum da cena de áudio na base do segundo sinal de canal de áudio e do quarto sinal de canal de áudio e um ou mais parâmetros de extensão de largura de banda (1358).

25. Decodificador de áudio, de acordo com qualquer uma das reivindicações 1 a 24, caracterizado pora representação codificada em conjunto do primeiro sinal residual e do segundo sinal residual compreender um elemento de par de canais que compreende um sinal de mistura descendente do primeiro e do segundo sinais residuais e um sinal residual comum do primeiro e do segundo sinais residuais.

26. Decodificador de áudio, de acordo com qualquer uma das reivindicações 1 a 25, em que o decodificador de áudio é caracterizado porser configurado para fornecer o primeiro sinal de mistura descendente e o segundo sinal de mistura descendente na base de uma representação codificada em conjunto do primeiro sinal de mistura descendente e do segundo sinal de mistura descendente com o uso de uma decodificação de múltiplos canais, em que a representação codificada em conjunto do primeiro sinal de mistura descendente e do segundo sinal de mistura descendente compreende um elemento de par de canais que compreende um sinal de mistura descendente do primeiro e do segundo sinais de mistura descendente e um sinal residual comum do primeiro e do segundo sinais de mistura descendente.

27. Codificador de áudio (100; 1100; 1200; 1500; 2100) para fornecer uma representação codificada (130; 1144, 1154; 1220, 1222; 2272, 2282) na base de pelo menos quatro sinais de canal de áudio (110, 112, 114, 116; 1110, 1112, 1114, 1116; 1210, 1212, 1214, 1216; 2216, 2226, 2218, 2228), caracterizado em que o codificador de áudio é configurado para codificar em conjunto pelo menos um primeiro sinal de canal de áudio e um segundo sinal de canal de áudio com o uso de uma codificação de múltiplos canais assistida por sinal residual (140; 1120; 1230; 2230), para obter um primeiro sinal de mistura descendente (120; 1122; 1232; 2234) e um primeiro sinal residual (142; 1124; 1234; 2236); e em que o codificador de áudio é configurado para codificar em conjunto pelo menos um terceiro sinal de canal de áudio e um quarto sinal de canal de áudio com o uso de uma codificação de múltiplos canais assistida por sinal residual (150; 1130; 1240; 2240), para obter um segundo sinal de mistura descendente (122; 1132; 1242; 2244) e um segundo sinal residual (152; 1134; 1244; 2246); e em que o codificador de áudio é configurado para codificar em conjunto o primeiro sinal residual e o segundo sinal residual com o uso de uma codificação de múltiplos canais (160; 1150; 1260; 2260) que explora similaridades e/ou dependências entre os sinais residuais, para obter uma representação codificada em conjunto (130; 1154; 1262; 2264) dos sinais residuais.

28. Codificador de áudio, de acordo com a reivindicação 27, em que o codificador de áudio é caracterizado porser configurado para codificar em conjunto o primeiro sinal de mistura descendente e o segundo sinal de mistura descendente com o uso de uma codificação de múltiplos canais (1140; 1250; 2250), para obter uma representação codificada em conjunto (1144; 1252; 2254) dos sinais de mistura descendente.

29. Codificador de áudio, de acordo com a reivindicação 28, em que o codificador de áudio é caracterizado porser configurado para codificar em conjunto o primeiro sinal residual e o segundo sinal residual com o uso de uma codificação de múltiplos canais baseada em previsão, e em que o codificador de áudio é configurado para codificar em conjunto o primeiro sinal de mistura descendente e o segundo sinal de mistura descendente com o uso de uma codificação de múltiplos canais baseada em previsão.

30. Codificador de áudio, de acordo com qualquer uma das reivindicações 27 a 29, em que o codificador de áudio é caracterizado porser configurado para codificar em conjunto pelo menos o primeiro sinal de canal de áudio e o segundo sinal de canal de áudio com o uso de uma codificação de múltiplos canais assistida por sinal residual baseada em parâmetro, e em que o codificador de áudio é configurado para codificar em conjunto pelo menos o terceiro sinal de canal de áudio e o quarto sinal de canal de áudio com o uso de uma codificação de múltiplos canais assistida por sinal residual baseada em parâmetro.

31. Codificador de áudio, de acordo com qualquer uma das reivindicações 27 a 30, caracterizado poro primeiro sinal de canal de áudio e o segundo sinal de canal de áudio serem associados a posições verticalmente adjacentes de uma cena de áudio, e em que o terceiro sinal de canal de áudio e o quarto sinal de canal de áudio são associados a posições verticalmente adjacentes da cena de áudio.

32. Codificador de áudio, de acordo com qualquer uma das reivindicações 27 a 31, caracterizado poro primeiro sinal de canal de áudio e o segundo sinal de canal de áudio serem associados a uma primeira posição horizontal ou posição azimutal de uma cena de áudio, e em que o terceiro sinal de canal de áudio e o quarto sinal de canal de áudio são associados a uma segunda posição horizontal ou posição azimutal da cena de áudio, que é diferente da primeira posição horizontal ou da posição azimutal.

33. Codificador de áudio, de acordo com qualquer uma das reivindicações 27 a 32, caracterizado poro primeiro sinal residual ser associado a um lado esquerdo de uma cena de áudio, e em que o segundo sinal residual é associado a um lado direito da cena de áudio.

34. Codificador de áudio, de acordo com a reivindicação 33, caracterizado poro primeiro sinal de canal de áudio e o segundo sinal de canal de áudio serem associados ao lado esquerdo da cena de áudio, e em que o terceiro sinal de canal de áudio e o quarto sinal de canal de áudio são associados ao lado direito da cena de áudio.

35. Decodificador de áudio, de acordo com a reivindicação 34, caracterizado poro primeiro sinal de canal de áudio ser associado a uma posição esquerda inferior da cena de áudio, em que o segundo sinal de canal de áudio é associado a uma posição esquerda superior da cena de áudio, em que o terceiro sinal de canal de áudio é associado a uma posição direita inferior da cena de áudio, e em que o quarto sinal de canal de áudio é associado a uma posição direita superior da cena de áudio.

36. Codificador de áudio, de acordo com qualquer uma das reivindicações 27 a 35, em que o codificador de áudio é caracterizado porser configurado para codificar em conjunto o primeiro sinal de mistura descendente e o segundo sinal de mistura descendente com o uso de uma codificação de múltiplos canais, para obter uma representação codificada em conjunto dos sinais de mistura descendente, em que o primeiro sinal de mistura descendente é associado a um lado esquerdo de uma cena de áudio e o segundo sinal de mistura descendente é associado a um lado direito da cena de áudio.

37. Método (800) para fornecer pelo menos quatro sinais de canal de áudio na base de uma representação codificada, em que o método é caracterizado porcompreender: fornecer (810) um primeiro sinal residual e um segundo sinal residual na base de uma representação codificada em conjunto do primeiro sinal residual e do segundo sinal residual com o uso de uma decodificação de múltiplos canais que explora similaridades e/ou dependências entre os sinais residuais; fornecer (820) um primeiro sinal de canal de áudio e um segundo sinal de canal de áudio na base de um primeiro sinal de mistura descendente e do primeiro sinal residual com o uso de uma decodificação de múltiplos canais assistida por sinal residual; e fornecer (830) um terceiro sinal de canal de áudio e um quarto sinal de canal de áudio na base de um segundo sinal de mistura descendente e do segundo sinal residual com o uso de uma decodificação de múltiplos canais assistida por sinal residual.

38. Método (700) para fornecer uma representação codificada na base de pelo menos quatro sinais de canal de áudio, em que o método é caracterizado porcompreender: codificar em conjunto (710) pelo menos um primeiro sinal de canal de áudio e um segundo sinal de canal de áudio com o uso de uma codificação de múltiplos canais assistida por sinal residual, para obter um primeiro sinal de mistura descendente e um primeiro sinal residual, codificar em conjunto (720) pelo menos um terceiro sinal de canal de áudio e um quarto sinal de canal de áudio com o uso de uma codificação de múltiplos canais assistida por sinal residual, para obter um segundo sinal de mistura descendente e um segundo sinal residual, codificar em conjunto (730) o primeiro sinal residual e o segundo sinal residual com o uso de uma codificação de múltiplos canais que explora similaridades e/ou dependências entre os sinais residuais, para obter uma representação codificada dos sinais residuais.

39. Decodificador de áudio (200, 300, 600, 1300, 1600; 2000) para fornecer pelo menos quatro sinais de canal de áudio (220, 222, 224, 226; 320, 322, 324, 326; 620, 622, 624, 626; 1320, 1322, 1324, 1326) na base de uma representação codificada (210; 310, 360; 610, 682; 1310,1312; 1610), caracterizado em que o decodificador de áudio é configurado para fornecer um primeiro sinal residual (232; 332; 684; 1362) e um segundo sinal residual (234; 334; 686; 1364) na base de uma representação codificada em conjunto (210; 310; 682; 1312) do primeiro sinal residual e do segundo sinal residual com uso de uma decodificação de múltiplos canais (230; 330; 680; 1360); o decodificador de áudio é configurado para fornecer um primeiro sinal de canal de áudio (220; 320; 642; 1372) e um segundo sinal de canal de áudio (222; 322; 644; 1374) na base de um primeiro sinal de mistura descendente (212; 312; 632; 1342) e o primeiro sinal residual com uso de uma decodificação de múltiplos canais assistida por sinal residual (240; 340; 640; 1370); e em que o decodificador de áudio é configurado para fornecer um terceiro sinal de canal de áudio (224; 324; 656; 1382) e um quarto sinal de canal de áudio (226; 326; 658; 1384) na base de um segundo sinal de mistura descendente (214; 314; 634; 1344) e o segundo sinal residual com uso de uma decodificação de múltiplos canais assistida por sinal residual (250; 350; 650; 1380); em que o decodificador de áudio é configurado para realizar uma primeira extensão de largura de banda de múltiplos canais (660; 1390) na base do primeiro sinal de canal de áudio e do terceiro sinal de canal de áudio, e em que o decodificador de áudio é configurado para realizar uma segunda extensão de largura de banda de múltiplos canais (670; 1394) na base do segundo sinal de canal de áudio e do quarto sinal de canal de áudio; em que o decodificador de áudio é configurado para realizar a primeira extensão de largura de banda de múltiplos canais a fim de obter dois ou mais sinais de canal de áudio de largura de banda estendida (620, 624;1320, 1324) associados a um primeiro plano horizontal comum ou uma primeira elevação comum de uma cena de áudio na base do primeiro sinal de canal de áudio e do terceiro sinal de canal de áudio e um ou mais parâmetros de extensão de largura de banda (1338), e em que o decodificador de áudio é configurado para realizar a segunda extensão de largura de banda de múltiplos canais a fim de obter dois ou mais sinais de canal de áudio de largura de banda estendida (622, 626: 1322, 1326) associados a um segundo plano horizontal comum ou uma segunda elevação comum da cena de áudio na base do segundo sinal de canal de áudio e do quarto sinal de canal de áudio e um ou mais parâmetros de extensão de largura de banda (1358).

40. Método (800) para fornecer pelo menos quatro sinais de canal de áudio na base de uma representação codificada, em que o método é caracterizado por: fornecer (810) um primeiro sinal residual e um segundo sinal residual na base de uma representação codificada em conjunto do primeiro sinal residual e o segundo sinal residual com uso de uma decodificação de múltiplos canais; fornecer (820) um primeiro sinal de canal de áudio e um segundo sinal de canal de áudio na base de um primeiro sinal de mistura descendente e o primeiro sinal residual com uso de uma decodificação de múltiplos canais assistida por sinal residual; e fornecer (830) um terceiro sinal de canal de áudio e um quarto sinal de canal de áudio na base de um segundo sinal de mistura descendente e o segundo sinal residual com uso de uma decodificação de múltiplos canais assistida por sinal residual; em que o método compreende realizar uma primeira extensão de largura de banda de múltiplos canais (660; 1390) na base do primeiro sinal de canal de áudio e do terceiro sinal de canal de áudio, e em que o método compreende realizar uma segunda extensão de largura de banda de múltiplos canais (670; 1394) na base do segundo sinal de canal de áudio e do quarto sinal de canal de áudio; em que a primeira extensão de largura de banda de múltiplos canais é realizada a fim de obter dois ou mais sinais de canal de áudio de largura de banda estendida (620, 624;1320, 1324) associados a um primeiro plano horizontal comum ou uma primeira elevação comum de uma cena de áudio na base do primeiro sinal de canal de áudio e do terceiro sinal de canal de áudio e um ou mais parâmetros de extensão de largura de banda (1338), e em que a segunda extensão de largura de banda de múltiplos canais é realizada a fim de obter dois ou mais sinais de canal de áudio de largura de banda estendida (622, 626: 1322, 1326) associados a um segundo plano horizontal comum ou uma segunda elevação comum da cena de áudio na base do segundo sinal de canal de áudio e do quarto sinal de canal de áudio e um ou mais parâmetros de extensão de largura de banda (1358).