BR122020017854B1 - Decodificador e codificador de áudio para alinhamento no tempo de dados de processamento baseados em qmf - Google Patents

Decodificador e codificador de áudio para alinhamento no tempo de dados de processamento baseados em qmf Download PDF

Info

Publication number
BR122020017854B1
BR122020017854B1 BR122020017854-0A BR122020017854A BR122020017854B1 BR 122020017854 B1 BR122020017854 B1 BR 122020017854B1 BR 122020017854 A BR122020017854 A BR 122020017854A BR 122020017854 B1 BR122020017854 B1 BR 122020017854B1
Authority
BR
Brazil
Prior art keywords
metadata
waveform
unit
delay
audio
Prior art date
Application number
BR122020017854-0A
Other languages
English (en)
Inventor
Kristofer Kjoerling
Heiko Purnhagen
Jens Popp
Original Assignee
Dolby International Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International Ab filed Critical Dolby International Ab
Priority claimed from PCT/EP2014/069039 external-priority patent/WO2015036348A1/en
Priority claimed from BR112016005167-0A external-priority patent/BR112016005167B1/pt
Publication of BR122020017854B1 publication Critical patent/BR122020017854B1/pt

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

a presente invenção refere-se ao alinhamento no tempo de dados codificados de um codificador de áudio com metadados associados, tais como metadados de replicação de banda espectral (sbr). um decodificador de áudio (100, 300) configurado para determinar um quadro reconstruído de um sinal de áudio (237) a partir de uma unidade de acesso (110) de um fluxo de dados recebido é descrito. a unidade de acesso (110) compreende dados de forma de onda (111) e metadados (112), em que os dados de forma de onda (111) e os metadados (112) são associados ao mesmo quadro reconstruído do sinal de áudio (127). o decodificador de áudio (100, 300) compreende um caminho de processamento de forma de onda (101, 102, 103, 104, 105) configurado para gerar uma pluralidade de sinais de sub-banda de forma de onda (123) a partir dos dados de forma de onda (111), e um caminho de processamento de metadados (108, 109) configurado para gerar metadados (128) decodificados a partir dos metadados (111).

Description

REFERÊNCIA CRUZADA A PEDIDOS RELACIONADOS
[001] Este pedido reivindica o benefício de prioridade do Pedido de Patente Provisório No U.S. 61/877.194 depositado em 12 de setembro de 2013 e do Pedido de Patente Provisório No U.S. 61/909.593 depositado em 27 de novembro de 2013, em que cada um dos quais é incorporado ao presente documento a título de referência em sua integridade.
CAMPO DA TÉCNICA DA INVENÇÃO
[002] A presente invenção refere-se ao alinhamento no tempo de dados codificados de um codificador de áudio com metadados associados, tal como replicação de banda espectral (SBR), em particular a metadados de Codificação de Áudio Avançada (AAC) de Alta Eficiência (HE).
ANTECEDENTES DA INVENÇÃO
[003] Um problema técnico no contexto da codificação de áudio é fornecer sistemas de codificação e decodificação de áudio que exibem um baixo atraso, por exemplo, de modo a permitir aplicações em tempo real tais como difusão ao vivo. Ademais, é desejado fornecer sistemas de codificação e decodificação de áudio que trocam fluxos de bits codificados que podem ser unidos com outros fluxos de bits. Adicionalmente, sistemas de codificação e decodificação de áudio computacionalmente eficientes devem ser fornecidos para permitir uma implantação rentável dos sistemas. O presente documento se volta ao problema técnico de fornecer fluxos de bits codificados que podem ser unidos de maneira eficiente, enquanto ao mesmo tempo latência de manutenção em um nível apropriado para difusão ao vivo. O presente documento descreve um sistema de codificação e decodificação de áudio que permite a união de fluxos de bits em atrasos de codificação razoáveis, permitindo assim aplicações tais como difusão ao vivo, em que um fluxo de dados difundido pode ser gerado a partir de uma pluralidade de fluxos de bits de fonte.
SUMÁRIO DA INVENÇÃO
[004] De acordo com um aspecto, um decodificador de áudio configurado para determinar um quadro reconstruído de um sinal de áudio a partir de uma unidade de acesso de um fluxo de dados recebido é descrito. Tipicamente, o fluxo de dados compreende uma sequência de unidade de acesso para determinar uma respectiva sequência de quadros reconstruídos do sinal de áudio. Um quadro do sinal de áudio compreende tipicamente um número N predeterminado de amostras de domínio de tempo do sinal de áudio (com N sendo maior do que um). Sendo assim, a sequência de unidades de acesso pode descrever a sequência de quadros do sinal de áudio, respectivamente.
[005] A unidade de acesso compreende dados e metadados de forma de onda, em que os dados de forma de onda e os metadados são associados ao mesmo quadro reconstruído do sinal de áudio. Em outras palavras, os dados de forma de onda e os metadados para determinar o quadro reconstruído do sinal de áudio são compreendidos dentro da mesma unidade de acesso. As unidades de acesso da sequência de unidades de acesso podem compreender, cada uma, os dados de forma de onda e os metadados para gerar um respectivo quadro reconstruído da sequência de quadros reconstruídos do sinal de áudio. Em particular, a unidade de acesso de um quadro particular pode compreender (por exemplo, todos) os dados necessários para determinar o quadro reconstruído para o quadro particular.
[006] Em um exemplo, a unidade de acesso de um quadro particular pode compreender (por exemplo, todos) os dados necessários para realizar um esquema de reconstrução de alta frequência (HFR) para gerar um sinal de alta banda do quadro particular com base em um sinal de baixa banda do quadro particular (compreendido dentro dos dados de forma de onda da unidade de acesso) e com base nos metadados decodificados.
[007] Alternativa ou adicionalmente, a unidade de acesso de um quadro particular pode compreender (por exemplo, todos) os dados necessários para realizar uma expansão da faixa dinâmica de um quadro particular. Em particular, uma expansão ou uma expansão do sinal de baixa banda do quadro particular pode ser realizada com base nos metadados decodificados. Para esse propósito, os metadados decodificados podem compreender um ou mais parâmetros de expansão. Os um ou mais parâmetros de expansão podem ser indicativos de um ou mais dentre: se a compressão/expansão deve ser aplicada ou não ao quadro particular; se a compressão/expansão deve ser aplicada de maneira homogênea para todos os canais de um sinal de áudio de múltiplos canais (isto é, se o(s) mesmo(s) ganho(s) de expansão deve(m) ser aplicado(s) para todos os canais de um sinal de áudio de múltiplos canais ou se diferente(s) ganho(s) de expansão deve(m) ser aplicado(s) para os diferentes canais do sinal de áudio de múltiplos canais); e/ou uma resolução temporal de uma expansão ganho.
[008] A provisão de uma sequência de unidades de acesso em que unidades de acesso, cada uma, compreendem os dados necessários para gerar um quadro reconstruído correspondente do sinal de áudio, independente de uma unidade de acesso precedente ou uma sucessora, é benéfica para unir aplicações, visto que isso permite que o fluxo de dados seja unido entre duas unidades de acesso adjacentes, sem afetar a qualidade de percepção de um quadro reconstruído do sinal de áudio no (por exemplo, diretamente subsequente ao) ponto de união.
[009] Em um exemplo, o quadro reconstruído do sinal de áudio compreende um sinal de baixa banda e um sinal de alta banda, em que os dados de forma de onda são indicativos do sinal de baixa banda e em que os metadados são indicativos de um envelope espectral do sinal de alta banda. O sinal de baixa banda pode corresponder a um componente do sinal de áudio que cobre uma faixa de frequência relativamente baixa (por exemplo, compreendendo frequências menores do que uma frequência de cruzamento predeterminada). O sinal de alta banda pode corresponder a um componente do sinal de áudio que cobre uma faixa de frequência relativamente alta (por exemplo, compreendem frequências maiores do que a frequência de cruzamento predeterminada). O sinal de baixa banda e o sinal de alta banda pode ser complementar em relação à faixa de frequência coberta pelo sinal de baixa banda e pelo sinal de alta banda. O decodificador de áudio pode ser configurado para realizar reconstrução de alta frequência (HFR) tal como replicação de banda espectral (SBR) do sinal de alta banda com o uso dos metadados e dos dados de forma de onda. Sendo assim, os metadados podem compreender metadados de HFR ou SBR indicativos do envelope espectral do sinal de alta banda.
[0010] O decodificador de áudio pode compreender um caminho de processamento de forma de onda configurado para gerar uma pluralidade de sinais de sub-banda de forma de onda a partir dos dados de forma de onda. A pluralidade de sinais de sub-banda de forma de onda pode corresponder a uma representação de um sinal de forma de onda de domínio de tempo em um domínio de sub-banda (por exemplo, em um domínio de QMF). O sinal de forma de onda de domínio de tempo pode corresponder ao sinal de baixa banda mencionado acima, e a pluralidade de sinais de sub-banda de forma de onda pode corresponder a uma pluralidade de sinais de baixa banda de sub-banda. Ademais, o decodificador de áudio pode compreender um caminho de processamento de metadados configurado para gerar metadados decodificados a partir dos metadados.
[0011] Adicionalmente, o decodificador de áudio pode compreender uma unidade de aplicação e síntese de metadados configurada para gerar o quadro reconstruído do sinal de áudio a partir da pluralidade de sinais de sub-banda de forma de onda e a partir dos metadados decodificados. Em particular, a unidade de aplicação e síntese de metadados pode ser configurada para realizar um esquema de HFR e/ou SBR para gerar uma pluralidade de sinais de sub-banda de alta banda (por exemplo, escalonados) a partir da pluralidade de sinais de sub-banda de forma de onda (isto é, nesse caso, a partir da pluralidade de sinais de baixa banda de sub-banda) e a partir dos metadados decodificados. O quadro reconstruído do sinal de áudio pode ser então determinado com base na pluralidade de sinais de subbanda de alta banda (por exemplo, escalonados) e com base na pluralidade de sinais de baixa banda.
[0012] Alternativa ou adicionalmente, o decodificador de áudio pode compreender uma unidade de expansão configurada para realizar uma expansão de ou configurada para expandir a pluralidade de sinais de sub-banda de forma de onda com o uso de pelo menos alguns dos metadados decodificados, em particular, com o uso dos um ou mais parâmetros de expansão compreendidos dentro dos metadados decodificados. Para esse propósito, a unidade de expansão pode ser configurada para aplicar um ou mais ganhos de expansão à pluralidade de sinais de sub-banda de forma de onda. A unidade de expansão pode ser configurada para determinar os um ou mais ganhos de expansão com base na pluralidade de sinais de subbanda de forma de onda, com base em uma ou mais regras de compressão/expansão predeterminadas ou funções e/ou com base nos um ou mais parâmetros de expansão.
[0013] O caminho de processamento de forma de onda e/ou o caminho de processamento de metadados pode compreender pelo menos uma unidade de atraso configurada para alinhar no tempo a pluralidade de sinais de sub-banda de forma de onda e os metadados decodificados. Em particular, a pelo menos uma unidade de atraso pode ser configurada para alinhar a pluralidade de sinais de sub-banda de forma de onda e os metadados decodificados, e/ou para inserir pelo menos um atraso no caminho de processamento de forma de onda e/ou no caminho de processamento de metadados, de modo que um atraso geral do caminho de processamento de forma de onda corresponda a um atraso geral de caminho de processamento de metadados. Alternativa ou adicionalmente, a pelo menos uma unidade de atraso pode ser configurada para alinhar no tempo a pluralidade de sinais de sub-banda de forma de onda e os metadados decodificados de modo que a pluralidade de sinais de sub-banda de forma de onda e os metadados decodificados sejam fornecidos à unidade de aplicação e síntese de metadados no momento exato para o processamento realizado pela unidade de aplicação e síntese de metadados. Em particular, a pluralidade de sinais de sub-banda de forma de onda e os metadados decodificados podem ser fornecidos à unidade de aplicação e síntese de metadados de modo que a unidade de aplicação e síntese de metadados não precise armazenar temporariamente a pluralidade de sinais de sub-banda de forma de onda e/ou os metadados decodificados antes de realizar processamento (por exemplo, processamento HFR ou SBR) na pluralidade de sinais de sub-banda de forma de onda e/ou nos metadados decodificados.
[0014] Em outras palavras, o decodificador de áudio pode ser configurado para atrasar o fornecimento dos metadados decodificados e/ou da pluralidade de sinais de sub-banda de forma de onda à unidade de aplicação e síntese de metadados, que pode ser configurada para realizar um esquema HFR, de modo que os metadados decodificados e/ou a pluralidade de sinais de sub-banda de forma de onda sejam fornecidos conforme necessário para processamento. O atraso inserido pode ser selecionado para reduzir (por exemplo, para minimizar) o atraso geral do codec de áudio (que compreende o decodificador de áudio e um codificador de áudio correspondente), enquanto, ao mesmo tempo, permite a união de um fluxo de bits que compreende a sequência de unidades de acesso. Sendo assim, o decodificador de áudio pode ser configurado para gerenciar unidades de acesso alinhadas no tempo, que compreendem os dados de forma de onda e os metadados para determinar um quadro particular reconstruído do sinal de áudio, com impacto mínimo no atraso geral do codec de áudio. Ademais, o decodificador de áudio pode ser configurado para gerenciar unidades de acesso alinhadas no tempo sem a necessidade de metadados de amostragem. Ao fazer isso, o decodificador de áudio é configurado para determinar um quadro particular reconstruído do sinal de áudio de maneira computacionalmente eficiente e sem deteriorar a qualidade de áudio. Portanto, o decodificador de áudio pode ser configurado para permitir a união de aplicações de maneira computacionalmente eficiente, enquanto mantém alta qualidade de áudio e baixo atraso geral.
[0015] Ademais, o uso de pelo menos uma unidade de atraso configurada para alinhar no tempo a pluralidade de sinais de subbanda de forma de onda e os metadados decodificados pode garantir um alinhamento preciso e consistente da pluralidade de sinais de subbanda de forma de onda e dos metadados decodificados no domínio de sub-banda (em que o processamento da pluralidade de sinais de sub-banda de forma de onda e dos metadados decodificados é tipicamente realizado).
[0016] O caminho de processamento de metadados pode compreender uma unidade de atraso de metadados configurada para atrasar os metadados decodificados por um múltiplo de número inteiro maior do que zero do comprimento de quadro N do quadro reconstruído do sinal de áudio. O atraso adicional que é introduzido pela unidade de atraso de metadados pode ser denominado como o atraso de metadados. O comprimento de quadro N pode corresponder ao número N de amostras de domínio de tempo compreendidas dentro do quadro reconstruído do sinal de áudio. O múltiplo de número inteiro pode se dar de modo que o atraso introduzido pela unidade de atraso de metadados seja maior do que um atraso introduzido pelo processamento do caminho de processamento de forma de onda (por exemplo, sem considerar um atraso de forma de onda adicional introduzido no caminho de processamento de forma de onda). O atraso de metadados pode depender do comprimento de quadro N do quadro reconstruído do sinal de áudio. Isso pode se dar devido ao fato de que o atraso causado pelo processamento dentro do caminho de processamento de forma de onda depende do comprimento de quadro N. Em particular, o múltiplo de número inteiro pode ser um para comprimentos de quadro N maior do que 960 e/ou o múltiplo de número inteiro pode ser dois para comprimentos de quadro N menor ou igual a 960.
[0017] Conforme indicado acima, a unidade de aplicação e síntese de metadados pode ser configurada para processar os metadados decodificados e a pluralidade de sinais de sub-banda de forma de onda no domínio de sub-banda (por exemplo, no domínio de QMF). Ademais, os metadados decodificados podem ser indicativos de metadados (por exemplo, indicativos de coeficientes espectrais que descrevem o envelope espectral do sinal de alta banda) no domínio de sub-banda. Adicionalmente, a unidade de atraso de metadados pode ser configurada para atrasar os metadados decodificados. O uso de atrasos de metadados que são múltiplos de número inteiro maiores do que zero do comprimento de quadro N pode ser benéfico, à medida que isso garante um alinhamento consistente da pluralidade de sinais de sub-banda de forma de onda e dos metadados decodificados no domínio de sub-banda (por exemplo, para processamento dentro da unidade de aplicação e síntese de metadados). Em particular, isso garante que os metadados decodificados possam ser aplicados ao quadro correto do sinal de forma de onda (isto é, ao quadro correto da pluralidade de sinais de sub-banda de forma de onda), sem a necessidade de reamostrar os metadados.
[0018] O caminho de processamento de forma de onda pode compreender uma unidade de atraso de forma de onda configurada para atrasar a pluralidade de sinais de sub-banda de forma de onda de modo que um atraso geral do caminho de processamento de forma de onda corresponda a um múltiplo de número inteiro maior do que zero do comprimento de quadro N do quadro reconstruído do sinal de áudio. O atraso adicional que é introduzido pela unidade de atraso de forma de onda pode ser denominado como o atraso de forma de onda. O múltiplo de número inteiro do caminho de processamento de forma de onda pode corresponder ao múltiplo de número inteiro do caminho de processamento de metadados.
[0019] A unidade de atraso de forma de onda e/ou a unidade de atraso de metadados pode ser implantada como armazenamentos temporários que são configurados para armazenar a pluralidade de sinais de sub-banda de forma de onda e/ou os metadados decodificados por uma quantidade de tempo correspondente ao atraso de forma de onda e/ou por uma quantidade de tempo correspondente ao atraso de metadados. A unidade de atraso de forma de onda pode ser colocada em qualquer posição dentro do caminho de processamento de forma de onda a montante da unidade de aplicação e síntese de metadados. Sendo assim, a unidade de atraso de forma de onda pode ser configurada para atrasar os dados de forma de onda e/ou a pluralidade de sinais de sub-banda de forma de onda (e/ou quaisquer dados ou sinais intermediários dentro do caminho de processamento de forma de onda). Em um exemplo, a unidade de atraso de forma de onda pode ser distribuída ao longo do caminho de processamento de forma de onda, em que as unidades de atraso distribuídas fornecem, cada uma, uma fração do atraso de forma de onda total. A distribuição da unidade de atraso de forma de onda pode ser benéfica para uma implantação rentável da unidade de atraso de forma de onda. De maneira similar à unidade de atraso de forma de onda, a unidade de atraso de metadados pode ser colocada em qualquer posição dentro do caminho de processamento de metadados a montante da unidade de aplicação e síntese de metadados. Ademais, a unidade de atraso de forma de onda pode ser distribuída ao longo do caminho de processamento de metadados.
[0020] O caminho de processamento de forma de onda pode compreender uma unidade de decodificação e desquantização configurada para decodificar e desquantizar os dados de forma de onda para fornecer uma pluralidade de coeficientes de frequência indicativos do sinal de forma de onda. Sendo assim, os dados de forma de onda podem compreender ou podem ser indicativos da pluralidade de coeficientes de frequência, o que permite a geração do sinal de forma de onda do quadro reconstruído do sinal de áudio. Ademais, o caminho de processamento de forma de onda pode compreender uma unidade de síntese de forma de onda configurada para gerar o sinal de forma de onda a partir da pluralidade de coeficientes de frequência. A unidade de síntese de forma de onda pode ser configurada para realizar uma transformada de domínio de frequência para domínio de tempo. Em particular, a unidade de síntese de forma de onda pode ser configurada para realizar uma transformada modificada discreta de cosseno inversa (MDCT). A unidade de síntese de forma de onda ou o processamento da unidade de síntese de forma de onda podem apresentar um atraso que depende do comprimento de quadro N do quadro reconstruído do sinal de áudio. Em particular, o atraso introduzido pela unidade de síntese de forma de onda pode corresponder à metade do comprimento de quadro N.
[0021] Subsequente à reconstrução do sinal de forma de onda a partir dos dados de forma de onda, o sinal de forma de onda pode ser processado em conjunto com os metadados decodificados. Em um exemplo, o sinal de forma de onda pode ser usado no contexto de um esquema de HFR ou SBR para determinar o sinal de alta banda, com o uso dos metadados decodificados. Para esse propósito, o caminho de processamento de forma de onda pode compreender uma unidade de análise configurada para gerar a pluralidade de sinais de sub-banda de forma de onda a partir do sinal de forma de onda. A unidade de análise pode ser configurada para realizar uma transformada de domínio de tempo para domínio de sub-banda, por exemplo, aplicando-se um banco de filtro em espelho de quadratura (QMF). Tipicamente, uma resolução de frequência da transformada realizada pela unidade de síntese de forma de onda é maior (por exemplo, por um fator de pelo menos 5 ou 10) do que uma resolução de frequência da transformada realizada pela unidade de análise. Isso pode ser indicado pelos termos "domínio de frequência"e "domínio de subbanda", em que o domínio de frequência pode ser associado a uma resolução de frequência maior do que o domínio de sub-banda. A unidade de análise pode introduzir um atraso fixado que é independente do comprimento de quadro N do quadro reconstruído do sinal de áudio. O atraso fixado que é introduzido pela unidade de análise pode ser dependente do comprimento dos filtros de um banco de filtro usado pela unidade de análise. A título de exemplo, o atraso fixado que é introduzido pela unidade de análise pode corresponder a 320 amostras do sinal de áudio.
[0022] O atraso geral do caminho de processamento de forma de onda pode depender adicionalmente de um lookahead predeterminado entre metadados e dados de forma de onda. Tal lookahead pode ser benéfico para aumentar a continuidade entre quadros reconstruídos adjacentes do sinal de áudio. O lookahead predeterminado e/ou o atraso de lookahead associado pode corresponder a 192 ou 384 amostras da amostra de áudio. O atraso de lookahead pode ser um lookahead no contexto da determinação de metadados de HFR ou SBR indicativos do envelope espectral do sinal de alta banda. Em particular, o lookahead pode permitir que um codificador de áudio correspondente determine os metadados de HFR ou SBR do quadro particular do sinal de áudio, com base em um número predeterminado de amostras a partir de um quadro diretamente sucessor do sinal de áudio. Isso pode ser benéfico em casos em que o quadro particular compreende um transiente acústico. O atraso de lookahead pode ser aplicado por uma unidade de atraso de lookahead compreendida dentro do caminho de processamento de forma de onda.
[0023] Sendo assim, o atraso geral do caminho de processamento de forma de onda, isto é, o atraso de forma de onda pode ser dependente do processamento diferente que é realizado dentro do caminho de processamento de forma de onda. Ademais, o atraso de forma de onda pode ser dependente do atraso de metadados, que é introduzido no caminho de processamento de metadados. O atraso de forma de onda pode corresponder a um múltiplo arbitrário de uma amostra do sinal de áudio. Por essa razão, pode ser benéfico fazer uso de uma unidade de atraso de forma de onda que é configurada para atrasar o sinal de forma de onda, em que o sinal de forma de onda é representado no domínio de tempo. Em outras palavras, pode ser benéfico aplicar o atraso de forma de onda no sinal de forma de onda. Ao fazer isso, uma aplicação precisa e consistente de um atraso de forma de onda, que corresponde a um múltiplo arbitrário de uma amostra do sinal de áudio, pode ser garantida.
[0024] Um decodificador exemplificador pode compreender uma unidade de atraso de metadados, que é configurada para aplicar o atraso de metadados nos metadados, em que os metadados podem ser representados no domínio de sub-banda, e uma unidade de atraso de forma de onda, que é configurada para aplicar o atraso de forma de onda no sinal de forma de onda que é representado no domínio de tempo. A unidade de atraso de metadados pode aplicar um atraso de metadados que corresponde a um múltiplo de número inteiro do comprimento de quadro N, e a unidade de atraso de forma de onda pode aplicar um atraso de forma de onda que corresponde a um múltiplo de número inteiro de uma amostra do sinal de áudio. Como consequência, um alinhamento preciso e consistente da pluralidade de sinais de sub-banda de forma de onda e dos metadados decodificados para processamento dentro da unidade de aplicação e síntese de metadados pode ser garantido. O processamento da pluralidade de sinais de sub-banda de forma de onda e dos metadados decodificados pode ocorrer no domínio de sub-banda. O alinhamento da pluralidade de sinais de sub-banda de forma de onda e dos metadados decodificados pode ser alcançado sem reamostragem dos metadados decodificados, fornecendo assim meio computacionalmente eficiente e com preservação de qualidade para alinhamento.
[0025] Conforme destacado acima, o decodificador de áudio pode ser configurado para realizar um esquema de HFR ou SBR. A unidade de aplicação e síntese de metadados pode compreender uma unidade de aplicação de metadados que é configurada para realizar reconstrução de alta frequência (tal como SBR) com o uso da pluralidade de sinais de baixa banda de sub-banda e com o uso dos metadados decodificados. Em particular, a unidade de aplicação de metadados pode ser configurada para transpor um ou mais dentre a pluralidade de sinais de baixa banda de sub-banda para gerar uma pluralidade de sinais de sub-banda de alta banda. Ademais, a unidade de aplicação de metadados pode ser configurada para aplicar os metadados decodificados à pluralidade de sinais de sub-banda de alta banda para fornecer uma pluralidade de sinais de sub-banda de alta banda escalonados. A pluralidade de sinais de sub-banda de alta banda escalonados pode ser indicativa do sinal de alta banda do quadro reconstruído do sinal de áudio. Para gerar o quadro reconstruído do sinal de áudio, a unidade de aplicação e síntese de metadados pode compreender adicionalmente uma unidade de síntese configurada para gerar o quadro reconstruído do sinal de áudio a partir da pluralidade de sinais de baixa banda de sub-banda e a partir da pluralidade de sinais de sub-banda de alta banda escalonados. A unidade de síntese pode ser configurada para realizar uma transformada inversa em relação à transformada realizada pela unidade de análise, por exemplo, aplicando-se um banco de QMF inverso. O número de filtros compreendidos dentro do banco de filtro da unidade de síntese pode ser maior do que o número de filtros compreendidos dentro do banco de filtro da unidade de análise (por exemplo, de modo a considerar a faixa de frequência estendida devido à pluralidade de sinais de sub-banda de alta banda escalonados).
[0026] Conforme indicado acima, o decodificador de áudio pode compreender uma unidade de expansão. A unidade de expansão pode ser configurada para modificar (por exemplo, aumentar) a faixa dinâmica da pluralidade de sinais de sub-banda de forma de onda. A unidade de expansão pode ser posicionada a montante da unidade de aplicação e síntese de metadados. Em particular, a pluralidade de sinais de sub-banda de forma de onda expandidos pode ser usada para realizar o esquema de HFR ou SBR. Em outras palavras, a pluralidade de sinais de baixa banda de sub-banda usados para realizar o esquema de HFR ou SBR pode corresponder à pluralidade de sinais de sub-banda de forma de onda expandidos na saída da unidade de expansão.
[0027] A unidade de expansão é preferencialmente posicionada a jusante da unidade de atraso de lookahead. Em particular, a unidade de expansão pode ser posicionada entre a unidade de atraso de lookahead e a unidade de aplicação e síntese de metadados. Posicionando-se a unidade de expansão a jusante da unidade de atraso de lookahead, isto é, aplicando-se o atraso de lookahead aos dados de forma de onda antes de expandir a pluralidade de sinais de sub-banda de forma de onda, é garantido que os um ou mais parâmetros de expansão compreendidos dentro dos metadados sejam aplicados aos dados de forma de onda corretos. Em outras palavras, realizar a expansão nos dados de forma de onda que já foram atrasados pelo atraso de lookahead garante que os um ou mais parâmetros de expansão dos metadados estão em sincronia com os dados de forma de onda.
[0028] Sendo assim, os metadados decodificados podem compreender um ou mais parâmetros de expansão, e o decodificador de áudio pode compreender uma unidade de expansão configurada para gerar uma pluralidade de sinais de sub-banda de forma de onda expandidos com base na pluralidade de sinais de sub-banda de forma de onda, com o uso dos um ou mais parâmetros de expansão. Em particular, a unidade de expansão pode ser configurada para gerar a pluralidade de sinais de sub-banda de forma de onda expandidos com o uso de um inverso de uma função de compressão predeterminada. Os um ou mais parâmetros de expansão são indicativos do inverso da função de compressão predeterminada. O quadro reconstruído do sinal de áudio pode ser determinado a partir da pluralidade de sinais de sub-banda de forma de onda expandidos.
[0029] Conforme indicado acima, o decodificador de áudio pode compreender uma unidade de atraso de lookahead configurada para atrasar a pluralidade de sinais de sub-banda de forma de onda de acordo com o lookahead predeterminado, para render uma pluralidade de sinais de sub-banda de forma de onda atrasados. A unidade de expansão pode ser configurada para gerar a pluralidade de sinais de sub-banda de forma de onda expandidos expandindo-se a pluralidade de sinais de sub-banda de forma de onda atrasados. Em outras palavras, a unidade de expansão pode ser posicionada a jusante da unidade de atraso de lookahead. Isso garante sincronia entre os um ou mais parâmetros de expansão e a pluralidade de sinais de sub-banda de forma de onda, aos quais os um ou mais parâmetros de expansão são aplicáveis.
[0030] A unidade de aplicação e síntese de metadados pode ser configurada para gerar o quadro reconstruído do sinal de áudio com o uso dos metadados decodificados (de modo notório, com o uso dos metadados relacionados a SBR/HFR) para uma porção temporal da pluralidade de sinais de sub-banda de forma de onda. A porção temporal pode corresponder a um número de intervalos de tempo da pluralidade de sinais de sub-banda de forma de onda. A duração temporal da porção temporal pode ser variável, isto é, a duração temporal da porção temporal da pluralidade de sinais de sub-banda de forma de onda aos quais os metadados decodificados são aplicados pode variar de um quadro ao próximo. Em ainda outras palavras, o enquadramento para os metadados decodificados pode variar. A variação da duração temporal de uma porção temporal pode ser limitada às ligações predeterminadas. As ligações predeterminadas podem corresponder ao comprimento de quadro menos o atraso de lookahead e ao comprimento de quadro mais o atraso de lookahead, respectivamente. A aplicação dos dados de forma de onda decodificados (ou partes dos mesmos) para porções temporais de diferentes comprimentos temporais pode ser benéfica para gerenciar sinais de áudio transientes.
[0031] A unidade de expansão pode ser configurada para gerar a pluralidade de sinais de sub-banda de forma de onda expandidos com o uso dos um ou mais parâmetros de expansão para a mesma porção temporal da pluralidade de sinais de sub-banda de forma de onda. Em outras palavras, o enquadramento dos um ou mais parâmetros de expansão pode ser igual ao enquadramento para os metadados decodificados que é usado pela unidade de aplicação e síntese de metadados (por exemplo, o enquadramento para os metadados de SBR/HFR). Ao fazer isso, a consistência do esquema de SBR e do esquema de compansão pode ser garantida e a qualidade de percepção do sistema de codificação pode ser aprimorada.
[0032] De acordo com um aspecto adicional, um codificador de áudio configurado para codificar um quadro de um sinal de áudio em uma unidade de acesso de um fluxo de dados é descrito. O codificador de áudio pode ser configurado para realizar tarefas de processamento correspondente em relação às tarefas de processamento realizadas pelo decodificador de áudio. Em particular, o codificador de áudio pode ser configurado para determinar dados e metadados de forma de onda a partir do quadro do sinal de áudio e para inserir os dados de forma de onda e os metadados em uma unidade de acesso. Os dados de forma de onda e os metadados podem ser indicativos de um quadro reconstruído do quadro do sinal de áudio. Em outras palavras, os dados de forma de onda e os metadados podem permitir que o decodificador de áudio correspondente determine uma versão reconstruída do quadro original do sinal de áudio. O quadro do sinal de áudio pode compreender um sinal de baixa banda e um sinal de alta banda. Os dados de forma de onda podem ser indicativos do sinal de baixa banda e os metadados podem ser indicativos de um envelope espectral do sinal de alta banda.
[0033] O codificador de áudio pode compreender um caminho de processamento de forma de onda configurado para gerar os dados de forma de onda a partir do quadro do sinal de áudio, por exemplo, a partir do sinal de baixa banda (por exemplo, com o uso de um decodificador de núcleo de áudio tal como um Codificador de Áudio Avançado, AAC). Ademais, o codificador de áudio compreende um caminho de processamento de metadados configurados para gerar os metadados a partir do quadro do sinal de áudio, por exemplo, a partir do sinal de alta banda e a partir do sinal de baixa banda. A título de exemplo, o codificador de áudio pode ser configurado para realizar AAC de Alta Eficiência (HE), e o decodificador de áudio correspondente pode ser configurado para decodificar o fluxo de dados recebido de acordo com AAC de HE.
[0034] O caminho de processamento de forma de onda e/ou o caminho de processamento de metadados podem compreender pelo menos uma unidade de atraso configurada para alinhar no tempo os dados de forma de onda e os metadados de modo que a unidade de acesso para o quadro do sinal de áudio compreenda os dados de forma de onda e os metadados para o mesmo quadro do sinal de áudio. A pelo menos uma unidade de atraso pode ser configurada para alinhar no tempo os dados de forma de onda e os metadados de modo que um atraso geral do caminho de processamento de forma de onda corresponda a um atraso geral de caminho de processamento de metadados. Em particular, a pelo menos uma unidade de atraso pode ser uma unidade de atraso de forma de onda configurada para inserir um atraso adicional no caminho de processamento de forma de onda, de modo que o atraso geral do caminho de processamento de forma de onda corresponda ao atraso geral do caminho de processamento de metadados. Alternativa ou adicionalmente, a pelo menos uma unidade de atraso pode ser configurada para alinhar no tempo os dados de forma de onda e os metadados de modo que os dados de forma de onda e os metadados sejam fornecidos a uma unidade de geração de unidade de acesso do codificador de áudio no momento exato para gerar uma única unidade de acesso a partir dos dados de forma de onda e a partir dos metadados. Em particular, os dados de forma de onda e os metadados podem ser fornecidos de modo que a única unidade de acesso possa ser gerada sem a necessidade de um armazenamento temporário para armazenar temporariamente os dados de forma de onda e/ou os metadados.
[0035] O codificador de áudio pode compreender uma unidade de análise configurada para gerar uma pluralidade de sinais de sub-banda a partir do quadro do sinal de áudio, em que a pluralidade de sinais de sub-banda pode compreender uma pluralidade de sinais de baixa banda indicativos do sinal de baixa banda. O codificador de áudio pode compreender uma unidade de compressão configurada para comprimir a pluralidade de sinais de baixa banda com o uso de uma função de compressão, para fornecer uma pluralidade de sinais de baixa banda comprimidos. Os dados de forma de onda podem ser indicativos da pluralidade de sinais de baixa banda comprimidos e os metadados podem ser indicativos da função de compressão usada pela unidade de compressão. Os metadados indicativos do envelope espectral do sinal de alta banda podem ser aplicáveis à mesma porção do sinal de áudio que os metadados indicativos da função de compressão. Em outras palavras, os metadados indicativos do envelope espectral do sinal de alta banda podem estar em sincronia com os metadados indicativos da função de compressão.
[0036] De acordo com um aspecto adicional, um fluxo de dados que compreende uma sequência de unidades de acesso para uma sequência de quadros de um sinal de áudio, respectivamente, é descrito. Uma unidade de acesso a partir da sequência de unidades de acesso compreende dados e metadados de forma de onda. Os dados de forma de onda e os metadados são associados ao mesmo quadro particular da sequência de quadros do sinal de áudio. Os dados de forma de onda e os metadados podem ser indicativos de um quadro reconstruído do quadro particular. Em um exemplo, o quadro particular do sinal de áudio compreende um sinal de baixa banda e um sinal de alta banda, em que os dados de forma de onda são indicativos do sinal de baixa banda e em que os metadados são indicativos de um envelope espectral do sinal de alta banda. Os metadados podem permitir que um decodificador de áudio gere o sinal de alta banda a partir do sinal de baixa banda, com o uso de um esquema HFR. Alternativa ou adicionalmente, os metadados podem ser indicativos de uma função de compressão aplicada ao sinal de baixa banda. Portanto, os metadados podem permitir que o decodificador de áudio realize uma expansão da faixa dinâmica do sinal de baixa banda recebido (com o uso de um inverso da função de compressão).
[0037] De acordo com um aspecto adicional, um método para determinar um quadro reconstruído de um sinal de áudio a partir de uma unidade de acesso de um fluxo de dados recebido é descrito. A unidade de acesso compreende dados e metadados de forma de onda, em que os dados de forma de onda e os metadados são associados ao mesmo quadro reconstruído do sinal de áudio. Em um exemplo, o quadro reconstruído do sinal de áudio compreende um sinal de baixa banda e um sinal de alta banda, em que os dados de forma de onda são indicativos do sinal de baixa banda (por exemplo, de coeficientes de frequência que descrevem o sinal de baixa banda) e em que os metadados são indicativos de um envelope espectral do sinal de alta banda (por exemplo, de fatores de escala para uma pluralidade de bandas de fator de escala do sinal de alta banda). O método compreende gerar uma pluralidade de sinais de sub-banda de forma de onda a partir dos dados de forma de onda e gerar metadados decodificados a partir dos metadados. Ademais, o método compreende alinhar no tempo a pluralidade de sinais de sub-banda de forma de onda e os metadados decodificados, conforme descrito no presente documento. Adicionalmente, o método compreende gerar o quadro reconstruído do sinal de áudio a partir da pluralidade alinhada no tempo de sinais de sub-banda de forma de onda e metadados decodificados.
[0038] De acordo com outro aspecto, um método para codificar um quadro de um sinal de áudio em uma unidade de acesso de um fluxo de dados é descrito. O quadro do sinal de áudio é codificado de modo que a unidade de acesso compreenda dados e metadados de forma de onda. Os dados de forma de onda e os metadados são indicativos de um quadro reconstruído do quadro do sinal de áudio, em um exemplo, o quadro do sinal de áudio compreende um sinal de baixa banda e um sinal de alta banda, e o quadro é codificado de modo que os dados de forma de onda sejam indicativos do sinal de baixa banda e de modo que os metadados sejam indicativos de um envelope espectral do sinal de alta banda. O método compreende gerar os dados de forma de onda a partir do quadro do sinal de áudio, por exemplo, a partir do sinal de baixa banda e gerar os metadados a partir do quadro do sinal de áudio, por exemplo, a partir do sinal de alta banda e a partir do sinal de baixa banda (por exemplo, de acordo com um esquema HFR). Adicionalmente, o método compreende alinhar no tempo os dados de forma de onda e os metadados de modo que a unidade de acesso para o quadro do sinal de áudio compreenda os dados de forma de onda e os metadados para o mesmo quadro do sinal de áudio.
[0039] De acordo com um aspecto adicional, um programa de software é descrito. O programa de software pode ser adaptado para execução em um processador e para realizar as etapas de método destacadas no presente documento quando realizadas no processador.
[0040] De acordo com outro aspecto, um meio de armazenamento (por exemplo, um meio de armazenamento não transitório) é descrito. O meio de armazenamento pode compreender um programa de software adaptado para execução em um processador e para realizar as etapas de método destacadas no presente documento quando realizadas no processador.
[0041] De acordo com um aspecto adicional, um produto de programa de computador é descrito. O programa de computador pode compreender instruções executáveis para realizar as etapas de método destacadas no presente documento quando executadas em um computador.
[0042] Deve-se observar que os métodos e sistemas que incluem suas modalidades preferenciais conforme destacado no presente pedido de patente podem ser usados de forma autônoma ou em combinação com os outros métodos e sistemas revelados neste documento. Ademais, todos os aspectos dos métodos e sistemas destacados no presente pedido de patente podem ser arbitrariamente combinados. Em particular, os recursos das reivindicações podem ser combinados uns com os outros de maneira arbitrária.
BREVE DESCRIÇÃO DAS FIGURAS
[0043] A invenção é explicada abaixo de maneira ilustrativa em referência aos desenhos anexos, nos quais
[0044] A Figura 1 mostra um diagrama de blocos de um decodificador de áudio exemplificador;
[0045] A Figura 2a mostra um diagrama de blocos de outro decodificador de áudio exemplificador;
[0046] A Figura 2b mostra um diagrama de blocos de um codificador de áudio exemplificador; e
[0047] A Figura 3a mostra um diagrama de blocos de um decodificador de áudio exemplificador que é configurado para realizar expansão de áudio;
[0048] A Figura 3b mostra um diagrama de blocos de um codificador de áudio exemplificador que é configurado para realizar compressão de áudio; e
[0049] A Figura 4 ilustra um enquadramento exemplificador de uma sequência de quadros de um sinal de áudio.
DESCRIÇÃO DETALHADA DA INVENÇÃO
[0050] Conforme indicado acima, o presente documento se refere ao alinhamento de metadados. A seguir, o alinhamento de metadados é destacado no contexto de um esquema de AAC (Codificação de Áudio Avançada) de HE (Alta Eficiência) de MPEG. Deve-se observar, no entanto, que os princípios de alinhamento de metadados que são descritos no presente documento também são aplicáveis a outros sistemas de codificação/decodificação de áudio. Em particular, os esquemas de alinhamento de metadados que são descritos no presente documento são aplicáveis a sistemas de codificação/decodificação de áudio que fazem uso de HFR (Reconstrução de Alta Frequência) e/ou SBR (Replicação de Largura de Banda Espectral) e que transmite metadados de HFR/SBR de um codificador de áudio a um decodificador de áudio correspondente. Ademais, os esquemas de alinhamento de metadados que são descritos no presente documento são aplicáveis a sistemas de codificação/decodificação de áudio que fazem uso de aplicações em um domínio de sub-banda (notoriamente um QMF). Um exemplo para tal aplicação é SBR. Outros exemplos são acoplamento A, pós- processamento, etc. A seguir, os esquemas de alinhamento de metadados são descritos no contexto do alinhamento de metadados de SBR. Deve-se observar, no entanto, que os esquemas de alinhamento de metadados também são aplicáveis a outros tipos de metadados, notoriamente a outros tipos de metadados no domínio de sub-banda.
[0051] Um fluxo de dados de HE-AAC de MPEG compreende metadados de SBR (também denominados como metadados de A- SPX). Os metadados de SBR em um quadro codificado particular do fluxo de dados (também denominados como uma AU (unidade de acesso) do fluxo de dados) tipicamente se refere a dados de forma de onda (W) no passado. Em outras palavras, os metadados de SBR e os dados de forma de onda compreendidos dentro de uma AU do fluxo de dados tipicamente correspondem ao mesmo quadro do sinal de áudio original. Isso se deve ao fato de que, após a decodificação dos dados de forma de onda, os dados de forma de onda são submetidos a várias etapas de processamento (tal como uma análise de IMDCT (Transformada Modificada Discreta de Cosseno Inversa e um QMF (Filtro em Espelho de Quadratura)) que apresentam um atraso de sinal. No ponto em que os metadados de SBR são aplicados aos dados de forma de onda, os metadados de SBR estão em sincronia com os dados de forma de onda processados. Sendo assim, os metadados de SBR e os dados de forma de onda são inseridos no fluxo de dados de HE-AAC de MPEG de modo que os metadados de SBR alcancem o decodificador de áudio, quando os metadados de SBR forem necessários para processamento de SBR no decodificador de áudio. Essa forma de entrega de metadados pode ser denominada como entrega de metadados "no momento exato" (Just-In-time) (JIT), à medida que os metadados de SBR são inseridos no fluxo de dados de modo que os metadados de SBR possam ser diretamente aplicados dentro do sinal ou cadeia de processamento do decodificador de áudio.
[0052] A entrega de metadados JIT pode ser benéfica para uma cadeia de processamento de codificação - transmissão - decodificação convencional, de modo a reduzir o atraso de codificação geral e de modo a reduzir as exigências de memória no decodificador de áudio. No entanto, uma união do fluxo de dados ao longo do caminho de transmissão pode induzir a uma incompatibilidade entre os dados de forma de onda e os metadados de SBR correspondentes. Tal incompatibilidade pode induzir a artefatos audíveis no ponto de união devido ao fato de que metadados de SBR errados são usados para replicação de banda espectral no decodificador de áudio.
[0053] Em vista do supracitado, é desejado fornecer um sistema de codificação/decodificação de áudio que permite a união de fluxos de dados, enquanto, ao mesmo tempo, mantém um baixo atraso de codificação geral.
[0054] A Figura 1 mostra um diagrama de blocos de um decodificador de áudio exemplificador 100 aborda o problema técnico mencionado acima. Em particular, o decodificador de áudio 100 da Figura 1 permite a decodificação de fluxos de dados com AUs 110 que compreendem os dados de forma de onda 111 de um segmento particular (por exemplo, quadro) de um sinal de áudio e que compreendem os metadados 112 correspondentes do segmento particular do sinal de áudio. Fornecendo-se decodificadores de áudio 100 que decodificam fluxos de dados que compreendem AUs 110 com dados de forma de onda 111 alinhados no tempo e metadados 112 correspondentes, a união consistente do fluxo de dados é permitida. Em particular, é garantido que o fluxo de dados pode ser dividido de tal maneira que pares correspondentes de dados de forma de onda 111 e metadados 112 sejam mantidos.
[0055] O decodificador de áudio 100 compreende uma unidade de atraso 105 dentro da cadeia de processamento dos dados de forma de onda 111. A unidade de atraso 105 pode ser colocada após ou a jusante da unidade de síntese de MDCT 102 e antes ou a montante da unidade de síntese de QMF 107 dentro do decodificador de áudio 100. Em particular, a unidade de atraso 105 pode ser colocada antes ou a montante da unidade de aplicação de metadados 106 (por exemplo, a unidade de SBR 106) que é configurada para aplicar os metadados decodificados 128 aos dados de forma de onda processados. A unidade de atraso 105 (também denominada como a unidade de atraso de forma de onda 105) é configurada para aplicar um atraso (denominado como o atraso de forma de onda) aos dados de forma de onda processados. O atraso de forma de onda é preferencialmente escolhido de modo que o atraso de processamento geral da cadeia de processamento de forma de onda ou do caminho de processamento de forma de onda (por exemplo, a partir da unidade de síntese de MDCT 102 à aplicação de metadados na unidade de aplicação de metadados 106) se resuma a exatamente um quadro (ou a um múltiplo de número inteiro do mesmo). Ao fazer isso, os dados de controle paramétricos podem ser atrasados por um quadro (ou um múltiplo do mesmo) e o alinhamento dentro da AU 110 é alcançado.
[0056] A Figura 1 mostra componentes de um decodificador de áudio exemplificador 100. Os dados de forma de onda 111 tomados a partir de uma AU 110 são decodificados e de-quantizados dentro de uma unidade de decodificação e desquantização de forma de onda 101 para fornecer uma pluralidade de coeficientes de frequência 121 (no domínio de frequência). A pluralidade de coeficientes de frequência 121 são sintetizados em um sinal de baixa banda de (domínio de tempo) 122 com o uso de uma transformada de domínio de frequência para domínio de tempo (por exemplo, uma MDCT inversa, transformada modificada discreta de cosseno) aplicada dentro da unidade de síntese de baixa banda 102 (por exemplo, a unidade de síntese de MDCT). Subsequentemente, o sinal de baixa banda 122 é transformado em uma pluralidade de sinais de baixa banda de subbanda 123 com o uso de uma unidade de análise 103. A unidade de análise 103 pode ser configurada para aplicar um banco de filtro em espelho de quadratura (QMF) ao sinal de baixa banda 122 para fornecer a pluralidade de sinais de baixa banda de sub-banda 123. Os metadados 112 são tipicamente aplicados à pluralidade de sinais de baixa banda de sub-banda 123 (ou às versões transpostas dos mesmos).
[0057] Os metadados 112 a partir da AU 110 são decodificados e desquantizados dentro de uma unidade de decodificação e desquantização de metadados 108 para fornecer os metadados decodificados 128. Ademais, o decodificador de áudio 100 pode compreender uma unidade de atraso 109 adicional (denominada como a unidade de atraso de metadados 109) que é configurada para aplicar um atraso (denominado como o atraso de metadados) aos metadados decodificados 128. O atraso de metadados pode corresponder a um múltiplo de número inteiro do comprimento de quadro N, por exemplo, D1=N, em que D1 é o atraso de metadados. Sendo assim, o atraso geral da cadeia de processamento de metadados corresponde a D1, por exemplo, D1=N.
[0058] De modo a garantir que os dados de forma de onda processados (isto é, a pluralidade de sinais de baixa banda de subbanda 123 atrasados) e os metadados processados (isto é, os metadados decodificados 128 atrasados) cheguem à unidade de aplicação de metadados 106 ao mesmo tempo, o atraso geral da cadeia de processamento de forma de onda (ou caminho) deve corresponder ao atraso geral da cadeia (ou caminho) de processamento de metadados (isto é, ao D1). Dentro da cadeia de processamento de forma de onda, a unidade de síntese de baixa banda 102 insere tipicamente um atraso de N/2 (isto é, de metade do comprimento de quadro). A unidade de análise 103 insere tipicamente um atraso fixado (por exemplo, de 320 amostras). Ademais, um lookahead (isto é, um deslocamento fixado entre metadados e dados de forma de onda) pode precisar ser levado em consideração. No caso de HE-AAC de MPEG, tal lookahead de SBR pode corresponder a 384 amostras (representadas pela unidade de lookahead 104). A unidade de lookahead 104 (que também pode ser denominada como a unidade de atraso de lookahead 104) pode ser configurada para atrasar os dados de forma de onda 111 (por exemplo, atrasar a pluralidade de sinais de baixa banda de sub-banda 123) por um atraso de lookahead de SBR fixado. O atraso de lookahead permite que um codificador de áudio correspondente determine os metadados de SBR com base em um quadro do sinal de áudio sucessor.
[0059] De modo a fornecer um atraso geral da cadeia de processamento de metadados que corresponde a um atraso geral da cadeia de processamento de forma de onda, o atraso de forma de onda D2 deve se dar de modo que: D1= 320+384+ D2+N/2, isto é, D2 = N/2 - 320 - 384 (no caso de Di=N).
[0060] A Tabela 1 mostra os atrasos de forma de onda D2 para uma pluralidade de diferentes comprimentos de quadro N. Pode-se observar que o atraso máximo de forma de onda D2 para os diferentes comprimentos de quadro N de HE-AAC é 928 amostras com uma latência de decodificador máxima geral de 2.i77 amostras. Em outras palavras, o alinhamento dos dados de forma de onda iii e dos metadados ii2 correspondentes dentro de uma única AU ii0 resulta em um máximo de atraso de PCM adicional de 928 amostras. Para o bloco de tamanhos de quadro N=i920/i536, os metadados são atrasados em i quadro, e para tamanhos de quadro N=960/768/5i2/384 os metadados são atrasados em 2 quadros. Isso significa que o atraso de desempenho no decodificador de áudio i00 é aumentado em dependência do tamanho de bloco N, e o atraso de codificação geral é aumentado em i ou 2 quadros completos. O atraso de PCM máximo no codificador de áudio correspondente é i.664 amostras (correspondente à latência inerente do decodificador de áudio i00).
Figure img0001
[0061] Sendo assim, é proposto no presente documento abordar a desvantagem de metadados JIT, por meio de uso de metadados alinhados por sinal 112 (SAM) que são alinhados com os dados de forma de onda 111 correspondentes em uma única AU 110. Em particular, é proposto introduzir uma ou mais unidades de atraso adicionais em um decodificador de áudio 100 e/ou em um codificador de áudio correspondente de modo que cada quadro codificado (ou AU) porte os (por exemplo, A-SPX) metadados que o mesmo usa em um estágio de processamento posterior, por exemplo, no estágio de processamento quando os metadados forem aplicados aos dados de forma de onda subjacentes.
[0062] Deve-se observar que - em princípio - poderia ser considerado aplicar um atraso de metadados D1 que corresponde a uma fração do comprimento de quadro N. Ao fazer isso, o atraso de codificação geral poderia ser possivelmente reduzido. No entanto, conforme mostrado, por exemplo, na Figura 1, o atraso de metadados D1 é aplicado no domínio de QMF (isto é, no domínio de sub-banda). Em vista disso e em vista do fato de que os metadados 112 são tipicamente somente definidos uma vez por quadro, isto é, em vista do fato de que os metadados 112 compreendem tipicamente um conjunto de parâmetros dedicados por quadro, a inserção de um atraso de metadados D1 que corresponde a uma fração de um comprimento de quadro N pode induzir a problemas de sincronização em relação aos dados de forma de onda 111. Por outro lado, o atraso de forma de onda D2 é aplicado no domínio de tempo (conforme mostrado na Figura 1), em que os atrasos que correspondem a uma fração de um quadro podem ser implantados de maneira precisa (por exemplo, atrasando-se o domínio de tempo sinal por um número de amostras que corresponde ao atraso de forma de onda D2). Portanto, é benéfico atrasar os metadados 112 por múltiplos de número inteiro de um quadro (em que o quadro corresponde à menor resolução de tempo para a qual os metadados 112 são definidos) e atrasar os dados de forma de onda 111 por um atraso de forma de onda D2 que pode tomar valores arbitrários. Um atraso de metadados D1 que corresponde a um múltiplo de número inteiro do comprimento de quadro N pode ser implantado no domínio de sub-banda de maneira precisa, e um atraso de forma de onda D2 que corresponde a um múltiplo arbitrário de uma amostra pode ser implantado no domínio de tempo de maneira precisa. Consequentemente, a combinação de um atraso de metadados D1 e um atraso de forma de onda D2 permite uma sincronização exata dos metadados 112 e dos dados de forma de onda 111.
[0063] Deve-se observar que - em princípio - poderia ser considerado aplicar um atraso de metadados D1 que corresponde a uma fração do comprimento de quadro N. Ao fazer isso, o atraso de codificação geral poderia ser possivelmente reduzido. No entanto, conforme mostrado, por exemplo, na Figura 1, o atraso de metadados D1 é aplicado no domínio de QMF (isto é, no domínio de sub-banda). Em vista disso e em vista do fato de que os metadados 112 são tipicamente somente definidos uma vez por quadro, isto é, em vista do fato de que os metadados 112 compreendem tipicamente um conjunto de parâmetros dedicados por quadro, a inserção de um atraso de metadados D1 que corresponde a uma fração de um comprimento de quadro N pode induzir a problemas de sincronização em relação aos dados de forma de onda 111. Por outro lado, o atraso de forma de onda D2 é aplicado no domínio de tempo (conforme mostrado na Figura 1), em que os atrasos que correspondem a uma fração de um quadro podem ser implantados de maneira precisa (por exemplo, atrasando-se o domínio de tempo sinal por um número de amostras que corresponde ao atraso de forma de onda D2). Portanto, é benéfico atrasar os metadados 112 por múltiplos de número inteiro de um quadro (em que o quadro corresponde à menor resolução de tempo para a qual os metadados 112 são definidos) e atrasar os dados de forma de onda 111 por um atraso de forma de onda D2 que pode tomar valores arbitrários. Um atraso de metadados D1 que corresponde a um múltiplo de número inteiro do comprimento de quadro N pode ser implantado no domínio de sub-banda de maneira precisa, e um atraso de forma de onda D2 que corresponde a um múltiplo arbitrário de uma amostra pode ser implantado no domínio de tempo de maneira precisa. Consequentemente, a combinação de um atraso de metadados D1 e um atraso de forma de onda D2 permite uma sincronização exata dos metadados 112 e dos dados de forma de onda 111.
[0064] A aplicação de um atraso de metadados D1 que corresponde a uma fração do comprimento de quadro N poderia ser implantada por reamostragem dos metadados 112, de acordo com o atraso de metadados D1. No entanto, a reamostragem dos metadados 112 envolve tipicamente custos computacionais substanciais. Ademais, a reamostragem dos metadados 112 pode levar a uma distorção dos metadados 112, afetando assim a qualidade do quadro reconstruído do sinal de áudio. Em vista disso, é benéfico, em vista da eficiência computacional e em vista de qualidade de áudio, para limitar o atraso de metadados D1 aos múltiplos de número inteiro do comprimento de quadro N.
[0065] A Figura 1 também mostra o processamento adicional dos metadados 128 atrasados e a pluralidade de sinais de baixa banda de sub-banda 123 atrasados. A unidade de aplicação de metadados 106 é configurada para gerar uma pluralidade de sinais de sub-banda de alta banda (por exemplo, escalonados) 126 com base na pluralidade de sinais de baixa banda de sub-banda 123 e com base nos metadados 128. Para esse propósito, a unidade de aplicação de metadados 106 pode ser configurada para transpor um ou mais dentre a pluralidade de sinais de baixa banda de sub-banda 123 para gerar uma pluralidade de sinais de sub-banda de alta banda. A transposição pode compreender um processo de cópia dos um ou mais dentre a pluralidade de sinais de baixa banda de sub-banda 123. Ademais, a unidade de aplicação de metadados 106 pode ser configurada para aplicar os metadados 128 (por exemplo, fatores de escala compreendidos dentro dos metadados 128) à pluralidade de sinais de sub-banda de alta banda, de modo a gerar a pluralidade de sinais de sub-banda de alta banda escalonados 126. A pluralidade de sinais de sub-banda de alta banda escalonados 126 é tipicamente escalonada com o uso dos fatores de escala, de modo que o envelope espectral da pluralidade de sinais de sub-banda de alta banda escalonados 126 simule o envelope espectral do sinal de alta banda de um quadro original do sinal de áudio (que corresponde a um quadro reconstruído do sinal de áudio 127 que é gerado com base na pluralidade de sinais de baixa banda de sub-banda 123 e a partir da pluralidade de sinais de sub-banda de alta banda escalonados 126).
[0066] Ademais, o decodificador de áudio 100 compreende uma unidade de síntese 107 configurada para gerar o quadro reconstruído de um sinal de áudio 127 a partir da pluralidade de sinais de baixa banda de sub-banda 123 e a partir da pluralidade de sinais de subbanda de alta banda escalonados 126 (por exemplo, com o uso de um banco de QMF inverso).
[0067] A Figura 2a mostra um diagrama de blocos de outro decodificador de áudio exemplificador 100. O decodificador de áudio 100 da Figura 2a compreende os mesmos componentes que o decodificador de áudio 100 da Figura 1. Ademais, componentes 210 exemplificadores para processamento de áudio de múltiplos canais são ilustrados. Pode-se observar que, no exemplo da Figura 2a, a unidade de atraso de forma de onda 105 é posicionada diretamente subsequente à unidade de MDCT Inversa 102. A determinação de um quadro reconstruído de um sinal de áudio 127 pode ser realizada para cada canal de um sinal de áudio de múltiplos canais (por exemplo, de um sinal de áudio de múltiplos canais de 5,1 ou um sinal de áudio de múltiplos canais de 7,1).
[0068] A Figura 2b mostra um diagrama de blocos de um codificador de áudio exemplificador 250 correspondente ao decodificador de áudio 100 da Figura 2a. O codificador de áudio 250 é configurado para gerar um fluxo de dados que compreende AUs 110 que porta pares de dados de forma de onda 111 e metadados 112 correspondentes. O codificador de áudio 250 compreende uma cadeia de processamento de metadados 256, 257, 258, 259, 260 para determinar os metadados. A cadeia de processamento de metadados pode compreender uma unidade de atraso de metadados 256 para alinhar os metadados com os dados de forma de onda correspondentes. No exemplo ilustrado, a unidade de atraso de metadados 256 do codificador de áudio 250 não introduz nenhum atraso adicional (devido ao fato de que o atraso introduzido pela cadeia de processamento de metadados é maior do que o atraso introduzido pela cadeia de processamento de forma de onda).
[0069] Ademais, o codificador de áudio 250 compreende uma cadeia de processamento de forma de onda 251, 252, 253, 254, 255 configurada para determinar os dados de forma de onda a partir de um sinal de áudio original na entrada do codificador de áudio 250. A cadeia de processamento de forma de onda compreende uma unidade de atraso de forma de onda 252 configurada para introduzir um atraso adicional à cadeia de processamento de forma de onda, de modo a alinhar os dados de forma de onda com os metadados correspondentes. O atraso que é introduzido pela unidade de atraso de forma de onda 252 pode se dar de modo que o atraso geral da cadeia de processamento de metadados (incluindo o atraso de forma de onda inserido pela unidade de atraso de forma de onda 252) corresponde ao atraso geral da cadeia de processamento de forma de onda. No caso de um comprimento de quadro N = 2,048, o atraso da unidade de atraso de forma de onda 252 pode ser 2,048 - 320 = 1,728 amostras.
[0070] A Figura 3a mostra um excerto de um decodificador de áudio 300 que compreende uma unidade de expansão 301. O decodificador de áudio 300 da Figura 3a pode corresponder ao decodificador de áudio 100 das Figuras 1 e/ou 2a e compreende adicionalmente a unidade de expansão 301 que é configurada para determinar uma pluralidade de sinais de baixa banda expandidos a partir da pluralidade de sinais de baixa banda 123, com o uso de um ou mais parâmetros de expansão 310 tomados a partir dos metadados decodificados 128 de uma unidade de acesso 110. Tipicamente, os um ou mais parâmetros de expansão 310 são acoplados com SBR (por exemplo, A-SPX) metadados compreendidos dentro de uma unidade de acesso 110. Em outras palavras, os um ou mais parâmetros de expansão 310 são tipicamente aplicáveis ao mesmo excerto ou porção de um sinal de áudio que os metadados de SBR.
[0071] Conforme destacado acima, os metadados 112 de uma unidade de acesso 110 são tipicamente associados aos dados de forma de onda 111 de um quadro de um sinal de áudio, em que o quadro compreende um número N predeterminado de amostras. Os metadados de SBR são tipicamente determinados com base em uma pluralidade de sinais de baixa banda (também denominados como uma pluralidade de sinais de sub-banda de forma de onda), em que a pluralidade de sinais de baixa banda pode ser determinada com o uso de uma análise de QMF. A análise de QMF rende uma representação de frequência de tempo de um quadro de um sinal de áudio. Em particular, as N amostras de um quadro de um sinal de áudio podem ser representadas por Q (por exemplo, Q=64) sinais de baixa banda, em que cada uma compreende N/Q intervalos de tempo ou intervalos. Para um quadro com N=2.048 amostras e for Q=64, cada sinal de baixa banda compreende N/Q=32 intervalos.
[0072] No caso de um transiente dentro de um quadro particular, pode ser benéfico determinar os metadados de SBR com base nas amostras de um quadro diretamente sucessor. Esse recurso é denominado como o lookahead de SBR. Em particular, os metadados de SBR podem ser determinados com base em um número predeterminado de intervalos a partir do quadro sucessor. A título de exemplo, até 6 intervalos do quadro sucessor podem ser levados em consideração (isto é, Q*6=384 amostras).
[0073] O uso do lookahead de SBR é ilustrado na Figura 4 que mostra uma sequência de quadros 401, 402, 403 de um sinal de áudio, com o uso de enquadramentos diferentes 400, 430 para o esquema de SBR ou HFR. No caso de enquadramento 400, o esquema de SBR/HFR não faz uso da flexibilidade fornecida pelo lookahead de SBR. Todavia, um deslocamento fixado, isto é, um atraso de lookahead de SBR fixado, 480 é usado para permitir o uso do lookahead de SBR. No exemplo ilustrado, o deslocamento fixado corresponde a 6 intervalos de tempo. Como resultado desse deslocamento fixado 480, os metadados 112 de uma unidade de acesso 110 particular de um quadro particular 402 é particularmente aplicável a intervalos de tempo de dados de forma de onda 111 compreendidos dentro da unidade de acesso 110 que precede a unidade de acesso 110 particular (e que é associada ao quadro diretamente precedente 401). Isso é ilustrado pelo deslocamento entre os metadados de SBR 411, 412, 413 e os quadros 401, 402, 403. Portanto, os metadados de SBR 411, 412, 413 compreendidos dentro de uma unidade de acesso 110 podem ser aplicáveis aos dados de forma de onda 111 que são deslocados pelo atraso de lookahead de SBR 480. Os metadados de SBR 411, 412, 413 são aplicados aos dados de forma de onda 111 para fornecer os quadros reconstruídos 421, 422, 423.
[0074] O enquadramento 430 faz uso do lookahead de SBR. Pode-se observar que os metadados de SBR 431 são aplicáveis a mais do que 32 intervalos de tempo de dados de forma de onda 111, por exemplo, devido à ocorrência de um transiente dentro do quadro 401. Por outro lado, os metadados de SBR 432 sucessores são aplicáveis a menos do que 32 intervalos de tempo de dados de forma de onda 111. Os metadados de SBR 433 são novamente aplicáveis a 32 intervalos de tempo. Portanto, o lookahead de SBR permite flexibilidade em relação à resolução temporal dos metadados de SBR. Deve-se observar que, independentemente do uso de o lookahead de SBR e independentemente da aplicabilidade dos metadados de SBR 431, 432, 433, os quadros reconstruídos 421, 422, 423 são gerados com o uso de um deslocamento fixado 480 em relação aos quadros 401, 402, 403.
[0075] Um codificador de áudio pode ser configurado para determinar os metadados de SBR e os um ou mais parâmetros de expansão com o uso do mesmo excerto ou porção do sinal de áudio. Portanto, se os metadados de SBR forem determinados com o uso de um lookahead de SBR, os um ou mais parâmetros de expansão podem ser determinados e podem ser aplicáveis ao mesmo lookahead de SBR. Em particular, os um ou mais parâmetros de expansão podem ser aplicáveis ao mesmo número de intervalos de tempo que os metadados de SBR correspondentes 431, 432, 433.
[0076] A unidade de expansão 301 pode ser configurada para aplicar um ou mais ganhos de expansão à pluralidade de sinais de baixa banda 123, em que os um ou mais ganhos de expansão dependem tipicamente dos um ou mais parâmetros de expansão 310. Em particular, os um ou mais parâmetros de expansão 310 podem ter um impacto em uma ou mais regras de compressão/expansão que são usados para determinar os um ou mais ganhos de expansão. Em outras palavras, os um ou mais parâmetros de expansão 310 podem ser indicativos da função de compressão que foi usada por uma unidade de compressão do codificador de áudio correspondente. Os um ou mais parâmetros de expansão 310 podem permitir que o decodificador de áudio determine o inverso dessa função de compressão.
[0077] Os um ou mais parâmetros de expansão 310 podem compreender um primeiro parâmetro de expansão indicativo de se o codificador de áudio correspondente comprimiu ou não a pluralidade de sinais de baixa banda. Se nenhuma compressão foi aplicada, então nenhuma expansão será aplicada pelo decodificador de áudio. Sendo assim, o primeiro parâmetro de expansão pode ser usado para acionar ou desativar o recurso de compansão.
[0078] Alternativa ou adicionalmente, os um ou mais parâmetros de expansão 310 podem compreender um segundo parâmetro de expansão indicativo de se os mesmos um ou mais ganhos de expansão devem ou não ser aplicados a todos os canais de um sinal de áudio de múltiplos canais. Sendo assim, o segundo parâmetro de expansão pode comutar entre uma aplicação por canal ou uma aplicação de múltiplos canais do recurso de compansão.
[0079] Alternativa ou adicionalmente, os um ou mais parâmetros de expansão 310 podem compreender um terceiro parâmetro de expansão indicativo de se se aplica ou não os mesmos um ou mais ganhos de expansão a todos os intervalos de tempo de um quadro. Sendo assim, o terceiro parâmetro de expansão pode ser usado para controlar a resolução temporal do recurso de compansão.
[0080] Com o uso dos um ou mais parâmetros de expansão 310, a unidade de expansão 301 pode determinar a pluralidade de sinais de baixa banda expandidos, aplicando-se o inverso de uma função de compressão aplicada ao codificador de áudio correspondente. A função de compressão que foi aplicada ao codificador de áudio correspondente é sinalizada ao decodificador de áudio 300 com o uso dos um ou mais parâmetros de expansão 310.
[0081] A unidade de expansão 301 pode ser posicionada a jusante da unidade de atraso de lookahead 104. Isso garante que os um ou mais parâmetros de expansão 310 sejam aplicados à porção correta da pluralidade de sinais de baixa banda 123. Em particular, isso garante que os um ou mais parâmetros de expansão 310 sejam aplicados à mesma porção da pluralidade de sinais de baixa banda 123 como os parâmetros de SBR (dentro da unidade de aplicação de SBR 106). Sendo assim, é garantido que a expansão opera no mesmo enquadramento de tempo 400, 430 que o esquema de SBR. Devido ao lookahead de SBR, o enquadramento 400, 430 pode compreender um número variável de intervalos de tempo, e por consequência, a expansão pode operar em um número variável de intervalos de tempo (conforme destacado no contexto da Figura 4). Colocando-se a unidade de expansão 301 a jusante da unidade de atraso de lookahead 104, é garantido que o enquadramento 400, 430 correto seja aplicado aos um ou mais parâmetros de expansão. Como resultado disso, um sinal de áudio de alta qualidade pode ser garantido, mesmo subsequente a um ponto de união.
[0082] A Figura 3b mostra um excerto de um codificador de áudio 350 que compreende uma unidade de compressão 351. O codificador de áudio 350 pode compreender os componentes do codificador de áudio 250 da Figura 2b. A unidade de compressão 351 pode ser configurada para comprimir (por exemplo, reduzir a faixa dinâmica) da pluralidade de sinais de baixa banda, com o uso de uma função de compressão. Ademais, a unidade de compressão 351 pode ser configurada para determinar um ou mais parâmetros de expansão 310 que são indicativos da função de compressão que foi usada pela unidade de compressão 351, para permitir que uma unidade de expansão 301 correspondente de um decodificador de áudio 300 aplique um inverso da função de compressão.
[0083] A compressão da pluralidade de sinais de baixa banda pode ser realizada a jusante de um lookahead de SBR 258. Ademais, o codificador de áudio 350 pode compreender uma unidade de enquadramento de SBR 353 que é configurada para garantir que os metadados de SBR sejam determinados para a mesma porção do sinal de áudio que os um ou mais parâmetros de expansão 310. Em outras palavras, a unidade de enquadramento de SBR 353 pode garantir que o esquema de SBR opere no mesmo enquadramento 400, 430 que o esquema de compansão. Em vista do fato de que o esquema de SBR pode operar em quadros estendidos (por exemplo, no caso de transientes), o esquema de compansão também pode operar em quadros estendidos (que compreendem intervalos de tempo adicionais).
[0084] No presente documento, um codificador de áudio e um decodificador de áudio correspondente foram descritos que permitem a codificação de um sinal de áudio em uma sequência de AUs alinhados no tempo que compreende dados e metadados de forma de onda associados a uma sequência de segmentos do sinal de áudio, respectivamente. O uso de AUs alinhados no tempo permite a união de fluxos de dados com artefatos reduzidos nos pontos de união. Ademais, o codificador de áudio e decodificador de áudio são projetados de modo que os fluxos de dados que podem ser unidos sejam processados de maneira computacionalmente eficiente e de modo que o atraso de codificação geral permaneça baixo.
[0085] Os métodos e sistemas descritos no presente documento podem ser implantados como software, firmware e/ou hardware. Determinados componentes podem, por exemplo, ser implantados como software em execução em um processador ou microprocessador de sinal digital. Outros componentes podem, por exemplo, ser implantados como hardware e/ou como circuitos integrados de aplicação específica. Os sinais encontrados nos métodos descritos e sistemas podem ser armazenados em mídia tal como memória de acesso aleatório ou mídia de armazenamento óptico. Os mesmos podem ser transferidos por meio de redes, tais como redes de rádio, redes de satélite, redes sem fio ou redes com fio, por exemplo, a Internet. Dispositivos típicos que fazem uso dos métodos e sistemas descritos no presente documento são dispositivos eletrônicos portáteis ou outro equipamento de consumidor que são usados para armazenar e/ou criar sinais de áudio.

Claims (30)

1. Decodificador de áudio (100, 300), configurado para determinar um quadro reconstruído de um sinal de áudio (127) a partir de uma unidade de acesso (110) de um fluxo de dados recebido; em que a unidade de acesso (110) compreende dados de forma de onda (111) e metadados (112); em que os dados de forma de onda (111) e os metadados (112) são associados ao mesmo quadro reconstruído do sinal de áudio (127); o decodificador de áudio (100, 300) caracterizado pelo fato de que compreende: um caminho de processamento de forma de onda (101, 102, 103, 104, 105) configurado para gerar uma pluralidade de sinais de sub-banda de forma de onda (123) a partir dos dados de forma de onda (111); um caminho de processamento de metadados (108, 109) configurado para gerar metadados (128) decodificados a partir dos metadados (111); e uma unidade de aplicação e síntese de metadados (106, 107) configurada para gerar o quadro reconstruído do sinal de áudio (127) a partir da pluralidade de sinais de sub-banda de forma de onda (123) e a partir dos metadados (128) decodificados; em que a pelo menos uma unidade de atraso (105, 109) é configurada para ali-nhar no tempo a pluralidade de sinais de subbanda de forma de onda (123) e os metadados (128) decodificados de modo que um atraso geral do caminho de processamento de forma de onda (101, 102, 103, 104, 105) corresponda a um atraso geral de caminho de processamento de metadados (108, 109).
2. Decodificador de áudio (100, 300), de acordo com a reivindicação 1, caracterizado pelo fato de que a pelo menos uma unidade de atraso (105, 109) é configurada para alinhar no tempo a pluralidade de sinais de sub-banda de forma de onda (123) e os metadados (128) decodificados de modo que a pluralidade de sinais de sub-banda de forma de onda (123) e os metadados (128) decodificados sejam fornecidos à unidade de aplicação e síntese de metadados (106, 107) no momento exato para o processamento realizado pela unidade de aplicação e síntese de metadados (106, 107).
3. Decodificador de áudio (100, 300), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o caminho de processamento de metadados (108, 109) compreende uma unidade de atraso de metadados (109) configurada para atrasar os metadados (128) decodificados por um múltiplo de número inteiro maior do que zero de um comprimento de quadro N do quadro reconstruído do sinal de áudio (127).
4. Decodificador de áudio (100, 300), de acordo com a reivindicação 3, caracterizado pelo fato de que o múltiplo de número inteiro é tal que o atraso introduzido pela unidade de atraso de metadados (109) é maior do que um atraso introduzido pelo processamento do caminho de processamento de forma de onda (101, 102, 103, 104, 105).
5. Decodificador de áudio (100, 300), de acordo com a reivindicação 3 ou 4, caracterizado pelo fato de que o múltiplo de número inteiro é um para comprimentos de quadro N maior do que 960 e em que o múltiplo de número inteiro é dois para comprimentos de quadro N menor ou igual a 960.
6. Decodificador de áudio (100, 300), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o caminho de processamento de forma de onda (101, 102, 103, 104, 105) compreende uma unidade de atraso de forma de onda (105) configurada para atrasar a pluralidade de sinais de sub-banda de forma de onda (123), de modo que um atraso geral do caminho de processamento de forma de onda corresponda a um múltiplo de número inteiro maior do que zero de um comprimento de quadro N do quadro reconstruído do sinal de áudio (127).
7. Decodificador de áudio (100, 300), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o caminho de processamento de forma de onda (101, 102, 103, 104, 105) compreende: uma unidade de decodificação e desquantização (101) configurada para decodificar e desquantizar os dados de forma de onda (111) para fornecer uma pluralidade de coeficientes de frequência (121) indicativos do sinal de forma de onda; uma unidade de síntese de forma de onda (102) configurada para gerar o sinal de forma de onda (122) a partir da pluralidade de coeficientes de frequência (121); e uma unidade de análise (103) configurada para gerar a pluralidade de sinais de sub-banda de forma de onda (123) a partir do sinal de forma de onda (122).
8. Decodificador de áudio (100, 300), de acordo com a reivindicação 7, caracterizado pelo fato de que: a unidade de síntese de forma de onda (102) é configurada para realizar uma transformada de domínio de frequência para domínio de tempo; a unidade de análise (103) é configurada para realizar uma transformada de domínio de tempo para domínio de sub-banda; e uma resolução de frequência da transformada realizada pela unidade de síntese de forma de onda (102) é maior do que uma resolução de frequência da transformada realizada pela unidade de análise (103).
9. Decodificador de áudio (100, 300), de acordo com a reivindicação 8, caracterizado pelo fato de que: a unidade de síntese de forma de onda (102) é configurada para realizar uma transformada modificada discreta de cosseno inversa; e a unidade de análise (103) é configurada para aplicar um banco de filtro em espelho de quadratura.
10. Decodificador de áudio (100, 300), de acordo com qualquer uma das reivindicações 7 a 9, caracterizado pelo fato de que a unidade de síntese de forma de onda (102) introduz um atraso que depende de um comprimento de quadro N do quadro reconstruído do sinal de áudio (127); e/ou a unidade de análise (103) introduz um atraso fixado que é independente do comprimento de quadro N do quadro reconstruído do sinal de áudio (127).
11. Decodificador de áudio (100, 300), de acordo com a reivindicação 10, caracterizado pelo fato de que: o atraso introduzido pela unidade de síntese de forma de onda (102) corresponde à metade do comprimento de quadro N; e/ou o atraso fixado introduzido pela unidade de análise (103) corresponde a 320 amostras do sinal de áudio.
12. Decodificador de áudio (100, 300), de acordo com qualquer uma das reivindicações 7 a 11, caracterizado pelo fato de que o atraso geral do caminho de processamento de forma de onda (101, 102, 103, 104, 105) depende de um lookahead predeterminado entre metadados (112) e dados de forma de onda (111).
13. Decodificador de áudio (100, 300), de acordo com a reivindicação 12, caracterizado pelo fato de que o lookahead predeterminado corresponde a 192 ou 384 amostras da amostra de áudio.
14. Decodificador de áudio (100, 300), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que: os metadados (128) decodificados compreendem um ou mais parâmetros de expansão (310); o decodificador de áudio (100, 300) compreende uma unidade de expansão (301) configurada para gerar uma pluralidade de sinais de sub-banda de forma de onda expandidos com base na pluralidade de sinais de sub-banda de forma de onda, com o uso do um ou mais parâmetros de expansão (310); e o quadro reconstruído do sinal de áudio (127) é determinado a partir da pluralidade de sinais de sub-banda de forma de onda expandidos.
15. Decodificador de áudio (100, 300), de acordo com a reivindicação 14, caracterizado pelo fato de que o decodificador de áudio (100, 300) compreende uma unidade de atraso de lookahead (104) configurada para atrasar a pluralidade de sinais de sub-banda de forma de onda (123) de acordo com um lookahead predeterminado, para render uma pluralidade de sinais de sub-banda de forma de onda (123) atrasados; e a unidade de expansão (301) é configurada para gerar a pluralidade de sinais de sub-banda de forma de onda expandidos expandindo-se a pluralidade de sinais de sub-banda de forma de onda atrasados.
16. Decodificador de áudio (100, 300), de acordo com a reivindicação 14 a 15, caracterizado pelo fato de que a unidade de expansão (301) é configurada para gerar a pluralidade de sinais de sub-banda de forma de onda expandidos com o uso de um inverso de uma função de compressão predeterminada; e o um ou mais parâmetros de expansão (310) são indicativos do inverso da função de compressão predeterminada.
17. Decodificador de áudio (100, 300), de acordo com qualquer uma das reivindicações 14 a 16, caracterizado pelo fato de que a unidade de aplicação e síntese de metadados (106, 107) é configurada para gerar o quadro reconstruído do sinal de áudio (127) com o uso dos metadados (128) decodificados para uma porção temporal da pluralidade de sinais de sub-banda de forma de onda (123); e a unidade de expansão (301) é configurada para gerar a pluralidade de sinais de sub-banda de forma de onda expandidos com o uso do um ou mais parâmetros de expansão (310) para a mesma porção temporal da pluralidade de sinais de sub-banda de forma de onda.
18. Decodificador de áudio (100, 300), de acordo com a reivindicação 17, caracterizado pelo fato de que uma duração temporal da porção temporal da pluralidade de sinais de sub-banda de forma de onda (123) é variável.
19. Decodificador de áudio (100, 300), de acordo com qualquer uma das reivindicações 7 a 18, caracterizado pelo fato de que a unidade de atraso de forma de onda (105) é configurada para atrasar o sinal de forma de onda (122); em que o sinal de forma de onda (122) é representado no domínio de tempo.
20. Decodificador de áudio (100, 300), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que a unidade de aplicação e síntese de metadados (106, 107) é configurada para processar os metadados (128) decodificados e a pluralidade de sinais de sub-banda de forma de onda (123) no domínio de sub-banda.
21. Decodificador de áudio (100, 300), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o quadro reconstruído do sinal de áudio (127) compreende um sinal de baixa banda e um sinal de alta banda; a pluralidade de sinais de sub-banda de forma de onda (123) é indicativa do sinal de baixa banda; os metadados (112) são indicativos de um envelope espectral do sinal de alta banda; e a unidade de aplicação e síntese de metadados (106, 107) compreende uma unidade de aplicação de metadados (106) que é configurada para realizar reconstrução de alta frequência com o uso da pluralidade de sinais de sub-banda de forma de onda (123) e dos metadados (128) decodificados.
22. Decodificador de áudio (100, 300), de acordo com a reivindicação 21, caracterizado pelo fato de que a unidade de aplicação de metadados (106) é configurada para: transpor um ou mais dentre a pluralidade de sinais de subbanda de forma de onda (123) para gerar uma pluralidade de sinais de sub-banda de alta banda; e aplicar os metadados (128) decodificados à pluralidade de sinais de sub-banda de alta banda para fornecer uma pluralidade de sinais de sub-banda de alta banda (126) escalonados; em que a pluralidade de sinais de sub-banda de alta banda (126) escalonados é indicativa do sinal de alta banda do quadro reconstruído do sinal de áudio (127).
23. Decodificador de áudio (100, 300), de acordo com a reivindicação 22, caracterizado pelo fato de que a unidade de aplicação e síntese de metadados (106, 107) compreende adicionalmente uma unidade de síntese (107) configurada para gerar o quadro reconstruído do sinal de áudio (127) a partir da pluralidade de sinais de sub-banda de forma de onda (123) e a partir da pluralidade de sinais de sub-banda de alta banda (126) escalonados.
24. Decodificador de áudio (100, 300), de acordo com a reivindicação 23, caracterizado pelo fato de que a unidade de síntese (107) é configurada para realizar uma transformada inversa em relação à transformada realizada pela unidade de análise (103).
25. Codificador de áudio (250, 350) caracterizado pelo fato de que é configurado para codificar um quadro de um sinal de áudio em uma unidade de acesso (110) de um fluxo de dados; em que a unidade de acesso (110) compreende dados de forma de onda (111) e metadados (112); em que os dados de forma de onda (111) e os metadados (112) são indicativos de um quadro reconstruído do quadro do sinal de áudio; em que o codificador de áudio (250, 350) compreende: um caminho de processamento de forma de onda (251, 252, 253, 254, 255) configurado para gerar os dados de forma de onda (111) a partir do quadro do sinal de áudio; e um caminho de processamento de metadados (256, 257, 258, 259, 260) configurado para gerar os metadados (111) a partir do quadro do sinal de áudio; em que a pelo menos uma unidade de atraso (252, 256) é configurada para ali-nhar no tempo os dados de forma de onda (111) e os metadados (111) de modo que um atraso geral do caminho de processamento de forma de onda (251, 252, 253, 254, 255) corresponda a um atraso geral do caminho de processamento de metadados (256, 257, 258, 259, 260)..
26. Codificador de áudio (250, 350), de acordo com a reivindicação 25, caracterizado pelo fato de que a pelo menos uma unidade de atraso (105, 109) é configurada para alinhar no tempo os dados de forma de onda (111) e os metadados (111) de modo que os dados de forma de onda (111) e os metadados (111) sejam fornecidos a uma unidade de geração de unidade de acesso do codificador de áudio (250, 350) no momento exato para gerar uma única unidade de acesso (110) a partir dos dados de forma de onda (111) e a partir dos metadados (111).
27. Codificador de áudio (250, 350), de acordo com qualquer uma das reivindicações 25 a 26, caracterizado pelo fato de que o caminho de processamento de forma de onda (251, 252, 253, 254, 255) compreende uma unidade de atraso de forma de onda (252) configurada para inserir um atraso no caminho de processamento de forma de onda (251, 252, 253, 254, 255).
28. Codificador de áudio (250, 350), de acordo com qualquer uma das reivindicações 25 a 27, caracterizado pelo fato de que o quadro do sinal de áudio compreende um sinal de baixa banda e um sinal de alta banda; os dados de forma de onda (111) são indicativos do sinal de baixa banda; os metadados (112) são indicativos de um envelope espectral do sinal de alta banda; o caminho de processamento de forma de onda (251, 252, 253, 254, 255) é configurado para gerar os dados de forma de onda (111) a partir do sinal de baixa banda; e o caminho de processamento de metadados (256, 257, 258, 259, 260) é configurado para gerar os metadados (111) a partir do sinal de baixa banda e do sinal de alta banda.
29. Codificador de áudio (250, 350), de acordo com a reivindicação 28, caracterizado pelo fato de que o codificador de áudio (250, 350) compreende uma unidade de análise (257) configurada para gerar uma pluralidade de sinais de sub-banda a partir do quadro do sinal de áudio; a pluralidade de sinais de sub-banda compreende uma pluralidade de sinais de baixa banda indicativos do sinal de baixa banda; o codificador de áudio (250, 350) compreende uma unidade de compressão (351) configurada para comprimir a pluralidade de sinais de baixa banda com o uso de uma função de compressão, para fornecer uma pluralidade de sinais de baixa banda comprimidos; os dados de forma de onda (111) são indicativos da pluralidade de sinais de baixa banda comprimidos; e os metadados (112) são indicativos da função de compressão usada pela unidade de compressão (351).
30. Codificador de áudio (250, 350), de acordo com a reivindicação 29, caracterizado pelo fato de que os metadados (112) indicativos do envelope espectral do sinal de alta banda são aplicáveis à mesma porção do sinal de áudio que os metadados (112) indicativos da função de compressão.
BR122020017854-0A 2013-09-12 2014-09-08 Decodificador e codificador de áudio para alinhamento no tempo de dados de processamento baseados em qmf BR122020017854B1 (pt)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201361877194P 2013-09-12 2013-09-12
US61/877,194 2013-09-12
US201361909593P 2013-11-27 2013-11-27
US61/909,593 2013-11-27
PCT/EP2014/069039 WO2015036348A1 (en) 2013-09-12 2014-09-08 Time- alignment of qmf based processing data
BR112016005167-0A BR112016005167B1 (pt) 2013-09-12 2014-09-08 Decodificador de áudio, codificador de áudio e método para alinhamento no tempo de dados de processamento baseados em qmf

Publications (1)

Publication Number Publication Date
BR122020017854B1 true BR122020017854B1 (pt) 2022-01-04

Family

ID=80214450

Family Applications (3)

Application Number Title Priority Date Filing Date
BR122020017854-0A BR122020017854B1 (pt) 2013-09-12 2014-09-08 Decodificador e codificador de áudio para alinhamento no tempo de dados de processamento baseados em qmf
BR122017019118-7A BR122017019118B1 (pt) 2013-09-12 2014-09-08 Decodificador de áudio, método e meio de armazenamento não transitório
BR122020017844-2A BR122020017844B1 (pt) 2013-09-12 2014-09-08 Decodificador e codificador de áudio para alinhamento no tempo de dados de processamento baseados em qmf

Family Applications After (2)

Application Number Title Priority Date Filing Date
BR122017019118-7A BR122017019118B1 (pt) 2013-09-12 2014-09-08 Decodificador de áudio, método e meio de armazenamento não transitório
BR122020017844-2A BR122020017844B1 (pt) 2013-09-12 2014-09-08 Decodificador e codificador de áudio para alinhamento no tempo de dados de processamento baseados em qmf

Country Status (1)

Country Link
BR (3) BR122020017854B1 (pt)

Also Published As

Publication number Publication date
BR122020017844B1 (pt) 2022-01-25
BR122017019118B1 (pt) 2022-04-26

Similar Documents

Publication Publication Date Title
JP7490722B2 (ja) Qmfベースの処理データの時間整列
USRE47824E1 (en) Method and apparatus for encoding and decoding high frequency band
TWI643487B (zh) 使用訊框控制同步化技術來編碼或解碼多通道信號之裝置及方法
BR122021014312B1 (pt) Aparelho e método para processar um sinal de áudio utilizando alinhamento de borda de patch
CN114242088A (zh) 具有减少后处理延迟的高频重建技术的集成
KR101854298B1 (ko) 낮은 계산 자원들로 인코딩된 오디오 신호를 디코딩하기 위한 장치 및 방법
BR122020017854B1 (pt) Decodificador e codificador de áudio para alinhamento no tempo de dados de processamento baseados em qmf
BR112016005167B1 (pt) Decodificador de áudio, codificador de áudio e método para alinhamento no tempo de dados de processamento baseados em qmf
RU2772778C2 (ru) Временное согласование данных обработки на основе квадратурного зеркального фильтра
US8762158B2 (en) Decoding method and decoding apparatus therefor

Legal Events

Date Code Title Description
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 08/09/2014, OBSERVADAS AS CONDICOES LEGAIS.

B25G Requested change of headquarter approved

Owner name: DOLBY INTERNATIONAL AB (IE)