BR122017019118B1 - Decodificador de áudio, método e meio de armazenamento não transitório - Google Patents
Decodificador de áudio, método e meio de armazenamento não transitório Download PDFInfo
- Publication number
- BR122017019118B1 BR122017019118B1 BR122017019118-7A BR122017019118A BR122017019118B1 BR 122017019118 B1 BR122017019118 B1 BR 122017019118B1 BR 122017019118 A BR122017019118 A BR 122017019118A BR 122017019118 B1 BR122017019118 B1 BR 122017019118B1
- Authority
- BR
- Brazil
- Prior art keywords
- metadata
- waveform
- delay
- unit
- audio
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 24
- 230000001052 transient effect Effects 0.000 title description 6
- 230000005236 sound signal Effects 0.000 claims abstract description 100
- 238000012545 processing Methods 0.000 claims abstract description 99
- 230000015572 biosynthetic process Effects 0.000 claims description 41
- 238000003786 synthesis reaction Methods 0.000 claims description 41
- 238000010422 painting Methods 0.000 claims 1
- 230000003595 spectral effect Effects 0.000 abstract description 18
- 230000010076 replication Effects 0.000 abstract description 5
- 230000006835 compression Effects 0.000 description 32
- 238000007906 compression Methods 0.000 description 32
- 230000006870 function Effects 0.000 description 16
- 230000009286 beneficial effect Effects 0.000 description 13
- 238000009432 framing Methods 0.000 description 10
- 230000003111 delayed effect Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000002123 temporal effect Effects 0.000 description 8
- 239000000523 sample Substances 0.000 description 7
- 238000012952 Resampling Methods 0.000 description 5
- 230000001934 delay Effects 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
A presente invenção refere-se ao alinhamento no tempo de dados criptados de um encriptador de áudio com metadados associados, tais como metadados de replicação de banda espectral (SBR). Um decodificador de áudio (100, 300) configurado para determinar um quadro reconstruído de um sinal de áudio (237) a partir de uma unidade de acesso (110) de um fluxo de dados recebido é descrito. A unidade de acesso (110) compreende dados de forma de onda (111) e metadados (112), em que os dados de forma de onda (111) e os metadados (112) são associados ao mesmo quadro reconstruído do sinal de áudio (127). O decodificador de áudio (100, 300) compreende um caminho de processamento de forma de onda (101, 102, 103, 104, 105) configurado para gerar uma pluralidade de sinais de sub-banda de forma de onda (123) a partir dos dados de forma de onda (111), e um caminho de processamento de metadados (108, 109) configurado para gerar metadados (128) decodificados a partir dos metadados (111).
Description
[001] Dividido do BR112016005167-0, depositado em 8 de se tembro de 2014.
[002] Este pedido reivindica o benefício de prioridade do Pedido de Patente Provisório no U.S. 61/877.194 depositado em 12 de setembro de 2013 e do Pedido de Patente Provisório no U.S. 61/909.593 depositado em 27 de novembro de 2013, em que cada um dos quais é incorporado ao presente documento a título de referência em sua integridade.
[003] A presente invenção refere-se ao alinhamento no tempo de dados codificados de um codificador de áudio com metadados associados, tal como replicação de banda espectral (SBR), em particular a metadados de Codificação de Áudio Avançada (AAC) de Alta Eficiência (HE).
[004] Um problema técnico no contexto da codificação de áudio é fornecer sistemas de codificação e decodificação de áudio que exibem um baixo atraso, por exemplo, de modo a permitir aplicações em tempo real tais como difusão ao vivo. Ademais, é desejado fornecer sistemas de codificação e decodificação de áudio que trocam fluxos de bits codificados que podem ser unidos com outros fluxos de bits. Adicionalmente, sistemas de codificação e decodificação de áudio computacionalmente eficientes devem ser fornecidos para permitir uma implantação rentável dos sistemas. O presente documento se volta ao problema técnico de fornecer fluxos de bits codificados que podem ser unidos de maneira eficiente, enquanto ao mesmo tempo latência de manutenção em um nível apropriado para difusão ao vivo. O presente documento descreve um sistema de codificação e decodificação de áudio que permite a união de fluxos de bits em atrasos de codificação razoáveis, permitindo assim aplicações tais como difusão ao vivo, em que um fluxo de dados difundido pode ser gerado a partir de uma pluralidade de fluxos de bits de fonte.
[005] De acordo com um aspecto, um decodificador de áudio configurado para determinar um quadro reconstruído de um sinal de áudio a partir de uma unidade de acesso de um fluxo de dados recebido é descrito. Tipicamente, o fluxo de dados compreende uma sequência de unidade de acesso para determinar uma respectiva sequência de quadros reconstruídos do sinal de áudio. Um quadro do sinal de áudio compreende tipicamente um número N predeterminado de amostras de domínio de tempo do sinal de áudio (com N sendo maior do que um). Sendo assim, a sequência de unidades de acesso pode descrever a sequência de quadros do sinal de áudio, respecti-vamente.
[006] A unidade de acesso compreende dados e metadados de forma de onda, em que os dados de forma de onda e os metadados são associados ao mesmo quadro reconstruído do sinal de áudio. Em outras palavras, os dados de forma de onda e os metadados para determinar o quadro reconstruído do sinal de áudio são compreendidos dentro da mesma unidade de acesso. As unidades de acesso da sequência de unidades de acesso podem compreender, cada uma, os dados de forma de onda e os metadados para gerar um respectivo quadro reconstruído da sequência de quadros reconstruídos do sinal de áudio. Em particular, a unidade de acesso de um quadro particular pode compreender (por exemplo, todos) os dados necessários para determinar o quadro reconstruído para o quadro particular.
[007] Em um exemplo, a unidade de acesso de um quadro parti cular pode compreender (por exemplo, todos) os dados necessários para realizar um esquema de reconstrução de alta frequência (HFR) para gerar um sinal de alta banda do quadro particular com base em um sinal de baixa banda do quadro particular (compreendido dentro dos dados de forma de onda da unidade de acesso) e com base nos metadados decodificados.
[008] Alternativa ou adicionalmente, a unidade de acesso de um quadro particular pode compreender (por exemplo, todos) os dados necessários para realizar uma expansão da faixa dinâmica de um quadro particular. Em particular, uma expansão ou uma expansão do sinal de baixa banda do quadro particular pode ser realizada com base nos metadados decodificados. Para esse propósito, os metadados decodificados podem compreender um ou mais parâmetros de expansão. Os um ou mais parâmetros de expansão podem ser indicativos de um ou mais dentre: se a compressão/expansão deve ser aplicada ou não ao quadro particular; se a compressão/expansão deve ser aplicada de maneira homogênea para todos os canais de um sinal de áudio de múltiplos canais (isto é, se o(s) mesmo(s) ganho(s) de expansão de- ve(m) ser aplicado(s) para todos os canais de um sinal de áudio de múltiplos canais ou se diferente(s) ganho(s) de expansão deve(m) ser aplicado(s) para os diferentes canais do sinal de áudio de múltiplos canais); e/ou uma resolução temporal de uma expansão ganho.
[009] A provisão de uma sequência de unidades de acesso em que unidades de acesso, cada uma, compreendem os dados necessários para gerar um quadro reconstruído correspondente do sinal de áudio, independente de uma unidade de acesso precedente ou uma sucessora, é benéfica para unir aplicações, visto que isso permite que o fluxo de dados seja unido entre duas unidades de acesso adjacentes, sem afetar a qualidade de percepção de um quadro reconstruído do sinal de áudio no (por exemplo, diretamente subsequente ao) ponto de união.
[0010] Em um exemplo, o quadro reconstruído do sinal de áudio compreende um sinal de baixa banda e um sinal de alta banda, em que os dados de forma de onda são indicativos do sinal de baixa banda e em que os metadados são indicativos de um envelope espectral do sinal de alta banda. O sinal de baixa banda pode corresponder a um componente do sinal de áudio que cobre uma faixa de frequência relativamente baixa (por exemplo, compreendendo frequências menores do que uma frequência de cruzamento predeterminada). O sinal de alta banda pode corresponder a um componente do sinal de áudio que cobre uma faixa de frequência relativamente alta (por exemplo, compreendem frequências maiores do que a frequência de cruzamento predeterminada). O sinal de baixa banda e o sinal de alta banda pode ser complementar em relação à faixa de frequência coberta pelo sinal de baixa banda e pelo sinal de alta banda. O decodificador de áudio pode ser configurado para realizar reconstrução de alta frequência (HFR) tal como replicação de banda espectral (SBR) do sinal de alta banda com o uso dos metadados e dos dados de forma de onda. Sendo assim, os metadados podem compreender metadados de HFR ou SBR indicativos do envelope espectral do sinal de alta banda.
[0011] O decodificador de áudio pode compreender um caminho de processamento de forma de onda configurado para gerar uma pluralidade de sinais de sub-banda de forma de onda a partir dos dados de forma de onda. A pluralidade de sinais de sub-banda de forma de onda pode corresponder a uma representação de um sinal de forma de onda de domínio de tempo em um domínio de sub-banda (por exemplo, em um domínio de QMF). O sinal de forma de onda de domínio de tempo pode corresponder ao sinal de baixa banda mencionado acima, e a pluralidade de sinais de sub-banda de forma de onda pode corresponder a uma pluralidade de sinais de baixa banda de subbanda. Ademais, o decodificador de áudio pode compreender um caminho de processamento de metadados configurado para gerar metadados decodificados a partir dos metadados.
[0012] Adicionalmente, o decodificador de áudio pode compreen der uma unidade de aplicação e síntese de metadados configurada para gerar o quadro reconstruído do sinal de áudio a partir da pluralidade de sinais de sub-banda de forma de onda e a partir dos metadados decodificados. Em particular, a unidade de aplicação e síntese de metadados pode ser configurada para realizar um esquema de HFR e/ou SBR para gerar uma pluralidade de sinais de sub-banda de alta banda (por exemplo, escalonados) a partir da pluralidade de sinais de sub-banda de forma de onda (isto é, nesse caso, a partir da pluralidade de sinais de baixa banda de sub-banda) e a partir dos metadados decodificados. O quadro reconstruído do sinal de áudio pode ser então determinado com base na pluralidade de sinais de sub-banda de alta banda (por exemplo, escalonados) e com base na pluralidade de sinais de baixa banda.
[0013] Alternativa ou adicionalmente, o decodificador de áudio po de compreender uma unidade de expansão configurada para realizar uma expansão de ou configurada para expandir a pluralidade de sinais de sub-banda de forma de onda com o uso de pelo menos alguns dos metadados decodificados, em particular, com o uso dos um ou mais parâmetros de expansão compreendidos dentro dos metadados decodificados. Para esse propósito, a unidade de expansão pode ser configurada para aplicar um ou mais ganhos de expansão à pluralidade de sinais de sub-banda de forma de onda. A unidade de expansão pode ser configurada para determinar os um ou mais ganhos de expansão com base na pluralidade de sinais de sub-banda de forma de onda, com base em uma ou mais regras de compressão/expansão prede- terminadas ou funções e/ou com base nos um ou mais parâmetros de expansão.
[0014] O caminho de processamento de forma de onda e/ou o ca minho de processamento de metadados pode compreender pelo menos uma unidade de atraso configurada para alinhar no tempo a pluralidade de sinais de sub-banda de forma de onda e os metadados decodificados. Em particular, a pelo menos uma unidade de atraso pode ser configurada para alinhar a pluralidade de sinais de sub-banda de forma de onda e os metadados decodificados, e/ou para inserir pelo menos um atraso no caminho de processamento de forma de onda e/ou no caminho de processamento de metadados, de modo que um atraso geral do caminho de processamento de forma de onda corresponda a um atraso geral de caminho de processamento de metadados. Alternativa ou adicionalmente, a pelo menos uma unidade de atraso pode ser configurada para alinhar no tempo a pluralidade de sinais de sub-banda de forma de onda e os metadados decodificados de modo que a pluralidade de sinais de sub-banda de forma de onda e os metadados decodificados sejam fornecidos à unidade de aplicação e síntese de metadados no momento exato para o processamento realizado pela unidade de aplicação e síntese de metadados. Em particular, a pluralidade de sinais de sub-banda de forma de onda e os metadados decodificados podem ser fornecidos à unidade de aplicação e síntese de metadados de modo que a unidade de aplicação e síntese de metadados não precise armazenar temporariamente a pluralidade de sinais de sub-banda de forma de onda e/ou os metadados decodificados antes de realizar processamento (por exemplo, processamento HFR ou SBR) na pluralidade de sinais de sub-banda de forma de onda e/ou nos metadados decodificados.
[0015] Em outras palavras, o decodificador de áudio pode ser con figurado para atrasar o fornecimento dos metadados decodificados e/ou da pluralidade de sinais de sub-banda de forma de onda à unidade de aplicação e síntese de metadados, que pode ser configurada para realizar um esquema HFR, de modo que os metadados decodificados e/ou a pluralidade de sinais de sub-banda de forma de onda sejam fornecidos conforme necessário para processamento. O atraso inserido pode ser selecionado para reduzir (por exemplo, para minimizar) o atraso geral do codec de áudio (que compreende o decodificador de áudio e um codificador de áudio correspondente), enquanto, ao mesmo tempo, permite a união de um fluxo de bits que compreende a sequência de unidades de acesso. Sendo assim, o decodificador de áudio pode ser configurado para gerenciar unidades de acesso alinhadas no tempo, que compreendem os dados de forma de onda e os metadados para determinar um quadro particular reconstruído do sinal de áudio, com impacto mínimo no atraso geral do codec de áudio. Ademais, o decodi- ficador de áudio pode ser configurado para gerenciar unidades de acesso alinhadas no tempo sem a necessidade de metadados de amostragem. Ao fazer isso, o decodificador de áudio é configurado para determinar um quadro particular reconstruído do sinal de áudio de maneira computacionalmente eficiente e sem deteriorar a qualidade de áudio. Portanto, o decodificador de áudio pode ser configurado para permitir a união de aplicações de maneira computacionalmente eficiente, enquanto mantém alta qualidade de áudio e baixo atraso geral.
[0016] Ademais, o uso de pelo menos uma unidade de atraso con figurada para alinhar no tempo a pluralidade de sinais de sub-banda de forma de onda e os metadados decodificados pode garantir um alinhamento preciso e consistente da pluralidade de sinais de sub-banda de forma de onda e dos metadados decodificados no domínio de subbanda (em que o processamento da pluralidade de sinais de subbanda de forma de onda e dos metadados decodificados é tipicamente realizado).
[0017] O caminho de processamento de metadados pode compre ender uma unidade de atraso de metadados configurada para atrasar os metadados decodificados por um múltiplo de número inteiro maior do que zero do comprimento de quadro N do quadro reconstruído do sinal de áudio. O atraso adicional que é introduzido pela unidade de atraso de metadados pode ser denominado como o atraso de metadados. O comprimento de quadro N pode corresponder ao número N de amostras de domínio de tempo compreendidas dentro do quadro reconstruído do sinal de áudio. O múltiplo de número inteiro pode se dar de modo que o atraso introduzido pela unidade de atraso de metadados seja maior do que um atraso introduzido pelo processamento do caminho de processamento de forma de onda (por exemplo, sem considerar um atraso de forma de onda adicional introduzido no caminho de processamento de forma de onda). O atraso de metadados pode depender do comprimento de quadro N do quadro reconstruído do sinal de áudio. Isso pode se dar devido ao fato de que o atraso causado pelo processamento dentro do caminho de processamento de forma de onda depende do comprimento de quadro N. Em particular, o múltiplo de número inteiro pode ser um para comprimentos de quadro N maior do que 960 e/ou o múltiplo de número inteiro pode ser dois para comprimentos de quadro N menor ou igual a 960.
[0018] Conforme indicado acima, a unidade de aplicação e síntese de metadados pode ser configurada para processar os metadados de-codificados e a pluralidade de sinais de sub-banda de forma de onda no domínio de sub-banda (por exemplo, no domínio de QMF). Ademais, os metadados decodificados podem ser indicativos de metadados (por exemplo, indicativos de coeficientes espectrais que descrevem o envelope espectral do sinal de alta banda) no domínio de subbanda. Adicionalmente, a unidade de atraso de metadados pode ser configurada para atrasar os metadados decodificados. O uso de atra- sos de metadados que são múltiplos de número inteiro maiores do que zero do comprimento de quadro N pode ser benéfico, à medida que isso garante um alinhamento consistente da pluralidade de sinais de sub-banda de forma de onda e dos metadados decodificados no domínio de sub-banda (por exemplo, para processamento dentro da unidade de aplicação e síntese de metadados). Em particular, isso garante que os metadados decodificados possam ser aplicados ao quadro correto do sinal de forma de onda (isto é, ao quadro correto da pluralidade de sinais de sub-banda de forma de onda), sem a necessidade de reamostrar os metadados.
[0019] O caminho de processamento de forma de onda pode com preender uma unidade de atraso de forma de onda configurada para atrasar a pluralidade de sinais de sub-banda de forma de onda de modo que um atraso geral do caminho de processamento de forma de onda corresponda a um múltiplo de número inteiro maior do que zero do comprimento de quadro N do quadro reconstruído do sinal de áudio. O atraso adicional que é introduzido pela unidade de atraso de forma de onda pode ser denominado como o atraso de forma de onda. O múltiplo de número inteiro do caminho de processamento de forma de onda pode corresponder ao múltiplo de número inteiro do caminho de processamento de metadados.
[0020] A unidade de atraso de forma de onda e/ou a unidade de atraso de metadados pode ser implantada como armazenamentos temporários que são configurados para armazenar a pluralidade de sinais de sub-banda de forma de onda e/ou os metadados decodificados por uma quantidade de tempo correspondente ao atraso de forma de onda e/ou por uma quantidade de tempo correspondente ao atraso de metadados. A unidade de atraso de forma de onda pode ser colocada em qualquer posição dentro do caminho de processamento de forma de onda a montante da unidade de aplicação e síntese de me tadados. Sendo assim, a unidade de atraso de forma de onda pode ser configurada para atrasar os dados de forma de onda e/ou a pluralidade de sinais de sub-banda de forma de onda (e/ou quaisquer dados ou sinais intermediários dentro do caminho de processamento de forma de onda). Em um exemplo, a unidade de atraso de forma de onda pode ser distribuída ao longo do caminho de processamento de forma de onda, em que as unidades de atraso distribuídas fornecem, cada uma, uma fração do atraso de forma de onda total. A distribuição da unidade de atraso de forma de onda pode ser benéfica para uma implantação rentável da unidade de atraso de forma de onda. De maneira similar à unidade de atraso de forma de onda, a unidade de atraso de metadados pode ser colocada em qualquer posição dentro do caminho de processamento de metadados a montante da unidade de aplicação e síntese de metadados. Ademais, a unidade de atraso de forma de onda pode ser distribuída ao longo do caminho de processamento de metadados.
[0021] O caminho de processamento de forma de onda pode com preender uma unidade de decodificação e desquantização configurada para decodificar e desquantizar os dados de forma de onda para fornecer uma pluralidade de coeficientes de frequência indicativos do sinal de forma de onda. Sendo assim, os dados de forma de onda podem compreender ou podem ser indicativos da pluralidade de coeficientes de frequência, o que permite a geração do sinal de forma de onda do quadro reconstruído do sinal de áudio. Ademais, o caminho de processamento de forma de onda pode compreender uma unidade de síntese de forma de onda configurada para gerar o sinal de forma de onda a partir da pluralidade de coeficientes de frequência. A unidade de síntese de forma de onda pode ser configurada para realizar uma transformada de domínio de frequência para domínio de tempo. Em particular, a unidade de síntese de forma de onda pode ser configura- da para realizar uma transformada modificada discreta de cosseno inversa (MDCT). A unidade de síntese de forma de onda ou o processamento da unidade de síntese de forma de onda podem apresentar um atraso que depende do comprimento de quadro N do quadro reconstruído do sinal de áudio. Em particular, o atraso introduzido pela unidade de síntese de forma de onda pode corresponder à metade do comprimento de quadro N.
[0022] Subsequente à reconstrução do sinal de forma de onda a partir dos dados de forma de onda, o sinal de forma de onda pode ser processado em conjunto com os metadados decodificados. Em um exemplo, o sinal de forma de onda pode ser usado no contexto de um esquema de HFR ou SBR para determinar o sinal de alta banda, com o uso dos metadados decodificados. Para esse propósito, o caminho de processamento de forma de onda pode compreender uma unidade de análise configurada para gerar a pluralidade de sinais de sub-banda de forma de onda a partir do sinal de forma de onda. A unidade de análise pode ser configurada para realizar uma transformada de domínio de tempo para domínio de sub-banda, por exemplo, aplicando-se um banco de filtro em espelho de quadratura (QMF). Tipicamente, uma resolução de frequência da transformada realizada pela unidade de síntese de forma de onda é maior (por exemplo, por um fator de pelo menos 5 ou 10) do que uma resolução de frequência da transformada realizada pela unidade de análise. Isso pode ser indicado pelos termos "domínio de frequência" e "domínio de sub-banda", em que o domínio de frequência pode ser associado a uma resolução de frequência maior do que o domínio de sub-banda. A unidade de análise pode introduzir um atraso fixado que é independente do comprimento de quadro N do quadro reconstruído do sinal de áudio. O atraso fixado que é introduzido pela unidade de análise pode ser dependente do comprimento dos filtros de um banco de filtro usado pela unidade de análise. A título de exemplo, o atraso fixado que é introduzido pela unidade de análise pode corresponder a 320 amostras do sinal de áudio.
[0023] O atraso geral do caminho de processamento de forma de onda pode depender adicionalmente de um lookahead predeterminado entre metadados e dados de forma de onda. Tal lookahead pode ser benéfico para aumentar a continuidade entre quadros reconstruídos adjacentes do sinal de áudio. O lookahead predeterminado e/ou o atraso de lookahead associado pode corresponder a 192 ou 384 amostras da amostra de áudio. O atraso de lookahead pode ser um lookahead no contexto da determinação de metadados de HFR ou SBR indicativos do envelope espectral do sinal de alta banda. Em particular, o lookahead pode permitir que um codificador de áudio corres-pondente determine os metadados de HFR ou SBR do quadro particular do sinal de áudio, com base em um número predeterminado de amostras a partir de um quadro diretamente sucessor do sinal de áudio. Isso pode ser benéfico em casos em que o quadro particular compreende um transiente acústico. O atraso de lookahead pode ser aplicado por uma unidade de atraso de lookahead compreendida dentro do caminho de processamento de forma de onda.
[0024] Sendo assim, o atraso geral do caminho de processamento de forma de onda, isto é, o atraso de forma de onda pode ser dependente do processamento diferente que é realizado dentro do caminho de processamento de forma de onda. Ademais, o atraso de forma de onda pode ser dependente do atraso de metadados, que é introduzido no caminho de processamento de metadados. O atraso de forma de onda pode corresponder a um múltiplo arbitrário de uma amostra do sinal de áudio. Por essa razão, pode ser benéfico fazer uso de uma unidade de atraso de forma de onda que é configurada para atrasar o sinal de forma de onda, em que o sinal de forma de onda é represen-tado no domínio de tempo. Em outras palavras, pode ser benéfico aplicar o atraso de forma de onda no sinal de forma de onda. Ao fazer isso, uma aplicação precisa e consistente de um atraso de forma de onda, que corresponde a um múltiplo arbitrário de uma amostra do sinal de áudio, pode ser garantida.
[0025] Um decodificador exemplificador pode compreender uma unidade de atraso de metadados, que é configurada para aplicar o atraso de metadados nos metadados, em que os metadados podem ser representados no domínio de sub-banda, e uma unidade de atraso de forma de onda, que é configurada para aplicar o atraso de forma de onda no sinal de forma de onda que é representado no domínio de tempo. A unidade de atraso de metadados pode aplicar um atraso de metadados que corresponde a um múltiplo de número inteiro do comprimento de quadro N, e a unidade de atraso de forma de onda pode aplicar um atraso de forma de onda que corresponde a um múltiplo de número inteiro de uma amostra do sinal de áudio. Como consequência, um alinhamento preciso e consistente da pluralidade de sinais de sub-banda de forma de onda e dos metadados decodificados para processamento dentro da unidade de aplicação e síntese de metadados pode ser garantido. O processamento da pluralidade de sinais de sub-banda de forma de onda e dos metadados decodificados pode ocorrer no domínio de sub-banda. O alinhamento da pluralidade de sinais de sub-banda de forma de onda e dos metadados decodificados pode ser alcançado sem reamostragem dos metadados decodificados, fornecendo assim meio computacionalmente eficiente e com preservação de qualidade para alinhamento.
[0026] Conforme destacado acima, o decodificador de áudio pode ser configurado para realizar um esquema de HFR ou SBR. A unidade de aplicação e síntese de metadados pode compreender uma unidade de aplicação de metadados que é configurada para realizar reconstrução de alta frequência (tal como SBR) com o uso da pluralidade de si- nais de baixa banda de sub-banda e com o uso dos metadados decodificados. Em particular, a unidade de aplicação de metadados pode ser configurada para transpor um ou mais dentre a pluralidade de sinais de baixa banda de sub-banda para gerar uma pluralidade de sinais de subbanda de alta banda. Ademais, a unidade de aplicação de metadados pode ser configurada para aplicar os metadados decodificados à pluralidade de sinais de sub-banda de alta banda para fornecer uma pluralidade de sinais de sub-banda de alta banda escalonados. A pluralidade de sinais de sub-banda de alta banda escalonados pode ser indicativa do sinal de alta banda do quadro reconstruído do sinal de áudio. Para gerar o quadro reconstruído do sinal de áudio, a unidade de aplicação e síntese de metadados pode compreender adicionalmente uma unidade de síntese configurada para gerar o quadro reconstruído do sinal de áudio a partir da pluralidade de sinais de baixa banda de sub-banda e a partir da pluralidade de sinais de sub-banda de alta banda escalonados. A unidade de síntese pode ser configurada para realizar uma transformada inversa em relação à transformada realizada pela unidade de análise, por exemplo, aplicando-se um banco de QMF inverso. O número de filtros compreendidos dentro do banco de filtro da unidade de síntese pode ser maior do que o número de filtros compreendidos dentro do banco de filtro da unidade de análise (por exemplo, de modo a considerar a faixa de frequência estendida devido à pluralidade de sinais de sub-banda de alta banda escalonados).
[0027] Conforme indicado acima, o decodificador de áudio pode compreender uma unidade de expansão. A unidade de expansão pode ser configurada para modificar (por exemplo, aumentar) a faixa dinâmica da pluralidade de sinais de sub-banda de forma de onda. A unidade de expansão pode ser posicionada a montante da unidade de aplicação e síntese de metadados. Em particular, a pluralidade de sinais de subbanda de forma de onda expandidos pode ser usada para realizar o es- quema de HFR ou SBR. Em outras palavras, a pluralidade de sinais de baixa banda de sub-banda usados para realizar o esquema de HFR ou SBR pode corresponder à pluralidade de sinais de sub-banda de forma de onda expandidos na saída da unidade de expansão.
[0028] A unidade de expansão é preferencialmente posicionada a jusante da unidade de atraso de lookahead. Em particular, a unidade de expansão pode ser posicionada entre a unidade de atraso de lookahead e a unidade de aplicação e síntese de metadados. Posicionando-se a unidade de expansão a jusante da unidade de atraso de lookahead, isto é, aplicando-se o atraso de lookahead aos dados de forma de onda antes de expandir a pluralidade de sinais de sub-banda de forma de onda, é garantido que os um ou mais parâmetros de expansão compreendidos dentro dos metadados sejam aplicados aos dados de forma de onda corretos. Em outras palavras, realizar a expansão nos dados de forma de onda que já foram atrasados pelo atraso de lookahead garante que os um ou mais parâmetros de expansão dos metadados estão em sincronia com os dados de forma de onda.
[0029] Sendo assim, os metadados decodificados podem compre ender um ou mais parâmetros de expansão, e o decodificador de áudio pode compreender uma unidade de expansão configurada para gerar uma pluralidade de sinais de sub-banda de forma de onda expandidos com base na pluralidade de sinais de sub-banda de forma de onda, com o uso dos um ou mais parâmetros de expansão. Em particular, a unidade de expansão pode ser configurada para gerar a pluralidade de sinais de sub-banda de forma de onda expandidos com o uso de um inverso de uma função de compressão predeterminada. Os um ou mais parâmetros de expansão são indicativos do inverso da função de compressão predeterminada. O quadro reconstruído do sinal de áudio pode ser determinado a partir da pluralidade de sinais de sub-banda de forma de onda expandidos.
[0030] Conforme indicado acima, o decodificador de áudio pode compreender uma unidade de atraso de lookahead configurada para atrasar a pluralidade de sinais de sub-banda de forma de onda de acordo com o lookahead predeterminado, para render uma pluralidade de sinais de sub-banda de forma de onda atrasados. A unidade de expansão pode ser configurada para gerar a pluralidade de sinais de sub-banda de forma de onda expandidos expandindo-se a pluralidade de sinais de sub-banda de forma de onda atrasados. Em outras palavras, a unidade de expansão pode ser posicionada a jusante da unidade de atraso de lookahead. Isso garante sincronia entre os um ou mais parâmetros de expansão e a pluralidade de sinais de sub-banda de forma de onda, aos quais os um ou mais parâmetros de expansão são aplicáveis.
[0031] A unidade de aplicação e síntese de metadados pode ser configurada para gerar o quadro reconstruído do sinal de áudio com o uso dos metadados decodificados (de modo notório, com o uso dos metadados relacionados a SBR/HFR) para uma porção temporal da pluralidade de sinais de sub-banda de forma de onda. A porção temporal pode corresponder a um número de intervalos de tempo da pluralidade de sinais de sub-banda de forma de onda. A duração temporal da porção temporal pode ser variável, isto é, a duração temporal da porção temporal da pluralidade de sinais de sub-banda de forma de onda aos quais os metadados decodificados são aplicados pode variar de um quadro ao próximo. Em ainda outras palavras, o enquadramento para os metadados decodificados pode variar. A variação da duração temporal de uma porção temporal pode ser limitada às ligações predeterminadas. As ligações predeterminadas podem corresponder ao comprimento de quadro menos o atraso de lookahead e ao comprimento de quadro mais o atraso de lookahead, respectivamente. A aplicação dos dados de forma de onda decodificados (ou partes dos mesmos) para porções temporais de diferentes comprimentos temporais pode ser benéfica para gerenciar sinais de áudio transientes.
[0032] A unidade de expansão pode ser configurada para gerar a pluralidade de sinais de sub-banda de forma de onda expandidos com o uso dos um ou mais parâmetros de expansão para a mesma porção temporal da pluralidade de sinais de sub-banda de forma de onda. Em outras palavras, o enquadramento dos um ou mais parâmetros de expansão pode ser igual ao enquadramento para os metadados decodificados que é usado pela unidade de aplicação e síntese de metadados (por exemplo, o enquadramento para os metadados de SBR/HFR). Ao fazer isso, a consistência do esquema de SBR e do esquema de com- pansão pode ser garantida e a qualidade de percepção do sistema de codificação pode ser aprimorada.
[0033] De acordo com um aspecto adicional, um codificador de áudio configurado para codificar um quadro de um sinal de áudio em uma unidade de acesso de um fluxo de dados é descrito. O codificador de áudio pode ser configurado para realizar tarefas de processamento correspondente em relação às tarefas de processamento realizadas pelo decodificador de áudio. Em particular, o codificador de áudio pode ser configurado para determinar dados e metadados de forma de onda a partir do quadro do sinal de áudio e para inserir os dados de forma de onda e os metadados em uma unidade de acesso. Os dados de forma de onda e os metadados podem ser indicativos de um quadro reconstruído do quadro do sinal de áudio. Em outras palavras, os dados de forma de onda e os metadados podem permitir que o decodifi- cador de áudio correspondente determine uma versão reconstruída do quadro original do sinal de áudio. O quadro do sinal de áudio pode compreender um sinal de baixa banda e um sinal de alta banda. Os dados de forma de onda podem ser indicativos do sinal de baixa ban da e os metadados podem ser indicativos de um envelope espectral do sinal de alta banda.
[0034] O codificador de áudio pode compreender um caminho de processamento de forma de onda configurado para gerar os dados de forma de onda a partir do quadro do sinal de áudio, por exemplo, a partir do sinal de baixa banda (por exemplo, com o uso de um decodi- ficador de núcleo de áudio tal como um Codificador de Áudio Avançado, AAC). Ademais, o codificador de áudio compreende um caminho de processamento de metadados configurados para gerar os metadados a partir do quadro do sinal de áudio, por exemplo, a partir do sinal de alta banda e a partir do sinal de baixa banda. A título de exemplo, o codificador de áudio pode ser configurado para realizar AAC de Alta Eficiência (HE), e o decodificador de áudio correspondente pode ser configurado para decodificar o fluxo de dados recebido de acordo com AAC de HE.
[0035] O caminho de processamento de forma de onda e/ou o ca minho de processamento de metadados podem compreender pelo menos uma unidade de atraso configurada para alinhar no tempo os dados de forma de onda e os metadados de modo que a unidade de acesso para o quadro do sinal de áudio compreenda os dados de forma de onda e os metadados para o mesmo quadro do sinal de áudio. A pelo menos uma unidade de atraso pode ser configurada para alinhar no tempo os dados de forma de onda e os metadados de modo que um atraso geral do caminho de processamento de forma de onda corresponda a um atraso geral de caminho de processamento de metadados. Em particular, a pelo menos uma unidade de atraso pode ser uma unidade de atraso de forma de onda configurada para inserir um atraso adicional no caminho de processamento de forma de onda, de modo que o atraso geral do caminho de processamento de forma de onda corresponda ao atraso geral do caminho de processamento de metadados. Alternativa ou adicionalmente, a pelo menos uma unidade de atraso pode ser configurada para alinhar no tempo os dados de forma de onda e os metadados de modo que os dados de forma de onda e os metadados sejam fornecidos a uma unidade de geração de unidade de acesso do codificador de áudio no momento exato para gerar uma única unidade de acesso a partir dos dados de forma de onda e a partir dos metadados. Em particular, os dados de forma de onda e os metadados podem ser fornecidos de modo que a única unidade de acesso possa ser gerada sem a necessidade de um armazenamento temporário para armazenar temporariamente os dados de forma de onda e/ou os metadados.
[0036] O codificador de áudio pode compreender uma unidade de análise configurada para gerar uma pluralidade de sinais de sub-banda a partir do quadro do sinal de áudio, em que a pluralidade de sinais de sub-banda pode compreender uma pluralidade de sinais de baixa banda indicativos do sinal de baixa banda. O codificador de áudio pode compreender uma unidade de compressão configurada para comprimir a pluralidade de sinais de baixa banda com o uso de uma função de compressão, para fornecer uma pluralidade de sinais de baixa banda comprimidos. Os dados de forma de onda podem ser indicativos da pluralidade de sinais de baixa banda comprimidos e os metadados podem ser indicativos da função de compressão usada pela unidade de compressão. Os metadados indicativos do envelope espectral do sinal de alta banda podem ser aplicáveis à mesma porção do sinal de áudio que os metadados indicativos da função de compressão. Em outras palavras, os metadados indicativos do envelope espectral do sinal de alta banda podem estar em sincronia com os metadados indicativos da função de compressão.
[0037] De acordo com um aspecto adicional, um fluxo de dados que compreende uma sequência de unidades de acesso para uma se- quência de quadros de um sinal de áudio, respectivamente, é descrito. Uma unidade de acesso a partir da sequência de unidades de acesso compreende dados e metadados de forma de onda. Os dados de forma de onda e os metadados são associados ao mesmo quadro particular da sequência de quadros do sinal de áudio. Os dados de forma de onda e os metadados podem ser indicativos de um quadro reconstruído do quadro particular. Em um exemplo, o quadro particular do sinal de áudio compreende um sinal de baixa banda e um sinal de alta banda, em que os dados de forma de onda são indicativos do sinal de baixa banda e em que os metadados são indicativos de um envelope espectral do sinal de alta banda. Os metadados podem permitir que um decodificador de áudio gere o sinal de alta banda a partir do sinal de baixa banda, com o uso de um esquema HFR. Alternativa ou adicionalmente, os metadados podem ser indicativos de uma função de compressão aplicada ao sinal de baixa banda. Portanto, os metadados podem permitir que o decodificador de áudio realize uma expansão da faixa dinâmica do sinal de baixa banda recebido (com o uso de um inverso da função de compressão).
[0038] De acordo com um aspecto adicional, um método para de terminar um quadro reconstruído de um sinal de áudio a partir de uma unidade de acesso de um fluxo de dados recebido é descrito. A unidade de acesso compreende dados e metadados de forma de onda, em que os dados de forma de onda e os metadados são associados ao mesmo quadro reconstruído do sinal de áudio. Em um exemplo, o quadro reconstruído do sinal de áudio compreende um sinal de baixa banda e um sinal de alta banda, em que os dados de forma de onda são indicativos do sinal de baixa banda (por exemplo, de coeficientes de frequência que descrevem o sinal de baixa banda) e em que os metadados são indicativos de um envelope espectral do sinal de alta banda (por exemplo, de fatores de escala para uma pluralidade de bandas de fator de escala do sinal de alta banda). O método compreende gerar uma pluralidade de sinais de sub-banda de forma de onda a partir dos dados de forma de onda e gerar metadados decodificados a partir dos metadados. Ademais, o método compreende alinhar no tempo a pluralidade de sinais de sub-banda de forma de onda e os metadados decodificados, conforme descrito no presente documento. Adicionalmente, o método compreende gerar o quadro reconstruído do sinal de áudio a partir da pluralidade alinhada no tempo de sinais de sub-banda de forma de onda e metadados decodificados.
[0039] De acordo com outro aspecto, um método para codificar um quadro de um sinal de áudio em uma unidade de acesso de um fluxo de dados é descrito. O quadro do sinal de áudio é codificado de modo que a unidade de acesso compreenda dados e metadados de forma de onda. Os dados de forma de onda e os metadados são indicativos de um quadro reconstruído do quadro do sinal de áudio, em um exemplo, o quadro do sinal de áudio compreende um sinal de baixa banda e um sinal de alta banda, e o quadro é codificado de modo que os dados de forma de onda sejam indicativos do sinal de baixa banda e de modo que os metadados sejam indicativos de um envelope espectral do sinal de alta banda. O método compreende gerar os dados de forma de onda a partir do quadro do sinal de áudio, por exemplo, a partir do sinal de baixa banda e gerar os metadados a partir do quadro do sinal de áudio, por exemplo, a partir do sinal de alta banda e a partir do sinal de baixa banda (por exemplo, de acordo com um esquema HFR). Adicionalmente, o método compreende alinhar no tempo os dados de forma de onda e os metadados de modo que a unidade de acesso para o quadro do sinal de áudio compreenda os dados de forma de onda e os metadados para o mesmo quadro do sinal de áudio.
[0040] De acordo com um aspecto adicional, um programa de sof tware é descrito. O programa de software pode ser adaptado para exe- cução em um processador e para realizar as etapas de método destacadas no presente documento quando realizadas no processador.
[0041] De acordo com outro aspecto, um meio de armazenamento (por exemplo, um meio de armazenamento não transitório) é descrito. O meio de armazenamento pode compreender um programa de software adaptado para execução em um processador e para realizar as etapas de método destacadas no presente documento quando realizadas no processador.
[0042] De acordo com um aspecto adicional, um produto de pro grama de computador é descrito. O programa de computador pode compreender instruções executáveis para realizar as etapas de método destacadas no presente documento quando executadas em um computador.
[0043] Deve-se observar que os métodos e sistemas que incluem suas modalidades preferenciais conforme destacado no presente pedido de patente podem ser usados de forma autônoma ou em combinação com os outros métodos e sistemas revelados neste documento. Ademais, todos os aspectos dos métodos e sistemas destacados no presente pedido de patente podem ser arbitrariamente combinados. Em particular, os recursos das concretizações podem ser combinados uns com os outros de maneira arbitrária.
[0044] A invenção é explicada abaixo de maneira ilustrativa em referência aos desenhos anexos, nos quais
[0045] A Figura 1 mostra um diagrama de blocos de um decodifi- cador de áudio exemplificador;
[0046] A Figura 2a mostra um diagrama de blocos de outro decodi- ficador de áudio exemplificador;
[0047] A Figura 2b mostra um diagrama de blocos de um codifica dor de áudio exemplificador; e
[0048] A Figura 3a mostra um diagrama de blocos de um decodifi- cador de áudio exemplificador que é configurado para realizar expansão de áudio;
[0049] A Figura 3b mostra um diagrama de blocos de um codifica dor de áudio exemplificador que é configurado para realizar compressão de áudio; e
[0050] A Figura 4 ilustra um enquadramento exemplificador de uma sequência de quadros de um sinal de áudio.
[0051] Conforme indicado acima, o presente documento se refere ao alinhamento de metadados. A seguir, o alinhamento de metadados é destacado no contexto de um esquema de AAC (Codificação de Áudio Avançada) de HE (Alta Eficiência) de MPEG. Deve-se observar, no entanto, que os princípios de alinhamento de metadados que são descritos no presente documento também são aplicáveis a outros sistemas de codificação/decodificação de áudio. Em particular, os esquemas de ali-nhamento de metadados que são descritos no presente documento são aplicáveis a sistemas de codificação/decodificação de áudio que fazem uso de HFR (Reconstrução de Alta Frequência) e/ou SBR (Replicação de Largura de Banda Espectral) e que transmite metadados de HFR/SBR de um codificador de áudio a um decodificador de áudio correspondente. Ademais, os esquemas de alinhamento de metadados que são descritos no presente documento são aplicáveis a sistemas de codificação/decodificação de áudio que fazem uso de aplicações em um domínio de sub-banda (notoriamente um QMF). Um exemplo para tal aplicação é SBR. Outros exemplos são acoplamento A, pós- processamento, etc. A seguir, os esquemas de alinhamento de metadados são descritos no contexto do alinhamento de metadados de SBR. Deve-se observar, no entanto, que os esquemas de alinhamento de metadados também são aplicáveis a outros tipos de metadados, notoria- mente a outros tipos de metadados no domínio de sub-banda.
[0052] Um fluxo de dados de HE-AAC de MPEG compreende me tadados de SBR (também denominados como metadados de A-SPX). Os metadados de SBR em um quadro codificado particular do fluxo de dados (também denominados como uma AU (unidade de acesso) do fluxo de dados) tipicamente se refere a dados de forma de onda (W) no passado. Em outras palavras, os metadados de SBR e os dados de forma de onda compreendidos dentro de uma AU do fluxo de dados tipicamente correspondem ao mesmo quadro do sinal de áudio original. Isso se deve ao fato de que, após a decodificação dos dados de forma de onda, os dados de forma de onda são submetidos a várias etapas de processamento (tal como uma análise de IMDCT (Transformada Modificada Discreta de Cosseno Inversa e um QMF (Filtro em Espelho de Quadratura)) que apresentam um atraso de sinal. No ponto em que os metadados de SBR são aplicados aos dados de forma de onda, os metadados de SBR estão em sincronia com os dados de forma de onda processados. Sendo assim, os metadados de SBR e os dados de forma de onda são inseridos no fluxo de dados de HE-AAC de MPEG de modo que os metadados de SBR alcancem o decodifica- dor de áudio, quando os metadados de SBR forem necessários para processamento de SBR no decodificador de áudio. Essa forma de entrega de metadados pode ser denominada como entrega de metadados "no momento exato" (Just-In-time) (JIT), à medida que os metadados de SBR são inseridos no fluxo de dados de modo que os metadados de SBR possam ser diretamente aplicados dentro do sinal ou cadeia de processamento do decodificador de áudio.
[0053] A entrega de metadados JIT pode ser benéfica para uma cadeia de processamento de codificação - transmissão - decodificação convencional, de modo a reduzir o atraso de codificação geral e de modo a reduzir as exigências de memória no decodificador de áudio. No entanto, uma união do fluxo de dados ao longo do caminho de transmissão pode induzir a uma incompatibilidade entre os dados de forma de onda e os metadados de SBR correspondentes. Tal incompatibilidade pode induzir a artefatos audíveis no ponto de união devido ao fato de que metadados de SBR errados são usados para replicação de banda espectral no decodificador de áudio.
[0054] Em vista do supracitado, é desejado fornecer um sistema de codificação/decodificação de áudio que permite a união de fluxos de dados, enquanto, ao mesmo tempo, mantém um baixo atraso de codificação geral.
[0055] A Figura 1 mostra um diagrama de blocos de um decodifi- cador de áudio exemplificador 100 aborda o problema técnico mencionado acima. Em particular, o decodificador de áudio 100 da Figura 1 permite a decodificação de fluxos de dados com AUs 110 que compreendem os dados de forma de onda 111 de um segmento particular (por exemplo, quadro) de um sinal de áudio e que compreendem os metadados 112 correspondentes do segmento particular do sinal de áudio. Fornecendo-se decodificadores de áudio 100 que decodificam fluxos de dados que compreendem AUs 110 com dados de forma de onda 111 alinhados no tempo e metadados 112 correspondentes, a união consistente do fluxo de dados é permitida. Em particular, é garantido que o fluxo de dados pode ser dividido de tal maneira que pares correspondentes de dados de forma de onda 111 e metadados 112 sejam mantidos.
[0056] O decodificador de áudio 100 compreende uma unidade de atraso 105 dentro da cadeia de processamento dos dados de forma de onda 111. A unidade de atraso 105 pode ser colocada após ou a jusante da unidade de síntese de MDCT 102 e antes ou a montante da unidade de síntese de QMF 107 dentro do decodificador de áudio 100. Em particular, a unidade de atraso 105 pode ser colocada antes ou a montante da unidade de aplicação de metadados 106 (por exemplo, a unidade de SBR 106) que é configurada para aplicar os metadados decodificados 128 aos dados de forma de onda processados. A unidade de atraso 105 (também denominada como a unidade de atraso de forma de onda 105) é configurada para aplicar um atraso (denominado como o atraso de forma de onda) aos dados de forma de onda processados. O atraso de forma de onda é preferencialmente escolhido de modo que o atraso de processamento geral da cadeia de processamento de forma de onda ou do caminho de processamento de forma de onda (por exemplo, a partir da unidade de síntese de MDCT 102 à aplicação de metadados na unidade de aplicação de metadados 106) se resuma a exatamente um quadro (ou a um múltiplo de número inteiro do mesmo). Ao fazer isso, os dados de controle paramétricos podem ser atrasados por um quadro (ou um múltiplo do mesmo) e o alinhamento dentro da AU 110 é alcançado.
[0057] A Figura 1 mostra componentes de um decodificador de áudio exemplificador 100. Os dados de forma de onda 111 tomados a partir de uma AU 110 são decodificados e de-quantizados dentro de uma unidade de decodificação e desquantização de forma de onda 101 para fornecer uma pluralidade de coeficientes de frequência 121 (no domínio de frequência). A pluralidade de coeficientes de frequência 121 são sintetizados em um sinal de baixa banda de (domínio de tempo) 122 com o uso de uma transformada de domínio de frequência para domínio de tempo (por exemplo, uma MDCT inversa, transformada modificada discreta de cosseno) aplicada dentro da unidade de síntese de baixa banda 102 (por exemplo, a unidade de síntese de MDCT). Subsequentemente, o sinal de baixa banda 122 é transformado em uma pluralidade de sinais de baixa banda de sub-banda 123 com o uso de uma unidade de análise 103. A unidade de análise 103 pode ser configurada para aplicar um banco de filtro em espelho de quadratura (QMF) ao sinal de baixa banda 122 para fornecer a pluralidade de sinais de baixa banda de sub-banda 123. Os metadados 112 são tipicamente aplicados à pluralidade de sinais de baixa banda de sub-banda 123 (ou às versões transpostas dos mesmos).
[0058] Os metadados 112 a partir da AU 110 são decodificados e desquantizados dentro de uma unidade de decodificação e desquanti- zação de metadados 108 para fornecer os metadados decodificados 128. Ademais, o decodificador de áudio 100 pode compreender uma unidade de atraso 109 adicional (denominada como a unidade de atraso de metadados 109) que é configurada para aplicar um atraso (denominado como o atraso de metadados) aos metadados decodificados 128. O atraso de metadados pode corresponder a um múltiplo de número inteiro do comprimento de quadro N, por exemplo, D1=N, em que D1 é o atraso de metadados. Sendo assim, o atraso geral da cadeia de processamento de metadados corresponde a D1, por exemplo, D1=N.
[0059] De modo a garantir que os dados de forma de onda pro cessados (isto é, a pluralidade de sinais de baixa banda de subbanda 123 atrasados) e os metadados processados (isto é, os metadados decodificados 128 atrasados) cheguem à unidade de aplicação de metadados 106 ao mesmo tempo, o atraso geral da cadeia de processamento de forma de onda (ou caminho) deve corresponder ao atraso geral da cadeia (ou caminho) de processamento de metadados (isto é, ao D1). Dentro da cadeia de processamento de forma de onda, a unidade de síntese de baixa banda 102 insere tipicamente um atraso de N/2 (isto é, de metade do comprimento de quadro). A unidade de análise 103 insere tipicamente um atraso fixado (por exemplo, de 320 amostras). Ademais, um lookahead (isto é, um deslocamento fixado entre metadados e dados de forma de onda) pode precisar ser levado em consideração. No caso de HE-AAC de MPEG, tal lookahead de SBR pode corresponder a 384 amostras (represen- tadas pela unidade de lookahead 104). A unidade de lookahead 104 (que também pode ser denominada como a unidade de atraso de lookahead 104) pode ser configurada para atrasar os dados de forma de onda 111 (por exemplo, atrasar a pluralidade de sinais de baixa banda de sub-banda 123) por um atraso de lookahead de SBR fixado. O atraso de lookahead permite que um codificador de áudio correspondente determine os metadados de SBR com base em um quadro do sinal de áudio sucessor.
[0060] De modo a fornecer um atraso geral da cadeia de proces samento de metadados que corresponde a um atraso geral da cadeia de processamento de forma de onda, o atraso de forma de onda D2 deve se dar de modo que: D1= 320+384+ D2+N/2,
[0061] isto é, D2 = N/2 - 320 - 384 (no caso de Di=N).
[0062] A Tabela 1 mostra os atrasos de forma de onda D2 para uma pluralidade de diferentes comprimentos de quadro N. Pode-se observar que o atraso máximo de forma de onda D2 para os diferentes comprimentos de quadro N de HE-AAC é 928 amostras com uma la- tência de decodificador máxima geral de 2.177 amostras. Em outras palavras, o alinhamento dos dados de forma de onda 111 e dos metadados 112 correspondentes dentro de uma única AU 110 resulta em um máximo de atraso de PCM adicional de 928 amostras. Para o bloco de tamanhos de quadro N=1920/1536, os metadados são atrasados em 1 quadro, e para tamanhos de quadro N=960/768/512/384 os metadados são atrasados em 2 quadros. Isso significa que o atraso de desempenho no decodificador de áudio 100 é aumentado em dependência do tamanho de bloco N, e o atraso de codificação geral é aumentado em 1 ou 2 quadros completos. O atraso de PCM máximo no codificador de áudio correspondente é 1.664 amostras (correspondente à latência inerente do decodificador de áudio 100).
[0063] Sendo assim, é proposto no presente documento abordar a desvantagem de metadados JIT, por meio de uso de metadados alinhados por sinal 112 (SAM) que são alinhados com os dados de forma de onda 111 correspondentes em uma única AU 110. Em particular, é proposto introduzir uma ou mais unidades de atraso adicionais em um decodificador de áudio 100 e/ou em um codificador de áudio correspondente de modo que cada quadro codificado (ou AU) porte os (por exemplo, A-SPX) metadados que o mesmo usa em um estágio de processamento posterior, por exemplo, no estágio de processamento quando os metadados forem aplicados aos dados de forma de onda subjacentes.
[0064] Deve-se observar que - em princípio - poderia ser conside rado aplicar um atraso de metadados D1 que corresponde a uma fração do comprimento de quadro N. Ao fazer isso, o atraso de codificação geral poderia ser possivelmente reduzido. No entanto, conforme mostrado, por exemplo, na Figura 1, o atraso de metadados D1 é aplicado no domínio de QMF (isto é, no domínio de sub-banda). Em vista disso e em vista do fato de que os metadados 112 são tipicamente somente definidos uma vez por quadro, isto é, em vista do fato de que os metadados 112 compreendem tipicamente um conjunto de parâmetros dedicados por quadro, a inserção de um atraso de metadados D1 que corresponde a uma fração de um comprimento de quadro N pode induzir a problemas de sincronização em relação aos dados de forma de onda 111. Por outro lado, o atraso de forma de onda D2 é aplicado no domínio de tempo (conforme mostrado na Figura 1), em que os atrasos que correspondem a uma fração de um quadro podem ser implantados de maneira precisa (por exemplo, atrasando-se o domínio de tempo sinal por um número de amostras que corresponde ao atraso de forma de onda D2). Portanto, é benéfico atrasar os metadados 112 por múltiplos de número inteiro de um quadro (em que o quadro corresponde à menor resolução de tempo para a qual os metadados 112 são definidos) e atrasar os dados de forma de onda 111 por um atraso de forma de onda D2 que pode tomar valores arbitrários. Um atraso de metadados D1 que corresponde a um múltiplo de número inteiro do comprimento de quadro N pode ser implantado no domínio de subbanda de maneira precisa, e um atraso de forma de onda D2 que corresponde a um múltiplo arbitrário de uma amostra pode ser implantado no domínio de tempo de maneira precisa. Consequentemente, a combinação de um atraso de metadados D1 e um atraso de forma de onda D2 permite uma sincronização exata dos metadados 112 e dos dados de forma de onda 111.
[0065] Deve-se observar que - em princípio - poderia ser conside rado aplicar um atraso de metadados D1 que corresponde a uma fração do comprimento de quadro N. Ao fazer isso, o atraso de codificação geral poderia ser possivelmente reduzido. No entanto, conforme mostrado, por exemplo, na Figura 1, o atraso de metadados D1 é aplicado no domínio de QMF (isto é, no domínio de sub-banda). Em vista disso e em vista do fato de que os metadados 112 são tipicamente somente definidos uma vez por quadro, isto é, em vista do fato de que os metadados 112 compreendem tipicamente um conjunto de parâmetros dedicados por quadro, a inserção de um atraso de metadados D1 que corresponde a uma fração de um comprimento de quadro N pode induzir a problemas de sincronização em relação aos dados de forma de onda 111. Por outro lado, o atraso de forma de onda D2 é aplicado no domínio de tempo (conforme mostrado na Figura 1), em que os atrasos que correspondem a uma fração de um quadro podem ser implantados de maneira precisa (por exemplo, atrasando-se o domínio de tempo sinal por um número de amostras que corresponde ao atraso de forma de onda D2). Portanto, é benéfico atrasar os metadados 112 por múltiplos de número inteiro de um quadro (em que o quadro corresponde à menor resolução de tempo para a qual os metadados 112 são definidos) e atrasar os dados de forma de onda 111 por um atraso de forma de onda D2 que pode tomar valores arbitrários. Um atraso de metadados D1 que corresponde a um múltiplo de número inteiro do comprimento de quadro N pode ser implantado no domínio de subbanda de maneira precisa, e um atraso de forma de onda D2 que corresponde a um múltiplo arbitrário de uma amostra pode ser implantado no domínio de tempo de maneira precisa. Consequentemente, a combinação de um atraso de metadados D1 e um atraso de forma de onda D2 permite uma sincronização exata dos metadados 112 e dos dados de forma de onda 111.
[0066] A aplicação de um atraso de metadados D1 que corresponde a uma fração do comprimento de quadro N poderia ser implantada por reamostragem dos metadados 112, de acordo com o atraso de metadados D1. No entanto, a reamostragem dos metadados 112 envolve tipicamente custos computacionais substanciais. Ademais, a reamostra- gem dos metadados 112 pode levar a uma distorção dos metadados 112, afetando assim a qualidade do quadro reconstruído do sinal de áudio. Em vista disso, é benéfico, em vista da eficiência computacional e em vista de qualidade de áudio, para limitar o atraso de metadados D1 aos múltiplos de número inteiro do comprimento de quadro N.
[0067] A Figura 1 também mostra o processamento adicional dos metadados 128 atrasados e a pluralidade de sinais de baixa banda de sub-banda 123 atrasados. A unidade de aplicação de metadados 106 é configurada para gerar uma pluralidade de sinais de sub-banda de alta banda (por exemplo, escalonados) 126 com base na pluralidade de sinais de baixa banda de sub-banda 123 e com base nos metadados 128. Para esse propósito, a unidade de aplicação de metadados 106 pode ser configurada para transpor um ou mais dentre a pluralidade de sinais de baixa banda de sub-banda 123 para gerar uma pluralidade de sinais de sub-banda de alta banda. A transposição pode compreender um processo de cópia dos um ou mais dentre a pluralidade de sinais de baixa banda de sub-banda 123. Ademais, a unidade de aplicação de metadados 106 pode ser configurada para aplicar os metadados 128 (por exemplo, fatores de escala compreendidos dentro dos metadados 128) à pluralidade de sinais de sub-banda de alta banda, de modo a gerar a pluralidade de sinais de sub-banda de alta banda escalonados 126. A pluralidade de sinais de sub-banda de alta banda escalonados 126 é tipicamente escalonada com o uso dos fatores de escala, de modo que o envelope espectral da pluralidade de sinais de sub-banda de alta banda escalonados 126 simule o envelope espectral do sinal de alta banda de um quadro original do sinal de áudio (que corresponde a um quadro reconstruído do sinal de áudio 127 que é gerado com base na pluralidade de sinais de baixa banda de sub-banda 123 e a partir da pluralidade de sinais de sub-banda de alta banda escalonados 126).
[0068] Ademais, o decodificador de áudio 100 compreende uma unidade de síntese 107 configurada para gerar o quadro reconstruído de um sinal de áudio 127 a partir da pluralidade de sinais de baixa banda de sub-banda 123 e a partir da pluralidade de sinais de subbanda de alta banda escalonados 126 (por exemplo, com o uso de um banco de QMF inverso).
[0069] A Figura 2a mostra um diagrama de blocos de outro decodi- ficador de áudio exemplificador 100. O decodificador de áudio 100 da Figura 2a compreende os mesmos componentes que o decodificador de áudio 100 da Figura 1. Ademais, componentes 210 exemplificadores para processamento de áudio de múltiplos canais são ilustrados. Pode- se observar que, no exemplo da Figura 2a, a unidade de atraso de forma de onda 105 é posicionada diretamente subsequente à unidade de MDCT Inversa 102. A determinação de um quadro reconstruído de um sinal de áudio 127 pode ser realizada para cada canal de um sinal de áudio de múltiplos canais (por exemplo, de um sinal de áudio de múltiplos canais de 5,1 ou um sinal de áudio de múltiplos canais de 7,1).
[0070] A Figura 2b mostra um diagrama de blocos de um codifica dor de áudio exemplificador 250 correspondente ao decodificador de áudio 100 da Figura 2a. O codificador de áudio 250 é configurado para gerar um fluxo de dados que compreende AUs 110 que porta pares de dados de forma de onda 111 e metadados 112 correspondentes. O codificador de áudio 250 compreende uma cadeia de processamento de metadados 256, 257, 258, 259, 260 para determinar os metadados. A cadeia de processamento de metadados pode compreender uma unidade de atraso de metadados 256 para alinhar os metadados com os dados de forma de onda correspondentes. No exemplo ilustrado, a unidade de atraso de metadados 256 do codificador de áudio 250 não introduz nenhum atraso adicional (devido ao fato de que o atraso in-troduzido pela cadeia de processamento de metadados é maior do que o atraso introduzido pela cadeia de processamento de forma de onda).
[0071] Ademais, o codificador de áudio 250 compreende uma ca deia de processamento de forma de onda 251, 252, 253, 254, 255 configurada para determinar os dados de forma de onda a partir de um sinal de áudio original na entrada do codificador de áudio 250. A cadeia de processamento de forma de onda compreende uma unidade de atraso de forma de onda 252 configurada para introduzir um atraso adicional à cadeia de processamento de forma de onda, de modo a alinhar os dados de forma de onda com os metadados correspondentes. O atraso que é introduzido pela unidade de atraso de forma de onda 252 pode se dar de modo que o atraso geral da cadeia de processamento de metadados (incluindo o atraso de forma de onda inserido pela unidade de atraso de forma de onda 252) corresponde ao atraso geral da cadeia de processamento de forma de onda. No caso de um comprimento de quadro N = 2,048, o atraso da unidade de atra-so de forma de onda 252 pode ser 2,048 - 320 = 1,728 amostras.
[0072] A Figura 3a mostra um excerto de um decodificador de áu dio 300 que compreende uma unidade de expansão 301. O decodifi- cador de áudio 300 da Figura 3a pode corresponder ao decodificador de áudio 100 das Figuras 1 e/ou 2a e compreende adicionalmente a unidade de expansão 301 que é configurada para determinar uma pluralidade de sinais de baixa banda expandidos a partir da pluralidade de sinais de baixa banda 123, com o uso de um ou mais parâmetros de expansão 310 tomados a partir dos metadados decodificados 128 de uma unidade de acesso 110. Tipicamente, os um ou mais parâmetros de expansão 310 são acoplados com SBR (por exemplo, A-SPX) metadados compreendidos dentro de uma unidade de acesso 110. Em outras palavras, os um ou mais parâmetros de expansão 310 são tipicamente aplicáveis ao mesmo excerto ou porção de um sinal de áudio que os metadados de SBR.
[0073] Conforme destacado acima, os metadados 112 de uma unidade de acesso 110 são tipicamente associados aos dados de forma de onda 111 de um quadro de um sinal de áudio, em que o quadro compreende um número N predeterminado de amostras. Os metadados de SBR são tipicamente determinados com base em uma pluralidade de sinais de baixa banda (também denominados como uma plu- ralidade de sinais de sub-banda de forma de onda), em que a pluralidade de sinais de baixa banda pode ser determinada com o uso de uma análise de QMF. A análise de QMF rende uma representação de frequência de tempo de um quadro de um sinal de áudio. Em particular, as N amostras de um quadro de um sinal de áudio podem ser representadas por Q (por exemplo, Q=64) sinais de baixa banda, em que cada uma compreende N/Q intervalos de tempo ou intervalos. Para um quadro com N=2.048 amostras e for Q=64, cada sinal de baixa banda compreende N/Q=32 intervalos.
[0074] No caso de um transiente dentro de um quadro particular, pode ser benéfico determinar os metadados de SBR com base nas amostras de um quadro diretamente sucessor. Esse recurso é denominado como o lookahead de SBR. Em particular, os metadados de SBR podem ser determinados com base em um número predeterminado de intervalos a partir do quadro sucessor. A título de exemplo, até 6 intervalos do quadro sucessor podem ser levados em consideração (isto é, Q*6=384 amostras).
[0075] O uso do lookahead de SBR é ilustrado na Figura 4 que mostra uma sequência de quadros 401, 402, 403 de um sinal de áudio, com o uso de enquadramentos diferentes 400, 430 para o esquema de SBR ou HFR. No caso de enquadramento 400, o esquema de SBR/HFR não faz uso da flexibilidade fornecida pelo lookahead de SBR. Todavia, um deslocamento fixado, isto é, um atraso de lookahead de SBR fixado, 480 é usado para permitir o uso do lookahead de SBR. No exemplo ilustrado, o deslocamento fixado corresponde a 6 intervalos de tempo. Como resultado desse deslocamento fixado 480, os metadados 112 de uma unidade de acesso 110 particular de um quadro particular 402 é particularmente aplicável a intervalos de tempo de dados de forma de onda 111 compreendidos dentro da unidade de acesso 110 que precede a unidade de acesso 110 particular (e que é associada ao quadro diretamente precedente 401). Isso é ilustrado pelo deslocamento entre os metadados de SBR 411, 412, 413 e os quadros 401, 402, 403. Portanto, os metadados de SBR 411, 412, 413 compreendidos dentro de uma unidade de acesso 110 podem ser aplicáveis aos dados de forma de onda 111 que são deslocados pelo atraso de lookahead de SBR 480. Os metadados de SBR 411, 412, 413 são aplicados aos dados de forma de onda 111 para fornecer os quadros reconstruídos 421, 422, 423.
[0076] O enquadramento 430 faz uso do lookahead de SBR. Po de-se observar que os metadados de SBR 431 são aplicáveis a mais do que 32 intervalos de tempo de dados de forma de onda 111, por exemplo, devido à ocorrência de um transiente dentro do quadro 401. Por outro lado, os metadados de SBR 432 sucessores são aplicáveis a menos do que 32 intervalos de tempo de dados de forma de onda 111. Os metadados de SBR 433 são novamente aplicáveis a 32 intervalos de tempo. Portanto, o lookahead de SBR permite flexibilidade em relação à resolução temporal dos metadados de SBR. Deve-se observar que, independentemente do uso de o lookahead de SBR e independentemente da aplicabilidade dos metadados de SBR 431, 432, 433, os quadros reconstruídos 421, 422, 423 são gerados com o uso de um deslocamento fixado 480 em relação aos quadros 401, 402, 403.
[0077] Um codificador de áudio pode ser configurado para deter minar os metadados de SBR e os um ou mais parâmetros de expansão com o uso do mesmo excerto ou porção do sinal de áudio. Portanto, se os metadados de SBR forem determinados com o uso de um lookahead de SBR, os um ou mais parâmetros de expansão podem ser determinados e podem ser aplicáveis ao mesmo lookahead de SBR. Em particular, os um ou mais parâmetros de expansão podem ser aplicáveis ao mesmo número de intervalos de tempo que os metadados de SBR correspondentes 431, 432, 433.
[0078] A unidade de expansão 301 pode ser configurada para aplicar um ou mais ganhos de expansão à pluralidade de sinais de baixa banda 123, em que os um ou mais ganhos de expansão dependem tipicamente dos um ou mais parâmetros de expansão 310. Em particular, os um ou mais parâmetros de expansão 310 podem ter um impacto em uma ou mais regras de compressão/expansão que são usados para determinar os um ou mais ganhos de expansão. Em outras palavras, os um ou mais parâmetros de expansão 310 podem ser indicativos da função de compressão que foi usada por uma unidade de compressão do codificador de áudio correspondente. Os um ou mais parâmetros de expansão 310 podem permitir que o decodificador de áudio determine o inverso dessa função de compressão.
[0079] Os um ou mais parâmetros de expansão 310 podem com preender um primeiro parâmetro de expansão indicativo de se o codificador de áudio correspondente comprimiu ou não a pluralidade de sinais de baixa banda. Se nenhuma compressão foi aplicada, então nenhuma expansão será aplicada pelo decodificador de áudio. Sendo assim, o primeiro parâmetro de expansão pode ser usado para acionar ou desativar o recurso de compansão.
[0080] Alternativa ou adicionalmente, os um ou mais parâmetros de expansão 310 podem compreender um segundo parâmetro de expansão indicativo de se os mesmos um ou mais ganhos de expansão devem ou não ser aplicados a todos os canais de um sinal de áudio de múltiplos canais. Sendo assim, o segundo parâmetro de expansão pode comutar entre uma aplicação por canal ou uma aplicação de múltiplos canais do recurso de compansão.
[0081] Alternativa ou adicionalmente, os um ou mais parâmetros de expansão 310 podem compreender um terceiro parâmetro de expansão indicativo de se se aplica ou não os mesmos um ou mais ganhos de expansão a todos os intervalos de tempo de um quadro. Sen- do assim, o terceiro parâmetro de expansão pode ser usado para controlar a resolução temporal do recurso de compansão.
[0082] Com o uso dos um ou mais parâmetros de expansão 310, a unidade de expansão 301 pode determinar a pluralidade de sinais de baixa banda expandidos, aplicando-se o inverso de uma função de compressão aplicada ao codificador de áudio correspondente. A função de compressão que foi aplicada ao codificador de áudio correspondente é sinalizada ao decodificador de áudio 300 com o uso dos um ou mais parâmetros de expansão 310.
[0083] A unidade de expansão 301 pode ser posicionada a jusante da unidade de atraso de lookahead 104. Isso garante que os um ou mais parâmetros de expansão 310 sejam aplicados à porção correta da pluralidade de sinais de baixa banda 123. Em particular, isso garante que os um ou mais parâmetros de expansão 310 sejam aplicados à mesma porção da pluralidade de sinais de baixa banda 123 como os parâmetros de SBR (dentro da unidade de aplicação de SBR 106). Sendo assim, é garantido que a expansão opera no mesmo enquadramento de tempo 400, 430 que o esquema de SBR. Devido ao lookahead de SBR, o enquadramento 400, 430 pode compreender um número variável de intervalos de tempo, e por consequência, a expansão pode operar em um número variável de intervalos de tempo (conforme destacado no contexto da Figura 4). Colocando-se a unidade de expansão 301 a jusante da unidade de atraso de lookahead 104, é garantido que o enquadramento 400, 430 correto seja aplicado aos um ou mais parâmetros de expansão. Como resultado disso, um sinal de áudio de alta qualidade pode ser garantido, mesmo subsequente a um ponto de união.
[0084] A Figura 3b mostra um excerto de um codificador de áudio 350 que compreende uma unidade de compressão 351. O codificador de áudio 350 pode compreender os componentes do codificador de áudio 250 da Figura 2b. A unidade de compressão 351 pode ser configurada para comprimir (por exemplo, reduzir a faixa dinâmica) da pluralidade de sinais de baixa banda, com o uso de uma função de compressão. Ademais, a unidade de compressão 351 pode ser configurada para determinar um ou mais parâmetros de expansão 310 que são indicativos da função de compressão que foi usada pela unidade de compressão 351, para permitir que uma unidade de expansão 301 correspondente de um decodificador de áudio 300 aplique um inverso da função de compressão.
[0085] A compressão da pluralidade de sinais de baixa banda po de ser realizada a jusante de um lookahead de SBR 258. Ademais, o codificador de áudio 350 pode compreender uma unidade de enquadramento de SBR 353 que é configurada para garantir que os metadados de SBR sejam determinados para a mesma porção do sinal de áudio que os um ou mais parâmetros de expansão 310. Em outras palavras, a unidade de enquadramento de SBR 353 pode garantir que o esquema de SBR opere no mesmo enquadramento 400, 430 que o esquema de compansão. Em vista do fato de que o esquema de SBR pode operar em quadros estendidos (por exemplo, no caso de transientes), o esquema de compansão também pode operar em quadros estendidos (que compreendem intervalos de tempo adicionais).
[0086] No presente documento, um codificador de áudio e um de- codificador de áudio correspondente foram descritos que permitem a codificação de um sinal de áudio em uma sequência de AUs alinhados no tempo que compreende dados e metadados de forma de onda associados a uma sequência de segmentos do sinal de áudio, respectivamente. O uso de AUs alinhados no tempo permite a união de fluxos de dados com artefatos reduzidos nos pontos de união. Ademais, o codificador de áudio e decodificador de áudio são projetados de modo que os fluxos de dados que podem ser unidos sejam processados de maneira computacionalmente eficiente e de modo que o atraso de codificação geral permaneça baixo.
[0087] Os métodos e sistemas descritos no presente documento podem ser implantados como software, firmware e/ou hardware. Determinados componentes podem, por exemplo, ser implantados como software em execução em um processador ou microprocessador de sinal digital. Outros componentes podem, por exemplo, ser implantados como hardware e/ou como circuitos integrados de aplicação específica. Os sinais encontrados nos métodos descritos e sistemas podem ser armazenados em mídia tal como memória de acesso aleatório ou mídia de armazenamento óptico. Os mesmos podem ser transferidos por meio de redes, tais como redes de rádio, redes de satélite, redes sem fio ou redes com fio, por exemplo, a Internet. Dispositivos típicos que fazem uso dos métodos e sistemas descritos no presente docu-mento são dispositivos eletrônicos portáteis ou outro equipamento de consumidor que são usados para armazenar e/ou criar sinais de áudio.
Claims (9)
1. Decodificador de áudio caracterizado pelo fato de que compreende: um processador para processar um caminho de processamento de forma de onda configurado para gerar pelo menos um sinal de forma de onda a partir de dados de forma de onda obtidos de uma unidade de acesso de um fluxo de dados de um sinal de áudio; um processador de metadados para processar um caminho de processamento de metadados configurado para gerar metadados decodificados a partir de metadados obtidos a partir da unidade de acesso, o caminho de processamento de metadados compreendendo uma unidade de atraso de metadados configurada para atrasar os metadados decodificados por um atraso, em que o atraso tem um valor maior do que zero, em que o valor do atraso é um primeiro número inteiro, e em que o primeiro número inteiro multiplicado por um segundo número inteiro resulta em uma valor que é igual a um comprimento de quadro; e uma unidade de aplicação e síntese de metadados configurada para gerar um quadro reconstruído do sinal de áudio a partir do pelo menos um sinal de forma de onda e dos metadados decodificados, em que pelo menos um dentre o caminho de processamento de forma de onda ou o caminho de processamento de metadados compreende pelo menos uma unidade de retardo configurada para alinhar no tempo o pelo menos um sinal de forma de onda e os metadados decodificados.
2. Decodificador de áudio, de acordo com a reivindicação 1, caracterizado pelo fato de que um atraso fixo é introduzido por uma unidade de análise que corresponde a 320 amostras do sinal de áudio.
3. Decodificador de áudio, de acordo com a reivindicação 1, caracterizado pelo fato de que um atraso geral do caminho de pro- cessamento da forma de onda depende de um dentre: um sinal de fluxo de bits codificado ou um lookahead pré-determinado entre metadados e dados de forma de onda.
4. Decodificador de áudio, de acordo com a reivindicação 1, caracterizado pelo fato de que o pelo menos um sinal de forma de onda e os metadados decodificados são alinhados no tempo, de modo que um atraso geral do caminho de processamento de forma de onda corresponde a um atraso geral do caminho de processamento de metadados.
5. Decodificador de áudio, de acordo com a reivindicação 1, caracterizado pelo fato de que o pelo menos um sinal de forma de onda e os metadados decodificados são alinhados no tempo, de modo que o pelo menos um sinal de forma de onda e os metadados decodificados são fornecidos para a unidade de aplicação e síntese de metadados just-in-time para o processamento realizado pela unidade de aplicação e síntese de metadados.
6. Método caracterizado pelo fato de que compreende: gerar, usando um caminho de processamento de forma de onda, pelo menos um sinal de forma de onda a partir de dados de forma de onda dos dados de forma de onda; gerar, usando um caminho de processamento de metadados, dados decodificados a partir de metadados obtidos a partir de uma unidade de acesso de um fluxo de dados de um sinal de áudio, o caminho de processamento de metadados compreendendo uma unidade de atraso de metadados configurada para atrasar os metadados decodificados por um atraso, em que o atraso tem um valor maior do que zero, em que o valor do atraso é um primeiro número inteiro, e em que o primeiro número inteiro multiplicado por um segundo número inteiro resulta em uma valor que é igual a um comprimento de quadro; e gerar, usando uma unidade de aplicação e síntese de metadados, um quadro reconstruído do sinal de áudio a partir do pelo menos um sinal de forma de onda e dos metadados decodificados, em que pelo menos um dentre o caminho de processamento de forma de onda ou o caminho de processamento de metadados compreende pelo menos uma unidade de retardo configurada para alinhar no tempo o pelo menos um sinal de forma de onda e os metadados decodificados.
7. Método, de acordo com a reivindicação 6, caracterizado pelo fato de que o pelo menos um sinal de forma de onda e os metadados decodificados são alinhados no tempo, de modo que um atraso geral do caminho de processamento de forma de onda corresponde a um atraso geral do caminho de processamento de metadados.
8. Método, de acordo com a reivindicação 6, caracterizado pelo fato de que o pelo menos um sinal de forma de onda e os metadados decodificados são alinhados no tempo, de modo que o pelo menos um sinal de forma de onda e os metadados decodificados são fornecidos para a unidade de aplicação e síntese de metadados justin-time para o processamento realizado pela unidade de aplicação e síntese de metadados.
9. Meio de armazenamento não transitório caracterizado pelo fato de que armazena instruções que, quando executadas por um processador, realizam o método conforme definido em qualquer uma das reivindicações 6 a 8.
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361877194P | 2013-09-12 | 2013-09-12 | |
US61/877,194 | 2013-09-12 | ||
US201361909593P | 2013-11-27 | 2013-11-27 | |
US61/909,593 | 2013-11-27 | ||
PCT/EP2014/069039 WO2015036348A1 (en) | 2013-09-12 | 2014-09-08 | Time- alignment of qmf based processing data |
BR112016005167-0A BR112016005167B1 (pt) | 2013-09-12 | 2014-09-08 | Decodificador de áudio, codificador de áudio e método para alinhamento no tempo de dados de processamento baseados em qmf |
Publications (1)
Publication Number | Publication Date |
---|---|
BR122017019118B1 true BR122017019118B1 (pt) | 2022-04-26 |
Family
ID=80214450
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR122020017844-2A BR122020017844B1 (pt) | 2013-09-12 | 2014-09-08 | Decodificador e codificador de áudio para alinhamento no tempo de dados de processamento baseados em qmf |
BR122020017854-0A BR122020017854B1 (pt) | 2013-09-12 | 2014-09-08 | Decodificador e codificador de áudio para alinhamento no tempo de dados de processamento baseados em qmf |
BR122017019118-7A BR122017019118B1 (pt) | 2013-09-12 | 2014-09-08 | Decodificador de áudio, método e meio de armazenamento não transitório |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR122020017844-2A BR122020017844B1 (pt) | 2013-09-12 | 2014-09-08 | Decodificador e codificador de áudio para alinhamento no tempo de dados de processamento baseados em qmf |
BR122020017854-0A BR122020017854B1 (pt) | 2013-09-12 | 2014-09-08 | Decodificador e codificador de áudio para alinhamento no tempo de dados de processamento baseados em qmf |
Country Status (1)
Country | Link |
---|---|
BR (3) | BR122020017844B1 (pt) |
-
2014
- 2014-09-08 BR BR122020017844-2A patent/BR122020017844B1/pt active IP Right Grant
- 2014-09-08 BR BR122020017854-0A patent/BR122020017854B1/pt active IP Right Grant
- 2014-09-08 BR BR122017019118-7A patent/BR122017019118B1/pt active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
BR122020017844B1 (pt) | 2022-01-25 |
BR122020017854B1 (pt) | 2022-01-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7490722B2 (ja) | Qmfベースの処理データの時間整列 | |
USRE47824E1 (en) | Method and apparatus for encoding and decoding high frequency band | |
BR122021014312B1 (pt) | Aparelho e método para processar um sinal de áudio utilizando alinhamento de borda de patch | |
BR122020007866B1 (pt) | Sistema configurado para gerar um componente de alta frequência de um sinal de áudio, método para gerar um componente de alta frequência de um sinal de áudio e método para projetar um transpositor de harmônicos | |
KR20160079878A (ko) | 낮은 계산 자원들로 인코딩된 오디오 신호를 디코딩하기 위한 장치 및 방법 | |
BR122017019118B1 (pt) | Decodificador de áudio, método e meio de armazenamento não transitório | |
KR102713162B1 (ko) | Qmf 기반 처리 데이터의 시간 정렬 | |
RU2772778C2 (ru) | Временное согласование данных обработки на основе квадратурного зеркального фильтра | |
KR20240149975A (ko) | Qmf 기반 처리 데이터의 시간 정렬 | |
Helmrich | Efficient Perceptual Audio Coding Using Cosine and Sine Modulated Lapped Transforms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06U | Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette] | ||
B06A | Patent application procedure suspended [chapter 6.1 patent gazette] | ||
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 08/09/2014, OBSERVADAS AS CONDICOES LEGAIS. |
|
B25G | Requested change of headquarter approved |
Owner name: DOLBY INTERNATIONAL AB (IE) |