BRPI0517234B1 - Decodificador para gerar um sinal de áudio, codificador para codificar um sinal de áudio, métodos para gerar e para codificar um sinal de áudio, receptor para receber um sinal de áudio, transmissor e sistema de transmissão para transmitir um sinal de áudio, métodos para receber, transmitir, e transmitir e receber um sinal de áudio, meio de armazenamento legível por computador, equipamento reprodutor de áudio, e, equipamento gravador de áudio - Google Patents

Decodificador para gerar um sinal de áudio, codificador para codificar um sinal de áudio, métodos para gerar e para codificar um sinal de áudio, receptor para receber um sinal de áudio, transmissor e sistema de transmissão para transmitir um sinal de áudio, métodos para receber, transmitir, e transmitir e receber um sinal de áudio, meio de armazenamento legível por computador, equipamento reprodutor de áudio, e, equipamento gravador de áudio Download PDF

Info

Publication number
BRPI0517234B1
BRPI0517234B1 BRPI0517234-9A BRPI0517234A BRPI0517234B1 BR PI0517234 B1 BRPI0517234 B1 BR PI0517234B1 BR PI0517234 A BRPI0517234 A BR PI0517234A BR PI0517234 B1 BRPI0517234 B1 BR PI0517234B1
Authority
BR
Brazil
Prior art keywords
signal
subband
sub
audio signal
time domain
Prior art date
Application number
BRPI0517234-9A
Other languages
English (en)
Inventor
Lars Falck Villemoes
Erik Gosuinus Petrus Schuijers
Original Assignee
Dolby International Ab
Koninklijke Philips Electronics N.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International Ab, Koninklijke Philips Electronics N.V. filed Critical Dolby International Ab
Publication of BRPI0517234A publication Critical patent/BRPI0517234A/pt
Publication of BRPI0517234B1 publication Critical patent/BRPI0517234B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

decodificador para gerar um sinal de áudio, codificador para codificar um sinal de áudio, métodos para gerar e para codificar um sinal de áudio, receptor para receber sinal de áudio, transmissor e sistema de transmissão para transmitir um sinal de áudio, métodos para receber, para transmitir, e para transmitir e receber um sinal de audio, produto de programa de computador, equipamento reprodutor de audio, e, equipamento de gravação de áudio. um codificador (109) contém um receptor (201) o qual recebe um sinal de áudio em domínio de tempo. um banco de filtro (203) gera um sinal da primeira sub-banda do sinal de áudio em dominio de tempo onde o sinal da primeira sub-banda corresponde a uma representação complexa do domínio da sub-banda não criticamente amostrada do sinal em domínio de tempo. um processador de conversão (205) gera um sinal da segunda sub- banda do sinal da primeira sub-banda pelo processamento da sub-banda. o sinal da segunda sub-banda corresponde a uma representação do domínio da sub-banda criticamente amostrada dos sinais de áudio em domínio de tempo. um processador de codificação (207) então gera um fluxo de dados codificados na forma de onda pela codificação dos valores dos dados do sinal da segunda sub-banda. o processador de conversão (205) gera o sinal da segunda sub-banda pela direta conversão da sub-banda sem converter de volta ao domínio do tempo. a invenção permite uma super amostragem do sinal da sub-banda tipicamente gerado na codificação paramétrica para ser codificado em forma de onda com complexidade reduzida. um decodificador executa a operação inversa.

Description

“DECODIFICADOR PARA GERAR UM SINAL DE ÁUDIO, CODIFICADOR PARA CODIFICAR UM SINAL DE ÁUDIO, MÉTODOS PARA GERAR E PARA CODIFICAR UM SINAL DE ÁUDIO, RECEPTOR PARA RECEBER UM SINAL DE ÁUDIO, TRANSMISSOR E SISTEMA DE TRANSMISSÃO PARA TRANSMITIR UM SINAL DE ÁUDIO, MÉTODOS PARA RECEBER, TRANSMITIR, E TRANSMITIR E RECEBER UM SINAL DE ÁUDIO, MEIO DE ARMAZENAMENTO LEGÍVEL POR COMPUTADOR, EQUIPAMENTO REPRODUTOR DE ÁUDIO, E, EQUIPAMENTO GRAVADOR DE ÁUDIO” [001] A invenção se relaciona à codificação e/ou à decodificação dos sinais de áudio e, em particular, à codificação e/ou à decodificação de um sinal de áudio.
[002] Codificação digital de vários sinais fontes tem se tornado cada vez mais importante nas últimas décadas assim como a representação e a comunicação de sinal digital cada vez mais substitui a representação e a comunicação analógica. Por exemplo, sistemas telefônicos móveis, tal como o Sistema Global para comunicação Móvel, são baseados na codificação digital da voz. Também a distribuição do conteúdo da mídia, tais como o vídeo e a música, é cada vez mais baseada na codificação digital de conteúdo.
[003] Tradicionalmente, aquela codificação de áudio tem empregado predominantemente a codificação por forma de onda onde a ondulação implícita foi digitalizada e codificada eficientemente. Por exemplo, um codificador por forma de onda típico contém um banco de filtro convertendo o sinal para uma frequência do domínio da sub-banda. Baseado em um modelo psíquico - acústico, uma malha de máscara é aplicada e os valores da sub-banda resultantes são eficientemente quantificados e codificados, por exemplo, usando um código Huffman.
[004] Exemplos de codificadores por forma de onda incluem a bem conhecida Camada 3 MPEG-1 (frequentemente referida como MP3) ou esquemas de codificação AAC (Codificação de Áudio Avançada).
Petição 870180137907, de 04/10/2018, pág. 16/64 / 34 [005] Nos anos recentes, um número de técnicas de codificação tem sido proposto, as quais não codificam diretamente a implícita forma de onda, mas preferem caracterizar sinais codificados por um número de parâmetros. Por exemplo, a codificação da voz, o codificador e o codificador podem ser baseados em um modelo do trato da voz humana e ao invés de codificar a forma de onda, vários parâmetros e sinais de excitação para o modelo podem ser codificados. Tais técnicas são geralmente referenciadas como técnicas de codificação paramétricas.
[006] Além do mais, a codificação por forma de onda e a codificação paramétrica podem ser combinadas para proporcionar uma codificação mais particularmente eficiente e de alta qualidade. Em tais sistemas, os parâmetros podem descrever parte do sinal com referência a uma outra parte do sinal o qual foi codificado por forma de onda. Por exemplo, técnicas de codificação foram propostas onde as frequências mais baixas são codificadas por forma de onda e as frequências mais altas são codificadas por extensão paramétrica que descreve as propriedades das frequências mais altas relativas às frequências mais baixas. Como um outro exemplo, a codificação do sinal multicanal foi proposta onde, por exemplo, um sinal mono é codificado por forma de onda e uma extensão paramétrica inclui dados de parâmetros indicando como os canais individuais variam do sinal comum.
[007] Exemplos das técnicas de codificação de extensão paramétrica incluem técnicas de Replicação da Banda Espectral (SBR), Estéreo Paramétrica
X (PS) e Codificação de Áudio Espacial (SAC).
[008] Atualmente técnica SAC está sendo desenvolvida para codificar eficientemente os sinais de áudio multicanais. Essa tecnologia é parcialmente baseada na técnica de codificação PS. Similarmente ao paradigma PS, o SAC é baseado na noção de que um sinal multicanal, consistindo de M canais, pode ser eficientemente representado por um sinal consistindo de N canais, com N < M, e uma pequena quantidade de parâmetros representando as sugestões
Petição 870180137907, de 04/10/2018, pág. 17/64 / 34 especiais. Os parâmetros especiais podem ser colocados na parte dos dados auxiliares do núcleo do fluxo de dados mono ou estéreo para formar uma extensão reversa compatível.
[009] Como as técnicas SBR e PS, a SAC usa os bancos complexos (pseudo) do Filtro de Espelho da Quadratura (QMF) de forma a transformar as representações do domínio do tempo para representações do domínio da frequência (e vice-versa). Uma característica desses bancos de filtro é que os sinais no domínio da sub-banda de valores complexos são amostrados de modo eficaz por um valor de dois. Isto habilita as operações após o processamento dos sinais do domínio da sub-banda sem introduzir distorções falsas.
[0010] Uma outra característica comum para extensões paramétricas é que sob condições típicas, essas técnicas não adquirem um nível de qualidade de áudio transparente, i.e., que alguma degradação da qualidade é introduzida. [0011] De forma a estender as extensões paramétricas como SBR, PS e SAC em direção a uma qualidade de áudio transparente seria desejável codificar certas partes, por exemplo, um certo número de bandas, dos sinais complexos em domínio da sub-banda com o uso de um codificador por forma de onda.
[0012] Uma abordagem mais direta consiste de primeiro transformar essas partes do domínio complexo da sub-banda de volta ao domínio do tempo. Um codificador por forma de onda existente (por exemplo, AAC) pode então ser aplicado aos sinais resultantes do domínio do tempo. No entanto, tal abordagem como esta é associada com um número de desvantagens.
[0013] A publicação “Low Complexity Parametric Stereo Coding in
MPEG-4 ”, Proceedings of the 7th International Conference on Digital Audio Effects (DAFx-04, Naples, Italy, October 5-8, 2004, pp 163-168) divulga uma codificação estéreo paramétrica em combinação com um codificador do estado da técnica para o sinal de áudio monaural subjacente. O codificador estéreo paramétrico inclui um bloco de estimativa de parâmetros downmix e estéreo,
Petição 870180137907, de 04/10/2018, pág. 18/64 / 34 um bloco de codificador de áudio mono, um bloco de quantização e codificação e um bloco de dados auxiliares de inserção para inserir dados auxiliares em um fluxo de bits de saída.
[0014] O decodificador estéreo paramétrico inclui um bloco de dados auxiliares de extração, um bloco de decodificador de áudio mono, um bloco de decodificação e dequantização e um bloco de reconstrução estéreo paramétrico. [0015] Particularmente, uma estéreo síntese é efetuada num domínio de (sub-)sub-banda tendo um banco de filtro de análise com 64 bandas subsequente a blocos de subamostragem, bancos de filtro de análise com 4 bandas e um banco de filtro de análise com 8 bandas para bandas mais elevadas.
[0016] Especificamente, a complexidade resultante do codificador e do decodificador é alta e tem um alto comprometimento computacional devido às repetidas conversões entre o domínio da frequência e do tempo usando diferentes transformadas. Por exemplo, se extensão paramétrica fizesse uso da codificação do sinal no domínio do tempo obtido depois da síntese QMF, o decodificador correspondente consistiria de um decodificador por forma de onda completo (por exemplo, um decodificador alternativo AAC) e adicionalmente um banco de análise QMF. Isto é caro em termos de complexidade computacional.
[0017] Além disso, seria benéfico ter uma correlação entre a extensão paramétrica usada e a codificação por forma de onda dos elementos de sinal codificados pela extensão paramétrica.
[0018] Por exemplo, um sistema pode consistir, por exemplo, em uma codificação AAC e SBR (HE-AAC) ou AAC e SAC. Se o sistema permite a extensão SBR ou SAC para ser melhorada por meio de codificação por forma de onda, seria lógico também usar AAC para codificar o sinal em domínio do tempo obtido após síntese QMF. Todavia, um outro sistema, usando as mesmas extensões, por exemplo, a combinação da Camada II MPEG-1 e SBR usaria de preferência um outro sistema de codificação por forma de onda: Camada II MPEG-1. Por conseguinte, seria mais vantajoso acoplar a melhoria de codificar
Petição 870180137907, de 04/10/2018, pág. 19/64 / 34 por forma de onda à ferramenta de extensão paramétrica do que ao codificador de núcleo.
[0019] Logo, um sistema melhorado seria vantajoso, e, em particular, um sistema de codificação e/ou decodificação permitindo maior flexibilidade, complexidade reduzida, comprometimento computacional reduzido, facilitada interoperação entre diferentes elementos da codificação aplicada, melhor (por exemplo, em termo de propriedade escalável) qualidade de áudio e/ou melhor desempenho seriam vantajosos.
[0020] Por conseguinte, a invenção procura preferencialmente mitigar, aliviar, ou eliminar, uma ou mais daquelas desvantagens mencionadas acima, singularmente, ou em qualquer combinação.
[0021] De acordo com um aspecto da invenção, é proporcionado um decodificador para gerar um sinal de áudio em domínio do tempo mediante a decodificação por forma de onda, o decodificador compreendendo: meio para receber um fluxo de dados codificados; meio para gerar um primeiro sinal de sub-banda mediante decodificação de valores de dados daquele fluxo de dados codificados, o primeiro sinal de sub-banda correspondendo a uma representação do sinal em domínio da sub-banda criticamente amostrado do sinal de áudio em domínio do tempo; meio de conversão para gerar um segundo sinal de subbanda a partir do primeiro sinal de sub-banda ou sua versão processada mediante processamento da sub-banda, o segundo sinal de sub-banda correspondendo a uma representação complexa do sinal em domínio da sub-banda não-criticamente amostrado do sinal de áudio em domínio do tempo; decodificador paramétrico para decodificar parametricamente dados paramétricos usando o segundo sinal de sub-banda; e um banco de filtro de síntese para gerar o sinal de áudio em domínio do tempo a partir do segundo sinal de sub-banda.
[0022] A invenção pode permitir um decodificador melhorado. Um decodificador de complexidade reduzida pode ser adquirido e/ou os requisitos de recursos computacionais podem ser reduzidos. Em particular, um banco de
Petição 870180137907, de 04/10/2018, pág. 20/64 / 34 filtro de síntese pode ser usado tanto para decodificar extensão paramétrica para o sinal de áudio em domínio do tempo e para decodificação por forma de onda. Uma comunhão ente a decodificação por forma de onda e a decodificação paramétrica pode ser conseguida. Em particular, o banco de filtro de síntese pode ser um banco de filtro QMF como tipicamente usado para decodificação paramétrica nas técnicas de codificação de extensão paramétrica tais como SBR, PS e SAC.
[0023] O processador de conversão está arranjado para gerar o segundo sinal de sub-banda mediante processamento da sub-banda sem exigir qualquer conversão de, por exemplo, o primeiro sinal de sub-banda de volta ao domínio do tempo.
[0024] O decodificador pode posteriormente compreender meio para a execução do processamento de sinal não-falso sobre o segundo sinal de subbanda antes da operação síntese do banco de filtro de síntese.
[0025] De acordo com uma característica opcional da invenção, cada sub-banda do primeiro sinal de sub-banda contém uma variedade de sub-subbandas e o meio de conversão contém um segundo banco de filtro de síntese para gerar as sub-bandas de segundos sinais de sub-banda das sub-sub-bandas do primeiro sinal de sub-banda.
[0026] Isto pode fornecer um meio eficiente de conversão do primeiro sinal de sub-banda. A característica pode fornecer um meio eficiente e/ou de baixa complexidade de compensação para uma resposta de frequência dos filtros da sub-banda do banco de filtro de síntese.
[0027] De acordo com uma característica opcional da invenção, cada sub-banda do segundo sinal de sub-banda contém uma banda falsa e uma banda não-falsa e em que o meio de conversão contém meio divisor para a divisão de uma sub-banda do primeiro sinal de sub-banda em uma sub-subbanda falsa de uma banda da primeira sub-banda do segundo sinal de subbanda e uma sub-banda não-falsa da segunda sub-banda do segundo sinal de
Petição 870180137907, de 04/10/2018, pág. 21/64 / 34 sub-banda, a sub-banda falsa e a sub-banda não-falsa tendo intervalos de frequências correspondentes do sinal em domínio do tempo.
[0028] Isto pode fornecer um meio eficiente de conversão do primeiro sinal de sub-banda. Em particular, pode permitir componentes de sinal em diferentes sub-bandas originando da mesma frequência no sinal de áudio em domínio do tempo a ser gerado de um componente de sinal simples.
[0029] De acordo com uma característica opcional dessa invenção, o meio de divisão compreende uma estrutura de borboleta.
[0030] Isto pode permitir uma implementação particularmente eficiente e/ou alto desempenho. A estrutura de borboleta pode usar uma entrada de valor zero e uma entrada de sub-banda de valor de dado para gerar dois valores de saída correspondentes as diferentes sub-bandas da segunda sub-banda.
[0031] De acordo com um outro aspecto da invenção, é fornecido um codificador para codificar um sinal de áudio em domínio do tempo, o referido codificador compreendendo: meio para receber o sinal de áudio em domínio do tempo; um primeiro banco de filtro para gerar um primeiro sinal de subbanda do sinal de áudio em domínio do tempo, o primeiro sinal de sub-banda correspondendo a uma representação complexa do sinal em domínio da subbanda não-criticamente amostrado do sinal em domínio do tempo; meio de conversão para gerar um segundo sinal de sub-banda do primeiro sinal de subbanda por intermédio do processamento da sub-banda, o dito segundo sinal de sub-banda correspondendo a uma representação do sinal em domínio da subbanda criticamente amostrado dos sinais de áudio em domínio do tempo; e meio para gerar um fluxo de dados codificados por forma de onda mediante a codificação dos valores de dados do segundo sinal de sub-banda.
[0032] A invenção pode permitir um codificador melhorado. Um codificador de complexidade reduzida pode ser adquirido e/ou os requisitos de recursos computacionais podem ser reduzidos. Uma comunhão entre a
Petição 870180137907, de 04/10/2018, pág. 22/64 / 34 codificação por forma de onda e a codificação paramétrica pode ser adquirida. Em particular, o primeiro banco de filtro pode ser um banco de filtro QMF como tipicamente usado para codificação paramétrica nas técnicas de codificação de extensão paramétrica tais como SBR, PS é SAC.
[0033] Uma qualidade de áudio decodificado melhorada pode ser adquirida. Por exemplo, o sinal de áudio em domínio do tempo pode ser um sinal residual de uma codificação paramétrica. O sinal codificado por forma de onda pode fornecer informação resultante em uma maior transparência. [0034] O processador de conversão é arranjado para gerar o segundo sinal de sub-banda pelo processamento da sub-banda sem requerer qualquer conversão de, por exemplo, o primeiro sinal de sub-banda de volta ao domínio do tempo.
[0035] De acordo com uma característica opcional da invenção, o codificador posteriormente contém meio para codificação parametricamente do sinal de áudio em domínio do tempo usando o primeiro sinal de sub-banda. [0036] A invenção pode permitir uma codificação eficiente e/ou de alta qualidade de um sinal implícito usando tanto a codificação paramétrica como por forma de onda. A funcionalidade poderá ser compartilhada entre a codificação paramétrica e aquela por forma de onda. A codificação paramétrica pode ser uma codificação de extensão paramétrica tais como as codificações SBR, PS e SAC. O codificador pode, em particular, fornecer a codificação por forma de onda de algumas ou de todas as sub-bandas de uma codificação de extensão paramétrica.
[0037] De acordo com uma característica opcional da invenção, o meio de conversão contém um segundo banco de filtro para gerar uma variedade de sub-sub-bandas para cada sub-banda do primeiro sinal de subbanda.
[0038] Isto pode fornecer um meio eficiente de conversão do primeiro sinal de sub-banda. A característica pode fornecer um meio eficiente e/ou de
Petição 870180137907, de 04/10/2018, pág. 23/64 / 34 baixa complexidade de compensação para a resposta de frequência dos filtros da sub-banda da primeira sub-banda.
[0039] De acordo com uma característica opcional da invenção, o segundo banco de filtro é formado diferentemente.
[0040] Isto pode melhorar o desempenho e permitir separação ampliada entre as frequências positivas e negativas no complexo domínio da sub-banda.
[0041] De acordo com uma característica opcional da invenção, cada sub-banda contém algumas sub-sub-bandas falsas correspondendo a uma banda não-falsa da sub-banda; e em que o dito meio de conversão contém meio de combinação para combinar sub-sub-bandas falsas de uma banda da primeira sub-banda com sub-sub-bandas não-falsas de uma segunda sub-banda, as subsub-bandas falsas e sub-sub-bandas não-falsas tendo intervalos de frequência correspondentes no sinal em domínio do tempo.
[0042] Isto pode fornecer um meio eficiente de conversão do primeiro sinal de sub-sub-banda. Em particular, pode permitir componentes de sinal em diferentes sub-bandas originando da mesma frequência no sinal no domínio do tempo a ser combinado num componente de sinal simples. Isto pode permitir uma redução na taxa de dados.
[0043] De acordo com uma característica opcional dessa invenção, o meio de combinação está arranjado para reduzir uma energia na banda falsa. [0044] Isto pode melhorar o desempenho e/ou pode permitir uma redução da taxa de dados. Em particular, a energia na banda falsa pode ser minimizada e as bandas falsas podem ser ignoradas.
[0045] Em particular, dito meio de combinação pode adicionalmente conter meio para compensar as sub-bandas não-falsas de uma banda da primeira sub-banda através das sub-bandas falsas de uma segunda sub-banda. Em particular, o meio de combinação pode conter meio de subtração dos coeficientes das sub-bandas falsas de uma segunda sub-banda das sub-subPetição 870180137907, de 04/10/2018, pág. 24/64 / 34 bandas não-falsas de uma primeira sub-banda.
[0046] De acordo com uma característica opcional da invenção, o meio de combinação contém meio para gerar um sinal de soma não-falso para uma primeira sub-sub-banda falsa na primeira sub-banda e uma primeira subsub-banda não-falsa na segunda sub-banda.
[0047] Isto pode permitir uma implementação particularmente eficiente e/ou alto desempenho.
[0048] De acordo com uma característica opcional da invenção, o meio de combinação compreende uma estrutura de borboleta para gerar o sinal de soma não-falso.
[0049] Isto pode permitir uma implementação particularmente eficiente e/ou alto desempenho. A estrutura de borboleta pode em particular ser uma meia estrutura de borboleta onde somente um valor de saída é gerado. [0050] De acordo com uma característica opcional da invenção, ao menos um coeficiente da estrutura de borboleta é dependente da resposta de frequência de um filtro do primeiro banco de filtro.
[0051] Isto pode permitir uma implementação eficiente e/ou alto desempenho.
[0052] De acordo com uma característica opcional da invenção, o meio de conversão está arranjado para não incluir valores de dados para a banda falsa no fluxo de dados codificados.
[0053] Isto pode permitir uma qualidade de áudio altamente codificada para uma certa taxa de dados.
[0054] De acordo com uma característica opcional da invenção, o codificador adicionalmente contém meio para execução do processamento do sinal não-falso no primeiro sinal de sub-banda antes da conversão do segundo sinal.
[0055] Isto pode melhorar o desempenho. A invenção pode permitir uma implementação eficiente de um codificador por forma de onda tendo um
Petição 870180137907, de 04/10/2018, pág. 25/64 / 34 sinal de saída criticamente amostrado enquanto permite o processamento do sinal das sub-bandas individuais a serem executadas sem introduzir erros falsos.
[0056] De acordo com uma característica opcional dessa invenção, o codificador posteriormente contém meio para compensação de fase do primeiro sinal de sub-banda antes da conversão ao segundo sinal.
[0057] Isto pode melhorar o desempenho e/ou dar condição para uma implementação eficiente.
[0058] De acordo com uma característica opcional da invenção, o primeiro banco de filtro é um banco de filtro QMF.
[0059] A invenção pode permitir uma codificação por forma de onda eficiente usando um filtro QMF que é usado em várias técnicas de codificação paramétricas, tais como, SBR, PS e SAC. Em seguida, uma compatibilidade melhorada e/ou um compartilhamento de funcionalidade melhorada e/ou uma inter-operabilidade melhorada das técnicas de codificação por forma de onda e paramétrica podem ser adquiridas.
[0060] De acordo com um outro aspecto da invenção, é fornecido um método para gerar um sinal de áudio em domínio do tempo pela decodificação por forma de onda, o método compreendendo: recepção de um fluxo de dados codificados; geração de um primeiro sinal de sub-banda mediante decodificação de valores de dados de um fluxo de dados codificados, o primeiro sinal de subbanda correspondendo a uma representação do sinal em domínio da sub-banda criticamente amostrado do sinal de áudio em domínio do tempo; geração de um segundo sinal de sub-banda a partir do primeiro sinal de sub-banda pelo processamento da sub-banda, o segundo sinal de sub-banda correspondendo a uma representação complexa do sinal no domínio da sub-banda não-criticamente amostrado do sinal de áudio em domínio do tempo; e um banco de filtro de síntese gerando o sinal de áudio em domínio do tempo do segundo sinal de sub-banda.
Petição 870180137907, de 04/10/2018, pág. 26/64 / 34 [0061] De acordo com um outro aspecto da invenção, é fornecido um método para codificar um sinal de áudio em domínio do tempo, o método contendo: receber o sinal de áudio em domínio do tempo; um primeiro banco de filtro gerando um primeiro sinal de sub-banda a partir do sinal de áudio em domínio do tempo, o dito primeiro sinal de sub-banda correspondendo a uma representação complexa do sinal em domínio da sub-banda não-criticamente amostrado do sinal em domínio do tempo; gerar um segundo sinal de subbanda do primeiro sinal de sub-banda pelo processamento da sub-banda, o dito segundo sinal de sub-banda correspondendo a uma representação do sinal no domínio da sub-banda criticamente amostrado dos sinais de áudio em domínio do tempo; e gerar um fluxo de dados codificados por forma de onda mediante codificação dos valores de dados do segundo sinal de sub-banda.
[0062] De acordo com um outro aspecto da invenção, é fornecido um receptor para receber um sinal de áudio, o receptor compreendendo: meio para receber um fluxo de dados codificados; meio para gerar um primeiro sinal de sub-banda mediante decodificação de valores de dados do dito fluxo de dados codificados, o primeiro sinal de sub-banda correspondendo a uma representação do sinal em domínio da sub-banda criticamente amostrado do sinal de áudio em domínio do tempo; meio de conversão para gerar um segundo sinal de subbanda do primeiro sinal de sub-banda pelo processamento da sub-banda, o segundo sinal de sub-banda correspondendo a uma representação do sinal em domínio da sub-banda não-criticamente amostrado do sinal em domínio do tempo; e um banco de filtro de síntese para gerar um sinal de áudio em domínio do tempo do segundo sinal de sub-banda.
[0063] De acordo com um outro aspecto da invenção, é fornecido um transmissor para transmitir um sinal de áudio codificado, o dito transmissor compreendendo: meio para receber um sinal de áudio em domínio do tempo; um primeiro banco de filtro para gerar um primeiro sinal de sub-banda do sinal de áudio em domínio do tempo, o primeiro sinal de sub-banda correspondendo
Petição 870180137907, de 04/10/2018, pág. 27/64 / 34 a uma representação complexa do sinal no domínio da sub-banda não-criticamente amostrado do sinal em domínio do tempo; meio de conversão para gerar um segundo sinal de sub-banda a partir do primeiro sinal de sub-banda mediante processamento da sub-banda, o segundo sinal de sub-banda correspondendo a uma representação do sinal em domínio da sub-banda criticamente amostrado dos sinais de áudio em domínio do tempo; e meio para gerar um fluxo de dados codificados por forma de onda mediante codificação dos valores de dados do segundo sinal de sub-banda; e meio para transmitir fluxo de dados codificados por forma de onda.
[0064] De acordo com outro aspecto da invenção, é proporcionado um sistema de transmissão para transmitir um sinal de áudio em domínio do tempo, o sistema de transmissão compreendendo: transmissor contendo: meio para recepção do sinal de áudio em domínio do tempo, um primeiro banco de filtro para gerar um primeiro sinal de sub-banda do sinal de áudio em domínio do tempo, o primeiro sinal de sub-banda correspondendo a uma representação complexa do sinal em domínio da sub-banda não-criticamente amostrado dos sinais de áudio em domínio do tempo, meio para gerar um fluxo de dados codificados por forma de onda mediante a codificação de valores de dados do segundo sinal de sub-banda, e meio para transmitir o fluxo de dados codificados por forma de onda; e um receptor contendo: meio para receber o fluxo de dados codificados por forma de onda, meio para gerar um terceiro sinal de sub-banda mediante a decodificação dos valores de dados do fluxo de dados codificados, o terceiro sinal de sub-banda correspondendo a uma representação do sinal em domínio da sub-banda criticamente amostrado dos sinais de áudio em domínio do tempo, meio para conversão para gerar um quarto sinal de sub-banda do terceiro sinal de sub-banda pelo processamento da sub-banda, o quarto sinal de sub-banda correspondendo a uma representação complexa do domínio da subbanda não-criticamente amostrada dos sinais de áudio em domínio do tempo; e um banco de filtro de síntese para gerar um sinal de áudio em domínio do
Petição 870180137907, de 04/10/2018, pág. 28/64 / 34 tempo do dito quarto sinal de sub-banda.
[0065] De acordo com um outro aspecto da invenção, é fornecido um método de receber um sinal de áudio, o método compreendendo: receber um fluxo de dados codificados; gerar um primeiro sinal de sub-banda mediante a decodificação de valores de dados do fluxo de dados codificados, o primeiro sinal de sub-banda correspondendo a uma representação do sinal em domínio da sub-banda criticamente amostrado dos sinais de áudio no domínio do tempo; gerar um segundo sinal de sub-banda do primeiro sinal de sub-banda pelo processamento da sub-banda, o segundo sinal de sub-banda correspondente a uma representação complexa do sinal no domínio da sub-banda não-criticamente amostrado dos sinais de áudio em domínio do tempo; e um banco de filtro de síntese gerando um sinal de áudio em domínio do tempo do segundo sinal de sub-banda.
[0066] De acordo com um outro aspecto da invenção, é fornecido um método de transmitir um sinal de áudio codificado, o método compreendendo: receber um sinal de áudio em domínio do tempo; um primeiro banco de filtro gerando um primeiro sinal de sub-banda do sinal de áudio em domínio do tempo, o primeiro sinal de sub-banda correspondente a uma representação complexa do sinal em domínio da sub-banda não-criticamente amostrado dos sinais de áudio em domínio do tempo; gerar um segundo sinal de sub-banda do primeiro sinal de sub-banda pelo processamento da sub-banda, o segundo sinal de sub-banda correspondente a uma representação do sinal em domínio da sub-banda criticamente amostrado dos sinais de áudio em domínio do tempo; e gerar um fluxo de dados codificados por forma de onda pela codificação dos valores de dados do segundo sinal de sub-banda; e transmitir o fluxo de dados codificados por forma de onda.
[0067] De acordo com um outro aspecto da invenção, é fornecido um método de transmitir e de receber um sinal de áudio em domínio do tempo, o método compreendendo: transmissor que recebe o sinal de áudio em domínio
Petição 870180137907, de 04/10/2018, pág. 29/64 / 34 do tempo, um primeiro banco de filtro que gera um primeiro sinal de sub-banda do sinal de áudio em domínio do tempo, aquele primeiro sinal de sub-banda correspondendo a uma representação complexa do sinal em domínio da subbanda não-criticamente amostrado dos sinais de áudio em domínio do tempo, gerar um segundo sinal de sub-banda a partir do primeiro sinal de sub-banda por processamento da sub-banda, o segundo sinal de sub-banda correspondendo a uma representação do sinal em domínio da sub-banda criticamente amostrado dos sinais de áudio em domínio do tempo; e gerar um fluxo de dados codificados por forma de onda pela codificação dos valores de dados do segundo sinal de sub-banda; e transmitir o fluxo de dados codificados por forma de onda; e um receptor: recebendo um fluxo de dados codificados por forma de onda, gerando um terceiro sinal de sub-banda mediante decodificação de valores de dados do fluxo de dados codificados, o terceiro sinal de sub-banda correspondendo a uma representação do sinal em domínio da sub-banda criticamente amostrado dos sinais de áudio em domínio do tempo; e gerar um quarto sinal de sub-banda a partir do terceiro sinal de sub-banda pelo processamento da sub-banda do quarto sinal de sub-banda correspondendo a uma representação complexa do sinal em domínio da sub-banda não-criticamente amostrado dos sinais de áudio em domínio do tempo; e um banco de filtro de síntese gerando um sinal de áudio em domínio do tempo do quarto sinal de sub-banda.
[0068] Segundo um outro aspecto da invenção, é fornecido um meio de armazenamento legível por computador contendo nele gravado quaisquer métodos descritos acima.
[0069] Esses e outros aspectos, características e vantagens da invenção são aparentes e aclarados com referência as modalidades descritas doravante. [0070] As modalidades da presente invenção serão descritas, por meio de exemplos somente, com referência aos desenhos, nos quais:
Fig. 1 ilustra um sistema de transmissão 100 para comunicação de sinal de áudio de acordo com algumas modalidades da invenção.
Petição 870180137907, de 04/10/2018, pág. 30/64 / 34
Fig. 2 ilustra um codificador de acordo com algumas modalidades da invenção;
Fig. 3 ilustra um exemplo de alguns elementos de um codificador de acordo com algumas modalidades da invenção;
Fig. 4 ilustra um decodificador de acordo com algumas modalidades da invenção;
Fig. 5 ilustra um codificador de acordo com algumas modalidades da invenção;
Fig. 6 ilustra um exemplo de um banco de filtro de análise é síntese;
Fig. 7 ilustra um exemplo de um espectro de banco de filtro
QMF;
Fig. 8 ilustra exemplos de espectros de filtro de baixa amostragem da sub-banda QMF
Fig. 9 ilustra exemplos de espectros da sub-banda QMF;
Fig. 10 ilustra exemplos de espectros de um banco de filtro da sub-banda; e
Fig. 11 ilustra um exemplo de estruturas transformadas em borboleta.
[0071] Fig. 1 ilustra um sistema de transmissão 100 para comunicação de um sinal de áudio de acordo com algumas modalidades da invenção. O sistema de transmissão 100 contém um transmissor 101 o qual é acoplado a um receptor 103 através de uma rede 105 a qual especificamente pode ser a Internet.
[0072] No exemplo específico, o transmissor 101 é um equipamento de gravação de sinal e o receptor é um equipamento de reprodução de sinal 103 mas será entendido que em outras modalidades um transmissor e receptor podem ser usados em outras aplicações e outros objetivos. Por exemplo, o transmissor 101 e/ou o receptor 103 pode ser parte de uma funcionalidade de
Petição 870180137907, de 04/10/2018, pág. 31/64 / 34 transcodificação e pode, por exemplo, fornecer interface para outras fontes ou destinos do sinal.
[0073] No exemplo específico onde uma função de gravação de sinal é suportada, o transmissor 101 contém um digitalizador 107 o qual recebe um sinal analógico que é convertido para um sinal digital PCM por amostragem e conversão analógica para digital.
[0074] O transmissor 101 é acoplado ao codificador 109 da Fig. 1 o qual codifica o sinal PCM de acordo com um algoritmo de codificação. O codificador 101 é acoplado a um transmissor de rede 111 o qual recebe o sinal codificado e interliga a Internet 105. O transmissor de rede pode transmitir o sinal codificado ao receptor 103 através da Internet 105.
[0075] O receptor 103 contém um receptor de rede 113 o qual interliga a Internet 105 e a qual é arranjada para receber o sinal codificado do transmissor 101.
[0076] O receptor de rede 111 é acoplado a um decodificador 115. O decodificador 115 recebe o sinal codificado e decodifica de acordo com um algoritmo de decodificação.
[0077] No exemplo específico onde uma função reproduzindo um sinal é suportada, o receptor 103 adicionalmente contém um reprodutor de sinal 117 o qual recebe o sinal de áudio decodificado do decodificador 115 e apresenta este ao usuário. Especificamente, o reprodutor de sinal 113 pode conter um conversor de digital para analógico, amplificadores e autofalantes como solicitado para dar saída ao sinal de áudio decodificado.
[0078] Fig. 2 ilustra o codificador 109 da Fig. 1 em mais detalhes. O codificador 109 contém um receptor 201 o qual recebe um sinal de áudio em domínio do tempo a ser codificado. O sinal de áudio pode ser recebido de uma fonte externa ou interna, tal como de um arquivo de sinal local.
[0079] O receptor está acoplado a um primeiro banco de filtro 203 o qual gera um sinal da sub-banda contendo uma variedade de diferentes subPetição 870180137907, de 04/10/2018, pág. 32/64 / 34 bandas. Especificamente, o primeiro banco de filtro 203 pode ser um banco de filtro QMF como conhecido das técnicas de codificação paramétricas tais como SBR, PS e SAC. Então, o primeiro banco de filtro 203 gera um primeiro sinal de sub-banda, que corresponde a uma representação complexa do sinal em domínio da sub-banda não-criticamente amostrada do sinal em domínio do tempo. No exemplo específico, o primeiro sinal de sub-banda tem um fator de super amostragem em dobro como é bem conhecido por filtros QMF complexomodulados.
[0080] Desde que cada banda QMF é super amostrada por um fator de dois, é possível executar várias operações de processamento de sinal nas subbandas individuais sem introduzir qualquer distorção falsa. Por exemplo, cada sub-banda individual pode, por exemplo, ser escalada, e/ou outras sub-bandas podem ser adicionadas ou subtraídas etc. Então, em algumas modalidades, o codificador 109 adicionalmente contém meio para executar operações de processamento de sinal não-falsas nas sub-bandas QMF.
[0081] O primeiro sinal de sub-banda corresponde aos sinais da subbanda convencionalmente geradas pelos codificadores de extensão paramétrica tais como SBR, PS e SAC. Então, o primeiro sinal de sub-banda pode ser usado para gerar uma codificação de extensão paramétrica para o sinal em domínio do tempo. Em adição, o sinal da mesma sub-banda esta no codificador 109 da Fig. 2 também usado para uma codificação por forma de onda do sinal em domínio do tempo. Então, o codificador 109 pode usar o mesmo banco de filtro 203 codificação paramétrica e por forma de onda de um sinal.
[0082] A principal dificuldade na codificação por forma de onda da representação de valor complexa do domínio da sub-banda do primeiro sinal de sub-banda é que ela não forma uma representação compacta, i.e., ela é super amostrada por um fator de dois. O codificador 109 transforma diretamente a representação complexa da sub-banda do domínio do tempo em
Petição 870180137907, de 04/10/2018, pág. 33/64 / 34 uma representação que parece de perto com uma representação a qual seria obtida quando aplicada uma Transformada em Cosseno Discreto Modificado () diretamente ao sinal original do domínio do tempo (veja, por exemplo, H. Malvar, ' Processamento de Sinal com Transformadas Lapped', Artech House, Boston, Londres, 1992 para uma descrição do MDCT). Esta representação similar ao MDCT é criticamente amostrada. Como tal, este sinal é adaptado a conhecidas técnicas de codificação de áudio perceptível as quais podem ser aplicadas de forma a codificar eficientemente a representação resultante em uma codificação por forma de onda eficiente.
[0083] Em particular, o codificador 109 contém um processador de conversão 205 o qual gera um segundo sinal de sub-banda do primeiro sinal de sub-banda aplicando uma transformada complexa as sub-bandas individuais do primeiro sinal de sub-banda. O segundo sinal de sub-banda corresponde a uma representação do domínio da sub-banda criticamente amostrada dos sinais de áudio em domínio do tempo.
[0084] Então, no codificador 109, o processador de conversão 205 converte a saída do banco de filtro QMF, a qual é compatível com os codificadores de extensão paramétrica típicos atuais, a uma sub-banda tipo MDCT criticamente amostrada que corresponde bem próximo aos sinais da sub-banda as quais são tipicamente geradas nos codificadores por forma de onda convencionais.
[0085] Então, é preferível do que usar ambas as transformadas QMF é
MDCT, o primeiro sinal de sub-banda é diretamente processado no domínio da sub-banda para gerar um segundo sinal de sub-banda que pode ser tratado como um sinal MDCT de um codificador por forma de onda convencional. Então, as técnicas conhecidas para a codificação do sinal da sub-banda podem ser aplicadas e uma codificação por forma de onda eficiente de, por exemplo, um sinal residual da codificação de extensão paramétrica pode ser adquirido sem necessitar uma conversão do domínio do tempo, e então as necessidades
Petição 870180137907, de 04/10/2018, pág. 34/64 / 34 dos filtros síntese QMF podem ser reduzidas.
[0086] No exemplo, o codificador 109 compreende um processador de codificação 207 o qual é acoplado ao processador de conversão 205. O processador de codificação 207 recebe o segundo sinal da sub-banda tipo MDCT criticamente amostrado do processador de conversão 205 e codifica este usando técnicas de codificação por forma de onda convencional, incluindo, por exemplo, quantização, fatores de escala, codificação Hoffman, etc. O dado codificado resultante é encaixado num fluxo de dados codificados. O fluxo de dados pode adicionalmente conter outros dados codificados, tal como, por exemplo, dado de codificação paramétrica.
[0087] Como será descrito em mais detalhes a seguir, o processador de conversão 205 utiliza informação do filtro fundamental (ou do protótipo) do primeiro banco de filtro 203 para combinar componentes do sinal de diferentes sub-bandas em bandas não-falsas (ou passa bandas) e para remover componentes do sinal de bandas falsas (ou bandas de parada). De acordo, os componentes da frequência da banda falsa para cada sub-banda podem ser ignorados resultando em um sinal criticamente amostrado sem super amostragem.
[0088] Especificamente como é descrito a seguir, o processador de conversão 205 contém um segundo filtro o qual gera uma variedade de subsub-bandas para cada uma das sub-bandas do banco de filtro QMF. Então as sub-bandas são divididas em posteriores sub-sub-bandas. Devido à sobreposição entre os filtros QMF, um certo componente de sinal do sinal em domínio do tempo (digamos uma senóide numa frequência específica) pode resultar em um componente de sinal em duas diferentes sub-banda QMF. O segundo banco de filtro dividira posteriormente essas sub-bandas tal que o componente de sinal será representado em uma sub-sub-banda da primeira sub-banda QMF em uma sub-sub-banda da segunda sub-banda QMF. Os valores dos dados dos sinais dessas duas sub-sub-bandas são alimentados ao
Petição 870180137907, de 04/10/2018, pág. 35/64 / 34 combinador ao qual combina os dois sinais para gerar um componente do sinal simples. Esse componente de sinal simples é então codificado pelo processador de codificação 207.
[0089] Fig. 3 ilustra um exemplo de alguns elementos do processador de conversão 205. Em particular, a Fig. 3 ilustra um primeiro banco de filtro de conversão 301 para uma primeira sub-banda QMF e um segundo banco de filtro de conversão 303 para uma segunda sub-banda QMF. Os sinais das subsub-bandas as quais correspondem às mesmas frequências são então alimentadas ao combinador 305 o qual gera um valor de dados de saída simples para a sub-sub-banda.
[0090] Será entendido que o decodificador 115 pode executar operações inversas do codificador 109. Fig. 4 exibe decodificador 115 em mais detalhes. [0091] O decodificador contém um receptor 401 o qual recebe o sinal codificado pelo codificador 109 do receptor 113 da rede. O sinal codificado é passado para um processador de decodificação 403 o qual decodifica a codificação por forma de onda do processador de codificação 204 consequentemente recriando o sinal da sub-banda criticamente amostrado. Esse sinal é alimentado para um processador de conversão decodificador 405 o qual recria o sinal da sub-banda não-criticamente amostrada pela execução da operação inversa do processador de conversão 205. O sinal amostrado nãocriticamente é então alimentado para um filtro de síntese QMF 407 o qual gera uma versão decodificada do sinal de áudio codificado do domínio do tempo original.
[0092] Em particular, o processador de conversão decodificado 405 contém um divisor tal como uma estrutura de borboleta inversa, que regenera os componentes do sinal nas sub-sub-bandas incluindo as bandas de sinal tanto na banda falsa como na banda não-falsa. Os sinais das sub-sub-bandas são então alimentados para um banco de filtro simples correspondente ao banco de filtro de conversão 301, 303 do codificador 109. A saída desses
Petição 870180137907, de 04/10/2018, pág. 36/64
22/34 bancos de filtro corresponde ao sinal da sub-banda não-criticamente amostrada.
[0093] As modalidades específicas da invenção serão descritas em mais detalhes a seguir. A descrição das modalidades será descrita com referência a estrutura do codificador 500 da Fig. 5. A estrutura do codificador 500 pode especificamente ser implementado no codificador do 109 da Fig. 1. [0094] A estrutura do codificador 500 contém um banco de filtro 501
QMF de análise de 64 bandas.
[0095] O filtro da sub-banda de análise QMF pode ser descrito como segue. Dado um filtro protótipo p(v) de fase linear, de valor real, um banco de filtro de análise modulado de banda-M complexa pode ser definida pelos filtros de análise
-0)}.
(1) para o índice da sub-banda k = 0, 1,..., M-l. O parâmetro de fase Θ tem importância para a análise que segue. Uma escolha típica é (N+M)/2, onde N é a ordem do filtro protótipo. Dado um sinal de tempo x(v) discreto de valor real, os sinais Vk(N) da sub-banda são obtidos pela filtragem (convolução) de x(v) com hk(v) e então subamostrando o resultado por um fator M como ilustrado pelo lado esquerdo da Fig. 6 a qual ilustra a operação dos bancos de filtro de síntese e análise QMF do codificador 109 e do decodificador 115. [0096] Assume-se que uma operação de síntese consiste de primeiro sobre amostrando os sinais da sub-banda QMF com um fator M, seguido pela filtragem com filtros modulados complexos do tipo similar à equação (1), somando os resultados e finalmente tomando duas vezes a parte real como ilustrado pelo lado direito da Fig. 6. Em tal caso, a reconstrução quase perfeita do sinal de entrada x(v) de valor real pode ser obtida pelo projeto adaptável de um filtro protótipo p(v) de fase linear de valor real, como mostrado em P. Ekstrand, “sinais de áudio de extensão de largura de banda pela replicação da banda espectral”, Processo. Ia Workshop Benelux IEEE de Processamento e
Petição 870180137907, de 04/10/2018, pág. 37/64
23/34
Codificação de Áudio Baseado em Modelo (MPCA-2002), pp 53-58, Leuven, Bélgica, 15 de Novembro de 2002.
[0097] Em seguida, deixe Ζ(ω) = ΈΤ=_χζ(.η)&χρ(-ίηω) ser a transformada de Fourier do tempo discreto de um sinal z(n) de tempo discreto.
[0098] Como complemento, a propriedade de reconstrução quase perfeita do banco QMF, será assumido que P(w), a transformada de Fourier de p(v), desaparece essencialmente para fora do intervalo de frequência [π/Μ, π/Μ].
[0099] A transformada de Fourier dos sinais complexos do domínio da sub-banda subamostrados é dada por:
„ , exp(-í(* +1 /2)0 /ÀO J ® +* +1 /2) - 2*' r* W--M á [ Ü f [“S”J(2) onde k é o índice da sub-banda e M é um número de sub-bandas. Devido ao fato da resposta de frequência do filtro protótipo ser limitada, a soma na equação (2) contém somente um termo para cada w.
[00100] As correspondentes respostas estilizadas de frequência absoluta são mostradas na Fig. 7 e na Fig. 8.
[00101] Especificamente, Fig. 7 exibe respostas em frequência estilizadas para as primeiras poucas bandas de frequência do banco QMF complexo 501 antes da subamostragem. A Fig. 8 ilustra as respostas de frequência estilizada do banco QMF complexo subamostrado para as sub-bandas k pares (acima) e impares (abaixo). Então, como ilustrado na Fig. 8 o centro de uma banda de filtro QMF será após a subamostragem distorcido em π/2 para as sub-bandas de numeração par e para -π/2 para as sub-bandas de numeração impares. [00102] Fig. 8 ilustra o efeito de super amostragem do banco QMF complexo para as bandas com índice k par e índice k impar respectivamente a parte negativa e positiva do espectro de frequência não são requeridas de forma a reconstruir o sinal (originalmente de valor real). Essas partes do espectro de frequência do banco de filtro subamostrado serão referidas as
Petição 870180137907, de 04/10/2018, pág. 38/64 / 34 bandas falsas ou de paradas, enquanto as outras partes serão indicadas como passa banda ou banda não-falsa. É de se notar que as bandas falsas contêm informação que esta também presente nas passa bandas do espectro de outras sub-bandas. Esta propriedade particular será usada para derivar um mecanismo de codificação eficiente.
[00103] Será entendido que as bandas falsas e as não-falsas contém informações redundantes e que uma pode ser determinada da outra. Será também entendido que a interpretação complementar das bandas falsas e das não-falsas podem ser usadas.
[00104] Como será mostrado a seguir, as energias correspondentes às bandas falsas (ou bandas de paradas) do banco de filtro de análise QMF podem ser reduzidas a zero ou a valores desprezíveis aplicando um certo tipo de banco de filtro adicional 503 em cada saída do banco de filtro 501 de análise subamostrado e aplicando certas estruturas em borboleta 505 entre as saídas dos bancos de filtro adicionais 501.
[00105] Como uma consequência, metade da informação, i.e., metade das saídas do banco de filtro podem ser descartadas. Como um resultado, uma representação criticamente amostrada é obtida. Essa representação é muito similar à representação adquirida por uma transformada MDCT das amostras do domínio do tempo originais e desta forma relembra bem de perto os sinais da sub-banda os quais são gerados pelos codificadores por forma de onda típicos tais como MP3 ou AAC. Consequentemente, técnicas de codificação por forma de onda podem ser aplicadas diretamente ao sinal criticamente amostrado no processador de codificação por forma de onda 5076 é nenhum requisito para uma conversão ao domínio do tempo seguida por uma geração da sub-banda MDCT é requerida. O dado codificado resultante é então incluído em um fluxo de bits por um processador de fluxo de bits 509.
[00106] Fig. 9 ilustra o efeito da geração da sub-banda QMF para um sinal consistindo de duas senóides.
Petição 870180137907, de 04/10/2018, pág. 39/64 / 34 [00107] No domínio complexo da frequência (tal como, por exemplo, o obtido por meio de um FFT) cada senóide aparecera no espectro tanto como frequência positiva como negativa. Agora se assume um banco QMF complexo de 8 bandas (no exemplo da Fig. 5 um banco de 64 bandas é empregado). Antes da subamostragem, as senóides aparecerão como ilustradas nos espectros de A a H. Como ilustrado, cada senóide ocorre em duas sub-bandas, por exemplo, a linha espectral de baixa frequência ocorre tanto no espectro A, correspondente a primeira sub-banda QMF, quanto no espectro B, correspondente a segunda sub-banda QMF.
[00108] O processo da subamostragem do banco QMF é ilustrado na parte inferior da Fig. 9, onde o espectro I mostra o espectro antes da subamostragem. O procedimento da subamostragem pode ser interpretado como segue. Primeiro o espectro é dividido em M espectros de A ate H, onde M é o fator da subamostragem (M = 8) como ilustrado em I e K para a primeira e a segunda sub-banda respectivamente. Cada espectro dividido individualmente é expandido (esticado) outra vez para a faixa completa de frequência. Então todos os espectros individuais expandidos e divididos são somados resultando nos espectros como ilustrado no espectro J e L para a primeira e a segunda sub-banda respectivamente.
[00109] Em resumo, devido ao filtro de cada sub-banda individual ter uma largura de banda a qual excede o intervalo de frequência entre as subbandas, os componentes de sinal do sinal em domínio do tempo resultarão em componente de sinal em duas sub-bandas diferentes. Mais adiante, um destes componentes de sinal cairá na banda falsa de uma das sub-bandas e um cairá na banda não-falsa da outra sub-banda.
[00110] Então, como mostrado no espectro J e L, nos espectros de saída final do banco QMF complexo, os componentes também ocorrem em duas sub-bandas, por exemplo, a linha espectral de baixa frequência ocorre na passa banda da primeira sub-banda assim como na banda de parada da
Petição 870180137907, de 04/10/2018, pág. 40/64 / 34 segunda sub-banda. A magnitude da linha espectral em ambos os casos é dada pela resposta de frequência do filtro protótipo (desviado).
[00111] De acordo com as modalidades da Fig. 5, um conjunto adicional de transformadas complexas (o banco de filtro 503) é introduzido, onde cada transformada é aplicada à saída de uma sub-banda. Isto é usado para posteriormente dividir o espectro de frequência daquelas sub-bandas em uma variedade de sub-sub-bandas.
[00112] Cada sub-sub-banda na passa banda de uma sub-banda QMF é então combinada com a correspondente sub-sub-banda da banda falsa na adjacente sub-banda QMF. No exemplo, a sub-sub-banda contendo senóide de baixa frequência no espectro J é combinada com a senóide de baixa frequência no espectro L, resultando então em ambos componentes de sinal surgindo da mesma senóide de baixa frequência do sinal em domínio do tempo, sendo combinado em um componente de sinal simples.
[00113] Além do mais, de forma a compensar pela resposta de frequência do filtro protótipo QMF o valor de cada sub-sub-banda é pesado pela relativa amplitude da resposta de frequência antes da combinação (é entendido que a resposta de amplitude do filtro protótipo QMF é constante dentro de cada sub-sub-banda).
[00114] Os componentes de sinal nas bandas de parada podem ser ignorados ou podem ser compensados pelos valores da passa banda resultando efetivamente na redução da energia na banda falsa. Então, a operação do processador de conversão 207 pode ser vista como correspondendo a concentração de energia dos dois componentes de sinal que surgem para cada frequência em um componente de sinal simples na passa banda de uma das sub-bandas QMF. Então, como os valores de sinal nas bandas falsas ou de parada podem ser ignorados, uma eficiente subamostragem pelos dois pode ser conseguida resultando em um sinal criticamente amostrado.
[00115] Como será mostrada a seguir, a combinação dos componentes
Petição 870180137907, de 04/10/2018, pág. 41/64
27/34 de sinal (e o cancelamento dos componentes de sinal nas bandas falsas pode ser obtido pelo uso de uma estrutura de borboleta).
[00116] Em princípio, aplicando uma outra transformada complexa (50% de sobreposição) nos sinais da sub-banda (através dos bancos de filtro 503) cederia uma outra super amostragem por um fator de 2. No entanto, as transformadas escolhidas possuem uma certa propriedade simétrica permitindo uma redução de 50% dos dados. A transformada resultante pode ser considerada equivalente a aplicar um MDCT ao dado real e um MDST ao dado imaginário. Ambas são transformadas criticamente amostradas e então nenhuma super amostragem ocorre.
[00117] Em mais detalhes, os bancos de filtro 503 podem ser um banco de filtro complexo-modulado consistindo de R = 2Q bandas. Um exemplo de uma resposta de frequência estilizada dos bancos de filtro 503 para cada subbanda são mostrados na Fig. 10, para cada sub-banda k. Como pode ser visto o banco de filtro singularmente empilhado e não tem sub-banda centralizada em torno do valor DC. Preferencialmente, no exemplo, as frequências centrais das sub-bandas são simétricas em torno do zero como a frequência central da primeira sub-banda estando em torno da metade da frequência da sub-banda deslocada.
[00118] O fator de subamostragem neste segundo banco Q é definido pelos filtros de análise, para r = -Q, -Q+l,..., Q-l, g„(V) = w(v) exP' onde a janela protótipo de valor real w(v) é tal que w(v) = w(-v-l-Q). E bem conhecido que esta janela pode ser projetada tal que a reconstrução perfeita pode ser obtida da análise em um banco de filtro com filtros sendo iguais a, ora a parte real de (3), ora a parte imaginaria de (3). Naqueles casos, somente Q das R = 2Q sub-bandas bastam, ora frequências positivas ora negativas. Um exemplo proeminente é a transformada MDCT do co-seno discreto modificado.
Petição 870180137907, de 04/10/2018, pág. 42/64
28/34 [00119] No entanto, na modalidade da Fig. 5 um sinal de valor complexo z(n) é por sua vez analisado com os filtros 503, os sinais resultantes são subamostrados por um fator Q e a parte real é tomada. A operação de síntese correspondente consiste de subamostragem por um fator Q, e a filtragem síntese pelos filtros modulados complexos, /r(y) = - 0} exp U/2) (v +1 /2). , (4) somando os resultados sobre as R = 2Q sub-bandas r = -Q, -Q+l,..., Q-l, e finalmente dividindo o resultado por 2.
[00120] Se a janela protótipo w(v) é projetada para dar reconstrução perfeita nos bancos de valor real mencionados acima, a operação combinada de análise e síntese no caso complexo reconstruirá perfeitamente o sinal de valor complexo z(n). Para ver isto, deixe C representar o banco de análise que tem filtros de análise iguais à parte real de (3), e deixe S representar o banco de análise que tem filtros de análise iguais à parte imaginaria de (3). Então, o banco de análise complexo (3) pode ser escrito como E = C - iS. Escrevendo o sinal complexo como ζ=ξ+ίη então da +S?J. (5) [00121] Aqui, (5) é avaliada para ambas as frequências positivas r = 0,..., Q-l, e as frequências negativas r = -Q,..., -1. Note-se que trocando r por -1-r em (3), leva a uma conjugação complexa do filtro de análise, então a análise (5) dá acesso a tanto Οξ+Ξη e Οξ-Ξη para frequências positivas r = 0, ..., Q-l. Para síntese, esta informação pode ser facilmente recombinada em Οξ e Sq, da qual a perfeita reconstrução tanto ξ quanto η é possível com os correspondentes bancos de síntese de valor real. Nos omitimos os detalhes mais diretos de provar a reivindicação de que esta reconstrução é equivalente à operação de análise complexa, parte real, síntese complexa e divisão por 2. [00122] Esta estrutura de banco de filtro é relacionada, mas não idêntica aos modificados bancos de filtros DFT (MDFT) como proposto em Karp T. Fliege N.J., “Os bancos de filtro DFT modificados com reconstrução
Petição 870180137907, de 04/10/2018, pág. 43/64
29/34 perfeita”, Transações IEEE em circuitos e sistemas - II: Processamento de Sinal Analógico e Digital, Vol. 46, no. 11 de novembro de 1999. Uma diferença principal é que o presente banco de filtro é montado diferentemente, um fato que é vantajoso para estrutura híbrida proposta a seguir.
[00123] Para cada k = 0, 1,..., N-1 e r = -Q, -Q+l,..., Q-l, deixe Vk,r(n) ser o sinal da sub-banda obtido pela análise do sinal de análise QMF complexo yk(v) com o filtro de análise 503, subamostrando por um fator Q, e tomando a parte real. Isto dá um total de 2QM sinais de valor real em uma taxa de amostragem de 1/(QM) da taxa de amostragem original. Então, uma representação super amostrada por um fator de 2 é obtida. Referindo-se as
Figs. 8 e 10, é conveniente definir os sinais de passa banda por iVz (ií) for k even v*^g(n) for k odd (6) [00124] Semelhantemente os sinais da banda de parada ou “banda falsa” referidos acima são definidos por l,r (”) = for k evenl for k oddp °! ,0-1.
(?) [00125] Observe que ambos estes sinais são criticamente amostrados.
[00126] A próxima etapa é explorar o fato de que o sinal do tempo é uma senóide pura na frequência π/(2Μ) < Ω < -π/(2Μ) e se θ = 0 em um (1), então Λ(«) = Ρ^Ω-^<2ί4·1)}<7βχρ(ί£1ίί»). (8) onde C é uma constante complexa. Como resultado, as bandas QMF vizinhas conterão então senóides complexas com as mesmas frequências e fases, mas com diferentes magnitudes, devido à resposta do filtro protótipo QMF de fase linear modulada. Então, como mencionado previamente, dois componentes de sinal surgem - um na passa banda de uma sub-banda QMF e um na banda falsa de uma sub-banda adjacente.
[00127] Transformando os correspondentes pares das amostragens de sub-bandas em somas e diferenças balanceadas levará, em consequência, a
Petição 870180137907, de 04/10/2018, pág. 44/64 / 34 muitas pequenas diferenças. Antes que os detalhes dessa transformada sejam destacados, deveria ser apontado que se a assertiva de que se Θ = 0 não é satisfeita, as amostragens QMF seriam preferencialmente compensadas em fase através de pré-aperfeiçoamento em um processador pré-aperfeiçoador 511 de acordo com ft(«) = exp(frfl?(t + 1/2)/2)/)^(/1). (9) [00128] Alternativamente, um salto de fase adicional de kK no processador de pré-aperfeiçoamento poderia também ser conseguido pela estrutura de borboleta através do sinal de negação.
[00129] Para k = 0,..., M-2 os sinais da soma e da diferença são definidos por ^+],(«) = Α,Λ») + ÂAl.rW r= (10) ,0/2-1.
[00130] Para a primeira e última banda QMF, a definição é substituída por í V^AAW+Me+A) 1 /2_l Γlf-L,r (H) _ AiY “I/· (JI) + (n) _ qj 2 q _ 1 (ra) (íj) + (B) [00131] A Fig. 11 ilustra as correspondentes transformadas das estruturas em borboleta. Essas estruturas em borboleta são similares a aquelas usadas na camada III MPEG-1 (MP3). No entanto, uma importante diferença é que as assim chamadas antifalsas em borboleta de mp3 são usadas para reduzir as falsas nas passa bandas dos bancos de filtro de valor real. Num banco de filtro modulado real, não é possível distinguir entre frequências (complexas) positivas e negativas nas sub-bandas. Na etapa de síntese, uma senóide na sub-banda geralmente dará surgimento a duas senóides na saída. Uma daquelas, a senóide falsa, é localizada em uma frequência muito distante da frequência correta. As borboletas antifalsas do banco real visam a suprimir
Petição 870180137907, de 04/10/2018, pág. 45/64
31/34 a senóide falsa através do direcionamento da segunda síntese do banco híbrido em duas bandas QMF vizinhas reais A presente abordagem difere fundamentalmente desta situação já que a sub-banda QMF é alimentada com uma senóide complexa do segundo banco híbrido. Isto dá surgimento à somente uma senóide complexa localizada corretamente na saída final, e o problema falso da MP3 nunca ocorre. As estruturas em borboleta 505 visa corrigir unicamente a resposta de magnitude da operação combinada de análise e síntese, quando os sinais de diferença d são omitidos.
[00132] Note-se primeiro que se os coeficientes da transformada são ajustados para Bk,r =1 e ak.r = 0 então o par de sinal (s,d) será só uma cópia do par (b, a). Isto pode ser feito de uma maneira seletiva desde que a estrutura de (10) e (11) é tal que as computações podem ser feitas no local. Isto tem importância para o caso onde a estrutura do banco de filtro híbrido é somente invocado para um sub conjunto das bandas QMF. Todas as operações de soma e diferença são invertidas já que como B2k,r + a2k.r>0ea transformação é ortogonal se B2k,r + a2 k,r = 1 · [00133] As etapas de síntese correspondentes são muito similares a (10) e (11) e serão claras para a pessoa habilitada. Isto vale também para a inversão do pré-aperfeiçoamento pelo processador de pré-aperfeiçoamento 511. A presente abordagem ensina que os sinais d k,r(n) se tornam muito pequenos para a escolha onde Bq+.t = Bk,r e oiQ-i-r = ak,r, e = H f π f r + l/2 1 Ã7 + 1/2 P Q~ + 2 •,r = 0 ρ/2-l, (12) onde K é a normalização constante.
[00134] Assim, sob a assertiva de que o banco de filtro adicional para cada sub-banda k é criticamente amostrado e perfeitamente reconstruível, a aproximação de sinais no domínio da sub-sub-banda da banda falsa praticamente reduz a representação super amostrada a uma representação criticamente
Petição 870180137907, de 04/10/2018, pág. 46/64 / 34 amostrada assemelhando-se aproximadamente ao MCT das amostras originais do domínio do tempo.
[00135] Isto possibilita a codificação eficiente dos sinais complexos no domínio da sub-banda em uma maneira similar aos conhecidos codificadores por forma de onda perceptuais. O erro de reconstrução de descartar os coeficientes da transformada correspondente às bandas de parada, ou falsas, esta na ordem de 34 dB para um comprimento típico de transformada Q = 16. [00136] Alternativamente, os coeficientes correspondentes às bandas de parada ou bandas falsas poderiam ser codificadas adicionalmente aos coeficientes correspondentes as passas bandas de forma a obter uma melhor reconstrução. Isto poderia ser benéfico no caso de Q ser muito pequeno (por exemplo, Q‹ 8) ou no caso de um desempenho pobre do banco QMF.
[00137] No exemplo da Fig. 5, as borboletas soma/diferença de (10) e (11) 505 são aplicadas de forma a obter o par de sinais (s, d) o qual neste caso somente os componentes dominantes (s) são preservados. Em uma próxima etapa, técnicas convencionais de codificação por forma de onda usando, por exemplo, codificação de fator de escala e de quantificação aplicadas aos sinais resultantes. Os coeficientes codificados são colocados num fluxo de bits. [00138] O decodificador segue o processo inverso. Primeiramente, os coeficientes são demultiplexados do fluxo de bits e decodificados. Então, a operação borboleta inversa do codificador é aplicada seguida pela filtragem síntese e pós-aperfeiçoamento para obter os sinais complexos do domínio da sub-banda. Esses podem finalmente ser transformados ao domínio do tempo por meio do banco síntese QMF.
[00139] Será entendido que a descrição acima por clareza tem descrito as modalidades da invenção com referência as unidades funcionais e processadores diferentes. No entanto, será aparente que qualquer distribuição ajustável de funcionalidade entre as unidades funcionais ou processadores diferentes pode ser usada sem desfazer a presente invenção. Por exemplo, a
Petição 870180137907, de 04/10/2018, pág. 47/64 / 34 funcionalidade ilustrada para ser executada por processadores separados ou controladores pode ser executada pelo mesmo processador ou controladores. Então, as referências às unidades específicas são somente para serem vistas como referências aos meios ajustáveis para o fornecimento da funcionalidade descrita, do que indicativo de uma lógica estrita ou estrutura física ou organização.
[00140] A invenção pode ser implementada em qualquer forma ajustável incluindo hardware, software, firmware ou qualquer combinação destas. A invenção pode opcionalmente ser implementada ao menos parcialmente como operação de software de computador sobre um ou mais processadores de dados e/ou processadores de sinal digital. Os elementos e componentes de uma modalidade da invenção podem ser fisicamente, funcionalmente e logicamente implementados em qualquer modo ajustável. Ainda, a funcionalidade pode ser implementada em uma unidade simples, em uma variedade de unidades ou como parte de outras unidades funcionais. Como tal, a invenção pode ser implementada em uma unidade simples ou pode ser fisicamente e funcionalmente distribuída entre as unidades e os processadores. [00141] Embora a presente invenção tenha sido descrita em conexão com algumas modalidades, não é intenção ser limitada a forma específica adiante colocada. Preferencialmente, o objetivo dessa presente invenção é limitado somente pelas reivindicações que a acompanham. Adicionalmente, embora uma característica possa parecer a ser descrita em conexão com modalidades particulares, alguém habilitado na arte reconheceria que várias características das modalidades descritas podem ser combinadas de acordo com a invenção. Nas reivindicações, o termo contendo não exclui a presença de outros elementos ou etapas.
[00142] Além do mais, embora individualmente listada, uma variedade de meios, elementos ou etapas de métodos podem ser implementadas por, por exemplo, uma unidade simples ou processador. Adicionalmente, embora as
Petição 870180137907, de 04/10/2018, pág. 48/64 / 34 características individuais possam ser incluídas em diferentes reivindicações, essas podem ser possivelmente vantajosamente combinadas, e a inclusão em diferentes reivindicações não implica que uma combinação de características não é viável e/ou vantajosa. Também a inclusão de uma característica em uma categoria de reivindicações não implica uma limitação a esta categoria, mas preferencialmente indica que a característica é igualmente aplicável a outras categorias de reivindicação como apropriado. Além do mais, a ordem das características nas reivindicações não implica qualquer ordem específica na qual as características devem ser executadas e em particular a ordem das etapas individuais em uma reivindicação de método não implica que as etapas devam ser executadas nesta ordem. Preferencialmente, as etapas podem ser executadas em qualquer ordem ajustável. Em adição, as referências simples não excluem uma variedade. Então as referências a “um”, “uma”, “primeiro”, “segundo”, etc., não excluem uma variedade. Os sinais de referência nas reivindicações são fornecidos meramente como um exemplo esclarecedor e não devem ser construídos como limitando o objetivo das reivindicações de qualquer maneira.

Claims (28)

  1. REIVINDICAÇÕES
    1. Decodificador para gerar um sinal de áudio em domínio do tempo mediante decodificação por forma de onda, decodificador este sendo caracterizado pelo fato de compreender:
    - meio para receber (401) um fluxo de dados codificados;
    - meio para gerar (403) um primeiro sinal de sub-banda mediante decodificação de valores de dados do fluxo de dados codificados, dito primeiro sinal de sub-banda correspondendo a uma representação do sinal em domínio da sub-banda criticamente amostrado do sinal de áudio em domínio do tempo;
    - meio de conversão (405) para gerar um segundo sinal de subbanda a partir do primeiro sinal de sub-banda ou sua versão processada mediante processamento da sub-banda, dito segundo sinal de sub-banda correspondendo a uma representação complexa do sinal em domínio da sub-banda não-criticamente amostrado do sinal de áudio em domínio do tempo;
    - um decodificador paramétrico para decodificar parametricamente dados paramétricos usando o segundo sinal de sub-banda; e
    - um banco de filtro de síntese (407) para gerar o sinal de áudio em domínio do tempo a partir do segundo sinal de sub-banda.
  2. 2. Decodificador de acordo com a reivindicação 1, caracterizado pelo fato de que cada sub-banda do primeiro sinal de sub-banda compreende uma variedade de sub-sub-bandas e o meio de conversão (405) compreende um segundo banco de filtro de síntese para gerar as sub-bandas dos segundos sinais de sub-banda a partir de sub-sub-bandas do primeiro sinal de sub-banda.
  3. 3. Decodificador de acordo com a reivindicação 2, caracterizado pelo fato de que cada sub-banda do segundo sinal de sub-banda compreende uma banda falsa e uma banda não-falsa e em que dito meio de conversão (405) compreende meio de divisão para dividir uma sub-sub-banda do primeiro sinal de sub-banda numa sub-sub-banda falsa de uma primeira sub-banda do segundo sinal de sub-banda e uma sub-banda não-falsa de uma segunda sub-banda do
    Petição 870180137907, de 04/10/2018, pág. 50/64 segundo sinal de sub-banda, a sub-banda falsa e a sub-banda não-falsa tendo intervalos de frequência correspondentes do sinal em domínio do tempo gerados pelo banco de filtro de síntese.
  4. 4. Decodificador de acordo com a reivindicação 3, caracterizado pelo fato de que o meio de divisão compreende uma estrutura de borboleta.
  5. 5. Codificador para codificar um sinal de áudio em domínio do tempo, codificador este sendo caracterizado pelo fato de compreender:
    - meio para receber (201) o sinal de áudio em domínio do tempo;
    - um primeiro banco de filtro (203) para gerar um primeiro sinal de sub-banda a partir do sinal de áudio em domínio do tempo, dito primeiro sinal de sub-banda correspondendo a uma representação complexa do sinal em domínio da sub-banda não-criticamente amostrado do sinal em domínio do tempo;
    - um codificador paramétrico para codificar parametricamente o sinal de áudio em domínio do tempo usando o primeiro sinal de sub-banda;
    - meio de conversão (205) para gerar um segundo sinal de subbanda a partir do primeiro sinal de sub-banda ou sua versão processada mediante processamento da sub-banda, dito segundo sinal de sub-banda correspondendo a uma representação do sinal em domínio da sub-banda criticamente amostrado do sinal de áudio em domínio do tempo; e
    - meio para gerar (207) um fluxo de dados codificados por forma de onda mediante codificação de valores de dados do segundo sinal de sub-banda.
  6. 6. Codificador de acordo com a reivindicação 5, caracterizado por compreender adicionalmente meio para codificar parametricamente o sinal de áudio em domínio do tempo usando o primeiro sinal de sub-banda.
  7. 7. Codificador de acordo com a reivindicação 5, caracterizado pelo fato de que o meio de conversão compreende um segundo banco de filtro (301, 303) para gerar uma variedade de sub-sub-bandas para cada sub-banda do primeiro sinal de sub-banda.
  8. 8. Codificador de acordo com a reivindicação 7, caracterizado
    Petição 870180137907, de 04/10/2018, pág. 51/64
    3 / 6 pelo fato de o segundo banco de filtro (301, 303) ser singularmente empilhado.
  9. 9. Codificador de acordo com a reivindicação 7, caracterizado pelo fato de que cada sub-banda do primeiro sinal de sub-banda compreende algumas sub-sub-bandas falsas que correspondem a uma banda falsa da subbanda e algumas sub-sub-bandas não-falsas que correspondem a uma banda não-falsa da sub-banda; e em que o meio de conversão (205) compreende meio de combinação (305) para combinar sub-sub-bandas falsas de uma primeira sub-banda com sub-sub-bandas não-falsas de uma segunda sub-banda, as subsub-bandas falsas e as sub-sub-bandas não-falsas tendo intervalos de frequência correspondentes do sinal em domínio do tempo codificados pelo codificador.
  10. 10. Codificador de acordo com a reivindicação 9, caracterizado pelo fato de que o meio de combinação (305) está arranjado para reduzir uma energia na banda falsa.
  11. 11. Codificador de acordo com a reivindicação 9, caracterizado pelo fato de que o meio de combinação (305) compreende meio para gerar um sinal de soma não-falso para uma primeira sub-sub-banda falsa na primeira subbanda e uma primeira sub-sub-banda não-falsa na segunda sub-banda.
  12. 12. Codificador de acordo com a reivindicação 11, caracterizado pelo fato de que o dito meio de combinação (305) compreende uma estrutura de borboleta para gerar o sinal de soma não-falso.
  13. 13. Codificador de acordo com a reivindicação 12, caracterizado pelo fato de que ao menos um coeficiente da estrutura de borboleta é dependente de uma resposta de frequência de um filtro do primeiro banco de filtro (203).
  14. 14. Codificador de acordo com a reivindicação 9, caracterizado pelo fato de que o dito meio de conversão (205) está arranjado para não incluir valores de dados para a banda falsa no fluxo de dados codificados.
  15. 15. Codificador de acordo com a reivindicação 5, caracterizado por compreender ainda meio para executar processamento de sinal não-falso no primeiro sinal de sub-banda antes da conversão ao segundo sinal de sub-banda.
    Petição 870180137907, de 04/10/2018, pág. 52/64
    4 / 6
  16. 16. Codificador de acordo com a reivindicação 5, caracterizado por compreender ainda meio para compensação de fase (511) do primeiro sinal de sub-banda antes da conversão ao segundo sinal de sub-banda.
  17. 17. Codificador de acordo com a reivindicação 5, caracterizado pelo fato de que o primeiro banco de filtro (203) é um banco de filtro QMF.
  18. 18. Método para gerar um sinal de áudio em domínio do tempo mediante decodificação por forma de onda, método este sendo caracterizado pelo fato de compreender:
    - receber um fluxo de dados codificados;
    - gerar um primeiro sinal de sub-banda mediante decodificação de valores de dados do fluxo de dados codificados, dito primeiro sinal de subbanda correspondendo a uma representação do sinal em domínio da sub-banda criticamente amostrado do sinal de áudio em domínio do tempo;
    - gerar um segundo sinal de sub-banda a partir do primeiro sinal de sub-banda ou sua versão processada mediante processamento da sub-banda, dito segundo sinal de sub-banda correspondendo a uma representação complexa do sinal em domínio da sub-banda não-criticamente amostrado do sinal de áudio em domínio do tempo;
    - decodificar parametricamente dados paramétricos com uso do segundo sinal de sub-banda; e
    - gerar, por um banco de filtro de síntese, o sinal de áudio em domínio do tempo a partir do segundo sinal de sub-banda.
  19. 19. Método para codificar um sinal de áudio em domínio do tempo, método este sendo caracterizado pelo fato de compreender:
    - receber o sinal de áudio em domínio do tempo;
    - gerar, por um primeiro banco de filtro, um primeiro sinal de sub-banda a partir do sinal de áudio em domínio do tempo, o primeiro sinal de sub-banda correspondendo a uma representação complexa do sinal em domínio da sub-banda não-criticamente amostrado do sinal em domínio do tempo;
    Petição 870180137907, de 04/10/2018, pág. 53/64
    5 / 6
    - codificar parametricamente o sinal de áudio em domínio do tempo com uso do primeiro sinal de sub-banda;
    - gerar um segundo sinal de sub-banda a partir do primeiro sinal de sub-banda ou sua versão processada mediante processamento da sub-banda, o segundo sinal de sub-banda correspondendo a uma representação do sinal em domínio da sub-banda criticamente amostrado dos sinais de áudio em domínio do tempo; e
    - gerar fluxo de dados codificados por forma de onda mediante codificação de valores de dados do segundo sinal de sub-banda.
  20. 20. Receptor para receber um sinal de áudio, receptor este sendo caracterizado pelo fato de que compreende o decodificador conforme definido na reivindicação 1.
  21. 21. Transmissor para transmitir um sinal de áudio codificado, transmissor este sendo caracterizado pelo fato de que compreende o codificador conforme definido na reivindicação 5; e meio para transmitir o fluxo de dados codificados por forma de onda.
  22. 22. Sistema de transmissão para transmitir um sinal de áudio em domínio do tempo, tal sistema de transmissão caracterizado por compreender o transmissor como definido na reivindicação 21; e o receptor como definido na reivindicação 20.
  23. 23. Método para receber um sinal de áudio, método este sendo caracterizado por compreender o método como definido na reivindicação 18.
  24. 24. Método para transmitir um sinal de áudio codificado, método este sendo caracterizado pelo fato de compreender o método como definido na reivindicação 19.
  25. 25. Método para transmitir e para receber um sinal de áudio em domínio do tempo, método este sendo caracterizado pelo fato de compreender o método conforme definido na reivindicação 24; e o método conforme definido na reivindicação 23.
    Petição 870180137907, de 04/10/2018, pág. 54/64
    6 / 6
  26. 26. Meio de armazenamento legível por computador, caracterizado pelo fato de que contém nele gravado o método conforme definido em qualquer uma das reivindicações 18, 19, 23, 24 ou 25.
  27. 27. Equipamento reprodutor de áudio, caracterizado pelo fato de compreender o decodificador como definido na reivindicação 1.
  28. 28. Equipamento gravador de áudio, caracterizado pelo fato de compreender o codificador como definido na reivindicação 5.
BRPI0517234-9A 2004-11-02 2005-10-31 Decodificador para gerar um sinal de áudio, codificador para codificar um sinal de áudio, métodos para gerar e para codificar um sinal de áudio, receptor para receber um sinal de áudio, transmissor e sistema de transmissão para transmitir um sinal de áudio, métodos para receber, transmitir, e transmitir e receber um sinal de áudio, meio de armazenamento legível por computador, equipamento reprodutor de áudio, e, equipamento gravador de áudio BRPI0517234B1 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP04105457.8 2004-11-02
EP04105457 2004-11-02
EP05108293 2005-09-09
EP05108293.1 2005-09-09
PCT/IB2005/053545 WO2006048814A1 (en) 2004-11-02 2005-10-31 Encoding and decoding of audio signals using complex-valued filter banks

Publications (2)

Publication Number Publication Date
BRPI0517234A BRPI0517234A (pt) 2008-10-07
BRPI0517234B1 true BRPI0517234B1 (pt) 2019-07-02

Family

ID=35530766

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0517234-9A BRPI0517234B1 (pt) 2004-11-02 2005-10-31 Decodificador para gerar um sinal de áudio, codificador para codificar um sinal de áudio, métodos para gerar e para codificar um sinal de áudio, receptor para receber um sinal de áudio, transmissor e sistema de transmissão para transmitir um sinal de áudio, métodos para receber, transmitir, e transmitir e receber um sinal de áudio, meio de armazenamento legível por computador, equipamento reprodutor de áudio, e, equipamento gravador de áudio

Country Status (11)

Country Link
US (1) US8255231B2 (pt)
EP (1) EP1810281B1 (pt)
JP (1) JP4939424B2 (pt)
KR (1) KR101187597B1 (pt)
CN (2) CN102148035B (pt)
BR (1) BRPI0517234B1 (pt)
ES (1) ES2791001T3 (pt)
MX (1) MX2007005103A (pt)
PL (1) PL1810281T3 (pt)
RU (1) RU2407069C2 (pt)
WO (1) WO2006048814A1 (pt)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2099027A1 (en) * 2008-03-05 2009-09-09 Deutsche Thomson OHG Method and apparatus for transforming between different filter bank domains
CA3076203C (en) 2009-01-28 2021-03-16 Dolby International Ab Improved harmonic transposition
BR122019023709B1 (pt) 2009-01-28 2020-10-27 Dolby International Ab sistema para gerar um sinal de áudio de saída a partir de um sinal de áudio de entrada usando um fator de transposição t, método para transpor um sinal de áudio de entrada por um fator de transposição t e meio de armazenamento
US8392200B2 (en) * 2009-04-14 2013-03-05 Qualcomm Incorporated Low complexity spectral band replication (SBR) filterbanks
US11657788B2 (en) * 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI675367B (zh) * 2009-05-27 2019-10-21 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
KR101599884B1 (ko) * 2009-08-18 2016-03-04 삼성전자주식회사 멀티 채널 오디오 디코딩 방법 및 장치
KR101701759B1 (ko) * 2009-09-18 2017-02-03 돌비 인터네셔널 에이비 입력 신호를 전위시키기 위한 시스템 및 방법, 및 상기 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 저장 매체
PL2545551T3 (pl) 2010-03-09 2018-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio
RU2591012C2 (ru) 2010-03-09 2016-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ обработки переходных процессов для аудио сигналов с изменением скорости воспроизведения или высоты тона
CA2792452C (en) * 2010-03-09 2018-01-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an input audio signal using cascaded filterbanks
RU2683175C2 (ru) 2010-04-09 2019-03-26 Долби Интернешнл Аб Стереофоническое кодирование на основе mdct с комплексным предсказанием
JP5850216B2 (ja) * 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
EP2581905B1 (en) * 2010-06-09 2016-01-06 Panasonic Intellectual Property Corporation of America Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
BR122021003887B1 (pt) 2010-08-12 2021-08-24 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Reamostrar sinais de saída de codecs de áudio com base em qmf
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
JP5552988B2 (ja) * 2010-09-27 2014-07-16 富士通株式会社 音声帯域拡張装置および音声帯域拡張方法
ES2564504T3 (es) 2010-12-29 2016-03-23 Samsung Electronics Co., Ltd Aparato de codificación y aparato de descodificación con una ampliación de ancho de banda
EP2719076B1 (en) * 2011-06-10 2021-08-11 Technion R&D Foundation Receiver, transmitter and a method for digital multiple sub-band processing
CN103918029B (zh) 2011-11-11 2016-01-20 杜比国际公司 使用过采样谱带复制的上采样
CN103366750B (zh) * 2012-03-28 2015-10-21 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
CN103366749B (zh) * 2012-03-28 2016-01-27 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
EP2709106A1 (en) * 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
ES2613747T3 (es) 2013-01-08 2017-05-25 Dolby International Ab Predicción basada en modelo en un banco de filtros críticamente muestreado
CN104078048B (zh) * 2013-03-29 2017-05-03 北京天籁传音数字技术有限公司 一种声音解码装置及其方法
KR20230020553A (ko) 2013-04-05 2023-02-10 돌비 인터네셔널 에이비 스테레오 오디오 인코더 및 디코더
ES2688134T3 (es) 2013-04-05 2018-10-31 Dolby International Ab Codificador y decodificador de audio para codificación de forma de onda intercalada
US9379830B2 (en) * 2013-08-16 2016-06-28 Arris Enterprises, Inc. Digitized broadcast signals
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
US9609451B2 (en) * 2015-02-12 2017-03-28 Dts, Inc. Multi-rate system for audio processing
BR112018005391B1 (pt) * 2015-09-22 2023-11-21 Koninklijke Philips N.V Aparelho para processamento de sinais de áudio, método de processamento de sinais de áudio, e dispositivo
EP3276620A1 (en) * 2016-07-29 2018-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis
EP3301673A1 (en) * 2016-09-30 2018-04-04 Nxp B.V. Audio communication method and apparatus
US10109959B1 (en) * 2017-05-25 2018-10-23 Juniper Networks, Inc. Electrical connector with embedded processor
JP7072041B2 (ja) * 2020-12-11 2022-05-19 株式会社東芝 計算装置
JP7254993B2 (ja) * 2020-12-11 2023-04-10 株式会社東芝 計算装置
WO2023118138A1 (en) * 2021-12-20 2023-06-29 Dolby International Ab Ivas spar filter bank in qmf domain

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
JPH05235701A (ja) * 1992-02-25 1993-09-10 Nippon Steel Corp 環状畳み込みによるディジタルフィルタバンク処理方法及び装置
DE19647399C1 (de) 1996-11-15 1998-07-02 Fraunhofer Ges Forschung Gehörangepaßte Qualitätsbeurteilung von Audiotestsignalen
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
KR100335609B1 (ko) 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
US6996198B2 (en) * 2000-10-27 2006-02-07 At&T Corp. Nonuniform oversampled filter banks for audio signal processing
CN1318904A (zh) * 2001-03-13 2001-10-24 北京阜国数字技术有限公司 一种实用的基于小波变换的声音编解码器
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US7555434B2 (en) * 2002-07-19 2009-06-30 Nec Corporation Audio decoding device, decoding method, and program
CA2399159A1 (en) * 2002-08-16 2004-02-16 Dspfactory Ltd. Convergence improvement for oversampled subband adaptive filters
BRPI0306434B1 (pt) * 2002-09-19 2018-06-12 Nec Corporation Aparelho e método de decodificação de áudio
WO2004105253A1 (ja) * 2003-05-21 2004-12-02 Sony Corporation データ処理装置、符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
KR101106026B1 (ko) * 2003-10-30 2012-01-17 돌비 인터네셔널 에이비 오디오 신호 인코딩 또는 디코딩

Also Published As

Publication number Publication date
PL1810281T3 (pl) 2020-07-27
US20090063140A1 (en) 2009-03-05
EP1810281B1 (en) 2020-02-26
WO2006048814A1 (en) 2006-05-11
EP1810281A1 (en) 2007-07-25
US8255231B2 (en) 2012-08-28
MX2007005103A (es) 2007-07-04
CN102148035B (zh) 2014-06-18
BRPI0517234A (pt) 2008-10-07
RU2007120591A (ru) 2008-12-10
JP2008519290A (ja) 2008-06-05
RU2407069C2 (ru) 2010-12-20
CN102148035A (zh) 2011-08-10
CN101053019B (zh) 2012-01-25
CN101053019A (zh) 2007-10-10
JP4939424B2 (ja) 2012-05-23
KR20070085681A (ko) 2007-08-27
ES2791001T3 (es) 2020-10-30
KR101187597B1 (ko) 2012-10-12

Similar Documents

Publication Publication Date Title
BRPI0517234B1 (pt) Decodificador para gerar um sinal de áudio, codificador para codificar um sinal de áudio, métodos para gerar e para codificar um sinal de áudio, receptor para receber um sinal de áudio, transmissor e sistema de transmissão para transmitir um sinal de áudio, métodos para receber, transmitir, e transmitir e receber um sinal de áudio, meio de armazenamento legível por computador, equipamento reprodutor de áudio, e, equipamento gravador de áudio
JP7483792B2 (ja) 符号化オーディオ信号を復号する復号装置および復号方法
ES2950286T3 (es) Decodificador para decodificar una señal de audio codificada y codificador para codificar una señal de audio
ES2901735T3 (es) Transposición armónica mejorada de productos de cruce
CN103329197B (zh) 用于反相声道的改进的立体声参数编码/解码
TW200947419A (en) Fast algorithms for computation of 5-point DCT-II, DCT-IV, and DST-IV, and architectures
CN104681030B (zh) 用于编码/解码信号的装置和方法
RU2665214C1 (ru) Стереофонический кодер и декодер аудиосигналов
CN101484936B (zh) 音频解码
BRPI0910792B1 (pt) &#34;sintetizador de sinal de áudio e codificador de sinal de áudio&#34;
BR122018007834B1 (pt) Codificador e decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, e, meio de armazenamento legível por computador
BR112012026324B1 (pt) Codificador de aúdio ou vídeo, decodificador de aúdio ou vídeo e métodos relacionados para o processamento do sinal de aúdio ou vídeo de múltiplos canais usando uma direção de previsão variável
BR112012013745B1 (pt) Método para decodificar um quadro de um sinal de áudio digital codificado, aparelho para decodificar um quadro de um sinal de áudio digital codificado e meio de armazenamento que grava o método
KR100776235B1 (ko) 변환 표시로의 변환 또는 변환 표시의 역변환을 위한 장치및 방법
US6629078B1 (en) Apparatus and method of coding a mono signal and stereo information
JP2004531151A (ja) 時間離散オーディオサンプル値を処理する方法と装置
Britanak et al. Cosine-/Sine-Modulated Filter Banks
KR101418227B1 (ko) 스피치 시그널 부호화 방법 및 복호화 방법
BRPI1007528A2 (pt) sistema para gerar um sinal de saída a partir de um sinal de entrada usando um fator de transposição t, sistema para decodificar um sinal de multimídia, método para transpor um sinal de entrada por um fator de transposição t, programa de software e meio de armazenamento
JPH11251917A (ja) 符号化装置及び方法、復号化装置及び方法、並びに記録媒体
Jhung et al. Architecture of dual mode audio filter for AC-3 and MPEG
CN118077000A (zh) 使用复数数据的音频处理方法及用于执行该方法的装置
Krishnan Fast integer MDCT for MPEG/audio coding

Legal Events

Date Code Title Description
B25G Requested change of headquarter approved

Owner name: KONINKLIJKE PHILIPS ELECTRONICS N.V. (NL) , CODING

B25D Requested change of name of applicant approved

Owner name: KONINKLIJKE PHILIPS ELECTRONICS N.V. (NL) , DOLBY

B25D Requested change of name of applicant approved

Owner name: KONINKLIJKE PHILIPS ELECTRONICS N.V. (NL) , DOLBY

B06T Formal requirements before examination [chapter 6.20 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 02/07/2019, OBSERVADAS AS CONDICOES LEGAIS. (CO) 10 (DEZ) ANOS CONTADOS A PARTIR DE 02/07/2019, OBSERVADAS AS CONDICOES LEGAIS

B25G Requested change of headquarter approved

Owner name: KONINKLIJKE PHILIPS ELECTRONICS N.V. (NL) ; DOLBY INTERNATIONAL AB (IE)