BRPI0612218B1 - codificação de áudio residual adaptativa - Google Patents

codificação de áudio residual adaptativa Download PDF

Info

Publication number
BRPI0612218B1
BRPI0612218B1 BRPI0612218-3A BRPI0612218A BRPI0612218B1 BR PI0612218 B1 BRPI0612218 B1 BR PI0612218B1 BR PI0612218 A BRPI0612218 A BR PI0612218A BR PI0612218 B1 BRPI0612218 B1 BR PI0612218B1
Authority
BR
Brazil
Prior art keywords
signal
audio
parameter
downmix
processed
Prior art date
Application number
BRPI0612218-3A
Other languages
English (en)
Inventor
Francois Philippus Myburg
Lars Villemoes
Original Assignee
Koninklijke Philips Electronics N. V
Dolby International Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=36589009&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=BRPI0612218(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Koninklijke Philips Electronics N. V, Dolby International Ab filed Critical Koninklijke Philips Electronics N. V
Publication of BRPI0612218A2 publication Critical patent/BRPI0612218A2/pt
Publication of BRPI0612218B1 publication Critical patent/BRPI0612218B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Abstract

CODIFICAÇÃO DE ÁUDIO RESIDUAL ADAPTATIVA. Sinal de áudio tendo pelo menos dois canais pode ser eficientemente processado por downmix em um sinal de dowrimix e um sinal residual, quando a regra de dowrirnix usada depende de um parâmetro espacial que é derivado do sinal de áudio e que é pôs-processado por um limitador para aplicar certo limite ao parâmetro espacial provido, com o objetivo de evitar instabilidades durante o processo de upmix ou downmix. Tendo uma regra de downmix que dinamicamente depende de parâmetros que descrevem uma inter-relação dos canais de áudio, é possível garantir que a energia dentro do sinal residual que sofreu dowrimix seja a menor possível, o que é vantajoso em vista da eficiência de codificação. Por pós-processamento do parâmetro espacial com um limitador antes de seu uso no processo de downmix, é possível evitar instabilidades no downrnix ou upmix, o que, por outro lado, poderia resultar em um distúrbio da percepção espacial do sinal de áudio codificado ou decodificado.

Description

Campo da Invenção
1. A presente invenção se refere à codificação e de- codificação de sinais de áudio e, em especial, à codificação efi-ciente de alta qualidade de um par de canais de áudio.
Histórico da técnica anterior da invenção
2. Recentemente, codificação efetiva de alta qualidade de sinais de áudio tem se tornado cada vez mais importante, visto que distribuição digital de conteúdo de áudio e vídeo comprimido, por exemplo, por satélite ou por transmissão de áudio ou vídeo digital terrestre, é amplamente usada. A técnica MP3 bem conhecida, por exemplo, permite a transmissão conveniente de títulos de áudio pela internet ou por outros canais de transmissão que possuem larguras de bandas limitadas.
3. Em adição à MP3, vários outros esquemas de codi-ficação de áudio objetivam maximizar a qualidade de áudio para uma taxa de compressão ou taxa de bit provida. Foi demonstrado no "Ef-ficient and scalable Parametric Stereo Coding for Low Bit rate Au-dio Coding Applications", PCT/SE02/01372, que é possível recriar um sinal estéreo que se assemelhe bastante com a imagem estéreo original subjacente, a partir de um sinal mono quando é usada, adicionalmente, uma representação muito compacta do sinal estéreo, comumente referida como “sinais de som espaciais”. Este princípio revelado divide o sinal de entrada estéreo em bandas de freqüência e estima parâmetros, os quais são denominados diferença de inten-sidade entre canais (IID) e coerência entre canais (ICC), para cada uma das bandas de freqüência separadamente. O primeiro parâmetro descreve uma medição da distribuição de energia entre os dois canais na banda de freqüência específica e o segundo parâmetro descreve uma estimativa da correlação entre os dois canais. Uma descrição mais completa de parâmetros espaciais pode ser encontrada no “High-quality parametric spatial audio coding at low bit rates” J. Breebaart, S. van de Par, A. Kohlrausch e E. Schuijers, Proc. 116thAES Convention, Berlin (Alemanha), 8 a 11 de Maio de 2004. Com base nestes sinais de som espaciais, o sinal de entrada estéreo é adaptativamente combinado em um sinal mono. Ambos os sinais de som espaciais e o sinal mono são codificados e a representação codificada é multiplexada em um fluxo de bits, que é transmitida para o decodificador. No lado do decodificador a imagem estéreo é recriada a partir do sinal mono pela distribuição da energia do sinal mono entre os dois canais de saída, de acordo com os dados IID, e pela adição de um sinal descorrelacionado, de modo a reter a correlação de canal dos canais estéreos originais, conformeé descrito pelos parâmetros IIC.
4. Quando mais larguras de banda de transmissão estão disponíveis, uma qualidade de áudio mais elevada por ser obtida pela substituição do sinal mono descorrelacionado no decodifi- cador por um sinal residual transmitido. Isto é, é requerida a transmissão de um sinal residual adicional para um decodificador. Este é, também, o caso da codificação do lado central (MS), onde a soma e a diferença dos canais de um sinal estéreo são codificadas em vez dos canais esquerdo e direito diretamente. Uma descrição da técnica MS pode ser encontrada no “Sum-difference stereo transform coding”, Proc. Int. Conf. Acoust. Speech Signal Process. (ICASSP), São Francisco, EUA, 1992, págs. II 569 - 572. Codificação MS é ba-seada na descoberta de que o canal esquerdo e o canal direito de um sinal de estéreo são, provavelmente, bastante similares. Por-tanto, uma diferença do canal esquerdo e do canal direito resultará em um sinal tendo uma intensidade comparativamente baixa a maior parte do tempo, isto é, a amplitude do sinal de diferença será bem pequena. Dessa maneira, é possível economizar uma quantidade significativa de taxa de bits ao codificar o sinal de diferença, visto que os parâmetros que descrevem o sinal de diferença podem ser grosseiramente quantizados. O sinal de soma evidentemente ne-cessitará aproximadamente da mesma largura de banda que um canal esquerdo ou direito único, quando codificado. Portanto, é possível economizar uma quantidade significativa de largura de banda no to-tal ao usar o esquema de codificação MS. Quando existir uma grande diferença de intensidade entre o canal esquerdo e o canal direito, a técnica MS terá suas limitações, visto que, então, também o canal de diferença conterá uma quantidade substancial de energia e, portanto, necessitará de uma largura de banda mais elevada. Pode ser observado, entretanto, que em implementações de estéreo codi-ficado regulares, codificação MS não será aplicada neste caso, de-vido aos altos custos da codificação. Nestes casos, é vantajoso ter a possibilidade de mudar de codificação estéreo normal para codificação MS, dependendo da intensidade carregada pelos canais de áudio originais que devem ser codificados.
5. Substituindo o conceito estático de construção da soma e da diferença de dois canais estéreos que devem ser codifi-cados por meio da invenção de uma matriz de rotação do decodifica- dor, com elementos de matriz que descrevem a composição de dois canais intermediários que são uma combinação de dois canais esté-reos,é possível superar o problema acima. Os elementos de matriz dependem de parâmetros de estéreo paramétrico que são extraídos do canal esquerdo e direito do sinal estéreo. Codificação residual adaptativa deve ser capaz de adaptar dinamicamente a regra de com-binação para a geração de canais intermediários às propriedades do sinal presente, atingindo um ganho de desempenho significativo em relação à codificação MS.
6. Ao escolher uma dependência adequada dos elementos de matriz da referida matriz de rotação dos parâmetros de estéreo paramétrico, é possível conseguir que a energia dentro de um canal de diferença permaneça tão pequena quanto possível, conforme demonstrado anteriormente no pedido de patente Européia não reve-lada, EP 04103168.3. Conforme é introduzida uma matriz de rotação para transformar (downmix ou upmix) o sinal estéreo em sinais m e s (os sinais intermediários, isto é, o sinal de downmix m e o sinal residual s), é crucial para a operação do método que as matrizes de rotação (a matriz de rotação do decodificador e a matriz de rotação do codificador) estejam unidas. Isto significa que os elementos de matriz dentro das matrizes não divergem infinitamente dentro da faixa inteira possível dos parâmetros de codificação de estéreo paramétrico. Em outras palavras, ambas as matrizes de rotação devem ser unidas no sentido de que o número de condição de matriz seja suficientemente pequeno para permitir inversão de matriz isenta de problema para a faixa inteira de parâmetros de codificação de estéreo paramétrico, o que não ocorre para implementação de acordo com a técnica anterior.
Sumário da Invenção
7. O objetivo da presente invenção é prover um con-ceito para codificação de áudio de alta qualidade que resulte em uma representação grandemente comprimida de um sinal de áudio, evitando simultaneamente artefatos introduzidos pela codificação ou decodificação de forma mais eficiente.
8. De acordo com um primeiro aspecto da presente in-venção, este objetivo é atingido por um codificador de áudio para codificar um sinal de áudio tendo pelo menos dois canais, compre-endendo: um extrator de parâmetro para prover um parâmetro espacial do sinal de áudio, onde o parâmetro espacial descreve uma in- ter-relação dos pelo menos dois canais; um limitador para limitar o parâmetro espacial usando uma regra de limitação para prover um parâmetro espacial limitado, onde a regra de limitação depende de uma inter-relação dos pelo menos dois canais; e um dispositivo de downmix para prover um sinal de downmix e um sinal residual do sinal de áudio usando uma regra de downmix que depende do parâmetro espacial limitado.
9. De acordo com um segundo aspecto da presente in-venção, este objetivo é atingido por um decodificador de áudio para decodificar um sinal de áudio decodificado representando um sinal de áudio original que tem pelo menos dois canais, o sinal de áudio codificado tendo um sinal de downmix, um sinal residual e um parâmetro espacial que descreve uma inter-relação dos pelo menos dois canais, compreendendo: um limitador para limitar o parâmetro espacial de modo a prover um parâmetro espacial limitado usando uma regra de limitação, onde a regra de limitação depende de uma inter-relação dos pelo menos dois canais; e um dispositivo de upmix para prover uma reconstrução do sinal de áudio original do sinal de downmix e do sinal residual usando uma regra de upmix que depende do parâmetro espacial limitado.
10. De acordo com um terceiro aspecto da presente in-venção, este objetivo é atingido por um método para codificar um sinal de áudio que tem pelo menos dois canais, o método compreen-dendo: prover um parâmetro espacial do sinal de áudio, onde o pa-râmetro espacial descreve uma inter-relação dos pelo menos dois canais; limitar o parâmetro espacial usando uma regra de limitação para prover um parâmetro espacial limitado, onde a regra de limi-tação depende de uma inter-relação dos pelo menos dois canais; e prover um sinal de downmix e um sinal residual a partir de um sinal de áudio usando uma regra de downmix que depende do parâmetro espacial limitado.
11. De acordo com um quarto aspecto da presente in-venção, este objetivo é atingido por um método para decodificar um sinal de áudio codificado que representa um sinal de áudio original tendo pelo menos dois canais, o sinal de áudio codificado tendo um sinal de downmix, um sinal residual e um parâmetro espacial que descreve uma inter-relação dos pelo menos dois canais, o método compreendendo: limitar o parâmetro espacial para prover um pa-râmetro espacial limitado usando uma regra de limitação, onde a regra de limitação depende de uma inter-relação dos pelo menos dois canais; e provendo uma reconstrução do sinal de áudio original a partir do sinal de downmix e do sinal residual usando uma regra de upmix que depende do parâmetro espacial limitado.
12. De acordo com um quinto aspecto da presente in-venção, este objetivo é atingido por um transmissor ou gravador de áudio que tem um codificador de áudio para codificar um sinal de áudio que tenha pelo menos dois canais, compreendendo: um extrator de parâmetro para prover um parâmetro espacial do sinal de áudio, onde o parâmetro espacial descreve uma inter-relação dos pelo menos dois canais; um limitador para limitar o parâmetro espacial usando uma regra de limitação para prover um parâmetro espacial, onde a regra de limitação depende de uma inter-relação dos pelo menos dois canais; e um dispositivo de downmix para prover um sinal de downmix e um sinal residual do sinal de áudio usando uma regra de downmix que depende do parâmetro espacial limitado.
13. De acordo com um sexto aspecto da presente inven-ção, este objetivo é atingido por um receptor ou reprodutor de áu-dio, que tem um decodificador de áudio para decodificar um sinal de áudio codificado representando um sinal de áudio original que tem pelo menos dois canais, o sinal de áudio codificado tendo um sinal de downmix, um sinal residual e um parâmetro espacial que descreve uma inter-relação dos pelo menos dois canais, compreendendo: um limitador para limitar o parâmetro espacial para prover um parâmetro espacial limitado usando uma regra de limitação, onde a regra de limitação depende de uma inter-relação dos pelo menos dois canais; e um dispositivo de upmix para prover uma reconstrução do sinal de áudio original a partir do sinal de downmix e do sinal residual usando uma regra de upmix que depende do parâmetro espacial limitado.
14. De acordo com um sétimo aspecto da presente in-venção, este objetivo é atingido por um método de transmissão ou gravação de áudio, o método tendo um método para gerar um sinal codificado, o método compreendendo um método para codificar um si-nal de áudio que tem pelo menos dois canais, o método compreenden-do: prover um parâmetro espacial a partir do sinal de áudio, onde o parâmetro espacial descreve uma inter-relação dos pelo menos dois canais; limitar o parâmetro espacial usando uma regra de li-mitação para prover um parâmetro espacial limitado, onde a regra de limitação depende de uma inter-relação dos pelo menos dois canais; provendo um sinal de downmix e um sinal residual a partir do sinal de áudio usando uma regra de downmix que depende do parâmetro espacial limitado.
15. De acordo com um oitavo aspecto da presente in-venção, este objetivo é atingido por um método de recepção ou re-produção de áudio, o método tendo um método para decodificar um sinal de áudio codificado, o método compreendendo um método para decodificar um sinal de áudio codificado que representa um sinal de áudio original tendo pelo menos dois canais, o sinal de áudio codificado tendo um sinal de downmix, um sinal residual e um parâ-metro espacial que descreve uma inter-relação dos pelo menos dois canais, o método compreendendo: limitar o parâmetro espacial de modo a prover um parâmetro espacial limitado usando uma regra de limitação, onde a regra de limitação depende de uma inter-relação dos pelo menos dois canais; e provendo uma reconstrução do sinal de áudio original a partir do sinal de downmix e do sinal residual usando uma regra de upmix que depende do parâmetro espacial limitado.
16. De acordo com um nono aspecto da presente invenção, este objetivo é atingido por um sistema de transmissão que tem um transmissor e um receptor, o transmissor tendo um codificador de áudio para codificar um sinal de áudio que tem pelo menos dois canais, compreendendo: um extrator de parâmetro para prover um parâmetro espacial a partir do sinal de áudio, onde o parâmetro espacial descreve uma inter-relação dos pelo menos dois canais; um limitador para limitar o parâmetro espacial usando uma regra de limitação para prover um parâmetro espacial limitado, onde a regra de limitação depende de uma inter-relação dos pelo menos dois ca-nais; e um dispositivo de downmix para prover um sinal de downmix e um sinal residual a partir do sinal de áudio, usando uma regra de downmix que depende do parâmetro espacial limitado; e o receptor tendo um decodificador de áudio para decodificar um sinal de áudio codificado que representa um sinal de áudio original tendo pelo menos dois canais, o sinal de áudio codificado tendo um sinal de downmix, um sinal residual e um parâmetro espacial que descreve uma inter-relação dos pelo menos dois canais, compreendendo: um limitador para limitar o parâmetro espacial para prover um parâme-tro espacial limitado usando uma regra de limitação, onde a regra de limitação depende de uma inter-relação dos pelo menos dois ca-nais; e um dispositivo de upmix para prover uma reconstrução do sinal de áudio original a partir do sinal de downmix e do sinal residual, usando uma regra de upmix que depende do parâmetro espacial limitado.
17. De acordo com um décimo aspecto da presente in-venção, este objetivo é atingido por um método de transmissão e recepção, o método incluindo um método de transmissão que tem um método para gerar um sinal codificado a partir de um sinal de áudio tendo pelo menos dois canais, o método compreendendo: prover um parâmetro espacial do sinal de áudio, onde o parâmetro espacial descreve uma inter-relação dos pelo menos dois canais; limitar o parâmetro espacial usando uma regra de limitação para prover um parâmetro espacial limitado, onde a regra de limitação depende de uma inter-relação dos pelo menos dois canais; e prover um sinal de downmix e um sinal residual a partir do sinal de áudio usando uma regra de downmix que depende do parâmetro espacial limitado; e um método de recepção que tem um método para decodificar um sinal de áudio codificado, o método compreendendo: limitar o parâmetro es-pacial para prover um parâmetro espacial limitado usando uma regra de limitação, onde a regra de limitação depende de uma inter- relação dos pelo menos dois canais; e prover uma reconstrução do sinal de áudio original a partir do sinal de downmix e do sinal residual usando uma regra de upmix que depende do parâmetro espacial limitado.
18. De acordo com um décimo primeiro aspecto da pre-sente invenção, este objetivo é atingido por um sinal de áudio co-dificado que é uma representação de um sinal de áudio tendo pelo menos dois canais, o sinal de áudio codificado tendo um parâmetro espacial que descreve uma inter-relação dos pelo menos dois canais, um sinal de downmix e um sinal residual, onde o sinal de downmix e o sinal residual são derivados do sinal de áudio usando uma regra de downmix que depende de um parâmetro espacial limitado provido usando uma regra de limitação que depende de uma inter- relação dos pelo menos dois canais.
19. A presente invenção é baseada na descoberta de que um sinal de áudio tendo pelo menos dois canais pode sofrer downmix eficientemente em um sinal de downmix e um sinal residual, quando a regra de downmix usada depende de um parâmetro espacial que é derivado do sinal de áudio e que é pós-processado por um limitador para aplicar certo limite ao parâmetro espacial derivado com o objetivo de evitar instabilidade durante os processos de upmix ou downmix. Tendo uma regra de downmix que depende dinamica- mente de parâmetros que descrevem uma inter-relação dos canais de áudio, é possível assegurar que a energia dentro do sinal residual de downmix seja tão pequena quanto possível, o que é vantajoso emrelação à eficiência de codificação. Através de pós-processamento do parâmetro espacial com o limitador antes do uso deste no downmix, é possível evitar instabilidades no downmix ou upmix, o que, por outro lado, resultaria em um distúrbio na percepção espacial do sinal de áudio codificado ou decodificado.
20. Em uma configuração da presente invenção, um si-nalestéreo original que tem um canal esquerdo e um canal direito,é suprido para um dispositivo de downmix e um extrator de parâmetro. O extrator de parâmetro deriva os parâmetros espaciais comu- mente conhecidos ICC (Correlação Entre Canais) e IDD (Diferença deIntensidade Entre Canais). O dispositivo de downmixé capaz de fazer o downmix dos canais esquerdo e direito em um sinal de downmixe um sinal residual, onde a regra de downmixé tal que o sinal residual resultante carrega a energia mínima atingível. Portanto, compressão subseqüente do sinal residual resultante por um codificador de áudio padrão resultará em um código extremamente compacto. Isto pode ser atingido pela formulação da regra de downmix emdependência dos parâmetros espaciais ICC e IID, visto que ambos osparâmetros são descrições de proporções de intensidade ou amplitude dos canais estéreos originais. Um problema geral durante codificação é a preservação de energia. É necessário que ambos, o sinal original e o sinal codificado, contenham a mesma energia, visto que uma violação da conservação de energia resultaria em umapercepção de altura de som diferente dos sinais codificados, ou mesmo em saltos incontroláveis na altura do sinal codificado. Por- tanto, no esquema de codificação acima, o sinal de downmix e o sinal residual devem ser escalados por um fator de escalonamento que garanta a regra de conservação de energia.
21. Se o sinal de áudio original que deve ser codifi-cado tiver propriedades especiais, este fator de escalonamento pode divergir, especialmente quando o canal original esquerdo e direito forem perfeitamente anti-correlacionados, isto é, quando eles tiverem as mesmas amplitudes e uma mudança de fase de precisamente 180°. Esta instabilidade é evitada dentro do conceito inventivo pela aplicação de uma função limitativa para o parâmetro ICC, onde a função de limitação depende de um fator de escalonamento máximo aceitável e do parâmetro IID. Para evitar uma possível divergência, a regra que descreve o downmix é alterada diretamente, enquanto em implementações da técnica anterior o fator de escalonamento é simplesmente limitado pela definição de um limite e o fator de escalonamento é substituído pelo valor de limite quando o fator exceder o limite.
22. É uma grande vantagem do conceito inventivo, que ambos os sinais dentro do canal de downmix e o canal residual sejam alterados através da alteração dos parâmetros que estão subjacentes ao processo de downmix. Apenas o sinal no canal de downmix seria influenciado ao aplicar um limite de acordo com a técnica anterior, assim uma preservação melhor da inter-relação entre o canal original esquerdo e direito pode ser atingida quando o conceito inventivo é aplicado.
23. Uma outra vantagem do conceito descrito acima é que os parâmetros espaciais usados são geralmente derivados durante um processo de codificação. Portanto, é possível implementar a lógica de limitação necessária sem ter que introduzir novos parâ-metros.
24. Em uma configuração adicional da presente invenção, um limitador é aplicado no lado do decodificador, tendo a mesma regra de limitação que um limitador no lado do codificador. Isto significa que no lado do decodificador, o downmix e o sinal residual, assim como os parâmetros espaciais IID e ICC, são recebidos, e os parâmetros espaciais recebidos são limitados usando a mesma regra de limitação usada durante o processo de codificação. O upmixé, então, dependente dos parâmetros espaciais limitados, garantindo a não ocorrência de uma divergência no processo de upmix. A vantagem de ter as mesmas regras de limitação na codificação e na decodificação é óbvia, visto que é necessário desenvolver circuitos de hardware ou uma implementação de um algoritmo de software apenas uma única vez. Hardware ou software que têm tanto funcionalidade de codificação quando de decodificação, podem ser desenvolvidos com custos menores, visto que é possível reutilizar o mesmo hardware ou software para a funcionalidade de limitação.
25. Em uma configuração adicional da presente invenção, os sinais de downmix e os parâmetros espaciais são comprimidosapós sua geração, resultando em duas correntes de bits de áudio para os sinais de downmix e um fluxo de bits de parâmetro que retém os parâmetros espaciais comprimidos. Isto reduz o tamanho da representação codificada a ser transmitida, economizando, adicio-nalmente, largura de banda, onde a codificação pode ser com perda ou sem perda, visto que a própria regra de codificação é indepen-dente do conceito inventivo. Um decodificador inventivo de acordo com o conceito inventivo, então, compreende um estágio de descom- pressão, onde as representações comprimidas são descomprimidas nos parâmetros espaciais, no canal de downmix e no canal residual antes de efetuar upmix.
26. Em uma outra configuração da presente invenção, as correntes de bits de áudio já comprimidas e o fluxo de bits de parâmetro são combinadas em um fluxo de bits combinado, por exem-plo, por multiplexação, permitindo uma armazenagem conveniente de um arquivo gerado em um meio de armazenagem. Isto também permite aplicações de streaming, por exemplo, streaming do conteúdo codi-ficadoatravés da internet, visto que toda a informação relevante está compreendida em um único arquivo ou fluxo de bits, permitindo um manuseio mais conveniente do que em um caso onde três correntes de bit separadas devem ser transferidas. O decodificador inventivo correspondente, então, tem um estágio de descombinação, que pode-ria, por exemplo, ser um desmultiplexador para descombinar o fluxo de bits em três correntes de bits separadas, isto é, as duas cor-rentes de bits de áudio e o fluxo de bits de parâmetro.
27. Deve ser observado aqui que o conceito inventivo provê uma compatibilidade retroativa perfeita à codificação resi-dual da técnica anterior onde os parâmetros espaciais não estão limitados, e mesmo à codificação estéreo paramétrica da técnica anterior onde um decodificador não usa o sinal residual. Isto é, obviamente, uma vantagem importante, visto que dados de áudio co-dificados recentemente podem ser reproduzidos com a qualidade má-ximapossível pelos decodificadores inventivos, enquanto eles po-demtambém ser reproduzidos por decodificadores já existentes de acordo com a técnica anterior.
28. Em uma configuração adicional da presente inven- ção, três codificadores inventivos são combinados para codificar um sinal de áudio de canais múltiplos compreendendo seis canais individuais, onde cada um dos três codificadores inventivos codi-fica um par de canais, derivando parâmetros espaciais, um downmix e um sinal residual para cada um dos pares de canal. O conceitoinventivo pode, portanto, ser usado também para codificar sinais de áudio de canais múltiplos onde a eficiência da codificação e acompactação da representação resultante têm uma prioridade ainda maior, visto que a quantidade total de dados a ser codificada e transmitida é muito maior que para um sinal estéreo. Em princípio, um número arbitrário de codificadores de áudio inventivos pode sercombinado para codificar simultaneamente um sinal de áudio de ca-naismúltiplos tendo basicamente qualquer número de canais de áu-diosúnicos. Em uma configuração adicional do codificador de áudiode canais múltiplos, os sinais de downmix individuais e os sinais residuais, assim como as correntes de bit de parâmetro individual são combinadas por um dispositivo de downmix de 3 para 2 para re-ceber um sinal esquerdo comum, um sinal direito comum, e um sinalresidual comum e um fluxo de bits de parâmetro combinada, reduzindo adicionalmente a quantidade de largura de banda requerida. Os decodificadores correspondentes compreendem então, de forma direta, um estágio de dispositivo de upmix de 2 para 3.
29. Em uma outra configuração da presente invenção,um transmissor ou gravador de áudio compreende um codificador in-ventivo, permitindo gravação ou transmissão de áudio compacta, de alta qualidade, onde o tamanho do conteúdo de áudio transmitido ou armazenado pode ser significativamente reduzido. Este conteúdo de áudio pode ser armazenado em um meio de armazenagem de uma capaci- dade dada ou largura de banda menor é usada durante a transmissão do sinal de áudio.
30. Em uma outra configuração, um receptor ou reprodutor de áudio tem um decodificador inventivo, que permite aplica-ções de streaming em ambientes de largura de banda limitados tais como telefones móveis ou que permite a construção de dispositivos de reprodução portáteis pequenos, usando meios de armazenagem de capacidade limitada.
31. Uma combinação de um transmissor e receptor inventivos resulta em um sistema de transmissão que permite transmi-tir, de forma conveniente, conteúdo de áudio através de interfaces de transmissão com fio ou sem fio, tais como LAN sem fio, Blueto-oth, LAN com fio, tecnologias de linha de energia, transmissão de rádio, ou qualquer outro tipo de transmissão de dados.
Breve descrição dos desenhos
32. Configurações preferidas da presente invenção sãodoravante descritas por referência aos desenhos em anexo, onde:
33. A Fig. 1 mostra um diagrama de bloco de um codificador inventivo;
34. A Fig. 2 mostra um diagrama de bloco do princípiode codificação inventivo;
35. A Fig. 3 mostra uma outra configuração de um codificador inventivo;
36. A Fig. 4 mostra a compatibilidade retroativa doesquema de codificação inventivo em relação aos decodificadores da técnica anterior;
37. A Fig. 5 mostra um codificador de áudio de canaismúltiplos inventivo;
38. A Fig. 6 mostra um diagrama de bloco de um deco-dificador de áudio inventivo;
39. A Fig. 7 mostra um diagrama de bloco do conceitoinventivo de decodificação;
40. A Fig. 8 mostra uma configuração adicional de umdecodificador inventivo;
41. A Fig. 9 mostra uma configuração de um decodifi-cador de áudio de canais múltiplos inventivo;
42. A Fig. 10 mostra uma configuração alternativa deum codificador de áudio inventivo;
43. A Fig. 11 mostra uma configuração alternativa deum decodificador de áudio inventivo;
44. A Fig. 12 mostra um transmissor/gravador de áudioinventivo;
45. A Fig. 13 mostra um receptor/reprodutor de áudioinventivo;
46. A Fig. 14 mostra um sistema de transmissão inven-tivo.
Descrição detalhada de configurações preferidas
47. A Figura 1 mostra um diagrama de bloco de um co-dificador de áudio inventivo 10, compreendendo um dispositivo de downmix 12, um limitador 14, e um extrator de parâmetro 16.
48. Um sinal estéreo 18, tendo um canal esquerdo e um canal direito, é inserido simultaneamente em um dispositivo de downmix 12 e no extrator de parâmetro 16. O extrator de parâmetro 16 extrai parâmetros espaciais 19 que descrevem uma inter-relação entre o canal esquerdo e o canal direito do sinal estéreo 18. Estes parâmetros são, por um lado, disponibilizados para transmissão e, por outro lado, inseridos no limitador 14. O limitador 14 aplica uma regra de limitação aos parâmetros. Os detalhes de uma regra de limitação apropriada devem ser providos nos parágrafos a seguir.
49. O limitador deriva parâmetros espaciais limitados e estes são inseridos no dispositivo de downmix 12, onde o dispositivo de downmix 12 aplica uma regra de downmix ao canal esquerdo e canal direito do sinal estéreo 18 para prover um sinal de downmix 20 e um sinal residual 22 a partir do canal esquerdo e canal direito do sinal estéreo. A regra de downmixé adicionalmente dependente do parâmetro espacial limitado.
50. Ao escolher uma regra de limitação apropriada para o limitador, o dispositivo de downmix 12 é suprido apenas com parâmetros limitados que são limitados de uma maneira que a regra de downmix que não cause divergência ou produza qualquer saída que esteja deteriorando uma inter-relação espacial do canal esquerdo e do canal direito devido ao downmix.
51. Como um resultado, o sinal estéreo 18 é represen-tado pelo sinal de downmix 20, pelo sinal residual 22, e pelos pa-râmetros espaciais 19 após o processo de codificação executado pelo codificador de áudio 10.
52. Para entender como uma regra de downmix e uma regra de limitação têm que inter-relacionar para prover um sinal residual resultante 22 contendo energia plausível mínima, enquanto limita simultaneamente um parâmetro espacial, de modo que a regra de downmixnão cause quaisquer divergências, o conceito básico subjacente da presente invenção é elaborado em maiores detalhes nos poucos parágrafos a seguir.
53. Os parâmetros extraídos pelo extrator de parâmetro 16, tipicamente resulta de um tempo único e intervalo de fre- qüência de amostras de sub-banda de uma análise de banco de filtro modulado complexo de sinais de tempo discretos. Isto significa que o sinal de áudio do canal esquerdo e do canal direito do sinal es-téreo 18 é primeiramente dividido em quadros de tempo de um com-primento dado, e dentro de um quadro de tempo único, o espectro de freqüência é subdividido em uma quantidade de amostras de subbanda. Para cada sub-banda única, o extrator de parâmetro 16, então, provê um parâmetro espacial por comparação dos canais esquerdo e direito do sinal estéreo dentro da sub-banda de interesse. Portanto, o canal esquerdo e o canal direito do sinal estéreo 18 e o sinal de downmix m e o sinal residual s da Figura 1 têm que ser entendidos como vetores de comprimento discretos e finitos, que descrevem os sinais subjacentes dentro de um intervalo de tempo discreto. Conforme mencionado acima, durante um processo de downmix, preservação de energia deve ser garantida. Para vetores complexos discretos x, y, o produto interno complexo e a norma quadrada(comparável à energia) é definida por
54.
Figure img0001
55. Após a convenção normal, um * denota conjugaçãocomplexa. A partir daqui, letras maiúsculas descrevem a soma doquadrado ou energia dos vetores complexos de comprimento finitocorrespondentes, denotados por letras minúsculas.
56. De acordo com a presente invenção, o canal de m resultante do downmix adaptativo é a soma pesada da do canal original esquerdo e direito, e, dessa maneira,
57.
Figure img0002
58. 58. onde g é um fator de ganho real e positivo ajustado de modo que a energia do downmix (M) seja igual à soma de energias dos vetores de sinal do canal esquerdo (L) e direito (R) (M = L + R).
59. Visto que este fator de ganho diverge até o infi- nito quando 1 e r estão fora de fase e têm energia comparável (istoé, 1 + r = 0 na equação no 2), é necessário limitar este fator por um fator de ganho máximo g0 que esteja, tipicamente, dentro do intervalo [1,2]. O extrator de parâmetro 16, conforme mostrado naFigura 1, extrai os parâmetros de áudio espaciais IID (Diferençade Intensidade Entre Canais) e ICC (Coerênciasão representados por
60.
Figure img0003
61. aqui c denote o parametric lld e denote o para âmetro ICC. O fator de ganho g pode ser expresso dependendo dos parâmetros ICC e IID e esta limitação requerida do fator de ganho pode ser escrita como segue:
62.
Figure img0004
63 . De forma geral, visto que
Figure img0005
nós temos
Figure img0006
de modo que
Figure img0007
64. Para atingir eficiência máxima de codificação, é desejado que a energia dentro do sinal residual 22 seja mínima. A derivação a seguir resolve um problema de otimização mais geral compreendendo um sinal residual adicional t, que, então, se revela sendo supérfluo devido a (9). Considerando o problema do lado do decodificador, é necessário determinar ganhos a, b, de modo que os sinais residuais s, t no upmix
65
Figure img0008
66 tenham energia mínima. A solução é provida por
67
Figure img0009
68 onde
69
Figure img0010
70. O mesmo problema, com a restrição adicional de que os coeficientes a,b são reais, tem a solução provida por tomar a parte real de (7) e a inserir em (6). Neste caso, pode ser expresso em termos dos parâmetros PS c, , como segue:
71
Figure img0011
72. Inserindo (6) em (5) e adicionando as duas equações em (5) ocorre que:
73.
Figure img0012
74. Ao descrever o processo de upmix na notação de matriz usual, o upmix pode ser representado por uma matriz de rotação H, como segue:
75
Figure img0013
76. No caso onde g não está limitado por g0em (4),uma representação diferente dos coeficientes ideais a, b é providapor:
77
Figure img0014
78. A primeira coluna da matriz giradora H é idêntica ao rotador de amplitude usado no estéreo paramétrico, que é, por exemplo, provido no WO 03/090206 A1.
79. O downmix necessita ser compatível com o upmix no sentido em que a reconstrução perfeita seja obtida quando todas as etapas de codificação com perda forem omitidas. Como uma conse-qüência, a matriz de downmixD,
80
Figure img0015
81. deve ser o inverso do rotador de upmix H. Umacomputação elementar resulta
82
Figure img0016
83. onde a primeira fila é consistente com (2)
84. Existe um problema de estabilidade com os dois rotadores ideais providos por (10) e (13). Conforme (c,p)se aproxima de (1, -1), o valor de p dado por (8) diverge. Portanto é ne cessário desviar dos rotadores ideais em uma vizinhança deste pon- to do domínio do parâmetro PS.A solução ensinada pela presente invenção é modificar os parâmetros PS por um limitador de instabilidade tanto no codificador quanto no decodificador.
85. Em sua forma geral, este limitador alterará osvalores do par (c, p)em uma vizinhança de (1, -1) de modo a atin-gir uma faixa limitada por p. Uma solução especialmente atraente ébaseada na observação de que o denominador de (8) é igual àquele de (4). A solução inventiva mantém c inalterado e modifica pexatamente quando o ganho de downmix adaptativo g é limitado por g0 em (4). Isto ocorre quando
86.
Figure img0017
87. A modificação preferida de p executada por um limitador de instabilidade 14 é, então:
88.
Figure img0018
89. O valor correspondente de p dado pela inserção dep no lugar de p em (8) tem a propriedade de
90
Figure img0019
91. Nos parágrafos anteriores, a análise do problema que conduz à definição do limitador 14 foi detalhada. Embora a anotação seja baseada em sinais estéreo, é claro que o mesmo método pode ser aplicado em qualquer par de sinais de áudio, tais como pares de canais selecionados ou gerados por um downmix parcial de um sinal de áudio de canais múltiplos. Particularmente vantajoso é que a mesma regra de limitação pode ser usada para limitar os pa- râmetros dentro da matriz de upmix e downmix.
92. A Figura 2 descreve o procedimento de codificação de áudio inventivo usando um diagrama de bloco, mostrando como a codificação de áudio é executada quando seguindo o conceito inventivo. Em uma primeira etapa de extração de parâmetro 30, os parâmetros ICC e IID são derivados.
93. Estes parâmetros são, então, enviados como saída 23 e transferidos para servir como entrada para a etapa de limitação 32, onde uma comparação do parâmetro ICC com um parâmetro ICC mínimo computado ICCminé efetuada, onde ICCminé dependente de IID. Em um primeiro caso, onde o parâmetro ICC excede o parâmetro ICC mínimo ICCmin (IID), o parâmetro ICC é diretamente enviado para a etapa de downmix 34.
94. Se o parâmetro ICC não exceder ICCmin (IID), uma etapa de mudança adicional 36 é executada, onde o valor do parâmetro ICC é substituído pelo valor do parâmetro ICC mínimo IC- Cmin(IID). Após a etapa de mudança 36, o parâmetro ICC que tem o novo valor é, então, transferido para a etapa de downmix 34.
95. Na etapa de downmix 34, o sinal de downmix 20 e o sinal residual 22 são derivados dos canais 1 e r, dependendo dos parâmetros ICC e IID.
96. Finalmente, os parâmetros 23 (ICC e IID), o sinal de downmix 20 e o sinal residual 22 são disponibilizados como saída do procedimento de codificação.
97. A Figura 3 mostra uma outra configuração do dis-positivo de codificação de áudio inventivo 50 que compreende um codificador de áudio 10, uma unidade de processamento de sinal 51 tendo um primeiro compressor de áudio 52, um segundo compressor de áudio 54, e um compressor de parâmetro 56, e uma interface de saída 58.
98. Os componentes do codificador de áudio 10 já fo-ram discutidos nos parágrafos anteriores. Portanto, apenas aquelas partes do dispositivo codificador de áudio 50 que estão estendendo o codificador de áudio 10 serão discutidas nos parágrafos a seguir.
99. O propósito geral da unidade de processamento de sinal 51 é comprimir o sinal de downmix 20, o sinal residual 22 e os parâmetros 23. Portanto, o sinal de downmix 20 é inserido no primeiro compressor de áudio 52, o sinal residual 22 é inserido no segundo compressor de áudio 54 e os parâmetros espaciais 23 são inseridos no compressor de parâmetro 56. O primeiro compressor de áudio 52 provê um primeiro fluxo de bits de áudio 60, o segundo compressor de áudio 54 provê um segundo fluxo de bits de áudio 62 e o compressor de parâmetro 56 provê um fluxo de bit de parâmetro 64. O primeiro e o segundo fluxo de bits de áudio (60, 62) e o fluxo de bits de áudio de parâmetro 64 são, então, usadas como entradas da interface de saída, que combinam as três correntes de bit (60, 62, 64) para prover um fluxo de bits combinada 66, que é a saída do dispositivo de codificação 50.
100. A combinação executada pela interface de saída 58 poderia, por exemplo, ser uma multiplexação simples das três cor-rentes de bit que estão entrando. Adicionalmente, qualquer tipo de combinação que conduza a um fluxo de bits de saída única 66 é possível. O manuseio de um fluxo de bits única é muito mais conveniente, tal como streaming através da internet ou outros links de dados.
101. Em outras palavras, a Figura 3 ilustra um codifi-cador que toma um sinal de áudio de dois canais, compreendendo os canais 1, r como entrada e gera um fluxo de bits que permite deco- dificação por um decodificador estéreo paramétrico. O downmix adaptativo toma o sinal de dois canais 1, r e gera um downmix mono m e um sinal residual s. Estes sinais podem, então, ser codifica-dos pelos codificadores de áudio perceptuais para produzir correntes de bits de áudio compactas. A estimativa de parâmetro estéreo paramétrico (PS) toma o sinal de dois canais 1, r como entrada e gera um conjunto de parâmetros PS. O limitador de instabilidade modifica os parâmetros PS que controlam o downmix adaptativo. O bloco de codificação produz a informação de lado estéreo paramétrico(informação de lado PS) a partir da saída não modificada da estimativa de parâmetro PS. O multiplexador combina todos os dados codificados para formar uma corrente de dados combinada.
102. Uma das principais vantagens do conceito de codi-ficação inventivo é que ele é totalmente compatível retroativamente com decodificadores estéreo paramétricos da técnica anterior. Para ilustrar isto, a Figura 4 mostra um decodificador estéreo paramétricoda técnica anterior.
103. O decodificador estéreo paramétrico 70 compreende uma interface de entrada 72, um decodificador de áudio 74, um de- codificador de parâmetro 76, e um dispositivo de upmix 78.
104. A interface de entrada 72 recebe um fluxo de bits combinada 80 conforme produzida a partir do codificador de áudio inventivo 50. A interface de entrada 72 do decodificador estéreo paramétrico da técnica anterior 70 não reconhece o sinal residual 22 e, portanto, extrai apenas o sinal de downmix 60 (primeiro flu- xo de bits de áudio 60 da Figura 3) e o fluxo de bits de parâmetro 64 do fluxo de bits de entrada 80. O decodificador de áudio 74 é o dispositivo complementar ao primeiro compressor de áudio 52 e o decodificador de parâmetro 76 é o dispositivo complementar ao compressor de parâmetro 56. Portanto, o fluxo de bits de áudio 60 é decodificada no sinal de downmix 20 e o fluxo de bits de parâmetro 64 é decodificada nos parâmetros espaciais 23. Visto que os parâmetros espaciais 23 foram transferidos diretamente e não foram processados adicionalmente pelo codificador inventivo 10 ou 50, um dispositivo de upmix da técnica anterior 78 pode reconstruir um canal esquerdo e um canal direito, construindo um sinal de saída 80 do sinal de downmix 20 usando os parâmetros espaciais 23.
105. Em outras palavras, a Figura 4 ilustra um decodi- ficador estéreo paramétrico que toma um fluxo de bits compatível, conforme gerada pelo dispositivo de codificação inventivo 50 como a entrada e gera o sinal de áudio estéreo compreendendo os canais 1 e r, sem usar ou sem acessar a parte do fluxo de bits que des-creve o sinal residual. Primeiramente, um desmultiplexador toma o fluxo de bits compatível como entrada e a decompõe em um fluxo de bits de áudio e na informação de lado PS. O decodificador de áudio perceptual produz um sinal mono m, e a informação de lado PS é decodificada em parâmetros PS. A síntese PS converte o sinal mono nos sinais esquerdo e direito 1 e r de acordo com os parâmetros PS, em especial pela adição de um sinal descorrelacionado de modo a reter a correlação de canal dos canais estéreo originais.
106. A Figura 5 mostra um codificador de áudio de ca-naismúltiplos 100 que codifica um sinal de áudio de 6 canais em um downmixestéreo e uma série de conjuntos de parâmetros.
107. O codificador de áudio de canais múltiplos 100 compreende um primeiro codificador adaptativo 102, um segundo co-dificador adaptativo 104, módulo de estimativa 106, um extrator de parâmetro 108, e um dispositivo de downmix de 3 para 2 110.
108. O primeiro codificador adaptativo 102 e o segundo codificador adaptativo 104 são configurações de um codificador inventivo 10. O sinal de entrada de 6 canais possui um canal frontal esquerdo 112a, um canal traseiro esquerdo 112b, um canal frontal direito 114a, um canal traseiro direito 114b, um canal central 116a, um canal de aprimoramento de baixa freqüência 116b. O canal frontal esquerdo 112a e o canal traseiro esquerdo 112b são inseridos no primeiro codificador adaptativo 102 que provê um primeiro sinal de downmix 118a, o sinal residual correspondente 118b e parâmetros espaciais 118c. O canal frontal direito 114a e o canal traseiro direito 114b são inseridos no segundo codificador adapta- tivo 104, que provê um segundo sinal de downmix 120a, o sinal residual correspondente 120b, e os parâmetros espaciais subjacentes 120c. O canal central 116a e o canal de aprimoramento de baixa freqüência 116b são inseridos no módulo de soma 106, que adiciona os sinais para criar um sinal mono 122a e parâmetros espaciais correspondentes 122b.
109. O dispositivo de downmix de 3 para 2 110 recebe os sinais de downmix 118a, 120a, e 122a para fazer o downmixdestes em um sinal de saída estéreo 124 que tem um canal esquerdo e um canal direito. O dispositivo de downmix de 3 para 2 provê adicionalmente um sinal residual 126 dos canais de entrada 118a, 120a, e 122a. Além disso, o dispositivo de downmix de 3 para 2 110 provê um conjunto de parâmetros 128 dos conjuntos de parâmetro 118b, 120b, e 122b.
110. Resumindo, a Figura 5 ilustra uma parte de um codificador de áudio espacial que toma como entrada um sinal de áudio de canais múltiplos no formato 5.1, compreendendo os canais Lf(frontal esquerdo), Lr (surround esquerdo), Rf (frontal direito), Rr (surround direito), C (central) e LFE (eficiente de baixa fre- qüência), e que cria um downmixestéreo, compreendendo L0 e R0, e uma série de conjuntos de parâmetros. Não são mostradas nesta fi-gura as transformações de tempo para freqüência, a codificação dos sinais de downmix e parâmetros, e a multiplexação da informação codificada em um fluxo de bits que pode ser decodificada por umdecodificador de áudio espacial correspondente. O downmix adapta- tivo toma como entrada os sinais Lf e Lr e produz um sinal mono Le um sinal residual L. A estimativa de parâmetro estéreo (PS) pa-ramétrico toma o sinal de dois canais Lf e Lr como a entrada e ge-ra um conjunto de parâmetros PS. O limitador de instabilidade mo-difica os parâmetros PS que controlam o downmix adaptativo. De umamaneira similar, o downmix adaptativo toma como entrada os sinaisRf e Rr e produz um sinal mono R e um sinal residual R. A estimativa de parâmetro estéreo (PS) paramétrico toma o sinal de dois canais Rf e Rr como entrada e gera um conjunto de parâmetros PS. Olimitador de instabilidade modifica os parâmetros PS que controlam o downmix adaptativo. O módulo de soma adiciona os sinais C e LFEpara criar um sinal mono C. A estimativa de parâmetro estéreo (PS) paramétrico toma o sinal de dois canais C e LFE como entrada e ge-ra um conjunto de parâmetros IID, um subconjunto de parâmetros PS.Os sinais mono L, R e C são misturados a um sinal estéreo (Lo e Ro) e a um sinal residual Eo por um módulo de 3 para 2. O módulo de 3 para 2 também envia um conjunto de parâmetros (Lo, Ro).
111. A Figura 6 descreve um decodificador de áudio inventivo 140, compreendendo um dispositivo de upmix 142, e um limitador 144.
112. O decodificador inventivo 140 recebe um sinal de downmix 146, um sinal residual 148 e parâmetros espaciais 150. O sinal de downmix 146 e o sinal residual 148 são inseridos no dis-positivo de upmix 142, enquanto os parâmetros espaciais 150 são inseridos no limitador 144. O limitador 144 limita os parâmetros espaciais 150 para prover parâmetros espaciais limitados 152.
113. É importante notar que o limitador está usando a mesma regra de limitação para prover os parâmetros limitados como o codificador correspondente durante o processo de codificação. Os parâmetros limitados são usados para controlar o processo de upmix no dispositivo de upmix 142 que provê um sinal estéreo 154 tendo um canal esquerdo e um canal direito a partir do sinal de downmix 146 e do sinal residual 148.
114. A Figura 7 mostra um diagrama de bloco que ilus-tra o princípio do decodificador inventivo. Em uma primeira etapa de limitação 160, os parâmetros espaciais recebidos ICC e IID são limitados. Isto é, é verificado se o parâmetro ICC recebido excede um parâmetro ICC mínimo ICCmin(IID). Se este for o caso, os parâmetros espaciais 150 (ICC e IID), um sinal de downmix recebido 146, e um sinal residual recebido 148 são transmitidos para a etapa de upmix 162. Se o parâmetro ICC não exceder o parâmetro ICC mínimo ICCmin (IID), uma etapa de limitação 164 é adicionalmente executada, onde o valor do parâmetro ICC é trocado pelo valor do parâmetro ICCmin(IID), tendo o efeito de que o valor de ICCmin(IID) é transmitido para a etapa de upmix 162.
115. Na etapa de upmix 162, um sinal estéreo 154 tendo um canal esquerdo e um canal direito é derivado do sinal de downmix 146 e do sinal residual 148, usando os parâmetros espaciais ICC e IID.
116. A Figura 8 mostra uma configuração adicional de um dispositivo de decodificação inventivo 180 que compreende um decodificador 140, uma unidade de processamento de sinal 182 tendo um primeiro decodificador de áudio 184, um segundo decodificador de áudio 186 e um decodificador de parâmetro 188. O dispositivo de decodificação 180 compreende ainda uma interface de entrada 190 para receber um fluxo de bits combinada 192, que é gerada por um dispositivo de codificação inventivo 50.
117. O fluxo de bits combinada 192 é decomposta pela interface de entrada 190 em um primeiro fluxo de bits de áudio 194a, um segundo fluxo de bits de áudio 194b e um fluxo de bits de parâmetro 196.
118. O primeiro fluxo de bits de áudio 194a é inserida no primeiro decodificador de áudio 185, o segundo fluxo de bits de áudio 194b é inserida no segundo decodificador de áudio 186, e o fluxo de bits de parâmetro 196 é inserida no decodificador de parâmetro 188. O sinal de downmix descomprimido 198 (m) e o sinal residual 200 (s) são inseridos no dispositivo de upmix 142 do de- codificador 140. Parâmetros espaciais 202 derivados pelo decodifi- cador de parâmetro 188 são inseridos no limitador 144 do decodifi- cador de áudio 140. A limitação dos parâmetros espaciais e o processo de upmixjá foram descritos dentro da descrição do decodifi- cador de áudio 140. Uma descrição detalhada pode ser obtida nos parágrafos correspondentes da descrição da Figura 6.
119. O dispositivo de decodificação inventivo 180 finalmente envia um sinal estéreo 204, tendo um canal esquerdo e um canal direito.
120. Em outras palavras, a figura 8 ilustra um decodi-ficador estéreo paramétrico que toma um fluxo de bits compatível como entrada e gera o sinal de áudio estéreo compreendendo os ca-nais 1 e r. Primeiramente, um desmultiplexador toma o fluxo de bits compatível como a entrada e a decompõe em duas correntes de bit de áudio e na informação de lado PS. Decodificadores de áudio perceptuais produzem um sinal mono m e um sinal residual s, res-pectivamente, e a informação de lado PS é decodificada nos parâmetros PS pelo decodificador de parâmetro. O limitador de instabilidade modifica os parâmetros PS. O dispositivo de upmix converte os sinais mono e residual nos sinais esquerdo e direito l e r por meio de uma matriz de rotação definida a partir dos parâmetros PS modificados pelo limitador de instabilidade.
121. A Figura 9 mostra um decodificador de áudio decanais múltiplos inventivo 210 compreendendo um primeiro decodifi- cador de dois canais 212, um segundo decodificador de dois canais 214, um módulo de síntese 216, e um módulo de 2 para 3 218.
122. A Figura 9 ilustra parte de um decodificador deáudio espacial que toma como entrada um sinal de áudio estéreo (compreendendo o Lo e Ro), um sinal residual Eo e um conjunto de parâmetros (Lo, Ro). O módulo de 2 para 3 218 produz três canaisde áudio L, R, e C a partir da entrada mencionada acima. O canal mono L e o canal residual L são convertidos por um primeiro deco-dificador de dois canais 211 nos sinais de saída Lf e Lr. O limi- tador de instabilidade modifica o conjunto de parâmetros PS L. Similarmente, o canal mono R e o canal residual R são convertidos por um segundo decodificador de dois canais 214 nos sinais de saída Rf e Rr. O limitador de instabilidade é igual àquele usado durante a geração do canal mono R e modifica o conjunto de parâmetros PS R. O módulo de síntese PS 216 toma o canal mono C e o conjunto de parâmetros C e gera os canais de saída C e LFE.
123. As Figuras 10 e 11 mostram uma solução alternativa para um codificador e um decodificador que evita o problema de instabilidade. A alternativa é baseada no uso dos parâmetros espaciais limitados como os parâmetros a serem codificados e transmitidos. Isto pode ser visto no codificador inventivo na Figura 10 que é baseado no dispositivo de codificação inventivo da Figura 3.
124. A Figura 10 mostra uma modificação de um codifi-cador inventivo já mostrado na Figura 3, com a diferença de que os parâmetros alimentados no codificador de parâmetro 56 são tomados em um ponto 300, isto é, após o processo de limitação. Isto é, os parâmetros limitados são codificados e transmitidos em vez dos parâmetros originais.
125. No lado do decodificador mostrado na Figura 11, é mostrada a modificação de que o limitador pode ser omitido se comparado com o dispositivo de decodificação 180. Portanto, o parâmetro espacial decodificado 310 é inserido diretamente no dispositivo de upmix 142 para prover o sinal estéreo 204.
126. As desvantagens desta solução se comparado com a colocação de limitadores de instabilidade conforme ensinado ante-riormente e mostrado nas figuras anteriores, são duas. Primeira-mente, a quantização dos parâmetros limitados moveria os rotadores mais para longe do que seria idealmente necessário. O tamanho do residual, portanto, seria, no geral, maior, conduzindo a uma perda no ganho de codificação para o método de codificação residual. Em segundo lugar, a compatibilidade retroativa a decodificadores estéreos paramétricos seria perdida. Em casos críticos, quando a correlação de canal do canal original é negativa, o decodificador não seria capaz de reproduzir esta correlação sem acesso ao sinal residual.
127. A Figura 12 está mostrando um transmissor ou gravador de áudio inventivo 330 que tem um codificador de áudio 50, uma interface de entrada 332 e uma interface de saída 334.
128. Um sinal de áudio pode ser suprido na interface de entrada 332 do transmissor/gravador 330. O sinal de áudio é codificado por um codificador inventivo 50 dentro do transmis- sor/gravador e a representação codificada é enviada na interface de saída 334 do transmissor/gravador 330. A representação codifi-cada pode, então, ser transmitida ou armazenada em um meio de ar-mazenagem.
129. A Figura 13 mostra um receptor inventivo ou re-produtor de áudio 340 tendo um decodificador de áudio inventivo 180, uma entrada de fluxo de bits 342, e uma saída de áudio 344.
130. Um fluxo de bits pode ser inserida na entrada 342 do receptor/reprodutor de áudio inventivo 340. O fluxo de bits, então, é decodificada pelo decodificador 180 e o sinal decodificadoé enviado ou reproduzido na saída 344 do receptor/reprodutor de áudio 340.
131. A Figura 14 mostra um sistema de transmissão compreendendo um transmissor inventivo 330, e um receptor inventivo 340.
132. A entrada de sinal de áudio na interface de en-trada 332 do transmissor 330 é codificada e transferida da saída 334 do transmissor 330 para a entrada 342 do receptor 340. O re-ceptor decodifica o sinal de áudio e reproduz ou envia o sinal de áudio em sua saída 344.
133. As configurações da presente invenção mencionadas e descritas acima são meramente ilustrativas dos princípios da presente invenção para a melhoria de codificação residual adapta- tiva. É entendido que modificações e variações dos arranjos e detalhes descritos aqui serão operandos para aqueles especializados na técnica. É objetivo, portanto, estar limitado apenas pelo escopo das reivindicações de patente iminente e não pelos detalhes específicos apresentados como descrição e explanação das configurações aqui mencionadas.
134. Embora as configurações da presente invenção descritas nas figuras acima sejam descritas usando principalmente uma nomenclatura usada para sinais estéreos, fica aparente que a presente invenção não está limitada a sinais estéreos, mas poderia ser aplicada a qualquer outro tipo de combinação de dois sinais de áudio como, por exemplo, é feito dentro dos codificadores e deco- dificadores de áudio de canais múltiplos mostrados na Figura 5 e Figura 9.
135. Usando um sistema de transmissão inventivo tendo um transmissor e um receptor, a transmissão entre o transmissor e o receptor pode ser obtida por vários meios. Isto pode ser, por exemplo, streaming pela internet ou por outros meios de rede, ar-mazenagem de um arquivo em um meio legível por computador e trans- ferência de mídia, diretamente conectando o transmissor e o receptor por um cabo ou conexão sem fio tal como LAN sem fio ou Bluetooth e qualquer outra conexão de dados imaginável.
136. Embora tenha sido descrito em detalhes que o pa-râmetro ICC apenas deve ser mudado para garantir uma matriz de upmix e downmixnão divergente, é também possível limitar ambos os parâmetros ICC e IID, de modo que nenhuma divergência ocorra. De forma mais geral, a aplicação do conceito inventivo pode também significar prover outros parâmetros espaciais e aplicar uma regra de limitação a estes parâmetros, garantindo um downmix e um upmix não divergentes.
137. As interfaces de saída e entrada nos codificado-res e decodificadores inventivos não estão limitadas apenas a mul- tiplexadores ou desmultiplexadores simples. Em uma variação mais sofisticada a interface de saída pode combinar as correntes de bits não apenas pela multiplexação destas, mas por qualquer outro meio, sendo possível mesmo tentar alguma codificação de entropia adicional para reduzir o tamanho da corrente de dados.
138. Dependendo de certos requisitos de implementação dos métodos inventivos, os métodos inventivos podem ser implemen-tados no hardware ou no software. A implementação pode ser execu-tada usando um meio de armazenagem digital, em especial um disco, DVD ou um CD tendo sinais de controle eletronicamente legíveis neles armazenados, que cooperem com um sistema de computador programávelde modo que os métodos inventivos sejam executados. De forma geral, a presente invenção é, portanto, um produto de um programa de computador com um código de programa armazenado em um transportadorlegível por máquina, o código do programa sendo operacional para executar os métodos inventivos quando o produto de programa de computador operar em um computador. Em outras palavras, os mé-todos inventivos são, portanto, um programa de computador tendo um código de programa para executar pelo menos um dos métodos inventivos quando o programa de computador estiver operando em um computador.
139. Embora a descrição anterior tenha sido mostrada e descrita especificamente com referência a configurações específicas desta, será entendido por aqueles com especialização na técnica que várias outras modificações na forma e detalhes podem ser efetuadas sem se afastar de seu espírito e escopo. Deve ser entendido que várias modificações podem ser efetuadas na adaptação de configurações diferentes sem se afastar dos conceitos amplos revelados aqui e abrangidos pelas reivindicações a seguir.

Claims (34)

1. Codificador de áudio (10) para codificação de um sinal de áudio tendo pelo menos dois canais (18), caracterizado pelo fato de que compreende:um extrator de parâmetro (16) para derivar um parâmetro de coerência (ICC) descrevendo uma coerência entre um primeiro e um segundo canal de pelo menos dois canais e um parâmetro de nível (IID) descrevendo uma diferença de nível entre o primeiro e o segundo canal como parâmetros espaciais;um limitador (14) para limitar o parâmetro de coerência para derivar um parâmetro de coerência limitado, onde a limitação do parâmetro de coerência depende do parâmetro de nível e de um fator de escala, eum dispositivo de downmix (12) para derivar um um sinal de downmix (20) e um sinal residual (18)a partir do sinal de áudio usando uma regra de downmix que depende do parâmetro de coe-rência limitado.
2. Codificador de áudio (10), de acordo com a reivindicação 1, caracterizado pelo fato de que o extrator de pa-râmetro (16) é operacional para derivar múltiplos parâmetros espaciais para uma porção de tempo dada do sinal de áudio.
3. Codificador de áudio (10), de acordo com as reivindicações 1 ou 2, caracterizado pelo fato de que o limitador (14) é operativo para limitar o parâmetro de coerência tal que uma razão de intensidades entre o sinal de downmix (20) e pelo menos dois canais não excedam um limite predefinido.
4. Codificador de áudio (10), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que uma regra limitadora do limitador (14) é tal que um limite inferior para o parâmetro de coerência ICC depende de um parâmetro de nível IDD e no fator de escala que depende de um fator de ganhopredefinido g0 como descrito pela expressão:
Figure img0020
5. Codificador de áudio (10), de acordo com areivindicação 4, caracterizado pelo fato de que o fator de ganhopredefinido g0 é escolhido a partir do intervalo [1, 2].
6. Codificador de áudio (10), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o dispositivo de downmix (12) é operacional para usar uma regra de downmix, de modo que o sinal de downmix (20) e o sinal residual (18) sejam derivados pela formação de uma combinação linear dos canais a partir dos pelo menos dois canais, onde os coeficientes da combinação linear dependem do parâmetro de coerência limitado.
7. Codificador de áudio (10), de acordo com a reivindicação 6, caracterizado pelo fato de que a regra de downmix é tal que a derivação do sinal de downmix (20) m e do sinal residual (18) s podem ser descritos pela equação a seguir, dependendo dos parâmetros limitados de coerência ICC, do parâmetro de nível IID, do primeiro canal l e do segundo canal r: m ^ z (1 + r) IDID2+1 + 2 - IID - ICC v 7
Figure img0021
8. Codificador de áudio (10), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que compreende ainda uma unidade de processamento de sinal (51) para processar ou transmitir o sinal de downmix (20), o sinal residual (18), e o parâmetro espacial para derivar um sinal de downmix processado, um sinal residual processado e parâmetros processados.
9. Codificador de áudio (10), de acordo com a reivindicação 8, caracterizado pelo fato de que a unidade de pro-cessamento de sinal (51) é operacional para derivar o sinal de downmix processado, o sinal residual processado, e os parâmetros processados tal que a derivação inclui uma compressão do sinal de downmix (20), do sinal residual (18) e dos parâmetros espaciais.
10. Codificador de áudio (10), de acordo com as reivindicações 8 ou 9, caracterizado pelo fato de que compreende ainda uma interface de saída (58) para prover a informação do si-nal de downmix processado (20), do sinal residual processado (18) e dos parâmetros espaciais processados.
11. Codificador de áudio (10), de acordo com a reivindicação 10, caracterizado pelo fato de que a interface de saída (58) é operacional para combinar o sinal de downmixproces-sado, o sinal residual processado e os parâmetros processados para derivar um fluxo de bits de saída que tem a informação do sinal de downmix processado, do sinal residual processado, e dos parâmetros processados.
12. Codificador de áudio (10), de acordo com a reivindicação 11, caracterizado pelo fato de que a interface de saída (58) é operacional para multiplexar o sinal de downmix pro- cessado, o sinal residual processado, e os parâmetros processados para prover o fluxo de bits de saída.
13. Codificador de áudio (10), de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fatode que pares múltiplos de canais são codificados, onde para cada par de canais de parâmetros espaciais, um sinal de downmix (20) e um sinal residual (18) é derivado.
14. Codificador de áudio (10), de acordo com a reivindicação 13, caracterizado pelo fato de que os pares múlti-plos de canais compreendem um canal frontal esquerdo, um canal traseiro esquerdo, um canal frontal direito, um canal traseiro direito, um canal de aprimoramento de baixa frequência e um canal central.
15. Decodificador de áudio (140) para decodificar um sinal de áudio codificado representando um sinal de áudio ori-ginal que tem pelo menos dois canais, o sinal de áudio codificado caracterizado pelo fato de ter um sinal de downmix e um sinal re-sidual assim como um parâmetro de coerência (ICC) que descreve uma inter-relação entre um primeiro e um segundo canal de pelo menos dois canais e um parâmetro de nível (IID) descrevendo uma diferença de nível entre o primeiro e o segundo canal como parâmetros espaciais, compreendendo:um limitador (144) para limitar o parâmetro de coerência para derivar um parâmetro de coerência limitado em que o limite do parâmetro de coerência depende do parâmetro de nível e do fator de escala; eum dispositivo de upmix (142) para derivar uma reconstrução do sinal de áudio original (154) a partir do sinal de downmix e do sinal residual usando uma regra de upmix que depende do parâmetro de coerência limitado.
16. Decodificador de áudio (140) de acordo com a reivindicação 15, caracterizado pelo fato de que o limitador (144) é operacional para limitar múltiplos parâmetros de coerência para uma porção de tempo dada do sinal de áudio codificado correspondendo a um quadro no tempo do sinal de áudio original.
17. Decodificador de áudio (140), de acordo com as reivindicações 15 ou 16, caracterizado pelo fato de que o limi- tador (144) é operacional para limitar o parâmetro de coerência de modo que a relação das intensidades entre o sinal de downmix e pe- lo menos dois canais de um sinal de áudio original não excedam um limite predefinido.
18. Decodificador de áudio (140), de acordo com as reivindicações 15 a 17, caracterizado pelo fato de que a regra de limitação (144) é tal que um limite inferior para o parâmetro de coerência ICC depende do parâmetro de nível IID e do fator de escala que depende de um fator de ganho predefinido g0 como des-crito pela expressão:
Figure img0022
19. Decodificador de áudio (140), de acordo com areivindicação 18, caracterizado pelo fato de que o fator de ganhopredefinido g0 é escolhido do intervalo [1,2].
20. Decodificador de áudio (140), de acordo comqualquer uma das reivindicação 15 a 19, caracterizado pelo fato de que o dispositivo de upmix (142)é operacional para usar uma regra de upmix, de modo que um primeiro canal reconstruído e um segundo canal reconstruído de pelo menos dois canais são derivados pela formação de uma combinação linear do sinal de downmix e do sinal residual, onde os coeficientes da combinação linear dependem do parâmetro de coerência limitado.
21. Decodificador de áudio (140), de acordo com a reivindicação 20, caracterizado pelo fato de que a regra de upmixé tal que a derivação do primeiro canal reconstruído l e do segundo canal reconstruído r a partir do sinal de downmix m e do sinal residual s dependem do parâmetro de coerência limitado ICC e do parâmetro de nível descrito pelas equações a seguir
Figure img0023
22. Decodificador de áudio (140), de acordo comqualquer uma das reivindicações 15 a 21, caracterizado pelo fato de que compreende ainda uma unidade de processamento de sinal (182) para transmitir ou processar um sinal residual processado, um sinal de downmix processado e parâmetros processados para prover o sinal residual, o sinal de downmix, e os parâmetros espaciais.
23. Decodificador de áudio (140), de acordo com a reivindicação 22, caracterizado pelo fato de que a unidade de processamento de sinal (182) é operacional para derivar o sinal residual, o sinal de downmix, e os parâmetros espaciais de modo que a derivação do sinal residual, do sinal de downmix e dos parâmetros espaciais incluem descompressão do sinal residual processado, do sinal de downmix processado, e dos parâmetros processados.
24. Decodificador de áudio (140), de acordo com as reivindicações 22 ou 23, caracterizado pelo fato de que compreende ainda uma interface de entrada (190) para prover o sinal residual processado, o sinal de downmix processado e os parâmetros processados.
25. Decodificador de áudio (140), de acordo com a reivindicação 24, caracterizado pelo fato de que a interface de entrada (190) é operacional para decompor um fluxo de bits de en-tradaúnica para derivar o sinal residual processado, o sinal de downmix processado e os parâmetros processados.
26. Decodificador de áudio (140), de acordo com a reivindicação 25, caracterizado pelo fato de que a interface de entrada (190) é operacional para decompor o fluxo de bits de en-tradaúnica, de modo que a derivação do sinal residual processado, o sinal de downmix processado e os parâmetros processados incluem uma desmultiplexação do fluxo de bits de entrada.
27. Método para codificar um sinal de áudio tendo pelo menos dois canais, o método caracterizado pelo fato de que compreende:prover um parâmetro de coerência (ICC) descrevendo uma coerência entre um primeiro e um segundo canal de pelo menos dois canais e um parâmetro de nível (IID) descrevendo uma diferença de nível entre o primeiro e o segundo canal como parâmetros espaciais;limitar o parâmetro de coerência para derivar um parâmetro de coerência limitado, onde o limite do parâmetro de coerência depende do parâmetro de nível e de um fator de escala; ederivar um sinal de downmix e um sinal residual a partir do sinal de áudio usando uma regra de downmix que depende do parâmetro de coerência limitado.
28. Método para decodificar um sinal de áudio co-dificado que representa um sinal de áudio original caracterizado pelo fato de ter pelo menos dois canais, o sinal de áudio codifi-cado tendo um sinal de downmix, um sinal residual assim como um parâmetro de coerência (ICC) que descreve uma inter-relação entre um primeiro e um segundo canal de pelo dois canais e um parâmetro de nível (IID) que descreve um diferença de nível entre o primeiro e o segundo canal como parâmetros espaciais, método compreendendo:limitar o parâmetro de coerência para prover um parâmetro de coerência limitada, em que o limite do parâmetro de coerência depende do nível do parâmetro e de um fator de escala; eprover uma reconstrução do sinal de áudio original a partir do sinal de downmix e do sinal residual usando uma regra de upmix que depende do parâmetro de coerência limitado.
29. Transmissor ou gravador de áudio, caracteri-zado por possuir um codificador de áudio (10) como definido na reivindicação 1.
30. Receptor ou reprodutor de áudio, caracteriza-do pelo fato de possuir um decodificador de áudio (140) como definido na reivindicação 15.
31. Método de transmissão ou gravação de áudio, caracterizado por possuir um método para gerar um sinal codificado conforme definido na reivindicação 27.
32. Método de recepção ou reprodução de áudio, o método caracterizado pelo fato de ter um método para decodificar um sinal de áudio como definido na reivindicação 28.
33. Sistema de transmissão tendo um transmissor e um receptor; o transmissor sendo caracterizado por compreender um codificador de áudio (10) para codificar um sinal de áudio de acordo com qualquer uma das reivindicações 1 a 14; e o receptor compreendendo um decodificador de áudio (140) de acordo com qual-quer uma das reivindicações 15 a 26.
34. Método de transmissão e recepção, o método compreende: um método de transmissão caracterizado por compreender um método para codificar um sinal de áudio conforme reivindicação 27; e um método de recepção que compreende um método para decodificar um sinal de áudio codificado de acordo com a reivindicação 28.
BRPI0612218-3A 2005-04-15 2006-04-07 codificação de áudio residual adaptativa BRPI0612218B1 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US67158105P 2005-04-15 2005-04-15
US60/671,581 2005-04-15
US11/247,555 US7751572B2 (en) 2005-04-15 2005-10-11 Adaptive residual audio coding
US11/247,555 2005-10-11
PCT/EP2006/003200 WO2006108573A1 (en) 2005-04-15 2006-04-07 Adaptive residual audio coding

Publications (2)

Publication Number Publication Date
BRPI0612218A2 BRPI0612218A2 (pt) 2010-10-26
BRPI0612218B1 true BRPI0612218B1 (pt) 2021-03-02

Family

ID=36589009

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0612218-3A BRPI0612218B1 (pt) 2005-04-15 2006-04-07 codificação de áudio residual adaptativa

Country Status (16)

Country Link
US (1) US7751572B2 (pt)
EP (1) EP1869668B1 (pt)
JP (1) JP4685925B2 (pt)
KR (1) KR100955361B1 (pt)
CN (1) CN101160619B (pt)
AT (1) ATE454693T1 (pt)
BR (1) BRPI0612218B1 (pt)
DE (1) DE602006011591D1 (pt)
ES (1) ES2338918T3 (pt)
HK (1) HK1110985A1 (pt)
MX (1) MX2007012686A (pt)
MY (1) MY147609A (pt)
PL (1) PL1869668T3 (pt)
RU (1) RU2380766C2 (pt)
TW (1) TWI303411B (pt)
WO (1) WO2006108573A1 (pt)

Families Citing this family (103)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8150042B2 (en) * 2004-07-14 2012-04-03 Koninklijke Philips Electronics N.V. Method, device, encoder apparatus, decoder apparatus and audio system
DE102004043521A1 (de) * 2004-09-08 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
ES2623551T3 (es) * 2005-03-25 2017-07-11 Iii Holdings 12, Llc Dispositivo de codificación de sonido y procedimiento de codificación de sonido
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
JP4988717B2 (ja) * 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US8270439B2 (en) * 2005-07-08 2012-09-18 Activevideo Networks, Inc. Video game system using pre-encoded digital audio mixing
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
US8074248B2 (en) 2005-07-26 2011-12-06 Activevideo Networks, Inc. System and method for providing video content associated with a source image to a television in a communication network
KR101228630B1 (ko) * 2005-09-02 2013-01-31 파나소닉 주식회사 에너지 정형 장치 및 에너지 정형 방법
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
KR100857108B1 (ko) * 2005-09-14 2008-09-05 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
US20080255859A1 (en) * 2005-10-20 2008-10-16 Lg Electronics, Inc. Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof
US8208641B2 (en) * 2006-01-19 2012-06-26 Lg Electronics Inc. Method and apparatus for processing a media signal
US8285556B2 (en) * 2006-02-07 2012-10-09 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
CN101401152B (zh) * 2006-03-15 2012-04-18 法国电信公司 通过多通道音频信号的主分量分析进行编码的设备和方法
FR2898725A1 (fr) * 2006-03-15 2007-09-21 France Telecom Dispositif et procede de codage gradue d'un signal audio multi-canal selon une analyse en composante principale
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
EP2595152A3 (en) * 2006-12-27 2013-11-13 Electronics and Telecommunications Research Institute Transkoding apparatus
US9042454B2 (en) 2007-01-12 2015-05-26 Activevideo Networks, Inc. Interactive encoded content system including object models for viewing on a remote device
US9826197B2 (en) 2007-01-12 2017-11-21 Activevideo Networks, Inc. Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device
US8639498B2 (en) * 2007-03-30 2014-01-28 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi object audio signal with multi channel
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
WO2009050896A1 (ja) * 2007-10-16 2009-04-23 Panasonic Corporation ストリーム合成装置、復号装置、方法
BRPI0816557B1 (pt) 2007-10-17 2020-02-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Codificação de áudio usando upmix
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
KR101597375B1 (ko) 2007-12-21 2016-02-24 디티에스 엘엘씨 오디오 신호의 인지된 음량을 조절하기 위한 시스템
CA2710560C (en) 2008-01-01 2015-10-27 Lg Electronics Inc. A method and an apparatus for processing an audio signal
CN101911732A (zh) * 2008-01-01 2010-12-08 Lg电子株式会社 用于处理音频信号的方法和装置
WO2009096898A1 (en) * 2008-01-31 2009-08-06 Agency For Science, Technology And Research Method and device of bitrate distribution/truncation for scalable audio coding
JP5668923B2 (ja) * 2008-03-14 2015-02-12 日本電気株式会社 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム
BR122020009732B1 (pt) 2008-05-23 2021-01-19 Koninklijke Philips N.V. Método para a geração de um sinal esquerdo e de um sinal direito a partir de um sinal de downmix mono com base em parâmetros espaciais, meio legível por computador não transitório, aparelho de downmix estéreo paramétrico para a geração de um sinal de downmix mono a partir de um sinal esquerdo e de um sinal direito com base em parâmetros espaciais e método para a geração de um sinal residual de previsão para um sinal de diferença a partir de um sinal esquerdo e de um sinal direito com base em parâmetros espaciais
JP5383676B2 (ja) * 2008-05-30 2014-01-08 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
WO2009153995A1 (ja) * 2008-06-19 2009-12-23 パナソニック株式会社 量子化装置、符号化装置およびこれらの方法
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
US20110112843A1 (en) * 2008-07-11 2011-05-12 Nec Corporation Signal analyzing device, signal control device, and method and program therefor
KR101614160B1 (ko) * 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
FR2936898A1 (fr) * 2008-10-08 2010-04-09 France Telecom Codage a echantillonnage critique avec codeur predictif
WO2010042024A1 (en) * 2008-10-10 2010-04-15 Telefonaktiebolaget Lm Ericsson (Publ) Energy conservative multi-channel audio coding
JP5237463B2 (ja) 2008-12-11 2013-07-17 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネルオーディオ信号を生成するための装置
EP2396637A1 (en) * 2009-02-13 2011-12-21 Nokia Corp. Ambience coding and decoding for audio applications
JP5564803B2 (ja) * 2009-03-06 2014-08-06 ソニー株式会社 音響機器及び音響処理方法
MX2011009660A (es) 2009-03-17 2011-09-30 Dolby Int Ab Codificacion estereo avanzada basada en una combinacion de codificacion izquierda/derecha o media/lateral seleccionable de manera adaptable y de codificacion estereo parametrica.
MY160545A (en) 2009-04-08 2017-03-15 Fraunhofer-Gesellschaft Zur Frderung Der Angewandten Forschung E V Apparatus, method and computer program for upmixing a downmix audio signal using a phase value smoothing
KR101387808B1 (ko) * 2009-04-15 2014-04-21 한국전자통신연구원 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
CN102414990A (zh) * 2009-05-29 2012-04-11 日本电信电话株式会社 编码装置、解码装置、编码方法、解码方法及其程序
WO2011013381A1 (ja) * 2009-07-31 2011-02-03 パナソニック株式会社 符号化装置および復号装置
US8194862B2 (en) * 2009-07-31 2012-06-05 Activevideo Networks, Inc. Video game system with mixing of independent pre-encoded digital audio bitstreams
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
KR20110018107A (ko) * 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
KR101613975B1 (ko) * 2009-08-18 2016-05-02 삼성전자주식회사 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
TWI433137B (zh) 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
WO2011029984A1 (en) * 2009-09-11 2011-03-17 Nokia Corporation Method, apparatus and computer program product for audio coding
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
EP2346028A1 (en) 2009-12-17 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
CN102792378B (zh) * 2010-01-06 2015-04-29 Lg电子株式会社 处理音频信号的设备及其方法
JP5604933B2 (ja) 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
CN102884570B (zh) * 2010-04-09 2015-06-17 杜比国际公司 基于mdct的复数预测立体声编码
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
JP5581449B2 (ja) * 2010-08-24 2014-08-27 ドルビー・インターナショナル・アーベー Fmステレオ無線受信機の断続的モノラル受信の隠蔽
US8885701B2 (en) * 2010-09-08 2014-11-11 Samsung Electronics Co., Ltd. Low complexity transform coding using adaptive DCT/DST for intra-prediction
JP5533502B2 (ja) * 2010-09-28 2014-06-25 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
AU2011315950B2 (en) 2010-10-14 2015-09-03 Activevideo Networks, Inc. Streaming digital video between video devices using a cable television system
FR2966634A1 (fr) * 2010-10-22 2012-04-27 France Telecom Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
TWI462087B (zh) 2010-11-12 2014-11-21 Dolby Lab Licensing Corp 複數音頻信號之降混方法、編解碼方法及混合系統
CN102056053B (zh) * 2010-12-17 2015-04-01 中兴通讯股份有限公司 一种多话筒混音方法及装置
WO2012138660A2 (en) 2011-04-07 2012-10-11 Activevideo Networks, Inc. Reduction of latency in video distribution networks using adaptive bit rates
UA107771C2 (en) * 2011-09-29 2015-02-10 Dolby Int Ab Prediction-based fm stereo radio noise reduction
US10409445B2 (en) 2012-01-09 2019-09-10 Activevideo Networks, Inc. Rendering of an interactive lean-backward user interface on a television
US9800945B2 (en) 2012-04-03 2017-10-24 Activevideo Networks, Inc. Class-based intelligent multiplexing over unmanaged networks
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
US9123084B2 (en) 2012-04-12 2015-09-01 Activevideo Networks, Inc. Graphical application integration with MPEG objects
KR20140017338A (ko) * 2012-07-31 2014-02-11 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 장치 및 방법
MY176406A (en) * 2012-08-10 2020-08-06 Fraunhofer Ges Forschung Encoder, decoder, system and method employing a residual concept for parametric audio object coding
CN103067629B (zh) * 2013-01-18 2014-10-29 苏州科达科技股份有限公司 回声消除装置
EP2757558A1 (en) 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
RU2676870C1 (ru) * 2013-01-29 2019-01-11 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Декодер для формирования аудиосигнала с улучшенной частотной характеристикой, способ декодирования, кодер для формирования кодированного сигнала и способ кодирования с использованием компактной дополнительной информации для выбора
WO2014145921A1 (en) 2013-03-15 2014-09-18 Activevideo Networks, Inc. A multiple-mode system and method for providing user selectable video content
KR20140123015A (ko) * 2013-04-10 2014-10-21 한국전자통신연구원 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법
CN110223702B (zh) 2013-05-24 2023-04-11 杜比国际公司 音频解码系统和重构方法
US9294785B2 (en) 2013-06-06 2016-03-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9219922B2 (en) 2013-06-06 2015-12-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
EP3005712A1 (en) 2013-06-06 2016-04-13 ActiveVideo Networks, Inc. Overlay rendering of user interface onto source video
KR20150009474A (ko) * 2013-07-15 2015-01-26 한국전자통신연구원 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
TWI579831B (zh) 2013-09-12 2017-04-21 杜比國際公司 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統
CN105531761B (zh) 2013-09-12 2019-04-30 杜比国际公司 音频解码系统和音频编码系统
US9788029B2 (en) 2014-04-25 2017-10-10 Activevideo Networks, Inc. Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks
CN105989851B (zh) 2015-02-15 2021-05-07 杜比实验室特许公司 音频源分离
KR102636396B1 (ko) 2015-09-25 2024-02-15 보이세지 코포레이션 스테레오 사운드 신호를 1차 및 2차 채널로 시간 영역 다운 믹싱하기 위해 좌측 및 우측 채널들간의 장기 상관 차이를 이용하는 방법 및 시스템
US9978381B2 (en) * 2016-02-12 2018-05-22 Qualcomm Incorporated Encoding of multiple audio signals
CN109644315A (zh) * 2017-02-17 2019-04-16 无比的优声音科技公司 用于缩混多声道音频信号的设备和方法
WO2019076739A1 (en) * 2017-10-16 2019-04-25 Sony Europe Limited AUDIO PROCESSING
EP3550561A1 (en) * 2018-04-06 2019-10-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value
CN110556119B (zh) 2018-05-31 2022-02-18 华为技术有限公司 一种下混信号的计算方法及装置
CN110556116B (zh) 2018-05-31 2021-10-22 华为技术有限公司 计算下混信号和残差信号的方法和装置
CN114708874A (zh) 2018-05-31 2022-07-05 华为技术有限公司 立体声信号的编码方法和装置
RU2769429C2 (ru) * 2018-08-17 2022-03-31 Нокиа Текнолоджиз Ой Кодер звукового сигнала
GB2578625A (en) * 2018-11-01 2020-05-20 Nokia Technologies Oy Apparatus, methods and computer programs for encoding spatial metadata
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding
WO2020216459A1 (en) * 2019-04-23 2020-10-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method or computer program for generating an output downmix representation

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0520068B1 (en) 1991-01-08 1996-05-15 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
US5960390A (en) * 1995-10-05 1999-09-28 Sony Corporation Coding method for using multi channel audio signals
US6036878A (en) * 1996-02-02 2000-03-14 Applied Materials, Inc. Low density high frequency process for a parallel-plate electrode plasma reactor having an inductive antenna
SG54379A1 (en) 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
JP4610087B2 (ja) 1999-04-07 2011-01-12 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 損失のない符号化・復号へのマトリックス改良
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
JP2002076904A (ja) 2000-09-04 2002-03-15 Victor Co Of Japan Ltd 符号化されたオーディオ信号の復号化方法、及び符号化されたオーディオ信号の復号化装置
US7120587B2 (en) 2000-11-03 2006-10-10 Koninklijke Philips Electronics N.V. Sinusoidal model based coding of audio signals
JP2002175097A (ja) 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
JP3951690B2 (ja) 2000-12-14 2007-08-01 ソニー株式会社 符号化装置および方法、並びに記録媒体
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
KR20040080003A (ko) 2002-02-18 2004-09-16 코닌클리케 필립스 일렉트로닉스 엔.브이. 파라메트릭 오디오 코딩
ATE459957T1 (de) 2002-04-10 2010-03-15 Koninkl Philips Electronics Nv Kodierung und dekodierung für mehrkanalige signale
CN100508026C (zh) 2002-04-10 2009-07-01 皇家飞利浦电子股份有限公司 立体声信号编码
EP1500084B1 (en) 2002-04-22 2008-01-23 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
JP2003330497A (ja) 2002-05-15 2003-11-19 Matsushita Electric Ind Co Ltd オーディオ信号の符号化方法及び装置、符号化及び復号化システム、並びに符号化を実行するプログラム及び当該プログラムを記録した記録媒体
CN1231889C (zh) * 2002-11-19 2005-12-14 华为技术有限公司 多通道声码器的语音处理方法
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme

Also Published As

Publication number Publication date
MY147609A (en) 2012-12-31
CN101160619B (zh) 2011-09-07
JP4685925B2 (ja) 2011-05-18
CN101160619A (zh) 2008-04-09
MX2007012686A (es) 2008-03-14
ES2338918T3 (es) 2010-05-13
TW200643897A (en) 2006-12-16
US7751572B2 (en) 2010-07-06
BRPI0612218A2 (pt) 2010-10-26
KR100955361B1 (ko) 2010-04-29
RU2007142177A (ru) 2009-05-27
WO2006108573A1 (en) 2006-10-19
ATE454693T1 (de) 2010-01-15
DE602006011591D1 (de) 2010-02-25
RU2380766C2 (ru) 2010-01-27
PL1869668T3 (pl) 2010-06-30
US20060233379A1 (en) 2006-10-19
KR20070120527A (ko) 2007-12-24
TWI303411B (en) 2008-11-21
JP2008536184A (ja) 2008-09-04
HK1110985A1 (en) 2008-07-25
EP1869668B1 (en) 2010-01-06
EP1869668A1 (en) 2007-12-26

Similar Documents

Publication Publication Date Title
BRPI0612218B1 (pt) codificação de áudio residual adaptativa
US20230345176A1 (en) Audio decoder for audio channel reconstruction
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
US7916873B2 (en) Stereo compatible multi-channel audio coding
JP5883561B2 (ja) アップミックスを使用した音声符号器
AU2007312597B2 (en) Apparatus and method for multi -channel parameter transformation
KR100908081B1 (ko) 인코딩 및 디코딩된 다채널 신호를 생성하는 장치 및 방법
BRPI0520053B1 (pt) Esquema de codificador/decodificador de canais múltiplos quase-transparente ou transparente
WO2007042108A1 (en) Temporal and spatial shaping of multi-channel audio signals
BRPI0514650B1 (pt) Métodos para codificação e decodificação de sinais de áudio, codificador e decodificador de sinais de áudio
BRPI0606387B1 (pt) Decodificador, dispositivo de reprodução de áudio, codificador, dispositivo de gravação, método para gerar um sinal de áudio multicanal, meio de armazenamento, método paracodificar um sinal de áudio multicanal, receptor, transmissor, sistema de transmissão, método de receber um sinal de áudio multicanal, e método de transmitir um sinal deáudio multicanal
US11776552B2 (en) Methods and apparatus for decoding encoded audio signal(s)
KR100891666B1 (ko) 믹스 신호의 처리 방법 및 장치
CN106463126A (zh) 基于对象的音频系统中的残差编码
US8781134B2 (en) Method and apparatus for encoding and decoding stereo audio
BR112016001141B1 (pt) Codificador de áudio, decodificador de áudio e métodos que usam sinais residuais codificados em conjunto

Legal Events

Date Code Title Description
B25F Entry of change of name and/or headquarter and transfer of application, patent and certif. of addition of invention: change of name on requirement

Owner name: CODING TECHNOLOGIES AB (SE) , KONINKLIJKE PHILIPS

Free format text: A FIM DE ATENDER A ALTERACAO DE NOME E SEDE REQUERIDA ATRAVES DA PETICAO NO 018120006432/SP DE 02/03/2012, E NECESSARIO RECOLHER AS GUIAS RELATIVAS A SEGUNDA ALTERACAO DE NOME, A ALTERACAO DE SEDE, BEM COMO A GUIA DE CUMPRIMENTO DESTA EXIGENCIA.

B25F Entry of change of name and/or headquarter and transfer of application, patent and certif. of addition of invention: change of name on requirement

Owner name: CODING TECHNOLOGIES AB (SE) , KONINKLIJKE PHILIPS

Free format text: A FIM DE ATENDER AS DUAS ALTERACOES DE NOME E A ALTERACAO DE ENDERECO REQUERIDAS ATRAVES DAS PETICOES NO 18120006432/SP DE 02/03/2012 E 18120037015/SP DE 03/10/2012, E NECESSARIO AINDA RECOLHER MAIS UMA GUIA RELATIVA AO TERCEIRO SERVICO SOLICITADO.

B25D Requested change of name of applicant approved

Owner name: KONINKLIJKE PHILIPS ELECTRONICS N. V (NL) , DOLBY

B25D Requested change of name of applicant approved

Owner name: KONINKLIJKE PHILIPS ELECTRONICS N. V (NL) , DOLBY

B25G Requested change of headquarter approved

Owner name: KONINKLIJKE PHILIPS ELECTRONICS N. V (NL) , DOLBY

B06T Formal requirements before examination [chapter 6.20 patent gazette]
B15K Others concerning applications: alteration of classification

Free format text: A CLASSIFICACAO ANTERIOR ERA: G10L 19/00

Ipc: G10L 19/008 (2013.01)

B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 02/03/2021, OBSERVADAS AS CONDICOES LEGAIS.

B25G Requested change of headquarter approved

Owner name: KONINKLIJKE PHILIPS ELECTRONICS N. V (NL) ; DOLBY INTERNATIONAL AB (IE)