BRPI0608756A2 - codificador e decodificador de áudio de multicanais, método para codificar um sinal de áudio de n canais, sinal de áudio de multicanais codificado para um sinal de áudio de n canais, meio de armazenagem, transmissor para transmitir um sinal de aúdio de multicanais codificado, receptor para receber um sinal de áudio de multicanais, sistema de transmissão, métodos para transmitir e para receber um sinal de áudio de multicanais codificado, produto de programa de computador, gravador de áudio de multicanais, e, reprodutor de áudio de multicanais - Google Patents

codificador e decodificador de áudio de multicanais, método para codificar um sinal de áudio de n canais, sinal de áudio de multicanais codificado para um sinal de áudio de n canais, meio de armazenagem, transmissor para transmitir um sinal de aúdio de multicanais codificado, receptor para receber um sinal de áudio de multicanais, sistema de transmissão, métodos para transmitir e para receber um sinal de áudio de multicanais codificado, produto de programa de computador, gravador de áudio de multicanais, e, reprodutor de áudio de multicanais Download PDF

Info

Publication number
BRPI0608756A2
BRPI0608756A2 BRPI0608756-6A BRPI0608756A BRPI0608756A2 BR PI0608756 A2 BRPI0608756 A2 BR PI0608756A2 BR PI0608756 A BRPI0608756 A BR PI0608756A BR PI0608756 A2 BRPI0608756 A2 BR PI0608756A2
Authority
BR
Brazil
Prior art keywords
signal
channel
enhancement data
data
enhancement
Prior art date
Application number
BRPI0608756-6A
Other languages
English (en)
Inventor
Gerard H Hotho
Francois P Myburg
Arnoldus W J Oomen
Original Assignee
Koninkl Philips Electronics Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=36607294&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=BRPI0608756(A2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Koninkl Philips Electronics Nv filed Critical Koninkl Philips Electronics Nv
Publication of BRPI0608756A2 publication Critical patent/BRPI0608756A2/pt
Publication of BRPI0608756B1 publication Critical patent/BRPI0608756B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

CODIFICADOR E DECODIFICADOR DE AUDIO DE MULTICANAIS, METODO PARA CODIFICAR UM SINAL DE áUDIO DE N CANAIS, SINAL DE AUDIO DE MULTICANAIS CODIFICADO PARA UM SINAL DE AUDIO DE N CANAIS, MEIO DE ARMAZENAGEM, TRANSMISSOR PARA TRANSMITIR UM SINAL DE áUDIO DE MULTICANAIS CODIFICADO, RECEPTOR PARA RECEBER UM SINAL DE áUDIO DE MULTICANAIS, SISTEMA DE TRANSMISSãO, METODOS PARA TRANSMITIR E PARA RECEBER UM SINAL DE AUDIO DE MULTICANAIS CODIFICADO, PRODUTO DE PROGRAMA DE COMPUTADOR, GRAVADOR DE AUDIO DE MULTICANAIS, E, REPRODUTOR DE AUDIO DE MULTICANAIS Um codificador de áudio de multicanais (10) codifica um sinal de áudio de N canais. Uma primeira unidade (110) gera um primeiro sinal de M canais codificado, por exemplo, uma da mistura descendente estéreo espacial, para o sinal de N canais (N>M). Misturadores descendentes (115, 116, 117) geram primeiros dados de realce para o sinal, relativos ao sinal de áudio de N canais. Um segundo sinal de M canais, tal como uma mistura estéreo artística, é gerado para o sinal de N canais. Um processador (123) então gera segundos dados de realce para o segundo sinal de M canais relativos ao primeiro sinal de M canais. Uma segunda unidade (120) gera um sinal de saída compreendendo o segundo sinal de M canais, os primeiros dados de realce e os segundos dados de realce. O gerador (123) pode selecionar dinamicamente entre gerar os segundos dados de realce como dados de realce absolutos ou como dados de realce relativos, relativos ao segundo sinal de M canais codificado. Um decodificador (20) pode executar a operação inversa e pode aplicar os segundos dados de realce como realce absoluto ou relativo, dependendo de uma indicação no fluxo de bits recebido.

Description

"CODIFICADOR E DECODIFICADOR DE ÁUDIO DE MULTICANAIS,MÉTODO PARA CODIFICAR UM SINAL DE ÁUDIO DE N CANAIS,SINAL DE ÁUDIO DE MULTICANAIS CODIFICADO PARA UM SINALDE ÁUDIO DE N CANAIS, MEIO DE ARMAZENAGEM,TRANSMISSOR PARA TRANSMITIR UM SINAL DE ÁUDIO DEMULTICANAIS CODIFICADO, RECEPTOR PARA RECEBER UMSINAL DE ÁUDIO DE MULTICANAIS, SISTEMA DE TRANSMISSÃO,MÉTODOS PARA TRANSMITIR E PARA RECEBER UM SINAL DEÁUDIO DE MULTICANAIS CODIFICADO, PRODUTO DE PROGRAMADE COMPUTADOR, GRAVADOR DE ÁUDIO DE MULTICANAIS, E,REPRODUTOR DE ÁUDIO DE MULTICANAIS"
A invenção relaciona-se a codificação e/ou decodificação deáudio para sinais de multicanais.
Um sinal de áudio de multicanais é um sinal de áudio tendodois ou mais canais de áudio. Exemplos bem conhecidos de sinais de áudio demulticanais são sinais de áudio estéreo de dois canais e sinais de áudio decanais 5.1 tendo dois canais de áudio frontais, dois canais de áudio traseiros,um sinal de áudio central e um canal de realce de baixa freqüência adicional(LFE). Tais sinais de áudio de canais 5.1 são usados em sistemas de DVD(Disco Versátil Digital) e SACD (Disco Compacto de Super Áudio). Devido àcrescente popularidade do material de multicanais, a codificação eficiente dematerial de multicanais está se tornando mais importante.
No campo de processamento de áudio, é bem conhecidoconverter um número de canais de áudio em um outro número de canais deáudio. Tal conversão pode ser efetuada por várias razões. Por exemplo, umsinal de áudio pode ser convertido em um outro formato para prover aousuário uma sensação realçada. Por exemplo, gravações de estéreotradicionais somente compreendem dois canais ao passo que sistemas deáudio modernos avançados tipicamente usam cinco ou seis canais, como nospopulares sistemas "surround" 5.1. Conseqüentemente, os dois canais estéreopodem ser convertidos em cinco ou seis canais no sentido de obter plenavantagem do sistema de áudio avançado.
Uma outra razão para uma conversão de canal é a eficiência decodificação. Tem sido verificado que, por exemplo, sinais de áudio de som"surround" podem ser codificados como sinais de áudio de canal estéreocombinados com um parâmetro de fluxo de bit descrevendo as propriedadesespaciais de multicanais do sinal de áudio. O decodificador pode reproduzir osinais de áudio de som "surround" com um grau muito satisfatório deprecisão. Deste modo, substancial economia de taxa de bit pode ser obtida.
Um sistema de codificação de áudio de multicanais 5.1-2-5.1 éconhecido. Neste sistema de codificação de áudio conhecido, um sinal deáudio de entrada 5.1 é codificado em e representado por dois canais demistura descendente e parâmetros associados. Os sinais de misturadescendente são também referidos em conjunto como mistura descendenteespacial. No sistema conhecido, a mistura descendente espacial forma umsinal de áudio estéreo tendo uma imagem estéreo que é, como qualidade,comparável a uma mistura descendente ITU fixa a partir dos canais de entrada5.1. usuários tendo somente equipamento estéreo podem ouvir esta misturadescendente estéreo espacial, enquanto ouvintes com equipamento de canal5.1 podem ouvir a reprodução de canal 5.1 que é feita usando esta misturadescendente estéreo espacial e parâmetros associados. O equipamento decanal 5.1 decodifica/reconstrói o sinal de áudio de canal 5.1 a partir damistura descendente estéreo espacial (isto é, o sinal de áudio estéreo) e osparâmetros associados.
Entretanto, uma mistura descendente estéreo espacial éfreqüentemente considerada de qualidade reduzida comparada a um sinaloriginal estéreo ou um sinal estéreo gerado explicitamente. Por exemplo,engenheiros de estúdio profissionais tendem a considerar a misturadescendente estéreo espacial algo sem brilho e desinteressante. Por esta razão,uma mistura descendente estéreo artística, que difere da mistura descendenteestéreo espacial é freqüentemente gerada. Por exemplo, reverberação extra oufontes são adicionadas, a imagem estéreo é alargada, etc. No sentido dosusuários serem capazes de aproveitar a mistura descendente estéreo artística,esta mistura descendente estéreo artística, ao invés da mistura descendenteestéreo espacial, pode ser transmitida via um meio de transmissão ouarmazenada em um meio de armazenagem. Entretanto, como os dadosparamétricos para gerar o sinal 5.1 a partir do sinal estéreo são baseados nosinal de mistura descendente original, esta abordagem afeta seriamente aqualidade da reprodução do sinal de áudio de canais 5.1. Especificamente, osinal de áudio de canais 5.1 foi codificado em uma mistura descendenteestéreo espacial e parâmetros associados. Substituindo a mistura descendenteestéreo espacial pela mistura descendente estéreo artística, a misturadescendente estéreo espacial não pode mais ser disponível na decodificaçãofinal do sistema e uma reconstrução de alta qualidade do sinal de áudio decanais 5.1 não é possível.
Uma abordagem possível para melhorar a qualidade do sinalde áudio de canais 5.1 é incluir dados adicionais do sinal de misturadescendente estéreo espacial. Por exemplo, em adição à mistura descendenteestéreo artística, o sinal de mistura descendente estéreo espacial pode serincluído no mesmo fluxo de bits ou pode ser transmitido em paralelo.Entretanto, isto aumenta substancialmente a taxa de dados e então asexigências de largura de faixa de comunicação ou armazenagem degradaram aqualidade para a relação de taxa de dados para um sinal de multicanaiscodificado.
Daí, um sistema melhorado de codificação/decodificação paraáudio de multicanais seria vantajoso e, em particular, um sistema permitindoum desempenho melhorado, qualidade e/ou qualidade para relação de taxa dedados seria vantajoso.
Conseqüentemente, a invenção busca preferivelmente mitigar,aliviar ou eliminar uma ou mais das desvantagens acima mencionadasisoladamente ou em qualquer combinação.
De acordo com um primeiro aspecto da invenção, é providoum codificador de áudio de multicanais para codificar sinal de áudio de Ncanais, o codificador de áudio de multicanais compreendendo: meio paragerar um primeiro sinal de M canais para o sinal de áudio de N canais, Msendo menor que N; meio para gerar primeiros dados de realce para oprimeiro sinal de M canais relativo ao sinal de áudio de N canais; meio paragerar um segundo geral de M canais para o sinal de áudio de N canais; meiode realce para gerar segundos dados de realce para o segundo sinal de Mcanais relativo ao primeiro sinal de M canais; meio para gerar um sinal desaída codificado compreendendo o segundo sinal de M canais, os primeirosdados de realce e os segundos dados de realce; onde o meio de realce éarranjado para selecionar dinamicamente entre gerar os segundos dados derealce como dados de realce absolutos ou como dados de realce relativos,relativos ao segundo sinal de M canais.
A invenção pode permitir uma codificação eficiente de umsinal de multicanais. Em particular, uma codificação eficiente com umaqualidade aumentada para relação de taxa de dados, pode ser obtida. Ainvenção pode permitir que um sinal de M canais substitua um outro sinal deM canais com impacto reduzido na geração de multicanais com base nosdados de realce relacionados ao primeiro sinal de M canais. Especificamente,uma mistura descendente artística pode ser transmitida ao invés de umamistura descendente espacial, enquanto permite uma recriação eficiente demulticanais em um decodificador baseado nos dados de realce associados àmistura descendente espacial. A seleção dinâmica dos dados de realce permiteum tamanho significativamente reduzido dos dados de realce e/ou umaqualidade melhorada do sinal que pode ser gerado.
Os dados de realce absolutos descrevem o primeiro sinal de Mcanais sem se referir ao segundo sinal de M canais, ao passo que os dados derealce relativos descrevem o primeiro sinal de M canais com referência aosegundo sinal de M canais.
O meio para gerar o primeiro e/ou segundo sinal de M canaispode gerar os sinais processando o sinal de N canais ou, por exemplo,recebendo o(s) sinal(is) de M canais a partir de fontes internas ou externas.
De acordo com uma característica adicional da invenção, o meio de realce é arranjado para selecionar entre os dados de realce absolutos eos dados de realce relativos, em resposta a uma característica do sinal de Ncanais.
Isto pode permitir um desempenho eficiente e em particularpode prover um sinal codificado com qualidade melhorada para relação detaxa de dados. A seleção pode, por exemplo, ser executada avaliando um oumais parâmetros derivados de uma característica de um segmento do sinal deN canais e especificamente baseado em um ou mais parâmetros derivados doprimeiro e/ou segundo sinal de M canais (que podem eles próprios serderivados do sinal de N canais).
De acordo com uma característica opcional da invenção, omeio de realce é arranjado para selecionar entre o dados de realce absolutos eos dados de realce relativos, em resposta a uma característica relativa dosdados de realce absolutos e dos dados de realce relativos.
Isto pode permitir um desempenho eficiente e em particularpode prover um sinal codificado com qualidade melhorada para relação detaxa de dados. Alternativamente ou adicionalmente, pode permitir umaimplementação eficiente e/ou de baixa complexidade.
De acordo com uma característica opcional da invenção, acaracterística relativa é uma energia de sinal dos dados de realce absolutos emrelação a uma energia de sinal dos dados de realce relativos.
Isto pode permitir um desempenho eficiente e em particularpode prover um sinal codificado com qualidade melhorada para relação detaxa de dados. Alternativamente ou adicionalmente, pode permitir umaimplementação eficiente e/ou de baixa complexidade. Especificamente, omeio de realce pode selecionar um tipo de dados de realce que possua aenergia de sinal mais baixa.
De acordo com uma característica opcional da invenção, omeio de realce é arranjado para dividir o segundo sinal de M canais em blocosde sinal e selecionar individualmente entre os dados de realce absolutos e osdados de realce relativos para cada bloco de sinal.
Isto pode permitir um desempenho eficiente e em particularpode prover um sinal codificado com qualidade melhorada para relação detaxa de dados. Alternativamente ou adicionalmente, pode permitir umaimplementação eficiente e/ou de baixa complexidade. Os blocos de sinalpodem ser divididos no domínio do tempo e/ou da freqüência e cada bloco desinal pode compreender especificamente um grupo de disposição lado a ladode tempo/freqüência. A divisão em blocos de sinais pode ser aplicada aoprimeiro sinal de M canais e/ou sinal de N canais.
De acordo com uma característica opcional da invenção, omeio de realce é arranjado para selecionar entre dados de realce absolutos e osdados de realce relativos para um bloco de sinal baseado somente emcaracterísticas associadas ao bloco de sinal.
Isto pode permitir um desempenho eficiente e em particularpode prover um sinal codificado com qualidade melhorada para relação detaxa de dados. Alternativamente ou adicionalmente, pode permitir umaimplementação eficiente e/ou de baixa complexidade. Especificamente, omeio de realce pode selecionar o tipo de dados de realce que possui a energiade sinal mais baixa.De acordo com uma característica opcional da invenção, omeio de realce é arranjado para gerar os dados de realce como umacombinação dos dados de realce absolutos e dos dados de realce relativosdurante um intervalo de tempo de comutação de uma chave entre a geraçãodos dados de realce como dados de realce absolutos e como dados de realcerelativos.
Isto pode permitir comutação melhorada que pode, emparticular, reduzir artefatos associados à comutação. Uma qualidade sonoramelhorada pode ser alcançada. A combinação durante um intervalo de tempode comutação pode ser aplicada ao comutar os dados de realce absolutos pararelativos e/ou dos dados de realce relativos para absolutos. A combinaçãopode ser alcançada usando uma técnica de superpor e adicionar.
De acordo com uma característica opcional da invenção, acombinação compreende uma interpolação entre os dados de realce absolutose os dados de realce relativos. Isto pode permitir uma implementação prática eeficiente com alta qualidade. Uma qualidade de som melhorada pode seralcançada.
De acordo com uma característica opcional da invenção, omeio para gerar o sinal de saída codificado é arranjado para incluir dadosindicando se os dados de realce relativos ou dados de realce absolutos sãousados.
Isto pode permitir um desempenho eficiente e em particularpode prover um sinal codificado com qualidade melhorada para relação detaxa de dados. Alternativamente ou adicionalmente, pode permitir umaimplementação eficiente e/ou de baixa complexidade. Os dados de indicaçãopode incluir especificamente uma indicação de seleção para cada bloco desinal.
De acordo com uma característica opcional da invenção, ossegundos dados de realce compreendem uma primeira parte de dados derealce e uma segunda parte de dados de realce, a segunda parte provendo umarepresentação de qualidade mais alta do primeiro sinal de M canais do que aprimeira parte.
Isto pode permitir um desempenho eficiente e em particularpode prover um sinal codificado com qualidade melhorada para relação detaxa de dados. A primeira parte pode ter uma taxa de dados mais baixa que asegunda parte. A segunda parte pode compreender dados que permitem maisprecisamente que um decodificador recrie o primeiro sinal de M canais.
De acordo com uma característica opcional da invenção, omeio de realce é arranjado para selecionar dinamicamente apenas entre gerara segunda parte como dados de realce absolutos ou como dados de realcerelativos.
Isto pode permitir um desempenho eficiente e em particularpode prover um sinal codificado com qualidade melhorada para relação detaxa de dados.
De acordo com uma característica opcional da invenção, omeio de realce é arranjado para gerar dados relativos da segunda parte emrelação a um sinal de referência gerado aplicando dados de realce da primeiraparte ao primeiro sinal de M canais.
Isto pode permitir um desempenho eficiente e em particularpode prover um sinal codificado com qualidade melhorada para relação detaxa de dados.
De acordo com um outro aspecto da invenção, é provido umdecodificador de áudio de multicanais para decodificar um sinal de áudio deN canais, o decodificador de áudio de multicanais compreendendo: meio parareceber um sinal de áudio codificado compreendendo um primeiro sinal de Mcanais para o sinal de áudio de N canais, M sendo menor que N, primeirosdados de realce para expansão de multicanais, os primeiros dados de realcesendo relativos a um segundo sinal de M canais diferente do primeiro sinal deM canais; segundos dados de realce para o primeiro sinal de M canais relativoao segundo sinal de M canais, os segundos dados de realce compreendendodados de realce absolutos e dados de realce relativos, relativos ao primeirosinal de M canais, e dados de indicação indicativos de se os segundos dadosde realce para um bloco de sinal são dados de realce absolutos ou dados derealce relativos; meio de geração para gerar um sinal de expansão demulticanais de M canais, em resposta ao primeiro sinal de M canais esegundos dados de realce; e meio para gerar um sinal decodificado de Ncanais em resposta ao sinal de expansão de multicanais de M canais eprimeiros dados de realce; e onde o meio de geração é arranjado paraselecionar entre aplicar os segundos dados de realce como dados de realceabsolutos ou dados de realce relativos, em resposta aos dados de indicação.
A invenção pode permitir uma decodificação eficiente e dealto desempenho de um sinal de multicanais. Em particular, umadecodificação eficiente de um sinal com qualidade melhorada para uma dadataxa de dados pode ser obtida. A invenção pode permitir que um sinal de Mcanais substitua um outro sinal de M canais com impacto reduzido na geraçãode multicanais com base nos dados de realce relacionados ao primeiro sinal deM canais. Especificamente, uma mistura descendente artística pode sertransmitida ao invés de uma mistura descendente espacial, enquanto permiteuma recriação de multicanais eficiente no decodificador, com base em dadosde realce associados à mistura descendente espacial.
Os dados de realce absolutos descrevem o segundo sinal de Mcanais sem se referir ao primeiro sinal de M canais, ao passo que os dados derealce relativos descrevem o segundo sinal de M canais com referência aoprimeiro sinal de M canais.
De acordo com uma característica opcional da invenção, o meio de geração é arranjado para aplicar os segundos dados de realce aoprimeiro sinal de M canais no domínio do tempo.Isto pode permitir um desempenho eficiente e em particularpode prover um sinal decodificado com qualidade melhorada para uma dadataxa de dados. Alternativamente ou adicionalmente, pode permitir umaimplementação eficiente e/ou de baixa complexidade.
De acordo com uma característica opcional da invenção, omeio de geração é arranjado para aplicar os segundos dados de realce aoprimeiro sinal de M canais no domínio da freqüência.
Isto pode permitir um desempenho eficiente e, em particular,pode prover um sinal decodificado com qualidade melhorada para uma dadataxa de dados. Alternativamente ou adicionalmente, este pode permitir umaimplementação eficiente e/ou de baixa complexidade.
Em particular, em muitas realizações, a aplicação no domínioda freqüência pode reduzir um número requerido de tempo paratransformadas de freqüência. O domínio da freqüência pode, por exemplo, serum domínio de Banco de Filtro Espelho em Quadratura (QMF) ou deTransformada de Co-seno Discreta Modificada (MDCT).
De acordo com uma característica opcional da invenção, ossegundos dados de realce compreendem uma primeira parte de dados derealce e uma segunda parte de dados de realce, a segunda parte provendo umarepresentação de qualidade mais alta do primeiro sinal de M canais do que aprimeira parte.
Isto pode permitir um desempenho eficiente e em particularpode prover um sinal decodificado com qualidade melhorada para uma dadataxa de dados. Alternativamente ou adicionalmente, pode permitir umaimplementação eficiente e/ou de baixa complexidade. A segunda parte podecompreender dados que permitem mais precisamente que um decodificadorrecrie o primeiro sinal de M canais.
De acordo com uma característica opcional da invenção, omeio de geração é arranjado para selecionar apenas entre aplicação dossegundos dados de realce da segunda parte como dados de realce absolutos oudados de realce relativos.
Isto pode permitir um desempenho eficiente e em particularpode prover um sinal decodificado com qualidade melhorada para uma dadataxa de dados. Alternativamente ou adicionalmente, pode permitir umaimplementação eficiente e/ou de baixa complexidade.
De acordo com uma característica opcional da invenção, omeio de geração é arranjado para gerar a expansão de multicanais de Mcanais, aplicando dados de realce relativos da segunda parte a um sinalgerado, aplicando dados de realce da primeira parte ao primeiro sinal de Mcanais.
Isto pode permitir um desempenho eficiente e em particularpode prover um sinal decodificado com qualidade melhorada para uma dadataxa de dados. Alternativamente ou adicionalmente, pode permitir umaimplementação eficiente e/ou de baixa complexidade.
De acordo com um outro aspecto da invenção, é provido ummétodo para codificar um sinal de áudio de N canais, o métodocompreendendo: gerar um primeiro sinal de M canais para o sinal de áudio deN canais, M sendo menor que N; gerar primeiros dados de realce para oprimeiro sinal de M canais relativo ao sinal de áudio de N canais; gerar umsegundo sinal de M canais para um sinal de áudio de N canais; gerar segundosdados de realce para o segundo sinal de M canais relativo ao primeiro sinal deM canais; gerar um sinal de saída codificado compreendendo o segundo sinalde M canais, os primeiros dados de realce e os segundos dados de realce; eonde a geração dos segundos dados de realce compreende selecionardinamicamente entre gerar os segundos dados de realce como dados de realceabsolutos ou como dados de realce relativos, relativos ao segundo sinal de Mcanais.
De acordo com um outro aspecto da invenção, é provido ummétodo para decodificar um sinal de áudio de N canais, o métodocompreendendo: receber um sinal de áudio codificado compreendendo umprimeiro sinal de M canais para o sinal de áudio de N canais, M sendo menorque N, primeiros dados de realce para expansão de multicanais, os primeirosdados de realce sendo relativos a um segundo sinal de M canais diferente doprimeiro sinal de M canais; segundos dados de realce para o primeiro sinal deM canais relativo ao sinal de M canais, os segundos dados de realcecompreendendo dados de realce absolutos e dados de realce relativos aoprimeiro sinal de M canais, e dados de indicação indicativos de se ossegundos dados de realce para um bloco de sinal são dados de realceabsolutos ou dados de realce relativos; gerar um sinal de expansão demulticanais de M canais em resposta ao primeiro sinal de M canais esegundos dados de realce; e gerar um sinal decodificado de N canais emresposta ao sinal de expansão de multicanais de M canais e primeiros dadosde realce; e onde a geração do sinal de expansão de multicanais de M canaiscompreende selecionar entre aplicar os segundos dados de realce como dadosde realce absolutos ou dados de realce relativos, em resposta aos dados deindicação.
De acordo com um outro aspecto da invenção, é provido umsinal de áudio de multicanais codificado para um sinal de áudio de M canaiscompreendendo: dados de sinal de M canais para o sinal de áudio de N canais,M sendo menor que N; primeiros dados de realce para expansão demulticanais, os primeiros dados de realce sendo relativos ao segundo sinal deM canais diferente do primeiro sinal de M canais; segundos dados de realcepara o primeiro sinal de M canais relativo ao segundo sinal de M canais, ossegundos dados de realce compreendendo dados de realce absolutos e dadosde realce relativos, relativos ao primeiro sinal de M canais; e dados deindicação, indicativos de se os segundos dados de realce para um bloco desinal são dados de realce absolutos ou dados de realce relativos.De acordo com um outro aspecto da invenção, é provido ummeio de armazenagem tendo armazenado nele um sinal conforme descritoacima.
De acordo com um outro aspecto da invenção, é provido umtransmissor para transmitir um sinal de áudio de multicanais codificado, otransmissor compreendendo um codificador de áudio de multicanais conformedescrito acima.
De acordo com um outro aspecto da invenção, é provido umreceptor para receber um sinal de áudio de multicanais, o receptorcompreendendo um decodificador de auto limpeza de multicanais conformedescrito acima.
De acordo com um outro aspecto da invenção, é provido umsistema de transmissão compreendendo um transmissor para transmitir umsinal de áudio de multicanais codificado, via um canal de transmissão, a umreceptor, o transmissor compreendendo um codificador de áudio demulticanais conforme descrito acima e o receptor compreendendo umdecodificador de áudio de multicanais conforme descrito acima.
De acordo com um outro aspecto da invenção, é provido ummétodo para transmitir um sinal de áudio de multicanais codificado, o métodocompreendendo codificar um sinal de áudio de N canais, onde a codificaçãocompreende: gerar um primeiro sinal de M canais para o sinal de áudio de Ncanais, M sendo menor que N; gerar primeiros dados de realce para oprimeiro sinal de M canais relativos ao sinal de áudio de N canais; gerar umsegundo sinal de M canais para o sinal de áudio de N canais; gerar segundosdados de realce para o segundo sinal de M canais relativo ao primeiro sinal deM canais; gerar um sinal de saída codificado compreendendo o segundo sinalde M canais, os primeiros dados de realce e os segundos dados de realce; eonde a geração dos segundos dados de realce compreende selecionardinamicamente entre gerar os segundos dados de realce como dados de realceabsolutos ou como dados de realce relativos, relativos ao segundo sinal de Mcanais.
De acordo com um outro aspecto da invenção, é provido ummétodo para receber um sinal de áudio de multicanais codificado, o métodocompreendendo decodificar o sinal de áudio de multicanais codificado, adecodificação compreendendo receber o sinal de áudio de multicanaiscodificado, compreendendo um primeiro sinal de M canais para o sinal deáudio de N canais, M sendo menor que N, primeiros dados de realce paraexpansão de multicanais, os primeiros dados de realce sendo relativos a umsegundo sinal de M canais diferente do primeiro sinal de M canais; segundosdados de realce para o primeiro sinal de M canais relativo ao segundo sinal deM canais, os segundos dados de realce compreendendo dados de realceabsolutos e dados de realce relativos, relativos ao primeiro sinal de M canais,e dados de indicação indicativos de se os segundos dados de realce para umbloco de sinais são dados de realce absolutos ou dados de realce relativos;gerar um sinal de expansão de multicanais de M canais, em resposta aoprimeiro sinal de M canais e segundos dados de realce; e gerar um sinaldecodificado de N canais em resposta ao sinal de expansão de multicanais deM canais e primeiros dados de realce; e onde a geração do sinal de expansãode multicanais de M canais compreende selecionar entre aplicar os segundosdados de realce como dados de realce absolutos ou dados de realce relativos,em resposta aos dados de indicação.
De acordo com um outro aspecto da invenção, é provido ummétodo para transmitir e receber um sinal de áudio, o métodocompreendendo: codificar um sinal de áudio de N canais, onde a codificaçãocompreende: gerar um primeiro sinal de M canais para o sinal de áudio de Ncanais, M sendo menor que N, gerar primeiros dados de realce para oprimeiro sinal de M canais para o sinal de áudio de N canais, gerar umsegundo sinal de M canais para o sinal de áudio de N canais, gerar segundosdados de realce para o segundo sinal de M canais relativo ao primeiro sinal deM canais, a geração dos segundos dados de realce compreendendo selecionardinamicamente entre gerar os segundos dados de realce como dados de realceabsolutos ou como dados de realce relativos, relativos ao segundo sinal de Mcanais, gerando um sinal de saída codificado compreendendo o segundo sinalde M canais, os primeiros dados de realce e os segundos dados de realce;transmitir o sinal de saída codificado de um transmissor para um receptor;receber, no receptor, o sinal de saída codificado; decodificar o sinal de saídacodificado quando a decodificação compreende: gerar um sinal de expansãode multicanais de M canais em resposta ao segundo sinal de M canais esegundos dados de realce, a geração do sinal de expansão de multicanais de Mcanais compreendendo selecionar entre aplicar os segundos dados de realcecomo dados de realce absolutos ou dados de realce relativos, e gerar um sinaldecodificado de N canais em resposta ao sinal de expansão de multicanais deM canais e primeiros dados de realce.
De acordo com um outro aspecto da invenção, é provido umproduto de programa de computador operativo para fazer com que umprocessador execute as etapas do método descrito acima.
De acordo com um outro aspecto da invenção, é provido umgravador de áudio de multicanais compreendendo um codificador de áudio demulticanais conforme descrito acima.
De acordo com um outro aspecto da invenção, é provido umreprodutor de áudio de multicanais (60) compreendendo um decodificador deáudio de multicanais, conforme descrito acima.
Estes e outros aspectos, características e vantagens dainvenção serão aparentes a partir de e elucidados com referência à(s)realização(ões) posteriormente descritas.
Realizações da invenção serão descritas, somente por meio deexemplo, com referência aos desenhos, nos quais:Figura 1 mostra um diagrama em blocos de um codificador deáudio de multicanais de acordo com algumas realizações da invenção;
Figura 2 mostra um diagrama em blocos de um decodificadorde áudio de multicanais de acordo com algumas realizações da invenção;
Figura 3 mostra um diagrama em blocos de um sistema detransmissão de acordo com algumas realizações da invenção;
Figura 4 mostra um diagrama em blocos de umreprodutor/gravador de áudio de multicanais de acordo com algumasrealizações da invenção;
Figura 5 mostra um diagrama em blocos de um codificador deáudio de multicanais de acordo com algumas realizações da invenção;
Figura 6 mostra um diagrama em blocos de um gerador dedados de realce de acordo com algumas realizações da invenção;
Figura 7 mostra um diagrama em blocos de um decodificadorde áudio de multicanais de acordo com algumas realizações da invenção;
Figura 8 mostra um diagrama em blocos de elementos de umdecodificador de áudio de multicanais;
Figura 9 mostra um diagrama em blocos de elementos de umdecodificador de áudio de multicanais de acordo com algumas realizações dainvenção;
Figura 10 mostra um diagrama em blocos de elementos de umdecodificador de áudio de multicanais de acordo com algumas realizações dainvenção; e
Figura 11 mostra um diagrama em blocos de elementos de umdecodificador de áudio de multicanais de acordo com algumas realizações dainvenção.
A seguinte descrição focaliza em realizações da invençãoaplicáveis a um codificador 5.1-para-2 e/ou um decodificador 2-para-5.1.Entretanto, será verificado que a invenção não está limitada a esta aplicação.Figura 1 mostra um diagrama em blocos de uma realização deum codificador de áudio de multicanais 10 de acordo com algumasrealizações da invenção. Este codificador de áudio de multicanais 10 éarranjado para codificar N sinais de áudio 101 em M sinais de áudio 102 edados paramétricos associados 104, 105. Neste, MeN são inteiros com N>Me M > 1. Um exemplo do codificador de áudio de multicanais 10 é umcodificador 5.1-para-2 no qual N é igual a 6, isto é, 5+1 canais, e M é igual a2. Tal codificador de áudio de multicanais codifica um sinal de áudio deentrada de 5.1 canais em um sinal de áudio de saída de dois canais, porexemplo, um sinal de áudio de saída estéreo e parâmetros associados. Outrosexemplos do codificador de áudio de multicanais 10 são codificadores 5.1-para-1, 6.1-para-2, 6.1-para-l, 7.1-para-2 e 7.1-para-l. Também codificadorestendo outros valores para NeM são possíveis, enquanto N é maior que M eenquanto M é maior ou igual a 1.
O codificador de áudio de multicanais 10 compreende uma primeira unidade de codificação IlOe acoplada a ela uma segunda unidade decodificação 120. A primeira unidade de codificação 110 recebe os N sinais deáudio de entrada 101 e codifica os N sinais de áudio 101 nos M sinais deáudio 102 e primeiros dados paramétricos associados 104. Os M sinais deáudio 102 e os primeiros dados paramétricos associados 104 representam osN sinais de áudio de entrada 101. A codificação dos N sinais de áudio 101 nosM sinais de áudio 102 conforme efetuada pela primeira unidade 110 podetambém ser referida como mistura descendente e os M sinais de áudio 102podem também ser referidos como mistura descendente espacial 102. Aunidade 110 pode ser um codificador de áudio de multicanais paramétricoconvencional que codifica um sinal de áudio de multicanais 101 em um sinalde áudio de mistura descendente mono ou estéreo 102 e parâmetrosassociados 104. Os parâmetros associados 104 habilitam um decodificador areconstruir o sinal de áudio de multicanais 101a partir do sinal de áudio demistura descendente mono ou estéreo 102. E notado que a misturadescendente 102 pode também ter mais de dois canais.
A primeira unidade 110 fornece a mistura descendenteespacial 102 à segunda unidade 120. A segunda unidade 120 gera, a partir daMS espacial 102, segundos dados de realce na forma dos segundos dadosparamétricos associados 105. Os segundos dados paramétricos associados 105representam a mistura descendente espacial 102, isto é, estes parâmetros 105compreendem características ou propriedades da mistura descendente espacial102 que habilitam um decodificador a reconstruir pelo menos parte da misturadescendente espacial 102, por exemplo, sintetizando um sinal lembrando amistura descendente espacial 102. Os dados paramétricos associadoscompreendem os primeiros e segundos dados paramétricos associados 104 e105.
Os segundos dados paramétricos associados 105 compreendemparâmetros de modificação habilitando uma reconstrução da misturadescendente espacial 102 a partir de K (=M) sinais de áudio adicionais 103.Deste modo, um decodificador pode executar uma reconstrução ainda melhorda mistura descendente espacial 102. Esta reconstrução pode ser feita combase em uma mistura descendente alternativa 103, isto é, os K sinais de áudioadicionais 103, tal como uma mistura descendente artística. Um decodificadorpode aplicar os parâmetros de modificação ao sinal de mistura descendentealternativa 103, de tal modo que este se parece mais com a misturadescendente espacial 102.
A segunda unidade 120 pode receber em suas entradas amistura descendente alternativa 103. A mistura descendente alternativa 103pode ser recebida de uma fonte externa ao codificador 10 (conforme mostradona Figura 1) ou, alternativamente a mistura descendente alternativa 103 podeser gerada dentro do codificador 10 (não mostrado), por exemplo, a partir dosN sinais de áudio 101. A segunda unidade 120 pode comparar pelo menosalguma mistura descendente espacial 102 com a mistura descendentealternativa 103 e gerar parâmetros de modificação 105 representando umadiferença entre a mistura descendente espacial 102 e a mistura descendentealternativa 103, por exemplo, uma diferença entre uma propriedade da misturadescendente espacial 102 e uma propriedade da mistura descendentealternativa 103. No exemplo, a mistura descendente alternativa 103 éespecificamente uma mistura descendente artística associada a misturadescendente espacial.
No exemplo, a segunda unidade 120 pode geraradicionalmente os parâmetro de modificação como valores absolutos querepresentam diretamente a mistura descendente espacial 102, sem qualquerreferência à mistura descendente alternativa 103. Ainda mais, a misturadescendente espacial 102 compreende funcionalidade para selecionar entre osparâmetros de modificação relativos e absolutos para o sinal de saída decodificador. Especificamente, esta seleção é dinamicamente efetuada e podeser feita para blocos de sinal individuais, dependendo das características dosinal e/ou dados paramétricos.
Em adição, a segunda unidade 120 pode compreenderfuncionalidade para incluir uma indicação de quais parâmetros demodificação (absolutos ou relativos) tenham sido usados para diferentesseções do sinal codificado. Por exemplo, para cada bloco de sinal, um bit dedados pode ser incluído para indicar se dados paramétricos relativos ouabsolutos foram incluídos para aquele bloco de sinal.
Os parâmetros de modificação 105 preferivelmentecompreendem (uma diferença entre) uma ou mais propriedades de sinalestatísticas tais como variância, covariância e correlação, ou uma relaçãodestas propriedades, ou do(s) (diferença entre o(s)) sinal(is) de misturadescendente. É notado que a variância de um sinal é equivalente à energia oupotência daquele sinal. Estas propriedades de sinal estatísticas habilitam umaboa reconstrução da mistura descendente espacial.
Figura 2 mostra um diagrama em blocos de uma realização deum decodificador de áudio de multicanais 20 de acordo com algumasrealizações da invenção. O decodificador de áudio de multicanais 20 éarranjado para decodificar K sinais de áudio 103 e dados paramétricosassociados 104, 105, em N sinais de áudio 203. 'neste, KeN são inteiros,com N>KeK>1.0sK sinais de áudio 103, isto é, a mistura descendentealternativa 103, e os dados paramétricos associados 104, 105, representam osN sinais de áudio 203, isto é, o sinal de áudio de multicanais 203. Umexemplo do decodificador de áudio de multicanais 20 é um decodificador 2-para-5.1 no qual N é igual a 6, isto é, 5+1 canais, e K é igual a 2. Taldecodificador de áudio de multicanais decodifica um sinal de áudio de entradade 2 canais, por exemplo um sinal de áudio de entrada estéreo, e parâmetrosassociados em um sinal de áudio de saída de 5.1 canais. Outros exemplos dodecodificador de áudio de multicanais 20 são decodificadores l-para-5.1, 2-para-6.1, l-para-6.1, 2-para-7.1 e l-para-7.1. também decodificadores tendooutros valores para NeK são possíveis enquanto N é maior que K e enquantoK é maior ou igual a 1.
O decodificador de áudio de multicanais 20 compreende umaprimeira unidade 210 e, acoplada a ela, uma segunda unidade 220. A primeiraunidade 210 recebe a mistura descendente alternativa 103 e dados de realce naforma de parâmetros de modificação 105 e reconstrói M sinais de áudioadicionais 202, isto é, a mistura descendente espacial 202 ou umaaproximadamente desta, a partir da mistura descendente alternativa 103 eparâmetros de modificação 105. Neste caso, M é um inteiro com M > 1. Osparâmetros de modificação 105 representam a mistura descendente espacial202. A primeira unidade 210 é especificamente arranjada para determinar seos parâmetros de modificação 105 são parâmetros de modificação absolutosou relativos e para aplicar os parâmetros de acordo. Especificamente, aprimeira unidade 210 pode determinar se os parâmetros de modificação 105para blocos de sinal individuais são parâmetros absolutos ou relativos, combase em dados explícitos no fluxo de bits recebido. Por exemplo, um único bitde dados pode ser incluído para cada bloco de sinal indicando se osparâmetros são parâmetros de modificação absolutos ou relativos naquelebloco de sinal.
A segunda unidade 220 recebe a mistura descendente espacial202 da primeira unidade 210 e parâmetros de modificação 104. A segundaunidade 220 decodifica a mistura descendente espacial 202 e parâmetros demodificação 104 no sinal de áudio de multicanais 203. A segunda unidade220 pode ser um decodificador de áudio de multicanais paramétricoconvencional que decodifica um sinal de áudio de mistura descendente monoou estéreo 202 e parâmetros associados 104 e m um sinal de áudio demulticanais 203.
A primeira unidade 210 pode ser arranjada para determinar seé necessário ou desejável reconstruir o sinal 202 a partir do sinal de entrada103. tal reconstrução pode não ser aplicável quando o sinal de misturadescendente espacial 202 é fornecido à primeira unidade 210 ao invés damistura descendente alternativa 103. A primeira unidade 210 pode determinaristo gerando, a partir do sinal de entrada 103 de mesmas propriedades de sinalou similares como são compreendidos nos parâmetros de modificação 105 ecomparando estas propriedades de sinal gerado com os parâmetros demodificação 105. Se esta comparação mostra que as propriedades do sinalgerado são iguais ou substancialmente iguais aos parâmetros de modificações105, então o sinal de entrada 103 lembra suficientemente o sinal de misturadescendente espacial 202 e a primeira unidade 210 pode enviar o sinal deentrada 103 à segunda unidade 220. Se a comparação mostra que aspropriedades do sinal gerado não são iguais ou substancialmente iguais aosparâmetros de modificação 105, então o sinal de entrada 103 não se parecesuficientemente com o sinal de mistura descendente espacial 202 e a primeiraunidade 210 pode reconstruir/aproximar o sinal de mistura descendenteespacial 202 a partir do sinal de entrada 103 e dos parâmetros de modificação105.
A primeira unidade 210 pode gerar, a partir da misturadescendente alternativa, parâmetros/propriedades de modificação adicionaisrepresentando a mistura descendente alternativa 103. Em tal caso, a primeiraunidade 210 pode reconstruir a mistura descendente espacial 202 a partir damistura descendente alternativa 103 e (uma diferença entre) os parâmetros demodificação 105 e os parâmetros de modificação adicionais.
Os parâmetros de modificação 105 e os parâmetros demodificação adicionais, respectivamente, podem incluir propriedadesestatísticas da mistura descendente espacial 202 e mistura descendentealternativa 103, respectivamente. Estas propriedades estatísticas tais comovariância, correlação e covariância, etc, provêem boas representações dossinais dos quais são derivados. Estes são úteis para reconstruir a misturadescendente espacial 202, por exemplo, transformando a mistura descendentealternativa de tal modo que suas propriedades associadas coincidem com aspropriedades compreendidas nos parâmetros de modificação 105.
Figura 3 mostra um diagrama em blocos de uma realização deum sistema de transmissão 70 de acordo com algumas realizações dainvenção. O sistema de transmissão 70 compreende um transmissor 40 paratransmitir um sinal de áudio de multicanais codificado via um canal detransmissão 30, por exemplo, um enlace de comunicação com fio ou sem fio,para um receptor 50. O transmissor 40 compreende um codificador de áudiode multicanais 10 conforme descrito acima, para codificar o sinal de áudio demulticanais 101 em uma mistura descendente espacial 102 e parâmetrosassociados 104, 105. O transmissor 40 compreende adicionalmente meio 41para transmitir um sinal de áudio de multicanais codificado compreendendoos parâmetros 104, 105 e a mistura descendente espacial 102 ou a misturadescendente alternativa 103, via canal de transmissão 30 para o receptor 50. Oreceptor 50 compreende meio 51 para receber o sinal de áudio de multicanaiscodificado e um decodificador de áudio de multicanais 20 conforme descritoacima, para decodificar a mistura descendente alternativa 103 ou a misturadescendente espacial 102 e os parâmetros associados 104, 105 no sinal deáudio de multicanais 203.
Figura 4 mostra um diagrama em blocos de uma realização deum reprodutor/gravador de multicanais de áudio 60 de acordo com algumasrealizações da invenção. O reprodutor/gravador de multicanais de áudio 60compreende um decodificador de áudio de multicanais 20 e/ou umcodificador de áudio de multicanais 10 de acordo com algumas realizações dainvenção. O reprodutor/gravador de multicanais de áudio 60 pode ter suaprópria armazenagem, por exemplo, memória de estado sólido ou discorígido. O reprodutor/gravador de multicanais de áudio 60 pode tambémfacilitar meios de armazenagem destacáveis tais como discos DVD(graváveis) ou discos CD (graváveis). Sinais de áudio de multicanaiscodificados armazenados compreendendo uma mistura descendentealternativa 103 e parâmetros 104, 105 podem ser decodificados pelodecodificador de áudio de multicanais 20 e executados ou reproduzidos peloreprodutor/gravador de multicanais de áudio 60. O codificador de áudio demulticanais 10 pode codificar sinais de áudio de multicanais paraarmazenagem no meio de armazenagem.
Figura 5 mostra um diagrama em blocos de um codificador deáudio de multicanais 10 de acordo com algumas realizações da invenção. Ocodificador da Figura 5 pode especificamente ser o codificador de áudio demulticanais 10 da Figura 1. O codificador de áudio de multicanais 10compreende uma primeira unidade 110 e uma segunda unidade 120 acopladaa ela. A primeira unidade 110 recebe um sinal de áudio de multicanais 101 5.1compreendendo sinais de áudio de realce esquerdo dianteiro, esquerdotraseiro, direito dianteiro, direito traseiro, centro e baixa freqüência, If Ir, rfrr, co, e Ife respectivamente. A segunda unidade 120 recebe uma misturadescendente estéreo artística 103 compreendendo sinais de áudio artísticoesquerdo e artístico direito, Ia e ra respectivamente. O sinal de áudio demulticanais 101 e a mistura descendente artística 103 são sinais de áudio nodomínio do tempo. Na primeira e segunda unidades 110 e 120, estes sinais101 e 103 são segmentados e transformados para o domínio freqüência-tempo.
Na primeira unidade 110, dados paramétricos 104 sãoderivados em três estágios. Em um primeiro estágio, três pares de sinais deáudio If q rf, rf q rr, q co e lfe, respectivamente, são segmentados e os sinaissegmentados são transformados para o domínio da freqüência em unidades desegmentação e transformação 112, 113 e 114, respectivamente. Asrepresentações do domínio da freqüência resultantes dos sinais segmentadossão mostradas como sinais no domínio da freqüência Lf Lr, Rf Rr, Co e LFE,respectivamente. Em um segundo estágio, três pares destes sinais no domínioda freqüência Lf e Lr, Rf e Rr e Co e LFE, respectivamente, são misturadescendentedos em misturadores descendentes 115, 116 e 117,respectivamente, para gerar sinais de áudio mono L, R e C, respectivamente, eparâmetros associados 141, 142 e 143, respectivamente. Os misturadoresdescendentes 115, 116 e 117 podem ser codificadores estéreo parâmetrosMPEG4 convencionais. Finalmente, em um terceiro estágio, os três sinais deáudio mono L, R e C são mistura descendentedos em um misturadordescendente 118, para obter um misturador descendente estéreo 102 eparâmetros associados 144. A mistura descendente espacial 102 compreendesinais Lo e Ro.
Os dados paramétricos 141, 142, 143 e 144 estãocompreendidos nos primeiros dados de realce na forma de primeiros dadosparamétricos associados 104. Os dados paramétricos 104 e a misturadescendente espacial 102 representam os sinais de entrada 101 5.1.
Na segunda unidade, o sinal de mistura descendente artístico103 representado no domínio do tempo pelos sinais de áudio Ia e ra,respectivamente, é primeiramente segmentado na unidade de segmentação121. O sinal de áudio segmentado resultante 127 compreende sinais Ias e rasrespectivamente. A seguir, este sinal de áudio segmentado 127 é transformadopara o domínio da freqüência pelo transformador 122. O sinal resultante nodomínio da freqüência 126 compreende os sinais La e Ra. Finalmente, o sinalno domínio da freqüência 126, que é uma representação do domínio dafreqüência da mistura descendente artística segmentada 103, e a representaçãono domínio da freqüência da mistura descendente espacial segmentada 102são fornecidos a um gerador 123 que gera (segundos) dados de realceadicionais na forma de parâmetros de modificação 105, que habilitam umdecodificador a modificar/transformar a mistura descendente artística 103 detal modo que esta se parece mais proximamente com a mistura descendenteespacial 102.
No exemplo específico, o sinal no domínio do temposegmentado 127 é também alimentado a um seletor 124. As outras duasentradas para este seletor 124 consistem na representação no domínio dafreqüência da mistura descendente estéreo espacial 102 e um sinal de controle128. O sinal de controle 128 determina se o seletor 124 é para emitir a misturadescendente artística 103 ou a mistura descendente espacial 102 como partedo sinal de áudio de multicanais codificado. A mistura descendente espacial102 pode ser selecionada quando a mistura descendente artística não estádisponível. O sinal de controle 128 pode ser manualmente ajustado ou podeser gerado automaticamente, sentindo a presença da mistura descendenteartística 103. O sinal de controle 128 pode ser incluído no fluxo de bits deparâmetro de tal modo que um decodificador de áudio de multicanais 20correspondente pode fazer uso dele conforme descrito mais tarde. Então, ocodificador típico específico permite que um sinal seja gerado, o qual inclui amistura descendente espacial 102 ou a mistura descendente artística 103.
O sinal de saída 102, 103 do seletor 124 é mostrado comosinais Io e ro. Se a mistura descendente estéreo artística 127 deve ser emitidapelo seletor 124, os sinais no domínio do tempo segmentados Ias e ras sãocombinados no seletor 124 por superposição-adição nos sinais Io e ro. Se amistura descendente estéreo espacial 102 deve ser emitida conforme indicadopelo sinal de controle 128, o seletor 124 transforma os sinais Lo e Ro de voltapara o domínio do tempo e os combina via superposição-adição nos sinais Loe Ro. Os sinais no domínio do tempo Io e ro formam a mistura descendenteestéreo do codificador 5.1-para-2 10.
Uma descrição mais detalhada do gerador 123 é provida aseguir. A função do gerador 123 é determinar segundo os dados de realce eespecificamente parâmetros de modificação que descrevem umatransformação da mistura descendente artística 103 de tal modo que esta, emalgum sentido se parece com a mistura descendente espacial 102 original.
Em geral, esta transformação pode ser descrita como
<formula>formula see original document page 27</formula>
onde La e Ra são vetores compreendendo amostras de uma disposição lado alado de tempo/freqüência do canal esquerdo e direito da mistura descendenteartística 103, e onde Ld e Rd são vetores compreendendo amostras de umadisposição lado a lado de tempo/freqüência do canal esquerdo e direito damistura descendente artística modificada, onde Ah...,An compreendem asamostras de uma disposição lado a lado de tempo/freqüência de canaisauxiliares opcionais, e onde T é uma matriz de transformação. Notar quequalquer vetor V é definido como um vetor coluna. A mistura descendenteartística modificada é a mistura descendente artística 103 que é transformadapela transformada, de tal modo que se parece com a mistura descendenteespacial 102 original. Os canais auxiliares Ai,...,An são, no sistema descrito,os sinais de mistura descendente espacial ou conteúdo de baixa freqüênciadestes.
A matriz de transformação T (N+2)x2 descreve umatransformação da mistura descendente artística 103 e canais auxiliares para amistura descendente artística modificada. A matriz de transformação ouelementos desta são preferivelmente compreendidos nos parâmetros demodificação 105, de tal modo que um decodificador 20 pode reconstruir pelomenos parte da matriz de transformação T. Posteriormente, o decodificador deáudio de multicanais 20 pode aplicar a matriz de transformação T à misturadescendente artística 103 para reconstruir a mistura descendente espacial 102(conforme descrito abaixo).
Alternativamente, os parâmetros de modificação 105compreendem propriedades de sinal, por exemplo, valores de energia oupotência e/ou valores de correlação da mistura descendente espacial 102. Odecodificador 20 pode então gerar tais propriedades de sinal a partir damistura descendente artística 103. As propriedades de sinal da misturadescendente espacial 102 e mistura descendente artística 103 habilitam odecodificador de áudio de multicanais 20 a construir uma matriz detransformação T (descrita abaixo) e a aplicá-la à mistura descendente artística103 para reconstruir a mistura descendente espacial 102 (também descritaabaixo).
Especificamente, o gerador 123 é arranjado para gerar ambosdados de modificação relativos e absolutos e para selecionar entre estes dadospara blocos de sinal individuais (ou segmentos). Então, os parâmetros demodificação 105 para o sinal codificado compreende ambos dados demodificação absolutos e dados de modificação relativos para diferentes blocosde sinal. Em contraste com os dados de modificação absolutos, os dados demodificação relativos descrevem a mistura descendente espacial 102 relativaà mistura descendente artística 103. Especificamente, os dados demodificação relativos podem ser dados diferenciais o que permite queamostras de mistura descendente artística sejam modificadas paracorresponder (mais proximamente) às amostras de mistura descendenteespacial, ao passo que os dados de mistura descendente absolutos podemcorresponder diretamente às amostras de mistura descendente espacial, semqualquer referência ou dependência das amostras de mistura descendenteartística.
Será verificado que há vários modos de modificar a misturadescendente estéreo artística 103 para parecer com a mistura descendenteespacial 102 original, incluindo:
I. Coincidir formas de onda.
II. Coincidir propriedades estatísticas:
a. Coincidir energia e potência do canal esquerdo e direito.
b. Coincidir matriz de covariância do canal esquerdo edireito.
III. Obter a melhor coincidência possível da forma de onda sob a restriçãode uma coincidência de energia ou potência do canal esquerdo e direito.
IV. Misturar os métodos I-III acima mencionados.
Para clareza, os canais auxiliares Ai,..., An de (I)primeiramente não são considerados, de tal modo que a matriz detransformação T
<formula>formula see original document page 29</formula>
e dados de realce relativos podem ser gerados, por exemplo, como a seguir:
I. Coincidir forma de onda (método I)
Uma coincidência das formas de onda da mistura descendenteartística 103 e mistura descendente espacial 102 pode ser obtida expressandoambos sinal do canal esquerdo e direito da mistura descendente artísticamodificada como uma combinação linear do sinal esquerdo e direito damistura descendente estéreo artística 103:
<formula>formula see original document page 30</formula>
Então, a matriz T de (2) pode ser escrita como:
<formula>formula see original document page 30</formula>
Um modo de escolher os parâmetros oti, CC2, (31 e P2 éminimizar o quadrado da distância Euclidiana entre os sinais de misturadescendente espacial Ls e Rs e suas estimativas (isto é, os sinais de misturadescendente artística modificados Ld e Rd), daí
<formula>formula see original document page 30</formula>
II. Coincidir propriedades estatísticas (método II)
Método ILa: coincidir as energias dos sinais esquerdo e direitoé agora discutido. O sinal de mistura descendente artística esquerdo e direitomodificado, denotado por Ld e Rd respectivamente, são agora computadoscomo
<formula>formula see original document page 30</formula>
onde, no caso de parâmetros reais, a e (3 são dados por
<formula>formula see original document page 30</formula>
de tal modo que a matriz de transformação T pode ser escrita como
<formula>formula see original document page 30</formula>
Com estas escolhas, pode ser assegurado que os sinais Ld eRd, respectivamente, possuem a mesma energia que os sinais Ls e Rs,respectivamente.
Método ILb: Para coincidir as matrizes de covariância damistura descendente estéreo artística 103 e mistura descendente estéreoespacial 102, estas matrizes podem ser decompostas usando decomposição deauto valor conforme segue:
<formula>formula see original document page 31</formula>
onde a matriz de covariância da mistura descendente estéreo artística 103, Ca,é dada por
<formula>formula see original document page 31</formula>
Ua é uma matriz unitária e Sa é uma matriz diagonal. Co é amatriz de covariância da mistura descendente estéreo espacial 102, Uq é umamatriz unitária e So é uma matriz diagonal. Ao computar
<formula>formula see original document page 31</formula>
dois sinais mutuamente não correlacionados Law e Raw são obtidos (devido amultiplicação pela matriz Ua), cujos sinais possuem energia unitária (devido àmultiplicação pela matriz Sa" ). Computando:
<formula>formula see original document page 31</formula>
primeiramente a matriz de covariância de [La Ra] é transformada em umamatriz de covariância que é igual à matriz identidade, isto é, a matriz decovariância de [La Ra] UaSa" . Aplicar qualquer matriz unitária arbitrária Urnão mudará a estrutura de covariância, e aplicar Sl'2U" resulta em umaestrutura de covariância à da mistura descendente estéreo espacial 102.
Definamos a matriz Sow e os sinais Low e Row como segue:
<formula>formula see original document page 31</formula>
A matriz Ur pode ser escolhida de tal modo que a melhorcoincidência de forma de onda possível, em termos de distância Euclidianaquadrada mínima, é obtida entre os sinais L0w e Law e os sinais R0w e Raw, ondeLaw e Raw são dados por (11). Com esta escolha para Un uma coincidência deforma de onda dentro do método estatístico pode ser usada.
A partir de (12) pode ser visto que a matriz de transformação Té dada por
<formula>formula see original document page 31</formula>III. Melhor coincidência de forma de onda sob uma restrição de energia(método III)
Supondo (3) que os parâmetros ai, ot2, Pi e p2 podem serobtidos minimizando (4) e (5) sob as restrições de energia
<formula>formula see original document page 32</formula>
IV. Método de mistura (método IV)
Para misturar os diferentes métodos, combinações possíveisincluem métodos de mistura ILa e ILb ou métodos de mistura ILa e III. Pode-se prosseguir conforme segue:
a) Se a coincidência de forma de onda entre Ls e Lj e entreRs e Rd, que é obtida ao usar o método Il.b/III é boa: usar método Il.b/III.
b) Se esta coincidência de forma de onda é pobre, usarmétodo II.a.
c) Assegurar uma transição gradual entre os dois métodos,misturando suas matrizes de transformação, como uma função da qualidadedesta coincidência de forma de onda.
Isto pode ser expresso matematicamente conforme segue:Usando (3) e (2) a matriz de transformação T pode ser escritaem sua forma geral como
<formula>formula see original document page 32</formula>
Esta matriz é rescrita usando dois vetores, Tl e Tr conformesegue
<formula>formula see original document page 32</formula>
A qualidade da coincidência de forma de onda entre Ls e Ldobtida usando o método ILb ou o método III, é expressa por yL. É definidacomo
<formula>formula see original document page 32</formula>
A qualidade da coincidência de forma de onda entre Rs e Rdobtida usando o método ILb ou o método III, é expressa por yR. E definidacomo
<formula>formula see original document page 33</formula>
Ambos Yl e yR estão entre 0 e 1. O coeficiente de mistura docanal esquerdo, ôL, e o coeficiente de mistura do canal direito 8r podem serdefinidas como segue:
<formula>formula see original document page 33</formula>
onde HLjmin, Humax, M-r,min e [iR,max, são valores entre 0 e 1, fiL,min < Humax e HRjmin< HRjHiax- A equação 20 assegura que os coeficientes de mistura 5L e 5r estãoentre 0 e 1.
Defina a matriz de transformação T do método Il.a, ILb e III,respectivamente como Te, que é dado por (8), Ta que é dados por (14) e Tce,respectivamente. Cada matriz de transformação pode ser dividida em doisvetores, similares à divisão de T em (17) como segue:
<formula>formula see original document page 33</formula>
A matriz de transformação T para o método de mistura ILa emétodo ILb é obtida como
<formula>formula see original document page 33</formula>
A matriz de transformação T para o método de mistura ILa emétodo III é obtida como
<formula>formula see original document page 33</formula>
Agora, considerando dois canais auxiliares correspondentes adois canais de camada de realce, a equação (1) acima pode ser rescrita como:
<formula>formula see original document page 33</formula>
onde La, Ra (como antes) contém as amostras de uma disposição lado alado de tempo/freqüência do canal esquerdo e direito da mistura descendenteartística, respectivamente, Ld, Rd contém as amostras de uma disposiçãolado a lado de tempo/freqüência do canal esquerdo e direito da misturadescendente artística modificada respectivamente e LerJl, Renh contém asamostras de uma disposição lado a lado de tempo/freqüência dos sinais decamada de realce. A matriz de transformação 4x2 T' descreve então atransformação a partir da mistura descendente artística e os sinais de camadade realce para a mistura descendente artística modificada. Em relação àequação (1), os únicos dois canais auxiliares usados aqui são os sinais decamada de realce Lenh, Renh.
No sistema típico específico, a segunda camada de realce podeconter dois tipos diferentes de dados:
O primeiro tipo de dados compreende os parâmetros contidosna matriz T da equação (1). Estes parâmetros estão no exemplo calculado paraa largura de faixa de sinal inteira e transforma a mistura descendente estéreoartística de tal modo que esta em algum sentido parece com a misturadescendente espacial. Então, este tipo de parâmetro pode prover uma misturadescendente artística modificada que lembra mais proximamente a misturadescendente espacial original, mas não (necessariamente) permite que umdecodificador gere exatamente a mistura descendente espacial. Para cadadisposição lado a lado de tempo/freqüência somente quatro parâmetros sãorequeridos, a saber os valores de T são requeridos (TI 1, T12, T21 e T22).Estes parâmetros podem ser codificados absolutamente ou diferencialmente eo codificador 10 pode comutar especificamente dinamicamente entre acodificação absoluta e diferencial.
O segundo tipo de dados corresponde à mistura descendenteespacial real e é, no exemplo específico, uma representação de uma versãolimitada em faixa da mistura descendente espacial. Especificamente, este tipode dados representa uma parte de baixa freqüência da mistura descendenteespacial (por exemplo, freqüências abaixo de, digamos, 1,7 kHz). Isto tornapossível reconstruir muito precisamente esta parte da mistura descendenteespacial no decodificador ao invés de apenas gerar um sinal que tem asmesmas, propriedades, por exemplo, estatísticas (como com a matriz T). Estetipo de dados pode ser codificado absolutamente ou relativamente para amistura descendente artística. Especificamente, este tipo de dados pode sercodificado diferencialmente. Por exemplo, a matriz de transformação T éaplicada à mistura descendente artística (ver, por exemplo, equação (26)) e adiferença daquele sinal e da mistura descendente espacial pode ser codificada.
Então, em algumas realizações, os segundos dados de realcesão divididos em uma primeira e segunda parte de dados de realce, onde aprimeira parte descreve a mistura descendente espacial menos precisamenteque a segunda parte. Tipicamente, a taxa de dados correspondente da primeiraparte dos segundos dados de realce é mais baixa que a da segunda parte. Osdados de realce da segunda parte dos segundos dados de realce podem serelacionar somente a uma parte da mistura descendente e especificamentepodem apenas se relacionar a uma parte de baixa freqüência.
Em algumas realizações, o gerados 123 pode ser arranjadopara selecionar entre dados absolutos e relativos para ambas primeira parte,segunda parte dos dados de realce, seja individualmente ou junto. Em outrasrealizações, o gerador 123 pode apenas selecionar entre dados absolutos erelativos para uma das partes de dados. Especificamente, nas realizações aseguir será descrito onde a primeira parte dos segundos dados de realcecompreende os parâmetros de T, ao passo que a segunda parte compreendeuma representação de baixa freqüência da mistura descendente espacial e aseleção dinâmica entre dados absolutos e relativos é apenas aplicada àsegunda parte dos segundos dados de realce.
Os dados relativos para a segunda parte dos segundos dados derealce podem, nestas realizações, ser gerados como valores diferenciaisrelativos à mistura descendente artística após os dados de realce da primeiraparte terem sido aplicados (isto é, como valores diferenciais relativos àmistura descendente artística modificada).
A seguir, realizações onde o gerador 123 seleciona apenasentre dados relativos e dados absolutos para a segunda parte dos segundosdados de realce, são descritas.
Dados de realce absolutos para parte da primeira e da segundaparte dos segundos dados de realce, podem, neste exemplo, ser derivados paraas disposições lado a lado de tempo/freqüência associadas, fazendo:
<formula>formula see original document page 36</formula>
onde
Lls-: Rs contém as amostras de uma disposição lado a lado detempo/freqüência do canal esquerdo e direito da mistura descendente estéreoespacial, respectivamente. Então, no exemplo específico, os dados de realceabsolutos correspondem simplesmente às amostras de disposição lado alado de tempo/freqüência reais da mistura descendente espacial 102 quepodem substituir as amostras de disposição lado a lado de tempo/freqüênciacorrespondentes da mistura descendente artística 103.
Ainda mais, para a parte da primeira e segunda parte dossegundos dados de realce, dados de realce relativos para as disposições lado alado de tempo/freqüência associadas podem ser especificamente derivadascomo dados diferenciais, fazendo:
<formula>formula see original document page 36</formula>
Aqui, os parâmetros Tu, Ti2, T2I e T22 constituem a matriz Tda equação (2):
<formula>formula see original document page 37</formula>
Deste modo, o gerador 123 pode gerar ambos dados de realceabsolutos e dados de realce relativos para a mistura descendente artística 103,permitindo que um decodificador gere uma mistura descendente artísticamodificada que se parece mais proximamente com a mistura descendenteespacial 102 usada para gerar os dados de realce de multicanais.
O gerador 123 é adicionalmente arranjado para selecionarentre os dados de realce absolutos e os dados de realce relativos. Esta seleçãoé o exemplo específico efetuado para blocos de sinal individuais (porexemplo, segmentos individuais) e com base em características dos sinaisdentro destes blocos de sinal. Especificamente, o gerador 123 pode avaliarcaracterísticas dos dados de realce absolutos e dados de realce relativos paraum dado bloco de sinal, e pode decidir quais dados incluir na camada derealce para o bloco de sinal dado. Em adição, o gerador 123 pode incluir umaindicação de quais dados foram selecionados, permitindo deste modo que odecodificador aplique os dados de realce recebidos corretamente.
Em algumas realizações, o gerador 123 pode avaliar acodificação para determinar se os dados de realce absolutos ou os dados derealce relativos podem ser codificados de modo mais eficiente (por exemplo,como número mais baixo de bits para uma dada precisão). Uma abordagem de"força bruta" pode ser codificar realmente ambos os tipos de dados de realce ecomparar o tamanho dos dados codificados. Entretanto, esta pode ser umaabordagem complexa em algumas realizações, e no codificador de áudio demulticanais 10 típico, o gerador 123 avalia a energia de sinal dos dados derealce absolutos relativos à energia de sinal dos dados de realce relativos eseleciona qual tipo de dados incluir, com base numa comparação entre osdois.
Especificamente, para codificadores de áudio é freqüentementebenéfico, em termos de taxa de bit, codificar um sinal com energia tãopequena quanto possível. Conseqüentemente, o gerador 123 seleciona o tipode dados de realce que tem a energia de sinal mais baixa. Em particular, osdados de realce relativos são selecionados quando
<formula>formula see original document page 38</formula>
e de outro modo os dados de realce absolutos são selecionados.
Um problema com a comutação entre diferentes dados derealce é que alguns artefatos notáveis podem resultar. No codificador de áudiode multicanais 10 típico, o gerador 123 também compreende funcionalidadepara comutar gradualmente entre diferentes dados de realce. Então, ao invésde comutar diretamente de um tipo de dados de realce em um bloco de sinalpara um outro tipo no próximo bloco de sinal, a comutação é feitagradualmente de um conjunto de dados para o outro.
Então, durante um intervalo de tempo (que pode ter umaduração de menos ou mais que um bloco de sinal) o gerador 123 gera osdados de realce como uma combinação dos dados de realce absolutos e dosdados de realce relativos. A combinação pode, por exemplo, ser obtida poruma interpolação entre os diferentes tipos de dados ou pode usar uma técnicade superposição e adição.
Como um exemplo específico, ao invés de comutarabruptamente entre os diferentes tipos de dados de realce:
<formula>formula see original document page 38</formula>
os dados de realce que são transmitidos podem ser gerados como
<formula>formula see original document page 38</formula>
onde o valor de a para o k-ésimo quadro de dados pode ser determinadocomo:
Imx(C)j (Xjm -8 X se o quadro comente é codificado absolutamente,
I min (1,(Xjm Hf-C ), se o quadro corrente é codificado diferencial mente,
onde Ctic denota o valor de a no k-ésimo quadro e 5 é a velocidade deadaptação. Um valor de 5 = 0,33 pode prover codificação confiavelmentelivre de artefatos em muitos cenários. Os sinais Lenh e Renh dados na equação(29) podem ser obtidos usando interpolação de parâmetros ou uma técnica desuperpor e adicionar, e são codificados e adicionados ao fluxo de bits. Emadição, a decisão com vistas aos dados de realce diferenciais ou absolutos éincluída no fluxo de bits, tornando deste modo possível para um decodificadorderivar o mesmo valor para a que é usado no decodificador.
Será verificado que, embora a descrição focalize no uso demodos diferenciais e absolutos com codificação (intra-canal) de cada umdestes M canais individualmente, outras realizações podem usar umaabordagem de codificação diferente. Por exemplo, para M=2, uma próximaetapa pode ser aplicar, por exemplo, codificação M/S (codificaçãoIntermediária/Lateral, daí codificando o sinal de soma e diferença) ao efetuarcodificação (inter-canal) do sinal estéreo. Em muitas realizações isto pode servantajoso em ambos modos diferencial e absoluto de codificação (intra-canal)dos canais individuais.
Os elementos da matriz de transformação T' podem ser devalor real ou de valor complexo. Estes elementos podem ser codificados emparâmetros de modificação conforme segue: aqueles elementos da matriz detransformação T que são reais e positivos podem ser quantizadoslogaritmicamente, como os parâmetros IID usados em MPEG4 EstéreoParamétrico. É possível configurar um limite superior para os valores dosparâmetros, para evitar sobre-amplificação de pequenos sinais. Este limitesuperior pode ser fixo ou uma função da correlação entre o canal esquerdogerado automaticamente e o canal esquerdo artístico e a correlação entre ocanal direito gerado automaticamente e o canal direito artístico. Doselementos de T' que são complexos, a magnitude pode ser quantizada usandoparâmetros IID, e a fase pode ser quantizada linearmente. Os elementos de T'são reais e possivelmente negativos e podem ser codificados considerando ologaritmo do valor absoluto de um elemento, enquanto assegura umadistinção entre os valores positivo e negativo.
Figura 6 ilustra um exemplo do gerador 123 da Figura 5 emmais detalhe. No exemplo, o gerador 123 compreende um processador debloco de sinal 145 que recebe as mistura descendentes espacial e artística nodomínio da freqüência 102, 126 e divide os sinais em blocos de sinal. Cadabloco de sinal pode corresponder a um intervalo de tempo de uma duraçãopredeterminada. Em algumas realizações, os blocos de sinal podem seralternativamente ou adicionalmente divididos no domínio da freqüência e, porexemplo, sub canais transformados podem ser agrupados em diferentes blocosde sinal.
O processador de bloco de sinal 145 é acoplado a umprocessador de dados de realce absolutos 146 que gera os dados de realceabsolutos para os blocos de sinal individuais, conforme descrito previamente.Em adição, o processador de bloco de sinal 145 é acoplado a um processadorde dados de realce relativos 147 que gera os dados de realce relativos para osblocos de sinal individuais, conforme descrito previamente. Os dados derealce relativos e absolutos são determinados com base nas características desinal dentro do bloco de sinal e, especificamente, os dados de realce para umdado grupo de disposição lado a lado de tempo/freqüência podem serdeterminados com base somente naquele grupo de disposição lado a lado detempo/freqüência.
O processador de dados de realce absolutos 146 é acoplado aum primeiro processador de energia de sinal 148 que determina a energia desinal dos dados de realce absolutos em cada bloco de sinal, conforme descritopreviamente. Similarmente, o processador de dados de realce relativos 147 éacoplado a um segundo processador de energia de sinal 149 que determina aenergia de sinal dos dados de realce relativos em cada bloco de sinal,conforme descrito previamente.
O primeiro e segundo processadores de energia de sinal 148,149 são acoplados a um processador de seleção 150 que seleciona para cadabloco de sinal ou os dados de realce absolutos ou relativos, dependendo dequal tipo tem a energia de sinal mais baixa.
O processador de seleção 150 é alimentado a um processadorde dados de realce 151 que é adicionalmente acoplado ao processador dedados de realce 146 e ao processador de dados de realce 147. O processadorde seleção recebe um sinal de controle indicando qual tipo de dados de realcefoi selecionado e conseqüentemente gera dados de realce como dados derealce selecionados. Adicionalmente, o processador de seleção 151 éarranjado para efetuar uma comutação gradual, incluindo uma interpolaçãoentre os parâmetros absolutos e relativos durante um intervalo de tempo decomutação.
O processador de seleção 151 é acoplado a um processador decodificação 152 que codifica os dados de realce de acordo com um dadoprotocolo. Em adição, o processador de codificação 152 codifica dadosindicando qual tipo de dados é selecionado em cada bloco de sinal, porexemplo, ajustando um bit para cada bloco de sinal, para indicar o tipo dedados. Os dados codificados a partir do processador de codificação 152 sãoincluídos no fluxo de bits codificado gerado pelo codificador de áudio demulticanais 10.
Figura 7 mostra um diagrama em blocos de uma outrarealização de um decodificador de áudio de multicanais de acordo comalgumas realizações da invenção, que pode ser especificamente odecodificador de áudio de multicanais 20 da Figura 2.
O decodificador de áudio de multicanais 20 compreende umaprimeira unidade 210 e acoplada a ela uma segunda unidade 220. A primeiraunidade 210 recebe sinais de mistura descendente Io e ro e parâmetros demodificação 105 com entradas. As entradas podem ser por exemplo, recebidascomo um único fluxo de bits a partir do codificador de áudio de multicanais10 da Figura 1 ou 5. Os sinais de mistura descendente Io e ro podem ser partede uma mistura descendente espacial 102 ou mistura descendente artística103.
A primeira unidade 210 compreende uma unidade desegmentação e transformação 211 e uma unidade de modificação de misturadescendente 212. Os sinais de mistura descendente Io e ro sãorespectivamente segmentados e os sinais segmentados são transformados parao domínio da freqüência na unidade de segmentação e transformação 211. Asrepresentações resultantes no domínio da freqüência dos sinais de misturadescendente segmentados são mostradas como sinais no domínio dafreqüência Lo e Ro, respectivamente. A seguir, os sinais no domínio dafreqüência sinais no domínio da freqüência Lo e Ro são processados naunidade de modificação de mistura descendente 212. A função desta unidadede modificação de mistura descendente 212 é modificar a mistura descendentede entrada de tal modo que esta se parece com a mistura descendente espacial202, isto é„ para reconstruir a mistura descendente espacial 202 a partir damistura descendente artística 103 e dos parâmetros de modificação 105.
Se a mistura descendente espacial 102 é recebida pelodecodificador de áudio de multicanais 20, a unidade de modificação demistura descendente 212 não tem que modificar os sinais de misturadescendente Lo e Ro e estes sinais de mistura descendente Lo e Ro podemsimplesmente ser passados para a segunda unidade 220 como sinaisde mistura descendente Ld e Rd da mistura descendente espacial 202. Umsinal de controle 217 pode indicar se há uma necessidade de modificação damistura descendente de entrada, isto é, se a mistura descendente de entrada éuma mistura descendente espacial ou uma mistura descendente alternativa. Osinal de controle 217 pode ser gerado internamente no decodificador de áudiode multicanais 20, por exemplo, analisando a mistura descendente de entradae os parâmetros de modificação 105 que podem descrever propriedades desinal da mistura descendente espacial desejada. Se a mistura descendente deentrada coincide com as propriedades de sinal desejadas, o sinal de controle217 pode ser ajustado para indicar que não há necessidade de modificação.Alternativamente, o sinal de controle 217 pode ser ajustado manualmente ouseu ajuste pode ser recebido como parte do sinal de áudio de multicanaiscodificado, por exemplo no conjunto de parâmetro 105.
Se o codificador 20 recebe a mistura descendente artística 103e o sinal de controle 217 indica que os sinais de mistura descendenterecebidos Lo e Ro devem ser modificados pela unidade de modificação demistura descendente 212, então o decodificador pode operar de dois modos,dependendo da representação dos parâmetros de modificação recebidos. Se osparâmetros representam a transformação relativa da mistura descendenteartística para a mistura descendente espacial (isto é, se os parâmetros sãodados de realce relativos) as variáveis de transformação são obtidasdiretamente aplicando os parâmetros de modificação à mistura descendenteartística em inverso à operação executada pelo codificador. Em diferentesrealizações, isto pode ser, por exemplo, aplicado à segunda parte dossegundos dados de realce somente.
Por outro lado, se os parâmetros transmitidos representampropriedades absolutas da mistura descendente espacial, o decodificador podesubstituir diretamente as amostras de mistura descendente artística pelasamostras de mistura descendente espacial. Por exemplo, se a segunda partedos segundos dados de realce simplesmente consiste nas amostras dedisposição lado a lado de tempo/freqüência da mistura descendente espacial, odecodificador pode substituir diretamente as amostras de disposição lado alado de tempo/freqüência da mistura descendente artística por estas. Seráverificado que é também possível para o decodificador computarprimeiramente as propriedades correspondentes da mistura descendenteartística realmente transmitida. Usando esta informação (parâmetrostransmitidos e propriedades computadas da mistura descendente artísticatransmitida), as variáveis de transformação são então determinadas, as quaisdescrevem a transformação a partir das (propriedades da) mistura descendenteartística transmitida para (propriedades da) mistura descendente espacial. Paraser mais específico, a matriz de transformação T pode ser determinada usandoqualquer dos dois métodos ILa ou (um ligeiramente modificado) ILb queforam previamente descritos.
O método ILa pode ser usado se as energias absolutas sãotransmitidas na primeira parte dos segundos dados de realce. Os parâmetrostransmitidos (absolutos) ELs e Ers representam a energia do sinal esquerdo edireito da sinal de áudio de multicanais respectivamente e são dados por
<formula>formula see original document page 44</formula>
As energias da mistura descendente transmitida, EDLs e EDrs sãocomputadas no decodificador. Usando estas variáveis podemos computar osparâmetros a e P de (7), conforme segue
A matriz de transformação T é dada por
<formula>formula see original document page 44</formula>
Especificamente, a unidade de modificação de misturadescendente 212 compreende funcionalidade para extrair a misturadescendente artística e os parâmetros de modificação 105 do fluxo de bitrecebido. A mistura descendente artística é dividida em blocos de sinal(correspondendo aos blocos de sinal usados pelo decodificador). Para cadabloco de sinal, a unidade de modificação de mistura descendente 212 avalia aindicação de dados recebidos do fluxo de bit para determinar se os segundosdados de realce relativos ou absolutos são providos para a primeira e para asegunda parte para este bloco de sinal. A unidade de modificação de misturadescendente 212 então aplica a primeira e segunda parte dos segundos dadosde realce como dados de realce absolutos ou dados de realce relativos, emresposta aos dados de indicação.
Foi verificado que baixa complexidade mas alto desempenhopodem ser alcançados quando os elementos da matriz de transformação Ti2 eT2I são ajustados para zero. A seguir, algumas implementações específicas daunidade de modificação de mistura descendente 212 são descritas com estarestrição. Entretanto, será verificado que as implementações podem serestendidas facilmente para o caso em que T12 e/ou T2I são diferentes de zero.
No caso em que não são transmitidos dados de realce dasegunda parte dos segundos dados de realce para o sinal de misturadescendente artística, a primeira unidade 210 pode ser implementadaconforme mostrado na Figura 8. Os canais de mistura descendente estéreo dodomínio do tempo, Io e ro são primeiramente segmentados e transformadospara o domínio da freqüência por uma transformação QMF, resultando nossinais La e Ra, representando uma disposição lado a lado de tempo/freqüênciada mistura descendente estéreo artística. A seguir, estes sinais sãotransformados usando a matriz de transformação T, resultando nos sinaisTijLa e T22Ra-
Será verificado que os dados de realce podem ser gerados eaplicados no domínio do tempo e/ou freqüência. Então, é possível incluir osdados de realce no domínio do tempo codificados (Lenhi Renh) no fluxo de bits.Entretanto, em algumas aplicações, pode ser vantajoso incluir os dados derealce no domínio da freqüência codificados ao invés dos dados de realce nodomínio do tempo. Por exemplo, em muitos codificadores os dados de realcesão gerados no domínio da freqüência para disposições lado a lado detempo/freqüência e no sentido de gerar o sinal no domínio do tempo, umafreqüência para transformação no domínio do tempo é requerida nocodificador. Adicionalmente, no sentido de aplicar tais dados de realce, odecodificador converte os dados do domínio do tempo para o domínio dafreqüência. As conversões de domínio podem então ser reduzidas incluindo osdados de realce no domínio da freqüência.
Em algumas realizações, diferentes conversões de tempo parafreqüência podem ser usadas para gerar a mistura descendente artística e osdados de realce. Por exemplo, a codificação da mistura descendente artísticapode usar uma transformação QFM ao passo que os dados de realce usamuma transformação MDCT. Neste caso, os dados de realce podem serincluídos no domínio da freqüência (MDCT) e uma transformada diretamenteentre os dois domínios da freqüência pode ser efetuada pela unidade demodificação de mistura descendente 212, conforme ilustrado na Figura 9.
No exemplo, a matriz de transformação T* pode simplesmenteser a matriz de transferência T da Equação (2). Entretanto, no sentido dereduzir artefatos de comutação, T* pode corresponder à matriz detransformação T da Equação (2), porem modificada para uma comutaçãogradual. Especificamente, a matriz T* pode incluir o fator a conformedeterminado pela Equação (30), onde a decisão com vistas aos dados derealce absolutos ou relativos é recuperada a partir do fluxo de bits. Esteesquema é usado para aqueles blocos/faixas de freqüência onde os dados dacamada de realce da segunda parte dos segundos dados de realce está presentee, de outra forma, a abordagem da Figura 8 pode ser usada.
Se os dados de realce (Lenh, Renh) são providos no domínio dotempo, uma abordagem similar a da Figura 9 pode ser usada como ilustradona Figura 10. Entretanto, neste caso a transformação de freqüência parafreqüência é substituída por uma transferência de tempo para freqüência quepode ser especificamente uma transformada no domínio do tempo para QMF,quando transformadas QMF são usadas para codificar a mistura descendenteartística. Então, neste exemplo, os dados de realce são aplicados no domínioda freqüência.
Em muitas realizações, uma implementação de decodificadorpara os dados de realce no domínio do tempo que somente usa umatransformada no domínio do tempo para freqüência na primeira unidade 210,pode ser usada.
Especificamente, os seguintes parâmetros de dados de realcediferenciais podem ser usados:
<formula>formula see original document page 47</formula>
desde que a matriz T, dada pela Equação (27) seja não singular (daí, existeuma inversa). Agora, a Equação (1) pode ser mudada para:
<formula>formula see original document page 47</formula>
Figura 11 ilustra uma implementação eficiente da unidade demodificação de mistura descendente 212 para dados de realce do domínio dotempo com base na Equação (34) e (35). Para clareza, Ti2 e T2I da matriz Tsão ajustados para zero. Em comparação com a implementação da Figura 10,somente uma transformada no domínio do tempo para QMF é requerida paraimplementação da Figura 11.
Então, como descrito acima, a unidade de modificação demistura descendente 212 gera um sinal 202 que se assemelha muitoproximamente à mistura descendente espacial usada para os dados de realcede multicanais. Isto pode efetivamente ser usado pela segunda unidade 220para expandir o sinal de áudio de dois canais para um sinal de multicanais desom "surround" pleno. Adicionalmente, selecionando dinamicamente eflexivelmente o tipo mais apropriado de dados de realce (relativos ouabsolutos) para cada bloco de sinal, uma codificação substancialmente maiseficiente é obtida e uma codificação/decodificação de multicanais com umarelação de qualidade para taxa de dados melhorada é obtida.A segunda unidade 220 pode ser um decodificador demulticanais 2-para-5.1 convencional que decodifica a mistura descendenteespacial 202 reconstruída e os dados paramétricos associados 104 em umsinal de áudio de multicanais 5.1 203. Como descrito anteriormente, os dadosparamétricos 104 compreendem dados paramétricos 141, 142, 143 e 144. Asegunda unidade 220 efetua o processamento inverso da primeira unidade 110no codificador de áudio de multicanais 10. A segunda unidade 220compreende um sobre-misturador 221 que converte a mistura descendenteestéreo 202 e parâmetros associados 144 em três sinais mono L, R e C. Aseguir, cada um dos sinais de áudio mono L, R e C, respectivamente, sãodescorrelacionados em descorrelatores 222, 225 e 228, respectivamente.Posteriormente, uma matriz de mistura 223 transforma o sinal de áudio monoL, seu complemento descorrelacionado e parâmetros associados 141, nossinais Lf e Lr. Similarmente, uma matriz de mistura 226 transforma o sinal deáudio mono R, seu complemento descorrelacionado e parâmetros associados142 nos sinais Rf e Rr, e uma matriz de mistura 229 transforma o sinal deáudio mono C, seu complemento descorrelacionado e parâmetros associados143 nos sinais Co e LFE. Finalmente, os três pares de sinais segmentados nodomínio da freqüência Lf e Lr, Rf e Rr, Co e LFE, respectivamente sãotransformados para o domínio do tempo e combinados por superposição-adição em transformadas inversa 224, 227 e 230, respectivamente para obtertrês pares de sinais de saída If e Ir, rf e rr, e co e lfe, respectivamente. Ossinais de saída lf, Ir, rf, rr, co e lfe formam o sinal de áudio de multicanaisdecodificado 203.
O codificador de áudio de multicanais IOeo decodificador deáudio de multicanais 20 podem ser implementados por meio de hardwaredigital ou por meio de software que é executado por um processador de sinaldigital ou por um microprocessador de finalidade geral.
Será verificado que a descrição acima, para clareza, descreveurealizações da invenção com referência a diferentes unidades funcionais eprocessadores. Entretanto, será aparente qualquer distribuição adequada defuncionalidade entre diferentes unidades funcionais ou processadores pode serusada sem depreciar a invenção. Por exemplo, funcionalidade ilustrada paraser executada por processadores ou controladores separados pode serexecutada pelo mesmo processador ou controlador. Daí, referências aunidades funcionais específicas são somente para ser visualizadas comoreferências a meios adequados para prover a funcionalidade descrita, ao invésde indicativas de uma lógica restrita ou estrutura física ou organização.
A invenção pode ser implementada de qualquer formaadequada incluindo hardware, software, firmware ou qualquer combinaçãodestes. A invenção pode opcionalmente ser implementada pelo menosparcialmente como software de computador rodando em um ou maisprocessadores de dados e/ou processadores de sinais digitais. Os elementos ecomponentes de uma realização da invenção podem ser fisicamente,funcionalmente e logicamente implementados de qualquer modo adequado.Realmente, a funcionalidade pode ser implementada em uma única unidade,em diversas unidades ou como parte de outras unidades funcionais. Como tal,a invenção pode ser implementada em uma única unidade ou pode serfisicamente e funcionalmente distribuídas em diferentes unidades eprocessadores.
Embora a presente invenção tenha sido descrita em conexãocom algumas realizações, esta não é destinada a ser limitada à formaespecífica aqui relatada. Ao invés disso, o escopo da presente invenção élimitado somente pelos desenhos que a acompanham. Adicionalmente,embora uma característica possa parecer ser descrita em conexão comrealizações particulares, um especialista na técnica reconheceria que váriascaracterísticas das realizações descritas podem ser combinadas de acordo coma invenção. Nas reivindicações, o termo compreendendo não exclui apresença de outros elementos ou etapas.
Adicionalmente, embora listados individualmente, diversosmeios, elementos ou etapas de método podem ser implementados, porexemplo, por uma única unidade ou processador. Adicionalmente, emboracaracterísticas individuais possam ser incluídas em diferentes reivindicações,estas podem possivelmente ser vantajosamente combinadas, e a inclusão emdiferentes reivindicações não implica em que uma combinação decaracterísticas não seja factível e/ou vantajosa. Também a inclusão de umacaracterística em uma categoria de reivindicações não implica em umalimitação para esta categoria, mas ao invés disso indica que a característica éigualmente aplicável a outras categorias de reivindicação conformeapropriado. Ainda mais, a ordem das características nas reivindicações nãoimplica em qualquer ordem específica na qual as características precisam sertrabalhadas e em particular a ordem das etapas individuais em umareivindicação de método não implica em que as etapas precisem serexecutadas nesta ordem. Ao invés disso, as etapas podem ser executadas emqualquer ordem adequada. Em adição, referências singulares não excluemdiversas. Então, referências a "um", "uma", "primeiro", "segundo", etc., nãoimpedem uma pluralidade. Sinais de referência nas reivindicações sãoprovidos meramente como um exemplo esclarecedor e não serão consideradoscomo limitando o escopo das reivindicações de modo algum.

Claims (31)

1. Codificador de áudio de multicanais (10) para codificar umsinal de áudio de N canais, o codificador de áudio de multicanais (10)caracterizado pelo fato de compreender:meio para gerar (110) um primeiro sinal de M canais para osinal de áudio de N canais, M sendo menor que N;meio para gerar (115, 116, 117, 118) primeiros dados de realcepara o primeiro sinal de M canais relativo ao sinal de áudio de N canais;meio para gerar (121) um segundo geral de M canais para osinal de áudio de N canais;meio de realce (123) para gerar segundos dados de realce parao segundo sinal de M canais relativo ao primeiro sinal de M canais;meio para gerar (120) um sinal de saída codificadocompreendendo o segundo sinal de M canais, os primeiros dados de realce eos segundos dados de realce; eonde o meio de realce (123) é arranjado para selecionardinamicamente entre gerar os segundos dados de realce como dados de realceabsolutos ou como dados de realce relativos, relativos ao segundo sinal de Mcanais.
2. Codificador de áudio de multicanais (10) de acordo com areivindicação 1, caracterizado pelo fato de que o meio de realce (123) éarranjado para selecionar entre os dados de realce absolutos e os dados derealce relativos, em resposta a uma característica do sinal de M canais.
3. Codificador de áudio de multicanais (10) de acordo com areivindicação 1, caracterizado pelo fato de que o meio de realce (123) éarranjado para selecionar entre os dados de realce absolutos e os dados derealce relativos, em resposta a uma característica relativa dos dados de realceabsolutos e dados de realce relativos.
4. Codificador de áudio de multicanais (10) de acordo com areivindicação 1, caracterizado pelo fato de que a característica relativa é umaenergia de sinal dos dados de realce absolutos para uma energia de sinal dosdados de realce relativos.
5. Codificador de áudio de multicanais (10) de acordo com areivindicação 1, caracterizado pelo fato de que o meio de realce (123) éarranjado para dividir o segundo sinal de M canais em blocos de sinal e paraselecionar individualmente entre os dados de realce absolutos e os dados derealce relativos para cada bloco de sinal.
6. Codificador de áudio de multicanais (10) de acordo com areivindicação 5, caracterizado pelo fato de que o meio de realce (123) éarranjado para selecionar entre os dados de realce absolutos e dados de realcerelativos para um bloco de sinal, com base somente nas característicasassociadas ao bloco de sinal.
7. Codificador de áudio de multicanais (10) de acordo com areivindicação 1, caracterizado pelo fato de que o meio de realce (123) éarranjado para gerar os dados de realce como uma combinação dos dados derealce absolutos e dados de realce relativos durante um intervalo de tempo decomutação de uma comutação entre gerar os dados de realce como dados derealce absolutos e como dados de realce relativos.
8. Codificador de áudio de multicanais (10) de acordo com areivindicação 7, caracterizado pelo fato de que a combinação compreendeuma interpolação entre os dados de realce absolutos e os dados de realcerelativos.
9. Codificador de áudio de multicanais (10) de acordo com areivindicação 1, caracterizado pelo fato de que o meio para gerar (120) o sinalde saída codificado é arranjado para incluir dados indicando se os dados derealce relativos ou dados de realce absolutos são usados.
10. Codificador de áudio de multicanais (10) de acordo com areivindicação 1, caracterizado pelo fato de que os segundos dados de realcecompreendem uma primeira parte de dados de realce e uma segunda parte dedados de realce, a segunda parte provendo uma representação de qualidademais alta do primeiro sinal de M canais do que a primeira parte.
11. Codificador de áudio de multicanais (10) de acordo com areivindicação 10, caracterizado pelo fato de que o meio de realce (123) éarranjado para selecionar dinamicamente somente entre gerar a segunda partecomo dados de realce absolutos ou como dados de realce relativos, relativos.
12. Codificador de áudio de multicanais (10) de acordo com areivindicação 10, caracterizado pelo fato de que o meio de realce (123) éarranjado para gerar dados relativos da segunda parte relativos a um sinal dereferência gerado aplicando dados de realce da primeira parte ao primeirosinal de M canais.
13. Decodificador de áudio de multicanais (20) paradecodificar um sinal de áudio de N canais, o decodificador de áudio demulticanais (20) caracterizado pelo fato de compreender:meio para receber (210) um sinal de áudio codificadocompreendendo:um primeiro sinal de M canais para o sinal de áudio de Ncanais, M sendo menor que N,primeiros dados de realce para expansão de multicanais, osprimeiros dados de realce sendo relativos a um segundo sinal de M canaisdiferente do primeiro sinal de M canais;segundos dados de realce para o primeiro sinal de M canaisrelativo ao segundo sinal de M canais, os segundos dados de realcecompreendendo dados de realce absolutos e dados de realce relativos,relativos ao primeiro sinal de M canais, edados de indicação indicativos de se os segundos dados derealce para um bloco de sinal são dados de realce absolutos ou dados de realcerelativos;meio de geração (212) para gerar um sinal de expansão demulticanais de M canais, em resposta ao primeiro sinal de M canais esegundos dados de realce; emeio para gerar (220) um sinal decodificado de N canais emresposta ao sinal de expansão de multicanais de M canais e primeiros dadosde realce; e onde o meio de geração (212) é arranjado para selecionar entreaplicar os segundos dados de realce como dados de realce absolutos ou dadosde realce relativos, em resposta aos dados de indicação.
14. Decodificador de áudio de multicanais (20) de acordo coma reivindicação 13, caracterizado pelo fato de que o meio de geração (212) éarranjado para aplicar os segundos dados de realce ao primeiro sinal de Mcanais no domínio do tempo.
15. Decodificador de áudio de multicanais (20) de acordo coma reivindicação 13, caracterizado pelo fato de que o meio de geração (212) éarranjado para aplicar os segundos dados de realce ao primeiro sinal de Mcanais no domínio da freqüência.
16. Decodificador de áudio de multicanais (20) de acordo coma reivindicação 13, caracterizado pelo fato de que os segundos dados de realcecompreendem uma primeira parte de dados de realce e uma segunda parte dedados de realce, a segunda parte provendo uma representação de qualidademais alta do primeiro sinal de M canais do que a primeira parte.
17. Decodificador de áudio de multicanais (20) de acordo coma reivindicação 13, caracterizado pelo fato de que o meio de geração (212) éarranjado para somente selecionar entre aplicar segundos dados de realce dasegunda parte como dados de realce absolutos ou dados de realce relativos.
18. Decodificador de áudio de multicanais (20) de acordo coma reivindicação 13, caracterizado pelo fato de que o meio de geração (212) éarranjado para gerar a expansão de multicanais de M canais, aplicando dadosde realce relativos da segunda parte a um sinal gerado, aplicando dados derealce da primeira parte ao primeiro sinal de M canais.
19. Método para codificar um sinal de áudio de N canais,caracterizado pelo fato de compreender:gerar um primeiro sinal de M canais para o sinal de áudio de Ncanais, M sendo menor que N;gerar primeiros dados de realce para o primeiro sinal de Mcanais relativo ao sinal de áudio de N canais;gerar um segundo sinal de M canais para um sinal de áudio deN canais;gerar segundos dados de realce para o segundo sinal de Mcanais relativo ao primeiro sinal de M canais;gerar um sinal de saída codificado compreendendo o segundosinal de M canais, os primeiros dados de realce e os segundos dados de realce;eonde a geração dos segundos dados de realce compreendeselecionar dinamicamente entre gerar os segundos dados de realce comodados de realce absolutos ou como dados de realce relativos, relativos aosegundo sinal de M canais.
20. Método para decodificar um sinal de áudio de N canais,caracterizado pelo fato de compreender:receber um sinal de áudio codificado compreendendo:um primeiro sinal de M canais para o sinal de áudio de Ncanais, M sendo menor que N,primeiros dados de realce para expansão de multicanais, osprimeiros dados de realce sendo relativos a um segundo sinal de M canaisdiferente do primeiro sinal de M canais;segundos dados de realce para o primeiro sinal de M canaisrelativo ao segundo sinal de M canais, os segundos dados de realcecompreendendo dados de realce absolutos e dados de realce relativos aoprimeiro sinal de M canais, edados de indicação indicativos de se os segundos dados derealce para um bloco de sinal são dados de realce absolutos ou dados de realcerelativos;gerar um sinal de expansão de multicanais de M canais emresposta ao primeiro sinal de M canais e segundos dados de realce; egerar um sinal decodificado de N canais em resposta ao sinalde expansão de multicanais de M canais e primeiros dados de realce; eonde a geração do sinal de expansão de multicanais de Mcanais compreende selecionar entre aplicar os segundos dados de realce comodados de realce absolutos ou dados de realce relativos, em resposta aos dadosde indicação.
21. Sinal de áudio de multicanais codificado para um sinal deáudio de N canais, caracterizado pelo fato de compreender:dados de sinal de M canais para o sinal de áudio de N canais,M sendo menor que N;primeiros dados de realce para expansão de multicanais, osprimeiros dados de realce sendo relativos ao segundo sinal de M canaisdiferente do primeiro sinal de M canais;segundos dados de realce para o primeiro sinal de M canaisrelativo ao segundo sinal de M canais, os segundos dados de realcecompreendendo dados de realce absolutos e dados de realce relativos,relativos ao primeiro sinal de M canais; edados de indicação, indicativos de se os segundos dados derealce para um bloco de sinal são dados de realce absolutos ou dados de realcerelativos.
22. Meio de armazenagem, caracterizado pelo fato de possuirarmazenado nele um sinal como definido na reivindicação 21.
23. Transmissor (40) para transmitir um sinal de áudio demulticanais codificado, caracterizado pelo fato de compreender umcodificador de áudio de multicanais (10) como definido na reivindicação 1.
24. Receptor (50) para receber um sinal de áudio demulticanais, caracterizado pelo fato de compreender um decodificador deáudio de multicanais (20) como definido na reivindicação 13.
25. Sistema de transmissão (70), caracterizado pelo fato decompreender um transmissor (40) para transmitir um sinal de áudio demulticanais codificado via um canal de transmissão (30) para um receptor(50), o transmissor (40) compreendendo um codificador de áudio demulticanais (10) como definido na reivindicação Ieo receptorcompreendendo um decodificador de áudio de multicanais (20) como definidona reivindicação 13.
26. Método para transmitir um sinal de áudio de multicanaiscodificado, caracterizado pelo fato de compreender codificar um sinal deáudio de N canais, onde a codificação compreende:gerar um primeiro sinal de M canais para o sinal de áudio de Ncanais, M sendo menor que N;gerar primeiros dados de realce para o primeiro sinal de Mcanais relativos ao sinal de áudio de N canais;gerar um segundo sinal de M canais para o sinal de áudio de Ncanais;gerar segundos dados de realce para o segundo sinal de Mcanais relativo ao primeiro sinal de M canais;gerar um sinal de saída codificado compreendendo o segundosinal de M canais, os primeiros dados de realce e os segundos dados de realce;eonde a geração dos segundos dados de realce compreendeselecionar dinamicamente entre gerar os segundos dados de realce comodados de realce absolutos ou como dados de realce relativos, relativos aosegundo sinal de M canais.
27. Método para receber um sinal de áudio de multicanaiscodificado, caracterizado pelo fato de compreender decodificar o sinal deáudio de multicanais codificado, a decodificação compreendendo:receber o sinal de áudio de multicanais codificado,compreendendo:um primeiro sinal de M canais para o sinal de áudio de Ncanais, M sendo menor que N,primeiros dados de realce para expansão de multicanais, osprimeiros dados de realce sendo relativos a um segundo sinal de M canaisdiferente do primeiro sinal de M canais;segundos dados de realce para o primeiro sinal de M canaisrelativo ao segundo sinal de M canais, os segundos dados de realcecompreendendo dados de realce absolutos e dados de realce relativos,relativos ao primeiro sinal de M canais, edados de indicação indicativos de se os segundos dados derealce para um bloco de sinais são dados de realce absolutos ou dados derealce relativos;gerar um sinal de expansão de multicanais de M canais, emresposta ao primeiro sinal de M canais e segundos dados de realce; egerar um sinal decodificado de N canais em resposta ao sinalde expansão de multicanais de M canais e primeiros dados de realce; e onde ageração do sinal de expansão de multicanais de M canais compreendeselecionar entre aplicar os segundos dados de realce como dados de realceabsolutos ou dados de realce relativos, em resposta aos dados de indicação.
28. Método para transmitir e receber um sinal de áudio,caracterizado pelo fato de compreender:codificar um sinal de áudio de N canais, onde a codificaçãocompreende:gerar um primeiro sinal de M canais para o sinal de áudio de Ncanais, M sendo menor que N,gerar primeiros dados de realce para o primeiro sinal de Mcanais para o sinal de áudio de N canais,gerar um segundo sinal de M canais para o sinal de áudio de Ncanais,gerar segundos dados de realce para o segundo sinal de Mcanais relativo ao primeiro sinal de M canais, a geração dos segundos dadosde realce compreendendo selecionar dinamicamente entre gerar os segundosdados de realce como dados de realce absolutos ou como dados de realcerelativos, relativos ao segundo sinal de M canais,gerar um sinal de saída codificado compreendendo o segundosinal de M canais, os primeiros dados de realce e os segundos dados de realce;transmitir o sinal de saída codificado de um transmissor paraum receptor;receber, no receptor, o sinal de saída codificado;decodificar o sinal de saída codificado onde a decodificaçãocompreende:gerar um sinal de expansão de multicanais de M canais emresposta ao segundo sinal de M canais e segundos dados de realce, a geraçãodo sinal de expansão de multicanais de M canais compreendendo selecionarentre aplicar os segundos dados de realce como dados de realce absolutos oudados de realce relativos, egerar um sinal decodificado de N canais em resposta ao sinalde expansão de multicanais de M canais e primeiros dados de realce.
29. Produto de programa de computador, caracterizado pelofato de ser operativo para fazer com que um processador execute as etapas dométodo, como definido em qualquer uma das reivindicações 19, 20, 26, 27 e 28.
30. Gravador de áudio de multicanais (60), caracterizado pelofato de compreender um codificador de áudio de multicanais (10) comodefinido na reivindicação 1.
31. Reprodutor de áudio de multicanais (60),caracterizado pelo fato de compreender um decodificador de áudio demulticanais (20) como definido na reivindicação 13.
BRPI0608756-6A 2005-03-30 2006-03-16 Codificador e decodificador de áudio de multicanais, método para codificar e decodificar um sinal de áudio de n canais, sinal de áudio de multicanais codificado para um sinal de áudio de n canais e sistema de transmissão BRPI0608756B1 (pt)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
EP05102515 2005-03-30
EP05102515.3 2005-03-30
EP05103085.6 2005-04-18
EP05103085 2005-04-18
EP06100245.7 2006-01-11
EP06100245 2006-01-11
PCT/IB2006/050826 WO2006103586A1 (en) 2005-03-30 2006-03-16 Audio encoding and decoding

Publications (2)

Publication Number Publication Date
BRPI0608756A2 true BRPI0608756A2 (pt) 2011-03-15
BRPI0608756B1 BRPI0608756B1 (pt) 2019-06-04

Family

ID=36607294

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0608756-6A BRPI0608756B1 (pt) 2005-03-30 2006-03-16 Codificador e decodificador de áudio de multicanais, método para codificar e decodificar um sinal de áudio de n canais, sinal de áudio de multicanais codificado para um sinal de áudio de n canais e sistema de transmissão

Country Status (11)

Country Link
US (1) US7840411B2 (pt)
EP (1) EP1866913B1 (pt)
JP (1) JP5106383B2 (pt)
KR (2) KR20130079627A (pt)
CN (2) CN101151660B (pt)
AT (1) ATE406651T1 (pt)
BR (1) BRPI0608756B1 (pt)
DE (1) DE602006002501D1 (pt)
ES (1) ES2313646T3 (pt)
MX (1) MX2007011995A (pt)
WO (1) WO2006103586A1 (pt)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080255832A1 (en) * 2004-09-28 2008-10-16 Matsushita Electric Industrial Co., Ltd. Scalable Encoding Apparatus and Scalable Encoding Method
CN101167126B (zh) * 2005-04-28 2011-09-21 松下电器产业株式会社 语音编码装置和语音编码方法
KR101259203B1 (ko) * 2005-04-28 2013-04-29 파나소닉 주식회사 음성 부호화 장치와 음성 부호화 방법, 무선 통신 이동국 장치 및 무선 통신 기지국 장치
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
CA2672165C (en) * 2006-12-12 2014-07-29 Ralf Geiger Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US8639519B2 (en) * 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
WO2010013450A1 (ja) * 2008-07-29 2010-02-04 パナソニック株式会社 音響符号化装置、音響復号化装置、音響符号化復号化装置および会議システム
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8140342B2 (en) * 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8175888B2 (en) 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
EP2578000A1 (en) * 2010-06-02 2013-04-10 Koninklijke Philips Electronics N.V. System and method for sound processing
CA2826018C (en) 2011-03-28 2016-05-17 Dolby Laboratories Licensing Corporation Reduced complexity transform for a low-frequency-effects channel
CN102802112B (zh) * 2011-05-24 2014-08-13 鸿富锦精密工业(深圳)有限公司 具有音频文件格式转换功能的电子装置
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP2830050A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhanced spatial audio object coding
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830334A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2830051A3 (en) * 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
CN103413553B (zh) * 2013-08-20 2016-03-09 腾讯科技(深圳)有限公司 音频编码方法、音频解码方法、编码端、解码端和系统
US9067135B2 (en) * 2013-10-07 2015-06-30 Voyetra Turtle Beach, Inc. Method and system for dynamic control of game audio based on audio analysis
EP2879408A1 (en) 2013-11-28 2015-06-03 Thomson Licensing Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
CN105206278A (zh) * 2014-06-23 2015-12-30 张军 一种基于流水线的三维音频编码加速方法
US10547960B2 (en) 2014-09-01 2020-01-28 Sony Semiconductor Solutions Corporation Audio processing apparatus
US20220319524A1 (en) * 2019-07-08 2022-10-06 Voiceage Corporation Method and system for coding metadata in audio streams and for efficient bitrate allocation to audio streams coding

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
SG54379A1 (en) * 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
US5946352A (en) 1997-05-02 1999-08-31 Texas Instruments Incorporated Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain
US6122619A (en) * 1998-06-17 2000-09-19 Lsi Logic Corporation Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
SE519985C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
WO2003069954A2 (en) * 2002-02-18 2003-08-21 Koninklijke Philips Electronics N.V. Parametric audio coding
US7359522B2 (en) * 2002-04-10 2008-04-15 Koninklijke Philips Electronics N.V. Coding of stereo signals
CN100539742C (zh) * 2002-07-12 2009-09-09 皇家飞利浦电子股份有限公司 多声道音频信号编解码方法和装置
KR100528325B1 (ko) * 2002-12-18 2005-11-15 삼성전자주식회사 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
EP1769655B1 (en) * 2004-07-14 2011-09-28 Koninklijke Philips Electronics N.V. Method, device, encoder apparatus, decoder apparatus and audio system
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme

Also Published As

Publication number Publication date
WO2006103586A1 (en) 2006-10-05
CN101151658B (zh) 2011-07-06
KR101346120B1 (ko) 2014-01-02
DE602006002501D1 (de) 2008-10-09
CN101151658A (zh) 2008-03-26
ES2313646T3 (es) 2009-03-01
KR20130079627A (ko) 2013-07-10
CN101151660B (zh) 2011-10-19
US7840411B2 (en) 2010-11-23
US20100153118A1 (en) 2010-06-17
MX2007011995A (es) 2007-12-07
CN101151660A (zh) 2008-03-26
EP1866913A1 (en) 2007-12-19
JP2008535015A (ja) 2008-08-28
ATE406651T1 (de) 2008-09-15
EP1866913B1 (en) 2008-08-27
BRPI0608756B1 (pt) 2019-06-04
JP5106383B2 (ja) 2012-12-26
KR20070116174A (ko) 2007-12-06

Similar Documents

Publication Publication Date Title
BRPI0608756A2 (pt) codificador e decodificador de áudio de multicanais, método para codificar um sinal de áudio de n canais, sinal de áudio de multicanais codificado para um sinal de áudio de n canais, meio de armazenagem, transmissor para transmitir um sinal de aúdio de multicanais codificado, receptor para receber um sinal de áudio de multicanais, sistema de transmissão, métodos para transmitir e para receber um sinal de áudio de multicanais codificado, produto de programa de computador, gravador de áudio de multicanais, e, reprodutor de áudio de multicanais
RU2367033C2 (ru) Многоканальное иерархическое аудиокодирование с компактной дополнительной информацией
RU2411594C2 (ru) Кодирование и декодирование аудио
RU2417458C2 (ru) Генерирование многоканальных звуковых сигналов
TWI393119B (zh) 多通道編碼器、編碼方法、電腦程式產品及多通道解碼器
US8433583B2 (en) Audio decoding
JP7413418B2 (ja) 信号をインタリーブするためのオーディオ復号器
BR112014010062B1 (pt) Codificador de objeto de áudio, decodificador de objeto de áudio, método para a codificação de objeto de áudio, e método para a decodificação de objeto de áudio
BRPI0613469A2 (pt) aparelhos e métodos para gerar um número de canais de áudio de saìda e um fluxo de dados, fluxo de dados, meio de armazenamento, receptor para gerar um número de canais de áudio de saìda, transmissor para gerar um fluxo de dados, sistema de transmissão, métodos de recepção e de transmissão de um fluxo de dados, produto de programa de computador, e, dispositivos de reprodução de áudio e de gravação de áudio
BRPI0509100B1 (pt) Codificador de multicanal operável para processar sinais de entrada, método paracodificar sinais de entrada em um codificador de multicanal
BRPI0606387B1 (pt) Decodificador, dispositivo de reprodução de áudio, codificador, dispositivo de gravação, método para gerar um sinal de áudio multicanal, meio de armazenamento, método paracodificar um sinal de áudio multicanal, receptor, transmissor, sistema de transmissão, método de receber um sinal de áudio multicanal, e método de transmitir um sinal deáudio multicanal
BR112016001137B1 (pt) Decodificador de áudio, codificador de áudio, método para fornecer pelo menos quatro sinais de canal de áudio na base de uma representação codificada, e método para fornecer uma representação codificada na base de pelo menos quatro sinais de canal de áudio que usa uma extensão de largura de banda

Legal Events

Date Code Title Description
B06G Technical and formal requirements: other requirements [chapter 6.7 patent gazette]

Free format text: SOLICITA-SE A REGULARIZACAO DA PROCURACAO, UMA VEZ QUE BASEADO NO ARTIGO 216 1O DA LPI, O DOCUMENTO DE PROCURACAO DEVE SER APRESENTADO NO ORIGINAL, TRASLADO OU FOTOCOPIA AUTENTICADA.

B25D Requested change of name of applicant approved

Owner name: KONINKLIJKE PHILIPS N. V. (NL)

B25G Requested change of headquarter approved

Owner name: KONINKLIJKE PHILIPS N. V. (NL)

B15K Others concerning applications: alteration of classification

Free format text: A CLASSIFICACAO ANTERIOR ERA: G10L 19/00

Ipc: G10L 19/008 (2013.01), H04S 3/00 (1980.01)

B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 04/06/2019, OBSERVADAS AS CONDICOES LEGAIS. (CO) 10 (DEZ) ANOS CONTADOS A PARTIR DE 04/06/2019, OBSERVADAS AS CONDICOES LEGAIS