BR122018069728B1 - Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada - Google Patents

Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada Download PDF

Info

Publication number
BR122018069728B1
BR122018069728B1 BR122018069728-8A BR122018069728A BR122018069728B1 BR 122018069728 B1 BR122018069728 B1 BR 122018069728B1 BR 122018069728 A BR122018069728 A BR 122018069728A BR 122018069728 B1 BR122018069728 B1 BR 122018069728B1
Authority
BR
Brazil
Prior art keywords
channel
downmix
channels
collateral
information
Prior art date
Application number
BR122018069728-8A
Other languages
English (en)
Inventor
Juergen Herre
Johannes Hilpert
Stefan Geyersberger
Andreas Hoelzer
Claus Spenger
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=34394093&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=BR122018069728(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. filed Critical Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V.
Publication of BR122018069728B1 publication Critical patent/BR122018069728B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Stereophonic System (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Error Detection And Correction (AREA)
  • Executing Machine-Instructions (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

no processamento de um sinal de áudio multicanais tendo pelo menos três canais originais, são providos um primeiro canal downmix e um segundo canal downmix (12), que se derivam dos canais originais. para um canal original selecionado dos canais originais, são calculadas as informações colaterais de canal (14) de maneira que um canal downmix ou um canal downmix combinado incluindo o primeiro e o segundo canais downmix, quando pesados usando as informações colaterais de canal, resulta em uma aproximação do canal original selecionado. as informações colaterais de canal e o primeiro e o segundo canais downmix formam os dados de saída (20) a ser transmitidos a um decodificador que, no caso de um decodificador de baixo nível somente decodifica o primeiro e o segundo canais downmix ou, no caso de um decodificador de alto nível, provê total sinal de áudio multicanais baseado nos canais downmix e nas informações colaterais de canal. como as informações colaterais de canal somente ocupam um pequeno número de bits, e como o decodificador não usa dematrixing, é obtida uma extensão eficiente e de alta qualidade multicanais para os stereo players e os players ampliados multicanais.

Description

Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada.
Dividido do PI 0414757-0, depositado em 30/09/2004.
Campo da invenção [001] A presente invenção se refere a um aparelho e um método para o processamento de um sinal de áudio multicanais e, em particular, a um aparelho e um método para o processamento de um sinal de áudio multicanais de maneira estéreo-compativel.
Histórico da Invenção e da Técnica Anterior [002] Atualmente, a técnica de reprodução de áudio multicanais está se tornando mais e mais importante. Isto pode ser devido ao fato de que as técnicas de compressão/codificação de áudio como a bem conhecida técnica MP3 tornaram possível distribuir reqistros de áudio via Internet ou outros canais de transmissão dotados de largura de banda limitada. A técnica de codificação MP3 tornou-se tão famosa devido ao fato de permitir a distribuição de todos os registros em formato estéreo, isto é, uma representação digital do registro de áudio, incluindo um primeiro canal estéreo (ou canal estéreo esquerdo) e um segundo canal estéreo (ou canal estéreo direito).
[003] Não obstante, existem desvantagens básicas nos sistemas de som convencionais de dois canais. Portanto, foi desenvolvida a técnica surround. Uma representação multicanais surround recomendada inclui, além dos dois canais estéreo L e R, um outro canal central C e dois canais surround Ls, Rs. Esse
Petição 870180156216, de 28/11/2018, pág. 4/37
2/34 formato sonoro de referência é também denominado de estéreo três/dois, que significa três canais frontais e dois canais surround. Em geral, são necessários cinco canais de transmissão. Em um ambiente de playback, são necessários pelo menos cinco auto-falantes nos respectivos cinco diferentes locais para obter-se um local ideal agradável a uma certa distância a partir dos cinco auto-falantes bem localizados.
[004] São conhecidas várias técnicas nesse campo para reduzir a quantidade de dados necessários para a transmissão de um sinal de áudio multicanais. Essas técnicas são denominadas técnicas joint stereo. Para essa finalidade, é feita referência à Fig. 10, que mostra um dispositivo joint stereo 60. Esse dispositivo pode ser um dispositivo de implementação, por exemplo, intensity stereo(IS) ou binaural cue coding (BCC). Esse dispositivo geralmente recebe - como entrada - pelo menos dois canais (CHI, CH2, ... CHn) , e emite um único canal portador e dados paramétricos. Os dados paramétricos são definidos de maneira que, em um decodificador, possa ser calculada uma aproximação de um canal original (CHI, CH2, ... CHn) .
[005] Normalmente, o canal portador incluirá amostras sub-banda, coeficientes espectrais, amostra de domínio no tempo, etc, que provêem uma representação comparativamente fina do sinal subjacente, enquanto os dados paramétricos não incluem essas amostras de coeficientes espectrais, mas incluem parâmetros de controle para o controle de um determinado algoritmo de reconstrução, como a pesagem por multiplicação, alteração de tempo, alteração de freqüência, ... Os dados paramétricos, portanto, incluem somente uma representação
Petição 870180156216, de 28/11/2018, pág. 5/37
3/34 comparativamente rústica do sinal ou do canal associado. Explicado em números, a quantidade de dados necessária por um canal portador estará na faixa de 60 - 70 kbit/s, enquanto a quantidade de dados necessária pelas informações do lado paramétrico para um canal, estará na faixa de 1,5 - 2,5 kbit/s. Um exemplo de dados paramétricos são os bem conhecidos fatores de escala, as informações de intensity stereo ou binaural cue parameters como será descrito abaixo.
[006] A codificação intensity stereo é descrita na pré-impressão AES 3799, Intensity Stereo Coding, J. Herre, K. H. Brandenburg, D. Lederer, February 1994, Amsterdam. Em geral, o conceito de intensity stereo se baseia em uma transformada de eixo principal a ser aplicada aos dados de ambos os canais estereofônicos de áudio. Se a maioria dos pontos dos dados está concentrada à volta do primeiro eixo principal, pode ser obtido um ganho de codificação pela rotação de ambos os sinais de um determinado ângulo antes da codificação. Entretanto, isto nem sempre é verdade nas técnicas reais de produção estereofônica. Portanto, essa técnica é modificada pela exclusão da segunda componente ortogonal da transmissão no bit stream. Assim, os sinais reconstruídos para os canais esquerdo e direito consistem de versões pesadas ou medidas diferentemente do mesmo sinal transmitido. Não obstante, os sinais reconstruídos diferem em suas amplitudes, mas são idênticos em relação a suas informações de fase. Os envelopes energia-tempo de ambos os canais originais de áudio, entretanto, são preservados por meio de operação de medição seletiva, que tipicamente opera de maneira a selecionar a freqüência. Isto se conforma à percepção humana de som em
Petição 870180156216, de 28/11/2018, pág. 6/37
4/34 altas freqüências, onde os cues espaciais dominantes são determinados pelos envelopes de energia.
[007] Além disso, em implementações práticas, o sinal [008] transmitido, isto é, o canal portador é gerado a partir do sinal de soma do canal esquerdo e do canal direito ao invés de rotacionar ambos os componentes. Também, esse processamento, isto é, a geração de parâmetros intensity stereo para a realização da operação de medição, é feito com seleção de frequência, isto é, independentemente de cada banda de fator de escala, isto é, da partição de freqüência codificadora. Preferencialmente, ambos os canais são combinados para formarem um canal combinador ou portador, e, além do canal combinador, as informações intensity stereo determinadas dependem da energia do primeiro canal, da energia do segundo canal ou da energia dos canais combinados.
[009] A técnica BCC é descrita no documento convenção da AES 5574, Binaural cue coding applied to stereo and multichannel audio compression, C. Faller, F. Baumgarte, May 2002, Munich. Na codificação BCC, alguns canais de entrada de áudio são convertidos em representação espectral usando uma transformada baseada DTF com janelas superpostas. O espectro uniforme resultante se divide em partições não superpostas, cada qual possuindo um índice. Cada partição tem uma largura de banda proporcional à largura de banda retangular equivalente (ERB). As diferenças de nível intercanais (ICLD) e as diferenças de tempos intercanais (ICTD) são estimadas para cada partição para o mesmo quadro k. O ICLD e o ICTD são quantificados e codificados,
Petição 870180156216, de 28/11/2018, pág. 7/37
5/34 resultando em um bit stream BCC. As diferenças de nível intercanais e as diferenças de tempos intercanais são dadas para cada canal com relação a um canal de referência. Então, os parâmetros são calculados de acordo com as formulas indicadas, que dependem de determinadas partições do sinal a ser processado.
[0010] No lado decodificador, este recebe um monosinal e o bit stream BCC. O mono-sinal é transformado em um domínio de freqüência e entra em um bloco de síntese espacial, que também recebe valores ICLD e ICTD decodificados. No bloco de síntese espacial, os valores dos parâmetros BCC (ICLD e ICTD) são usados para realizar uma operação de pesagem do mono-sinal para sintetizar os sinais multicanais, que após uma conversão freqüência/tempo, representam uma reconstrução do sinal original de áudio multicanais.
[0011] No caso BCC, o módulo joint stereo 60 é operativo para a saída das informações colaterais de canal, de maneira que os dados do canal paramétrico sejam parâmetros ICLD ou ICTD quantificados e codificados, considerando o fato de que um dos canais originais é usado como canal de referência para a codificação das informações colaterais de canal.
[0012] Normalmente, o canal portador é formado pela soma dos canais originais participantes.
[0013] Naturalmente, as técnicas acima somente provêem uma mono representação para um decodificador, que pode somente processar o canal portador, mas não consegue processar os dados paramétricos para a geração de uma ou mais aproximações de mais de um canal de entrada.
Petição 870180156216, de 28/11/2018, pág. 8/37
6/34 [0014] Para a transmissão dos cinco canais de maneira compatível, isto é, em formato bitstream, que também é compreensível para um decodificador estéreo normal, a denominada técnica de matrixing foi usada como descrito em MUSICAM surround: a universal multi-channel coding system compatible with ISO 11172-3, G. Theile and G. Stoll, AES preprint 3403, October 1992, San Francisco. Os cinco canais de entrada L, R, C, Ls, e Rs são abastecidos em um dispositivo de matrixing e realizam uma operação de matrixing para calcular os canais estéreo compatíveis ou básicos Lo, Ro, a partir dos cinco canais
de entrada. Em particular, esses canais estéreo básicos Lo/Ro
são calculados como indicado abaixo:
Lo = L + xC + yLs
Ro = R + xC + yRs
[0015] x e y sendo constantes. Os outros três canais
C, Ls, Rs são transmitidos como são em uma camada de extensão, além da camada estéreo básica, que inclui uma versão codificada dos sinais estéreo básicos Lo/Ro. Com respeito ao bitstream, essa camada estéreo básica Lo/Ro inclui um cabeçalho, informações como os fatores de escala e as amostras de subbanda. A camada de extensão multicanais, isto é, o canal central e os dois canais surround estão incluídos no campo de extensão multicanais, que também é denominado canal de dados auxiliares.
[0016] No lado decodificador, é realizada uma operação matrixing inversa para formar reconstruções dos canais esquerdo e direito na representação de cinco canais usando os canais estéreo básicos Lo, Ro e os três canais adicionais. Além disso, os três canais adicionais são decodificados a partir das
Petição 870180156216, de 28/11/2018, pág. 9/37
7/34 informações auxiliares para obter uma representação de cinco canais decodificados ou surround do sinal de áudio multicanais original.
[0017] Outra abordagem de codificação multicanais está descrita na publicação Improved MPEG-2 audio multi-channel encoding, B. Grill, J. Herre, K. H. Brandenburg, E. Eberlein, J. Koller, J. Mueller, AES preprint 3865, February 1994, Amsterdam, na qual, para se obter uma compatibilidade backward, são considerados os modos compatíveis backward. Para esse fim, é usada uma matriz de compatibilidade para obter os dois chamados canais downmix Lc, Rc a partir dos cinco canais originais de entrada. Além disso, é possível selecionar dinamicamente os três canais auxiliares transmitidos como dados auxiliares.
[0018] Para explorar a irrelevância do estéreo, é aplicada uma técnica joint stereo aos grupos de canais, por exemplo, os três canais frontais, isto é, para o canal esquerdo, o canal direito e o canal central. Para isso, esses três canais são combinados para obter um canal combinado. Esse canal combinado é quantificado e embalado no bitstream. Depois, esse canal combinado juntamente com as correspondentes informações joint stereo são colocados em um módulo de decodificação joint stereo para obter os canais decodificados joint stereo isto é, um canal esquerdo decodificado joint stereo, um canal direito decodificado joint stereo e um canal central decodificado joint stereo. Esses canais decodificados joint stereo, juntamente com o canal surround esquerdo e o canal surround direito entram em um bloco matriz de compatibilidade para formar o primeiro e o segundo canais downmix Lc, Rc. Depois, as versões quantificadas
Petição 870180156216, de 28/11/2018, pág. 10/37
8/34 do canal combinado são embaladas no bitstream juntamente com os parâmetros de codificação joint stereo.
[0019] Usando codificação intensity stereo, portanto, um grupo de sinais independente de canais originais é transmitido dentro de uma porção dos dados portadores. O decodificador então reconstrói os sinais envolvidos como dados idênticos, que são reescalados de acordo com seus envelopes energia-tempo originais. Como consequência, uma combinação linear dos canais transmitidos conduzirá aos resultados, que são bastante diferentes do downmix original. Isto se aplica a qualquer tipo de codificação joint stereo baseada no conceito de intensity stereo. Para um sistema de codificação que provê canais downmix compatíveis, existe uma consequência direta: A reconstrução por dematrixing, como descrita na publicação anterior, sofre por problemas causados pela reconstrução imperfeita. Usando o denominado esquema de pré-dístorção joint stereo, no qual é feita uma codificação joint stereo dos canais da esquerda, da direita e do centro antes de ser feito o matrixing no codificador, ameniza o problema. Assim, o esquema de dematrixing para a reconstrução introduz menos problemas, já que no lado do codificador, os sinais decodificados joint stereo foram usados para gerar os canais downmix. Assim, o processo de reconstrução imperfeito é alterado para os canais downmix compatíveis Lc e Rc, onde tem muito mais probabilidades de ser mascarado pelo próprio sinal de áudio.
[0020] Apesar desse sistema ter resultado em menos problemas devido ao dematrixing no lado do decodificador, tem ainda assim algumas desvantagens. A desvantagem é que os canais
Petição 870180156216, de 28/11/2018, pág. 11/37
9/34 downmix estéreo-compatíveis Lc e Rc se derivam não dos canais originais, mas das versões codificada/decodifiçada intensity stereo dos canais originais. Portanto, as perdas de dados devidas ao sistema de codificação intensity stereo estão incluídas nos canais downmix compatíveis. 0 decodificador somente estéreo, que somente decodifica os canais compatíveis ao invés de ampliar os canais codificados intensity stereo, portanto, provê um sinal de saída que é afetado pelas perdas de dados induzidas por intensity stereo.
[0021] Além disso, um outro canal completo tem que ser transmitido além dos dois canais downmix. Esse canal é o canal combinado, que é formado pelos meios de codificação intensity stereo do canal esquerdo, do canal direito e do canal central. Além disso, as informações intensity stereo para a reconstrução dos canais originais L, R, C do canal combinador também devem ser transmitidas ao decodificador. No decodificador, é feita uma matrixing inversa, isto é, é feita uma operação de dematrixing para derivar os canais surround dos dois canais downmix. Também, os canais esquerdo, direito e central originais são aproximados pela decodificação intensity stereo usando o canal combinado transmitido e os parâmetros intensity stereo transmitidos. Deve ser notado que os canais esquerdo, direito e central originais são derivados pela decodificação intensity stereo do canal combinado.
Sumário da Invenção [0022] É o objeto da presente invenção prover um conceito para um processamento bit-eficiente e com a redução de
Petição 870180156216, de 28/11/2018, pág. 12/37
10/34 problemas ou o processamento inverso de um sinal de áudio multicanais.
[0023] De acordo com um primeiro aspecto da presente invenção, este objeto é alcançado por um equipamento para processamento de um sinal de áudio multicanais, o sinal de áudio multicanais tendo pelo menos três canais originais, compreendendo: meios para prover um primeiro canal downmix e um segundo canal downmix, o primeiro e o segundo canais downmix sendo derivados dos canais originais; meios para calcular as informações colaterais de canal de um canal original selecionado dos sinais originais, os meios para cálculo sendo operativos para o cálculo das informações colaterais de canal, como de um canal downmix ou de um canal downmix combinado, incluindo o primeiro e o segundo canais downmix, quando pesados usando as informações colaterais de canal, resulta em uma aproximação do canal oriqinal selecionado; e meios para a geração de dados de saída, os dados de saída incluindo as informações colaterais de canal, o primeiro canal downmix ou um sinal derivado do primeiro canal downmix e do segundo canal downmix ou um sinal derivado do segundo canal downmix.
[0024] De acordo com um Segundo aspecto da presente invenção, este objeto é alcançado por um método para o processamento de um sinal de áudio multicanais, o sinal de áudio multicanais tendo pelo menos três canais originais, compreendendo: prover um primeiro canal downmix e um segundo canal downmix, o primeiro e o Segundo canais downmix sendo derivados dos canais originais; calcular as informações colaterais de canal para um canal original selecionado dos
Petição 870180156216, de 28/11/2018, pág. 13/37
11/34 sinais originais, de maneira que um canal downmix ou um canal downmix combinado, incluindo o primeiro e o segundo canais downmix, quando pesados usando as informações colaterais de canal, resulta em uma aproximação do canal original selecionado; e gerar dados de saída, os dados de saída incluindo as informações colaterais de canal, o primeiro canal downmix ou o sinal derivado do primeiro canal downmix e do segundo canal downmix ou um sinal derivado do segundo canal downmix.
[0025] De acordo com um terceiro aspecto da presente invenção, este objeto é alcançado por um equipamento para o processamento inverso dos dados de entrada, os dados de entrada incluindo as informações colaterais de canal, um primeiro canal downmix ou um sinal derivado do primeiro canal downmix e um segundo canal downmix ou um sinal derivado do segundo canal downmix, caracterizado pelo fato de que o primeiro canal downmix e o segundo canal downmix são derivados de pelo menos três canais originais de um sinal de áudio multicanais, e caracterizado pelo fato de que as informações colaterais de canal são calculadas de maneira que um canal downmix ou um canal downmix combinado, incluindo o primeiro canal downmix e o segundo canal downmix, quando pesados usando as informações colaterais de canal, resultam em uma aproximação do canal original selecionado, o equipamento compreendendo: uma leitora de dados de entrada para ler os dados de entrada de maneira a obter o primeiro canal downmix ou um sinal derivado do primeiro canal downmix e o segundo canal downmix ou um sinal derivado do segundo canal downmix e as informações colaterais de canal; e um reconstrutor de canais para a reconstrução da aproximação do
Petição 870180156216, de 28/11/2018, pág. 14/37
12/34 canal original selecionado usando as informações colaterais de canal e o canal downmix ou o canal downmix combinado para obter a aproximação do canal original selecionado.
[0026] De acordo com um quarto aspecto da presente invenção, este objeto é alcançado por um método de processamento inverso dos dados de entrada, os dados de entrada incluindo as informações colaterais de canal, um primeiro canal downmix ou um sinal derivado de um primeiro canal downmix e um segundo canal downmix ou um sinal derivado de um segundo canal downmix, caracterizado pelo fato de que o primeiro canal downmix e o segundo canal downmix são derivados de pelo menos três canais originais de um sinal de áudio multicanais, e caracterizado pelo fato de que as informações colaterais de canal são calculadas de maneira que um canal downmix ou um canal downmix combinado, incluindo o primeiro canal downmix e o segundo canal downmix, quando pesados usando as informações colaterais de canal, resultam em uma aproximação do canal original selecionado, o método compreendendo: leitura dos dados de entrada para obter o primeiro canal downmix ou um sinal derivado do primeiro canal downmix e um segundo canal downmix ou um sinal derivado do segundo canal downmix e as informações colaterais de canal; e reconstruir a aproximação do canal original selecionado usando as informações colaterais de canal e o canal downmix ou o canal downmix combinado para obter a aproximação do canal original selecionado.
[0027]
De acordo com um quinto aspecto e sexto aspecto da presente invenção, este objeto é alcançado por um programa de
Petição 870180156216, de 28/11/2018, pág. 15/37
13/34 computador incluindo o método de processamento ou o método de processamento inverso.
[0028] A presente invenção se baseia na descoberta de que é obtida uma codificação eficiente e com menos problemas do sinal de áudio multicanais quando dois canais downmix, preferencialmente representando os canais estéreo esquerdo e direito são embalados nos dados de saida.
[0029] Inventivamente, as informações paramétricas colaterais do canal para um ou mais dos canais originais se derivam de maneira a se relacionarem com um dos canais downmix, ao invés de, como na técnica anterior, a um canal joint stereo combinado adicional. Isto significa que as informações paramétricas colaterais do canal são calculadas de maneira que, no lado do decodificador, um reconstrutor de canal usa as informações colaterais de canal e um dos canais downmix ou uma combinação dos canais downmix para reconstruir uma aproximação do canal de áudio original, para o qual as informações colaterais de canal são indicadas.
[0030] O conceito inventivo é vantajoso por prover uma extensão multicanais bit-eficiente, de maneira que possa ser reproduzido em um decodificador o sinal de áudio multicanais.
[0031] Além disso, o conceito inventivo é compatível backward, já que um decodificador de menor escala, que é somente adaptado para o processamento de dois canais, pode simplesmente ignorar a informação da extensão, isto é, as informações colaterais de canal. O decodificador de menor escala somente pode reproduzir os dois canais downmix para obter uma representação estéreo do sinal original de áudio multicanais.
Petição 870180156216, de 28/11/2018, pág. 16/37
14/34
Entretanto, um decodificador de maior escala habilitado para operações multicanais, pode usar as informações colaterais de canal transmitidas para reconstruir aproximações dos canais originais.
[0032] A presente invenção é vantajosa por ser biteficiente, já que, em contraste com a técnica anterior, não é necessário outro canal portador além do primeiro e do segundo canais downmix Lc, Rc. Ao invés disso, as informações colaterais de canal se relacionam com um ou ambos os canais downmix. Isto significa que os próprios canais downmix servem como canais portadores, para os quais as informações colaterais de canal são combinadas para reconstruir um canal de áudio original. Isto significa que as informações colaterais de canal são preferivelmente informações colaterais paramétricas, isto é, informações que não incluem quaisquer amostras de sub-banda ou coeficientes espectrais. Ao invés disso, as informações colaterais paramétricas são informações usadas para pesagem (no tempo e/ou freqüência) do respectivo canal downmix ou da combinação dos respectivos canais downmix para obter uma versão reconstruída de um canal original selecionado.
[0033] Em uma configuração preferida da presente invenção, é obtida uma codificação compatível backward de um sinal multicanais baseada em um sinal estéreo compatível. Preferencialmente, o sinal estéreo compatível (sinal downmix) é gerado usando o matrixing dos canais originais do sinal de áudio multicanais.
[0034] Inventivamente, as informações colaterais de canal de um canal original selecionado são obtidas com base nas
Petição 870180156216, de 28/11/2018, pág. 17/37
15/34 técnicas joint stereo como a codificação intensity stereo ou a binaural cue coding. Assim, no lado do decodificador, não devem ser feitas operações de dematrixing. Os problemas associados com dematrixing, isto é, são evitados alguns problemas relacionados com uma distribuição indesejada de ruídos de quantificação nas operações de dematrixing. Isto se deve ao fato do decodificador usar um reconstrutor de canais, que reconstrói um sinal original, usando um dos canais downmix ou uma combinação dos canais downmix e as informações colaterais de canal transmitidas.
[0035] Preferivelmente, todo conceito inventivo é aplicado a um sinal de áudio multicanais com cinco canais. Esses cinco canais são um canal esquerdo L, um canal direito R, um canal central C, um canal surround esquerdo Ls e um canal surround direito Rs. Preferencialmente, os canais downmix são canais downmix estéreo compatíveis Ls e Rs, que provêem uma representação estéreo do sinal de áudio multicanais original.
[0036] De acordo com a configuração preferida da presente invenção, para cada canal original, são calculadas as informações colaterais de canal em um lado codificador embalado nos dados de saída. As informações colaterais de canal do canal esquerdo original se derivam usando o canal downmix esquerdo. As informações colaterais de canal do canal surround esquerdo original se derivam usando o canal downmix esquerdo. As informações colaterais de canal do canal direito original se derivam do canal downmix direito. As informações colaterais de
Petição 870180156216, de 28/11/2018, pág. 18/37
16/34 canal para o canal surround direito original se derivam do canal downmix direito.
[0037] De acordo com a configuração preferida da presente invenção, as informações de canal do canal central original se derivam usando o primeiro canal downmix assim como o segundo canal downmix, isto é, usando uma combinação dos dois canais downmix. Preferencialmente, essa combinação é uma soma.
[0038] Assim, os subgrupos, isto é, a relação entre as informações colaterais de canal e o sinal portador, isto é, o canal downmix usado para prover as informações colaterais de canal para um canal original selecionado é de tal modo que, para a qualidade ideal, é selecionado um determinado canal downmix, que contém a maior quantidade relativa possível do respectivo sinal multicanais original que é representado por meio das informações colaterais de canal. Como um sinal portador joint stereo, são usados o primeiro e o segundo canais downmix. Preferencialmente, também a soma do primeiro e do segundo canais downmix pode ser usada. Naturalmente, a soma do primeiro e do segundo canais downmix pode ser usada para o cálculo das informações colaterais de canal de cada um dos canais originais. Preferencialmente, entretanto, a soma dos canais downmix é usada para calcular as informações colaterais de canal do canal central original em um ambiente surround, como o surround de cinco canais, surround de sete canais, surround 5.1 ou surround 7.1. Usar a soma do primeiro e do segundo canais downmix é especialmente vantajoso, já que não precisa ser realizado nenhum outro cabeçalho de transmissão. Isto se deve ao fato de que ambos os canais downmix estão presentes no decodificador, de
Petição 870180156216, de 28/11/2018, pág. 19/37
17/34 maneira que a soma desses canais downmix pode ser facilmente feita no decodificador sem a exigência de outros bits de transmissão.
[0039] Preferencialmente, as informações colaterais de canal que formam a extensão multicanais são inseridas no bit stream dos dados de saída de maneira compatível, de maneira que o decodificador de menor escala simplesmente ignora os dados de extensão multicanais e somente fornece uma representação estéreo do sinal de áudio multicanais. Não obstante, um codificador de maior escala não somente usa dois canais downmix, mas, além disso, emprega as informações colaterais de canal para reconstruir uma representação completa multicanais do sinal original de áudio.
[0040] Um decodificador inventivo é operativo para primeiramente decodificar ambos os canais downmix e ler as informações colaterais de canal dos canais originais selecionados. Depois, as informações colaterais de canal e os canais downmix são usados para reconstruir aproximações dos canais originais. Para essa finalidade, preferencialmente, não é feita nenhuma operação de dematrixing. Isto significa que, nesta configuração, cada um dos, por exemplo, cinco canais originais de entrada são reconstruídos usando, por exemplo, cinco conjuntos de diferentes informações colaterais de canal. No codificador, é realizado o mesmo agrupamento que no codificador para calcular a aproximação do canal reconstruído. Em um ambiente surround de cinco canais, isto significa que, para reconstruir o canal original esquerdo, são usados o canal downmix esquerdo e as informações colaterais de canal do canal
Petição 870180156216, de 28/11/2018, pág. 20/37
18/34 esquerdo. Para reconstruir o canal direito original, são usados o canal downmix direito e as informações colaterais de canal do canal direito. Para reconstruir o canal surround esquerdo original, são usados o canal downmix esquerdo e as informações colaterais do canal surround esquerdo. Para reconstruir o canal surround direito original, são usadas as informações colaterais de canal do canal surround direito e o canal downmix direito. Para reconstruir o canal central original, são usados um canal combinado formado a partir do primeiro canal downmix e o segundo canal downmix e as informações colaterais do canal central.
[0041] Naturalmente, também é possível reproduzir o primeiro e o Segundo canais downmix como os canais esquerdo e direito, de maneira que somente três conjuntos (entre, por exemplo, cinco) de parâmetros de informações colaterais do canal tenham que ser transmitidos. Isto é, entretanto, somente aconselhável em situações onde existam regras menos rigorosas com respeito à qualidade. Isto se deve ao fato que, normalmente, o canal downmix esquerdo e o canal downmix direito são diferentes do canal esquerdo original ou do canal direito original. Somente em situações em que não se possa transmitir as informações colaterais do canal para cada um dos canais originais, esse processo é vantajoso.
Breve Descrição dos Desenhos [0042] As configurações preferidas da presente invenção são agora discutidas com referência às figuras anexas, nas quais:
Fig. 1 é um diagrama de blocos de uma configuração preferida do decodificador do invento;
Petição 870180156216, de 28/11/2018, pág. 21/37
19/34
Fig. 2 é um diagrama de blocos de uma
configuração preferida do decodificador do invento;
Fig. 3A é um diagrama de blocos de uma
implementação preferida do meio de cálculo para obter
informações colaterais de canal seletivo de freqüência;
Fig. 3B é uma configuração preferida de um calculador para a implementação de um processamento joint stereo como intensity coding ou binaural cue coding;
Fig. 4 ilustra outra configuração preferida do meio para calcular as informações colaterais de canal, na qual as informações colaterais de canal são fatores de ganho;
Fig. 5 ilustra uma configuração preferida de uma implementação do decodificador, quando o codificador é implementado como na Fig. 4;
Fig. 6 ilustra uma implementação preferida de um meio para prover canais downmix·,
Fig. 7 ilustra agrupamentos de canais originais e downmix para o cálculo das informações colaterais de canal dos respectivos canais originais;
Figure BR122018069728B1_D0001
Figure BR122018069728B1_D0002
outra configuração preferida
Figure BR122018069728B1_D0003
Figure BR122018069728B1_D0004
Figure BR122018069728B1_D0005
outra implementação
Figure BR122018069728B1_D0006
Figure BR122018069728B1_D0007
Figure BR122018069728B1_D0008
Figure BR122018069728B1_D0009
Figure BR122018069728B1_D0010
joint stereo
Figure BR122018069728B1_D0011
técnica anterior.
Descrição____Detalhada____das____Configurações
Preferidas
Petição 870180156216, de 28/11/2018, pág. 22/37
20/34 [0043] A Fig. 1 mostra um equipamento para o processamento de um sinal de áudio multicanais 10 tendo pelo menos três canais originais como R, L e C. Preferencialmente, o sinal de áudio original tem mais do que três canais, como cinco canais no ambiente surround, que está ilustrado na Fiq. 1. Os cinco canais são o canal esquerdo L, o canal direito R e o canal central C, o canal surround esquerdo Ls e o canal surround direito Rs. O equipamento do invento inclui o meio 12 para prover um primeiro canal downmix Lc e um sequndo canal downmix Rc, o primeiro e o segundo canais downmix sendo derivados dos canais originais. Para derivar os canais downmix dos canais originais, existem várias possibilidades. Uma possibilidade é derivar os canais downmix Lc e Rc por meio de matrixing dos canais originais usando uma operação de matrixing como ilustrada na Fig. 6. Essa operação de matrixing é realizada no domínio do tempo.
[0044] Os parâmetros de matrixing a, b e t são selecionados de maneira que sejam menores ou iguais a 1. Preferenclalmente, a e b são 0,7 ou 0,5. O parâmetro geral de pesagem t é, preferencialmente, escolhido de maneira que seja evitado o clipping de canais.
[0045] Alternativamente, como indicado na Fig. 1, os canais downmix Lc e Rc podem também ser fornecidos externamente. Isto pode ser feito, quando os canais downmix Lc e Rc forem o resultado de uma operação de mistura manual. Nesse cenário, o próprio engenheiro de som faz a mixagem dos canais downmix ao invés de usar uma operação automatizada de matrixing. O engenheiro de som faz uma mixagem criativa para obter os canais
Petição 870180156216, de 28/11/2018, pág. 23/37
21/34 downmix otimizados Lc e Rc, que proporcionam a melhor representação estéreo possível do sinal de áudio multicanais original.
[0046] No caso de um suprimento externo de canais downmix, os meios não realizam uma operação matrixing, mas simplesmente encaminha os canais downmix supridos externamente para um meio subseqüente de cálculo 14.
[0047] O meio de cálculo 14 é operativo para calcular as informações colaterais de canal como llf lst, r^ ou rsL para os canais selecionados originais como L, Ls, R ou Rs, respectivamente. Em particular, o meio 14 para cálculo está operativo para calcular as informações colaterais de canal como de um canal downmix, quando pesado usando as informações colaterais de canal, resultando em uma aproximação do canal selecionado original.
[0048] Alternativa ou adicionalmente, o meio de cálculo das informações colaterais de canal é ainda operativo e para calcular as informações colaterais de canal para um canal original selecionado como um canal downmix combinador, incluindo uma combinação do primeiro e do segundo canais downmix, quando pesados usando as informações colaterais de canal calculadas, resulta em uma aproximação do canal original selecionado. Para mostrar essa característica na figura, são mostrados um somador 14a e um calculador de informações colaterais de canal combinado 14b.
[0049] Está claro para os peritos na técnica que esses
elementos não precisam ser implementados como elementos
distintos. Ao invés disso, toda a funcionalidade dos blocos 14,
Petição 870180156216, de 28/11/2018, pág. 24/37
22/34
14a e 14b pode ser implementada por meio de um determinado
processador que pode ser um processador genérico ou qualquer
outro meio para a realização da funcionalidade necessária.
[0050] Além disso, deve ser notado aqui que os sinais
de canal sendo amostras sub-banda ou valores de domínio de
freqüência estão indicados em letras maiúsculas. As informações
colaterais do canal são, em contraste aos próprios canais,
indicadas em letras minúsculas. As informações colaterais de
canal c± são, portanto, as informações colaterais de canal do canal central original C.
[0051] As informações colaterais de canal, assim como
os canais downmix Lc e Rc ou uma versão codificada Lc' e Rc',
como produzidas por um codificador de áudio 16 são inseridas em um formatador de dados de saída 18. Em geral, o formatador de dados de saída 18 atua como meio para a geração dos dados de saída, os dados de saída incluindo as informações colaterais de canal de pelo menos um canal original, o primeiro canal downmix ou um sinal derivado do primeiro canal downmix (como uma versão
codificada deste) e o segundo canal downmix ou um sinal derivado
do segundo canal downmix (como uma versão codificada deste).
[0052] Os dados de saída ou o bitstream de saída 20
pode então ser transmitidos para um decodificador bitstream ou
pode ser armazenado ou distribuído. Preferencialmente, o
bitstream de saída 20 é um bitstream compatível que também pode ser lido por um decodificador de pequena escala não tendo capacidade de extensão multicanais. Esses codificadores de pequena escala, como a maioria dos decodificadores existentes MP3 da técnica atual, simplesmente ignoram os dados de extensão
Petição 870180156216, de 28/11/2018, pág. 25/37
23/34 multicanais, isto é, as informações colaterais de canal. Somente decodificarão o primeiro e o Segundo canais downmix para produzir uma saida estéreo. Os decodificadores de maior escala, como os decodificadores habilitados para multicanais lerão as informações colaterais de canal e então gerarão uma aproximação dos canais originais de áudio, como é obtida uma impressão de áudio multicanais.
[0053] A Fig. 8 mostra uma configuração preferida da presente invenção no ambiente de cinco canais surround / MP3. Aqui, é preferível escrever os dados de ampliação surround no campo de dados auxiliares na sintaxe bit stream MP3 padronizada, como um bitstream MP3 surround é obtido.
[0054] A Fig. 2 mostra uma ilustração de um decodificador do invento atuando como um equipamento de dados de entrada para processamento inverso recebido em uma porta de dados de entrada 22. Os dados recebidos na porta dos dados de entrada 22 são os mesmos dados de saída da porta dos dados de saída 20 da Fig. 1. De maneira alternativa, quando os dados não são transmitidos por canal com fio mas por canal sem fio, os dados recebidos na porta de entrada de dados 22 são derivados dos dados dos dados originais produzidos pelo codificador.
[0055] Os dados de entrada do decodificador são inseridos na leitora data stream 24 para a leitura dos dados de entrada e finalmente obter as informações colaterais de canal 26 e do canal downmix esquerdo 28 e do canal downmix direito 30. Caso os dados de entrada incluírem versões codificadas dos canais downmix, que correspondam ao caso em que o codificador de áudio 16 da Fig. 1 está presente, a leitora data stream 24
Petição 870180156216, de 28/11/2018, pág. 26/37
24/34 também inclui um decodifiçador de áudio, adaptado ao codificador de áudio usado para a codificação dos canais downmix. Nesse caso, o decodifiçador de áudio, que faz parte da leitora data stream 24, é operativo para gerar o primeiro canal downmix Lc e o segundo canal downmix Rc, ou, melhor explicado, uma versão decodificada desses canais. Para uma descrição mais fácil, a distinção entre sinais e suas versões decodificadas é feita
somente quando explicitamente declarada.
[0056] As informações colaterais de canal 26 e os
canais downmix esquerdo e direito 28 e 30 produzidos pela
leitora data stream 24 são alimentados em um reconstrutor
multicanais 32 para prover uma versão reconstruída 34 dos sinais originais de áudio, que podem ser reproduzidos por meio de um player multicanais 36. No caso em que o reconstrutor multicanais estiver operativo no domínio da freqüência, o player multicanais 36 receberá os dados de entrada do domínio de freqüência, que devem ser de certa forma decodificados como convertidos no domínio de tempo antes de serem reproduzidos. Para essa finalidade, o player multicanais 36 pode também incluir dispositivos para decodificação.
[0057] Deve ser notado aqui que o decodif içador de menor escala somente terá a leitora data stream 24, que somente reproduz os canais downmix esquerdo e direito 28 e 30 em saída estéreo 38. Entretanto, o decodifiçador ampliado da invenção extrairá as informações colaterais de canal 26 e usará essas informações colaterais e os canais downmix 28 e 30 para reconstruir as versões reconstruídas 34 dos canais originais usando o reconstrutor multicanais 32.
Petição 870180156216, de 28/11/2018, pág. 27/37
25/34 [0058] A Fig. 3A mostra uma configuração da calculadora do invento 14 para o cálculo das informações colaterais de canal que, um codificador de áudio por um lado e a calculadora de informações colaterais de canal pelo outro lado operam na mesma representação espectral do sinal multicanais. Entretanto, a Fig.
mostra a outra alternativa, na qual o codificador de áudio por um lado e a calculadora de informações colaterais de canal pelo outro lado operam em diferentes representações espectrais do sinal multicanais.
Quando a computação de recursos não é tão importante quanto a qualidade de áudio, é preferida alternativa da Fig.l, já que podem ser usados os bancos de filtros otimizados individualmente para codificação de áudio cálculo de informações colaterais. Entretanto, quando os recursos de computação forem um problema, é preferida alternativa da Fig. 3A, já que essa alternativa requer menos potência de computação devido à utilização compartilhada dos elementos.
[0059]
O dispositivo mostrado na Fig. 3A é operativo para a recepção de dois canais
A, B. O dispositivo mostrado na
Fig. 3A é operativo para calcular as informações colaterais para o canal B, de maneira que usando essas informações colaterais de canal para o canal original selecionado B, pode ser calculada uma versão reconstruída do canal B a partir do sinal do canal A. Além disso, o dispositivo mostrado na Fig. 3A é operativo para formar informações colaterais de canal no domínio de freqüência, como parâmetros para a pesagem (multiplicando ou processando no tempo como na codificação BCC, p. exemplo) de valores espectrais
Petição 870180156216, de 28/11/2018, pág. 28/37
26/34 ou amostras sub-banda. Para essa finalidade, a calculadora do invento inclui meios de janelamento e de conversão tempo/freqüência 140a para obter uma representação de freqüência de canal A em uma saída 140b ou uma representação de domínio de freqüência do canal B em uma saída 140c.
[0060]
Na configuração preferida, a determinação das informações colaterais (pelo meio de determinação de informações colaterais 140f) é feita usando valores espectrais quantificados. Depois, também está presente um quantificador 140d que, preferencialmente é controlado usando um modelo psicoacústico tendo uma entrada de controle de modelo psicoacústico
140e.
Não obstante, não é necessário um quantificador quando os meios de determinação de informações colaterais 140c usam uma representação não quantificada do canal
A para determinar as informações colaterais de canal do canal
B.
[0061]
Caso as informações colaterais de canal do canal B forem calculadas por meio de uma representação de domínio de freqüência do canal A e da representação de domínio de freqüência do canal B, os meios de janelamento e de conversão tempo/freqüência 140a podem ser os mesmos que os usados no codificador de áudio baseado no banco de filtros. Nesse caso, quando é considerada a AAC (ISO/IEC 13818-3), são implementados os meios 140a como um banco de filtros MDCT (MDCT = transformada co-seno discreta modificada) com 50% de funcionalidade overlapand-add [sobrepõe e soma].
[0062] Nesse caso, o quantificador 140d é um quantificador iterativo como o usado quando são gerados sinais de áudio codificados mp3 ou AAC. A representação do domínio de
Petição 870180156216, de 28/11/2018, pág. 29/37
27/34 frequência do canal A que, preferencialmente já está quantificado, pode então ser usada diretamente para a codificação entrópica usando um codificador de entropia 140g, que pode ser um codificador base Huffman ou um codificador de entropia implementando codificação aritmética.
[0063] Quando comparada à Fig. 1, a saída do dispositivo na Fig. 3A são as informações colaterais como a 1± para um canal original (correspondendo às informações colaterais de B na saída do dispositivo 140f). O bitstream com codificação entrópica do canal A corresponde, por ex., ao canal codificado downmix esquerdo Lc' na saída do bloco 16 da Fig. 1. Na Fig. 3A torna-se claro que o elemento 14 (Fig. 1), i.e., a calculadora para o cálculo das informações colaterais de canal e do codificador de áudio 16 (Fig. 1) pode ser implementado como um meio separado ou pode ser implementado como uma versão compartilhada, de maneira que ambos os dispositivos compartilhem vários elementos como o banco de filtros MDCT 140a, o quantificador 140e e o codificador de entropia 140g. Naturalmente, caso seja necessário uma transformada diferente, etc., para determinar as informações colaterais de canal, então o codificador 16 e a calculadora 14 (Fig. 1) serão implementados em diferentes dispositivos, tais como ambos os elementos não compartilharem o banco de filtros etc.
[0064] Em geral, o real determinante para o cálculo das informações colaterais (ou geralmente indicados pela calculadora 14) pode ser implementado como um módulo joint stereo como mostrado na Fig. 3B, que opera de acordo com
Petição 870180156216, de 28/11/2018, pág. 30/37
28/34 quaisquer das técnicas de joint stereo como a codificação intensity stereo ou o binaural cue coding.
[0065] Em contraste com esses codificadores intensity stereo da técnica anterior, o meio de determinação do invento 140f não tem que calcular o canal combinado. O canal combinador ou canal portador, como se pode dizer, já existe e é o canal downmix compatível esquerdo Lc ou o canal downmix compatível direito Rc ou uma versão combinada desses canais downmix como Lc + Rc. Portanto, o dispositivo do invento 140f somente tem que calcular as medições de escala para escalar o canal downmix respectivo, de maneira que seja obtido o envelope energia/tempo do respectivo canal original, quando o canal downmix é pesado usando as informações de medição ou, como se pode dizer, as informações direcionais de intensidade.
[0066] Portanto, o módulo joint stereo 140f da Fig. 3B está ilustrado de maneira a receber, como entrada, o canal A combinado, que é o primeiro ou o segundo canal downmix ou uma combinação dos canais downmix, e o canal original selecionado. Esse módulo, naturalmente, reproduz o canal A combinado e os parâmetros joint stereo como informações colaterais de canal de maneira que, usando o canal A combinado e os parâmetros joint stereo possa ser calculada uma aproximação do canal original selecionado.
[0067] De maneira alternativa, o módulo joint stereo 140f pode ser implementado para realizar o binaural cue coding.
[0068] No caso do BCC, o módulo joint stereo 140f é operativo para reproduzir as informações colaterais de canal de maneira que as informações colaterais de canal sejam
Petição 870180156216, de 28/11/2018, pág. 31/37
29/34 quantificadas e codificados os parâmetros ICLD ou ICTD, caracterizado pelo fato de que o canal original selecionado serve como o canal real a ser processado, enquanto o canal downmix respectivo usado para calcular as informações colaterais, como o primeiro, o segundo ou uma combinação do primeiro e do segundo canais downmix seja usada como o canal de referência no sentido da técnica
BCC de codificação/decodificação.
[0069]
Com referência à Fig. 4, é dada uma simples implementação direcionada para energia do elemento
140f. Esse dispositivo inclui um seletor de banda de freqüência 44 que seleciona uma banda de freqüência do canal
A e uma banda de freqüência correspondente do canal
B. Depois, em ambas as bandas de freqüência, é calculada uma energia por meio de uma calculadora de energia para cada ramal. A implementação detalhada da calculadora de energia 42 dependerá de ser o sinal do bloco 40 é um sinal de sub-banda ou são coeficientes de freqüência.
Em outras implementações, onde são calculados os fatores de usar já os escala para as bandas de fator de escala, pode-se fatores de escala do primeiro e do segundo canais A,
B como valores de energia EA e EB ou pelo menos como estimativas de energia. Em um dispositivo de cálculo de fator de ganho 44, é determinado um fator de ganho gB para a banda selecionada de freqüência com base em uma determinada regra, como a regra de determinação de ganho ilustrada no bloco 44 da Fig. 4. Aqui, o fator de ganho gB pode ser usado diretamente para pesar amostras de domínio de tempo ou coeficientes de freqüência, como será descrito posteriormente na Fig. 5. Para esse fim, o fator de
Petição 870180156216, de 28/11/2018, pág. 32/37
30/34 ganho gB, que é válido para a banda selecionada de freqüência é usado como informações colaterais de canal para o canal B sendo o canal original selecionado. Esse canal original selecionado B não será transmitido ao decodificador, mas será representado pelas informações colaterais de canal paramétrico calculadas pela calculadora 14 da Fig. 1.
[0070] Deve ser aqui notado que não é necessário transmitir valores de ganho como informações colaterais de canal. É também suficiente transmitir valores dependentes de freqüência relativos à energia absoluta do canal original selecionado. Depois, o decodificador deve calcular a energia real do canal downmix e o fator de ganho baseado na energia do canal downmix e na energia transmitida para o canal B.
[0071] A Fig. 5 mostra uma possível implementação de uma montagem de decodificador em conexão com um codificador de áudio perceptual baseado em transformada. Comparado com a Fig. 2, as funcionalidades do decodificador de entropia e do quantificador inverso 50 (Fig. 5) serão incluídas no bloco 24 da Fig. 2. A funcionalidade dos elementos conversores de freqüência/tempo 52a, 52b (Fig. 5) será, entretanto implementada no item 36 da Fig. 2. O elemento 50 da Fig. 5 recebe uma versão codificada do primeiro ou do segundo sinal downmix Lc' ou Rc'. Na saída do elemento 50, uma versão pelo menos parcialmente decodificada do primeiro e do segundo canais downmix está presente, sendo subsequentemente denominada de canal A. O canal A é uma entrada em um seletor de banda de freqüência 54 para a seleção de uma determinada banda de freqüência do canal A. Essa banda selecionada de freqüência é pesada usando um multiplicador
Petição 870180156216, de 28/11/2018, pág. 33/37
31/34
56. 0 multiplicador 56 recebe, para a multiplicação, um determinado fator de ganho gB, que é indicado para a banda de freqüência selecionada pelo seletor de banda de freqüência 54, que corresponde ao seletor de banda de freqüência 40 da Fig. 4 no lado do codificador. Na entrada do conversor freqüência tempo 52a, existe, juntamente com outras bandas, uma representação de domínio de freqüência do canal A. Na saída do multiplicador 56 e, em particular na entrada do meio de conversão freqüência/tempo 52b será reconstruída a representação de domínio de freqüência do canal B. Portanto, na saída do elemento 52a, será feita uma representação de domínio de tempo para o canal A, enquanto na saída do elemento 52b, haverá uma representação de domínio de tempo do canal B reconstruído.
[0072] Deve ser aqui notado que, dependendo de uma determinada implementação, o canal downmix decodificado Lc ou Rc não tem playback em um decodificador ampliado multicanais. Em tal decodificador ampliado multicanais, os canais downmix decodificados são somente usados para reconstruir os canais originais. Os canais downmix originais são somente reproduzidos em decodificadores somente estéreo de menor escala.
[0073] Para isso, é feita referência à Fig. 9, que mostra a implementação preferida da presente invenção em um ambiente surround/mp3. Um bitstream surround ampliado mp3 é inserido em um decodificador mp3 padrão 24, que reproduz versões decodificadas dos canais downmix originais. Esses canais downmix podem então ser diretamente reproduzidos por meio de um decodificador de baixo nível. De maneira alternativa, esses dois canais são inseridos no dispositivo decodificador joint stereo
Petição 870180156216, de 28/11/2018, pág. 34/37
32/34 avançado 32, que também recebe os dados de extensão multicanais, que são, preferencialmente, inseridos no campo de dados auxiliares em um bitstream conforme mp3.
[0074] Subseqüentemente, é feita referência à Fig. 7 mostrando o agrupamento do canal original selecionado e o respectivo canal downmix ou canal downmix combinado. A esse respeito, a coluna direita da tabela da Fig. 7 corresponde ao canal A da Fig. 3A, 3B, 4 e 5, enquanto a coluna do meio corresponde ao canal B nessas figuras. Na coluna esquerda da Fig. 7, as respectivas informações colaterais de canal são explicitamente declaradas. De acordo com a tabela da Fig. 7, as informações colaterais de canal li do canal original esquerdo L
são calculadas usando o canal downmix esquerdo Lc. As
informações colaterais do canal surround esquerdo lsi são
determinadas por meio do canal surround esquerdo original
selecionado Ls e o canal downmix esquerdo Lc é o portador. As informações colaterais do canal direito r^ do canal direito original R são determinadas usando o canal downmix direito Rc. Além disso, as informações colaterais de canal do canal surround direito Rs são determinadas usando o canal downmix direito Rc como portador. Finalmente, as informações colaterais de canal Ci do canal central C são determinadas usando o canal downmix combinado, que são obtidas por meio de uma combinação do primeiro e do segundo canais downmix, que podem ser facilmente calculadas tanto em um codificador como em um decodificador e que não exigem bits extra para transmissão.
[0075] Naturalmente, também é possível calcular as informações colaterais de canal para os canal esquerdo, por
Petição 870180156216, de 28/11/2018, pág. 35/37
33/34 exemplo, baseado em um canal downmix combinado ou mesmo em um canal downmix, que é obtido por uma adição pesada do primeiro e do segundo canais downmix, como 0,7 Lc e 0,3 Rc, enquanto os parâmetros de pesaqem são conhecidos de um decodificador ou transmitidos de acordo. Para a maioria das aplicações, entretanto, será preferível somente derivar informações colaterais de canal para o canal central a partir do canal downmix combinado, i.e., a partir de uma combinação do primeiro e do segundo canais downmix.
[0076] Para demonstrar o potencial de economia de bits da presente invenção, é dado o seguinte exemplo típico. No caso de um sinal de áudio de cinco canais, um codificador comum precisa de uma taxa de bit de 64 kbit/s para cada canal, totalizando uma taxa de bit total de 320 kbit/s para o sinal dos cinco canais. Os sinais estéreo esquerdo e direito requerem uma taxa de bit de 128 kbit/s. As informações colaterais dos canais para um canal ficam entre 1,5 e 2 kbit/s. Portanto, mesmo em um caso em que sejam transmitidas as informações colaterais de canal dos cinco canais, esses dados adicionais somam-se a somente 7,5 a 10 kbit/s. Portanto, o conceito inventivo permite a transmissão de um sinal de áudio de cinco canais usando uma taxa de bit de 138 kbit/s (comparado a 320 (!) kbit/s) com boa qualidade, já que o decodificador não usa a problemática operação de dematrixing. Provavelmente ainda mais importante é o fato de que o conceito inventivo é totalmente compatível backward, já que cada um dos mp3 players pode reproduzir o primeiro canal downmix e o segundo canal downmix para produzir uma reprodução estéreo convencional.
Petição 870180156216, de 28/11/2018, pág. 36/37
34/34 [0077] Dependendo do ambiente da aplicação, o método inventivo para o processamento ou para o processamento inverso pode ser implementado em hardware ou software. A implementação pode ser um meio de armazenagem digital como um disco ou um CD com sinais de controle de leitura eletrônica, que pode cooperar com um sistema de computador programável de maneira que o método do invento para o processamento ou o processamento inverso seja realizado. No geral, portanto, a invenção também se relaciona com um produto de programa de computador dotado de um código de programa armazenado em um portador com leitura por máquina, o código do programa sendo adaptado para realizar o método inventivo, quando o produto de programa de computador opera em um computador. Em outras palavras, a invenção, portanto, também se relaciona com um programa de computador dotado de um código de programa para a realização do método, quando o programa de computador é operado em um computador.

Claims (4)

  1. REIVINDICAÇÕES
    1. Equipamento para o processamento inverso dos dados de entrada, os dados de entrada incluindo informações colaterais de canal, um canal downmix esquerdo ou um sinal derivado do canal downmix esquerdo e um canal downmix direito ou um sinal derivado do canal downmix direito, onde o canal downmix esquerdo e o canal downmix direito se derivam de pelo menos três canais originais de um sinal de áudio multicanais e o resultado, quando reproduzido, é uma representação estéreo do sinal de áudio multicanais, e onde as informações colaterais de canal são calculadas de maneira que um canal downmix ou um canal downmix combinado incluindo o canal downmix esquerdo e o canal downmix direito, quando pesados usando as informações colaterais de canal, resultam em uma aproximação do canal original selecionado, o equipamento compreendendo:
    uma leitora de dados de entrada (24) para ler os dados de entrada para obter o canal downmix esquerdo ou um sinal derivado do canal downmix esquerdo e o canal downmix direito ou a sinal derivado do canal downmix direito e as informações colaterais de canal; e um reconstrutor de canais (32) para a reconstrução da aproximação do canal original selecionado usando as informações colaterais de canal e o canal downmix ou o canal downmix combinado para obter a aproximação do canal original selecionado,
    Petição 870180134895, de 26/09/2018, pág. 49/116
  2. 2/3 caracterizado pelas informações colaterais de canal serem informações colaterais paramétricas e pelo canal reconstrutor (32) ser configurado para usar as informações colaterais paramétricas.
    2. Equipamento em conformidade com a reivindicação 1, caracterizado pelo fato de compreender ainda um decodificador perceptual (24) para a decodificação do sinal derivado do canal downmix esquerdo para obter a versão decodificada do canal downmix esquerdo e para a decodificação do sinal derivado do canal downmix direito para obter uma versão decodificada do canal downmix direito.
  3. 3. Equipamento em conformidade com a reivindicação 1 ou 2, caracterizado pelo fato de compreender ainda um combinador para combinar o canal downmix esquerdo e o canal downmix direito para obter o canal downmix combinado.
  4. 4. Método para o processamento inverso dos dados de entrada, o método incluindo informação colateral do canal, um canal de downmix esquerdo ou um sinal derivado do canal de downmix esquerdo e um canal de downmix direito ou um sinal derivado do canal de downmix direito, caracterizado pelo canal de downmix esquerdo e o canal de downmix direito serem derivados de, pelo menos, três canais originais de um sinal de áudio multicanal e resultado, quando reproduzido, em uma representação estéreo do sinal de áudio multicanal e em que a informação colateral do canal é calculada, de modo
    Petição 870180134895, de 26/09/2018, pág. 50/116
    3/3 que um canal de downmix ou um canal de downmix combinado, incluindo o canal de downmix esquerdo e o canal de downmix direito, quando ponderados utilizando a informação colateral do canal, resulte em uma aproximação do canal original selecionado, o método compreendendo:
    leitura (24) dos dados de entrada para obter o canal de downmix esquerdo ou um sinal derivado do canal de downmix esquerdo e o canal de downmix direito ou um sinal derivado do canal de downmix direito e a informação colateral do canal; e reconstrução (32) da aproximação do canal original selecionado, utilizando a informação colateral do canal e do canal de downmix ou do canal de downmix combinado para obter a aproximação do canal original selecionado.
BR122018069728-8A 2003-10-02 2004-09-30 Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada BR122018069728B1 (pt)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US10/679,085 US7447317B2 (en) 2003-10-02 2003-10-02 Compatible multi-channel coding/decoding by weighting the downmix channel
US10/679,085 2003-10-02
BRPI0414757A BRPI0414757B1 (pt) 2003-10-02 2004-09-30 equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada
PCT/EP2004/010948 WO2005036925A2 (en) 2003-10-02 2004-09-30 Compatible multi-channel coding/decoding

Publications (1)

Publication Number Publication Date
BR122018069728B1 true BR122018069728B1 (pt) 2019-03-19

Family

ID=34394093

Family Applications (5)

Application Number Title Priority Date Filing Date
BR122018069726-1A BR122018069726B1 (pt) 2003-10-02 2004-09-30 Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada
BR122018069731-8A BR122018069731B1 (pt) 2003-10-02 2004-09-30 Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada.
BR122018069728-8A BR122018069728B1 (pt) 2003-10-02 2004-09-30 Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada
BR122018069730-0A BR122018069730B1 (pt) 2003-10-02 2004-09-30 Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada.
BRPI0414757A BRPI0414757B1 (pt) 2003-10-02 2004-09-30 equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada

Family Applications Before (2)

Application Number Title Priority Date Filing Date
BR122018069726-1A BR122018069726B1 (pt) 2003-10-02 2004-09-30 Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada
BR122018069731-8A BR122018069731B1 (pt) 2003-10-02 2004-09-30 Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada.

Family Applications After (2)

Application Number Title Priority Date Filing Date
BR122018069730-0A BR122018069730B1 (pt) 2003-10-02 2004-09-30 Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada.
BRPI0414757A BRPI0414757B1 (pt) 2003-10-02 2004-09-30 equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada

Country Status (18)

Country Link
US (11) US7447317B2 (pt)
EP (1) EP1668959B1 (pt)
JP (1) JP4547380B2 (pt)
KR (1) KR100737302B1 (pt)
CN (1) CN1864436B (pt)
AT (1) ATE350879T1 (pt)
BR (5) BR122018069726B1 (pt)
CA (1) CA2540851C (pt)
DE (1) DE602004004168T2 (pt)
DK (1) DK1668959T3 (pt)
ES (1) ES2278348T3 (pt)
HK (1) HK1092001A1 (pt)
IL (1) IL174286A (pt)
MX (1) MXPA06003627A (pt)
NO (8) NO347074B1 (pt)
PT (1) PT1668959E (pt)
RU (1) RU2327304C2 (pt)
WO (1) WO2005036925A2 (pt)

Families Citing this family (152)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
WO2003046891A1 (en) 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
KR20050116828A (ko) * 2003-03-24 2005-12-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 다채널 신호를 나타내는 주 및 부 신호의 코딩
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
CN1922654A (zh) * 2004-02-17 2007-02-28 皇家飞利浦电子股份有限公司 音频分发系统、音频编码器、音频解码器及其操作方法
DE102004009628A1 (de) * 2004-02-27 2005-10-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Beschreiben einer Audio-CD und Audio-CD
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
WO2005086139A1 (en) * 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding
RU2396608C2 (ru) * 2004-04-05 2010-08-10 Конинклейке Филипс Электроникс Н.В. Способ, устройство, кодирующее устройство, декодирующее устройство и аудиосистема
WO2005098824A1 (en) * 2004-04-05 2005-10-20 Koninklijke Philips Electronics N.V. Multi-channel encoder
CN102122509B (zh) * 2004-04-05 2016-03-23 皇家飞利浦电子股份有限公司 多信道解码器和多信道解码方法
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
CA2566366C (en) * 2004-05-19 2013-08-06 Matsushita Electric Industrial Co. Ltd. Audio signal encoder and audio signal decoder
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
JPWO2006004048A1 (ja) * 2004-07-06 2008-04-24 松下電器産業株式会社 オーディオ信号符号化装置、オーディオ信号復号化装置、方法、及びプログラム
US7751804B2 (en) * 2004-07-23 2010-07-06 Wideorbit, Inc. Dynamic creation, selection, and scheduling of radio frequency communications
TWI498882B (zh) * 2004-08-25 2015-09-01 Dolby Lab Licensing Corp 音訊解碼器
WO2006035705A1 (ja) * 2004-09-28 2006-04-06 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
SE0402652D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
CN1989563B (zh) * 2005-02-01 2011-06-22 松下电器产业株式会社 再现装置、程序和再现方法
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
CN101151660B (zh) * 2005-03-30 2011-10-19 皇家飞利浦电子股份有限公司 多通道音频编码器、解码器以及相应方法
KR101271069B1 (ko) * 2005-03-30 2013-06-04 돌비 인터네셔널 에이비 다중채널 오디오 인코더 및 디코더와, 인코딩 및 디코딩 방법
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
JP4907522B2 (ja) * 2005-04-28 2012-03-28 パナソニック株式会社 音声符号化装置および音声符号化方法
JP2008542816A (ja) * 2005-05-26 2008-11-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号の符号化及び復号化方法
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
CA2610430C (en) * 2005-06-03 2016-02-23 Dolby Laboratories Licensing Corporation Channel reconfiguration with side information
JP2009500656A (ja) * 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
AU2006266579B2 (en) * 2005-06-30 2009-10-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
AU2006266655B2 (en) * 2005-06-30 2009-08-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
WO2007007263A2 (en) * 2005-07-14 2007-01-18 Koninklijke Philips Electronics N.V. Audio encoding and decoding
US8626503B2 (en) * 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
PL1905006T3 (pl) * 2005-07-19 2014-02-28 Koninl Philips Electronics Nv Generowanie wielokanałowych sygnałów audio
KR101169280B1 (ko) * 2005-08-30 2012-08-02 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
JP4859925B2 (ja) * 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
US7761303B2 (en) * 2005-08-30 2010-07-20 Lg Electronics Inc. Slot position coding of TTT syntax of spatial audio coding application
CN101253556B (zh) * 2005-09-02 2011-06-22 松下电器产业株式会社 能量整形装置以及能量整形方法
TWI462086B (zh) * 2005-09-14 2014-11-21 Lg Electronics Inc 音頻訊號之解碼方法及其裝置
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
EP1946295B1 (en) 2005-09-14 2013-11-06 LG Electronics Inc. Method and apparatus for decoding an audio signal
EP1943642A4 (en) * 2005-09-27 2009-07-01 Lg Electronics Inc METHOD AND DEVICE FOR CODING / DECODING A MULTI-CHANNEL AUDIO SIGNAL
WO2007039957A1 (ja) * 2005-10-03 2007-04-12 Sharp Kabushiki Kaisha 表示装置
EP1946062A4 (en) * 2005-10-05 2009-09-09 Lg Electronics Inc METHOD AND DEVICE FOR SIGNAL PROCESSING AND CODING AND DECODING METHOD AND DEVICE THEREFOR
US7672379B2 (en) * 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
KR100857121B1 (ko) * 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US8068569B2 (en) * 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
US20070092086A1 (en) * 2005-10-24 2007-04-26 Pang Hee S Removing time delays in signal paths
KR100644715B1 (ko) * 2005-12-19 2006-11-10 삼성전자주식회사 능동적 오디오 매트릭스 디코딩 방법 및 장치
US8111830B2 (en) * 2005-12-19 2012-02-07 Samsung Electronics Co., Ltd. Method and apparatus to provide active audio matrix decoding based on the positions of speakers and a listener
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
KR100803212B1 (ko) 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
EP1974347B1 (en) * 2006-01-19 2014-08-06 LG Electronics Inc. Method and apparatus for processing a media signal
KR101366291B1 (ko) * 2006-01-19 2014-02-21 엘지전자 주식회사 신호 디코딩 방법 및 장치
WO2007091850A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
KR20080093422A (ko) * 2006-02-09 2008-10-21 엘지전자 주식회사 오브젝트 기반 오디오 신호의 부호화 및 복호화 방법과 그장치
CN101390443B (zh) * 2006-02-21 2010-12-01 皇家飞利浦电子股份有限公司 音频编码和解码
BRPI0706488A2 (pt) * 2006-02-23 2011-03-29 Lg Electronics Inc método e aparelho para processar sinal de áudio
KR100773560B1 (ko) 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
KR100773562B1 (ko) * 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
JP2009532712A (ja) * 2006-03-30 2009-09-10 エルジー エレクトロニクス インコーポレイティド メディア信号処理方法及び装置
KR20080086549A (ko) * 2006-04-03 2008-09-25 엘지전자 주식회사 미디어 신호 처리 방법 및 장치
US8027479B2 (en) 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
EP2112652B1 (en) * 2006-07-07 2012-11-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for combining multiple parametrically coded audio sources
KR101438387B1 (ko) * 2006-07-12 2014-09-05 삼성전자주식회사 서라운드 확장 데이터 부호화 및 복호화 방법 및 장치
KR100763920B1 (ko) 2006-08-09 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치
US7907579B2 (en) * 2006-08-15 2011-03-15 Cisco Technology, Inc. WiFi geolocation from carrier-managed system geolocation of a dual mode device
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US20080061578A1 (en) * 2006-09-07 2008-03-13 Technology, Patents & Licensing, Inc. Data presentation in multiple zones using a wireless home entertainment hub
US9233301B2 (en) 2006-09-07 2016-01-12 Rateze Remote Mgmt Llc Control of data presentation from multiple sources using a wireless home entertainment hub
US9319741B2 (en) * 2006-09-07 2016-04-19 Rateze Remote Mgmt Llc Finding devices in an entertainment system
US9386269B2 (en) 2006-09-07 2016-07-05 Rateze Remote Mgmt Llc Presentation of data on multiple display devices using a wireless hub
US8607281B2 (en) 2006-09-07 2013-12-10 Porto Vinci Ltd. Limited Liability Company Control of data presentation in multiple zones using a wireless home entertainment hub
US8935733B2 (en) * 2006-09-07 2015-01-13 Porto Vinci Ltd. Limited Liability Company Data presentation using a wireless home entertainment hub
US8005236B2 (en) * 2006-09-07 2011-08-23 Porto Vinci Ltd. Limited Liability Company Control of data presentation using a wireless home entertainment hub
US8966545B2 (en) 2006-09-07 2015-02-24 Porto Vinci Ltd. Limited Liability Company Connecting a legacy device into a home entertainment system using a wireless home entertainment hub
WO2008046530A2 (en) * 2006-10-16 2008-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
EP2054875B1 (en) * 2006-10-16 2011-03-23 Dolby Sweden AB Enhanced coding and parameter representation of multichannel downmixed object coding
KR100847453B1 (ko) * 2006-11-20 2008-07-21 주식회사 대우일렉트로닉스 입체 음향을 위한 적응 간섭 제거 방법
WO2008069584A2 (en) * 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
JP2010516077A (ja) * 2007-01-05 2010-05-13 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
JP5291096B2 (ja) * 2007-06-08 2013-09-18 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
US8170218B2 (en) 2007-10-04 2012-05-01 Hurtado-Huyssen Antoine-Victor Multi-channel audio treatment system and method
EP2128856A4 (en) * 2007-10-16 2011-11-02 Panasonic Corp DEVICE FOR PRODUCING A STREAM AND DECODING DEVICE AND CORRESPONDING METHOD
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
KR101438389B1 (ko) * 2007-11-15 2014-09-05 삼성전자주식회사 오디오 매트릭스 디코딩 방법 및 장치
CA2705968C (en) * 2007-11-21 2016-01-26 Lg Electronics Inc. A method and an apparatus for processing a signal
US8600532B2 (en) 2007-12-09 2013-12-03 Lg Electronics Inc. Method and an apparatus for processing a signal
TWI424755B (zh) * 2008-01-11 2014-01-21 Dolby Lab Licensing Corp 矩陣解碼器
KR100998913B1 (ko) * 2008-01-23 2010-12-08 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
EP2083584B1 (en) * 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
US8615316B2 (en) * 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal
JP5340261B2 (ja) * 2008-03-19 2013-11-13 パナソニック株式会社 ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
EP2154911A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
KR101335975B1 (ko) * 2008-08-14 2013-12-04 돌비 레버러토리즈 라이쎈싱 코오포레이션 복수의 오디오 입력 신호를 리포맷팅하는 방법
WO2010038318A1 (en) * 2008-10-01 2010-04-08 Thomson Licensing Decoding apparatus, decoding method, encoding apparatus, encoding method, and editing apparatus
EP2175670A1 (en) 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
US9330671B2 (en) * 2008-10-10 2016-05-03 Telefonaktiebolaget L M Ericsson (Publ) Energy conservative multi-channel audio coding
KR101513042B1 (ko) * 2008-12-02 2015-04-17 엘지전자 주식회사 신호 전송 방법 및 전송 장치
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
US8774417B1 (en) * 2009-10-05 2014-07-08 Xfrm Incorporated Surround audio compatibility assessment
EP2323130A1 (en) 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
PL3779979T3 (pl) * 2010-04-13 2024-01-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sposób dekodowania audio do przetwarzania sygnałów audio stereo z wykorzystaniem zmiennego kierunku predykcji
DE102010015630B3 (de) * 2010-04-20 2011-06-01 Institut für Rundfunktechnik GmbH Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates
KR101748760B1 (ko) * 2011-03-18 2017-06-19 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치
CN103890841B (zh) * 2011-11-01 2017-10-17 皇家飞利浦有限公司 音频对象编码和解码
US9131313B1 (en) * 2012-02-07 2015-09-08 Star Co. System and method for audio reproduction
EP2645748A1 (en) 2012-03-28 2013-10-02 Thomson Licensing Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal
US20150371643A1 (en) * 2012-04-18 2015-12-24 Nokia Corporation Stereo audio signal encoder
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
US9516446B2 (en) 2012-07-20 2016-12-06 Qualcomm Incorporated Scalable downmix design for object-based surround codec with cluster analysis by synthesis
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
EP2885929A1 (en) * 2012-08-16 2015-06-24 Turtle Beach Corporation Multi-dimensional parametric audio system and method
MY172752A (en) * 2013-01-29 2019-12-11 Fraunhofer Ges Forschung Decoder for generating a frequency enhanced audio signal, method of decoding encoder for generating an encoded signal and method of encoding using compact selection side information
CN109887516B (zh) * 2013-05-24 2023-10-20 杜比国际公司 对音频场景进行解码的方法、音频解码器以及介质
CN105393304B (zh) 2013-05-24 2019-05-28 杜比国际公司 音频编码和解码方法、介质以及音频编码器和解码器
US9883312B2 (en) 2013-05-29 2018-01-30 Qualcomm Incorporated Transformed higher order ambisonics audio data
EP2830051A3 (en) * 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
TWI671734B (zh) 2013-09-12 2019-09-11 瑞典商杜比國際公司 在包含三個音訊聲道的多聲道音訊系統中之解碼方法、編碼方法、解碼裝置及編碼裝置、包含用於執行解碼方法及編碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置及編碼裝置的音訊系統
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
KR102160254B1 (ko) * 2014-01-10 2020-09-25 삼성전자주식회사 액티브다운 믹스 방식을 이용한 입체 음향 재생 방법 및 장치
US9344825B2 (en) 2014-01-29 2016-05-17 Tls Corp. At least one of intelligibility or loudness of an audio program
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
CN104486033B (zh) * 2014-12-03 2017-09-29 重庆邮电大学 一种基于c‑ran平台的下行多模信道编码系统及方法
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
BR112019009424A2 (pt) 2016-11-08 2019-07-30 Fraunhofer Ges Forschung mixador de redução, método para mixagem de redução de pelo menos dois canais, codificador multicanal, método para codificar um sinal multicanal, sistema e método de processamento de áudio
CN111034225B (zh) * 2017-08-17 2021-09-24 高迪奥实验室公司 使用立体混响信号的音频信号处理方法和装置
CN111615044B (zh) * 2019-02-25 2021-09-14 宏碁股份有限公司 声音信号的能量分布修正方法及其系统
JP7416816B2 (ja) * 2019-03-06 2024-01-17 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ダウンミキサ及びダウンミックス方法
US10779105B1 (en) 2019-05-31 2020-09-15 Apple Inc. Sending notification and multi-channel audio over channel limited link for independent gain control

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
EP0631458B1 (en) * 1993-06-22 2001-11-07 Deutsche Thomson-Brandt Gmbh Method for obtaining a multi-channel decoder matrix
ES2165370T3 (es) 1993-06-22 2002-03-16 Thomson Brandt Gmbh Metodo para obtener una matriz decodificadora multicanal.
CA2124379C (en) 1993-06-25 1998-10-27 Thomas F. La Porta Distributed processing architecture for control of broadband and narrowband communications networks
DE4409368A1 (de) 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
JP3397001B2 (ja) * 1994-06-13 2003-04-14 ソニー株式会社 符号化方法及び装置、復号化装置、並びに記録媒体
EP0688113A2 (en) 1994-06-13 1995-12-20 Sony Corporation Method and apparatus for encoding and decoding digital audio signals and apparatus for recording digital audio
DE69618633T2 (de) 1995-10-09 2002-05-08 Matsushita Electric Ind Co Ltd Optische Platte und Gerät zur Wiedergabe optischer Platten
JP3790550B2 (ja) 1996-02-08 2006-06-28 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴイ 5チャネル送信及び2チャネル送信に対応可能な7チャネル送信
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
SG54379A1 (en) * 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
US6449368B1 (en) * 1997-03-14 2002-09-10 Dolby Laboratories Licensing Corporation Multidirectional audio decoding
JP3657120B2 (ja) 1998-07-30 2005-06-08 株式会社アーニス・サウンド・テクノロジーズ 左,右両耳用のオーディオ信号を音像定位させるための処理方法
JP2000214887A (ja) * 1998-11-16 2000-08-04 Victor Co Of Japan Ltd 音声符号化装置、光記録媒体、音声復号装置、音声伝送方法及び伝送媒体
US6928169B1 (en) * 1998-12-24 2005-08-09 Bose Corporation Audio signal processing
US6442517B1 (en) * 2000-02-18 2002-08-27 First International Digital, Inc. Methods and system for encoding an audio sequence with synchronized data and outputting the same
JP4304401B2 (ja) * 2000-06-07 2009-07-29 ソニー株式会社 マルチチャンネルオーディオ再生装置
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
JP4062905B2 (ja) * 2001-10-24 2008-03-19 ヤマハ株式会社 ディジタル・ミキサ
US7333930B2 (en) * 2003-03-14 2008-02-19 Agere Systems Inc. Tonal analysis for perceptual audio coding using a compressed spectral representation
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
WO2006060279A1 (en) * 2004-11-30 2006-06-08 Agere Systems Inc. Parametric coding of spatial audio with object-based side information

Also Published As

Publication number Publication date
CA2540851A1 (en) 2005-04-21
US7447317B2 (en) 2008-11-04
NO20061898L (no) 2006-06-30
NO20180991A1 (no) 2006-06-30
JP2007507731A (ja) 2007-03-29
US20180359589A1 (en) 2018-12-13
CA2540851C (en) 2012-05-01
DK1668959T3 (da) 2007-04-10
NO20180993A1 (no) 2006-06-30
CN1864436B (zh) 2011-05-11
US20190239018A1 (en) 2019-08-01
US20190239017A1 (en) 2019-08-01
US11343631B2 (en) 2022-05-24
US10165383B2 (en) 2018-12-25
BRPI0414757A (pt) 2006-11-28
NO344091B1 (no) 2019-09-02
AU2004306509A1 (en) 2005-04-21
NO347074B1 (no) 2023-05-08
PT1668959E (pt) 2007-04-30
WO2005036925A3 (en) 2005-07-14
RU2327304C2 (ru) 2008-06-20
JP4547380B2 (ja) 2010-09-22
US20050074127A1 (en) 2005-04-07
MXPA06003627A (es) 2006-06-05
RU2006114742A (ru) 2007-11-20
US20190110146A1 (en) 2019-04-11
US10237674B2 (en) 2019-03-19
NO344760B1 (no) 2020-04-14
US20090003612A1 (en) 2009-01-01
EP1668959A2 (en) 2006-06-14
DE602004004168D1 (de) 2007-02-15
IL174286A0 (en) 2006-08-01
HK1092001A1 (en) 2007-01-26
US20160078872A1 (en) 2016-03-17
KR20060060052A (ko) 2006-06-02
US20190239016A1 (en) 2019-08-01
IL174286A (en) 2010-12-30
NO20180978A1 (no) 2006-06-30
NO20180990A1 (no) 2006-06-30
NO345265B1 (no) 2020-11-23
BR122018069731B1 (pt) 2019-07-09
NO344093B1 (no) 2019-09-02
US20190379990A1 (en) 2019-12-12
ES2278348T3 (es) 2007-08-01
BRPI0414757B1 (pt) 2018-12-26
KR100737302B1 (ko) 2007-07-09
US10206054B2 (en) 2019-02-12
US9462404B2 (en) 2016-10-04
US20130016843A1 (en) 2013-01-17
US8270618B2 (en) 2012-09-18
EP1668959B1 (en) 2007-01-03
ATE350879T1 (de) 2007-01-15
NO20180980A1 (no) 2006-06-30
NO20191058A1 (no) 2006-06-30
DE602004004168T2 (de) 2007-10-11
US10299058B2 (en) 2019-05-21
CN1864436A (zh) 2006-11-15
US10425757B2 (en) 2019-09-24
BR122018069730B1 (pt) 2019-03-19
NO344635B1 (no) 2020-02-17
US10455344B2 (en) 2019-10-22
WO2005036925A2 (en) 2005-04-21
BR122018069726B1 (pt) 2019-03-19
NO20200106A1 (no) 2006-06-30
NO344483B1 (no) 2020-01-13
US20180359588A1 (en) 2018-12-13
US10433091B2 (en) 2019-10-01
NO342804B1 (no) 2018-08-06

Similar Documents

Publication Publication Date Title
US11343631B2 (en) Compatible multi-channel coding/decoding
BRPI0506533B1 (pt) equipamento e método para a construção de um sinal de saída multicanais ou para a geração de um sinal downmix
AU2004306509B2 (en) Compatible multi-channel coding/decoding

Legal Events

Date Code Title Description
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 19/03/2019, OBSERVADAS AS CONDICOES LEGAIS.