BR122018069731B1 - Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada. - Google Patents

Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada. Download PDF

Info

Publication number
BR122018069731B1
BR122018069731B1 BR122018069731-8A BR122018069731A BR122018069731B1 BR 122018069731 B1 BR122018069731 B1 BR 122018069731B1 BR 122018069731 A BR122018069731 A BR 122018069731A BR 122018069731 B1 BR122018069731 B1 BR 122018069731B1
Authority
BR
Brazil
Prior art keywords
channel
downmix
channels
collateral
information
Prior art date
Application number
BR122018069731-8A
Other languages
English (en)
Inventor
Juergen Herre
Johannes Hilpert
Stefan Geyersberger
Andreas Hoelzer
Claus Spenger
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=34394093&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=BR122018069731(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. filed Critical Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V.
Publication of BR122018069731B1 publication Critical patent/BR122018069731B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Error Detection And Correction (AREA)
  • Executing Machine-Instructions (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

no processamento de um sinal de áudio multicanais tendo pelo menos três canais originais, são providos um primeiro canal downmix e um segundo canal downmix (12), que se derivam dos canais originais. para um canal original selecionado dos canais originais, são calculadas as informações colaterais de canal (14) de maneira que um canal downmix ou um canal downmix combinado incluindo o primeiro e o segundo canais downmix, quando pesados usando as informações colaterais de canal, resulta em uma aproximação do canal original selecionado. as informações colaterais de canal e o primeiro e o segundo canais downmix formam os dados de saída (20) a ser transmitidos a um decodificador que, no caso de um decodificador de baixo nível somente decodifica o primeiro e o segundo canais downmix ou, no caso de um decodificador de alto nível, provê total sinal de áudio multicanais baseado nos canais downmix e nas informações colaterais de canal. como as informações colaterais de canal somente ocupam um pequeno número de bits, e como o decodificador não usa dematrixing, é obtida uma extensão eficiente e de alta qualidade multicanais para os stereo players e os players ampliados multicanais.

Description

Campo da invenção [001] A presente invenção se refere a um aparelho e um método para o processamento de um sinal de áudio multicanais e, em particular, a um aparelho e um método para o processamento de um sinal de áudio multicanais de maneira estéreo-compatível.
Histórico da Invenção e da Técnica Anterior [002] Atualmente, a técnica de reprodução de áudio multicanais está se tornando mais e mais importante. Isto pode ser devido ao fato de que as técnicas de compressão/codificação de áudio como a bem conhecida técnica MP3 tornaram possível distribuir registros de áudio via Internet ou outros canais de transmissão dotados de largura de banda limitada. A técnica de codificação MP3 tornou-se tão famosa devido ao fato de permitir a distribuição de todos os registros em formato estéreo, isto é, uma representação digital do registro de áudio, incluindo um primeiro canal estéreo (ou canal estéreo esquerdo) e um segundo canal estéreo (ou canal estéreo direito).
[003] Não obstante, existem desvantagens básicas nos sistemas de som convencionais de dois canais. Portanto, foi desenvolvida a técnica surround. Uma representação multicanais surround recomendada inclui, além dos dois canais estéreo L e R, um outro canal central C e dois canais surround Ls, Rs. Esse
Petição 870190031598, de 02/04/2019, pág. 7/40
2/34 formato sonoro de referência é também denominado de estéreo três/dois, que significa três canais frontais e dois canais surround. Em geral, são necessários cinco canais de transmissão. Em um ambiente de playback, são necessários pelo menos cinco auto-falantes nos respectivos cinco diferentes locais para obter-se um local ideal agradável a uma certa distância a partir dos cinco auto-falantes bem localizados.
[004] São conhecidas várias técnicas nesse campo para reduzir a quantidade de dados necessários para a transmissão de um sinal de áudio multicanais. Essas técnicas são denominadas técnicas joint stereo. Para essa finalidade, é feita referência à Fig. 10, que mostra um dispositivo joint stereo 60. Esse dispositivo pode ser um dispositivo de implementação, por exemplo, intensity stereo(IS) ou binaural cue coding (BCC). Esse dispositivo geralmente recebe - como entrada - pelo menos dois canais (CH1, CH2, ... CHn), e emite um único canal portador e dados paramétricos. Os dados paramétricos são definidos de maneira que, em um decodificador, possa ser calculada uma aproximação de um canal original (CH1, CH2, ... CHn) .
[005] Normalmente, o canal portador incluirá amostras sub-banda, coeficientes espectrais, amostra de domínio no tempo, etc, que provêem uma representação comparativamente fina do sinal subjacente, enquanto os dados paramétricos não incluem essas amostras de coeficientes espectrais, mas incluem parâmetros de controle para o controle de um determinado algoritmo de reconstrução, como a pesagem por multiplicação, alteração de tempo, alteração de freqüência,... Os dados paramétricos, portanto, incluem somente uma representação
Petição 870190031598, de 02/04/2019, pág. 8/40
3/34 comparativamente rústica do sinal ou do canal associado. Explicado em números, a quantidade de dados necessária por um canal portador estará na faixa de 60 - 70 kbit/s, enquanto a quantidade de dados necessária pelas informações do lado paramétrico para um canal, estará na faixa de 1,5 - 2,5 kbit/s. Um exemplo de dados paramétricos são os bem conhecidos fatores de escala, as informações de intensity stereo ou binaural cue parameters como será descrito abaixo.
[006] A codificação intensity stereo é descrita na pré-impressão AES 3799, Intensity Stereo Coding, J. Herre, K. H. Brandenburg, D. Lederer, February 1994, Amsterdam. Em geral, o conceito de intensity stereo se baseia em uma transformada de eixo principal a ser aplicada aos dados de ambos os canais estereofônicos de áudio. Se a maioria dos pontos dos dados está concentrada à volta do primeiro eixo principal, pode ser obtido um ganho de codificação pela rotação de ambos os sinais de um determinado ângulo antes da codificação. Entretanto, isto nem sempre é verdade nas técnicas reais de produção estereofônica. Portanto, essa técnica é modificada pela exclusão da segunda componente ortogonal da transmissão no bit stream. Assim, os sinais reconstruídos para os canais esquerdo e direito consistem de versões pesadas ou medidas diferentemente do mesmo sinal transmitido. Não obstante, os sinais reconstruídos diferem em suas amplitudes, mas são idênticos em relação a suas informações de fase. Os envelopes energia-tempo de ambos os canais originais de áudio, entretanto, são preservados por meio de operação de medição seletiva, que tipicamente opera de maneira a selecionar a freqüência. Isto se conforma à percepção humana de som em
Petição 870190031598, de 02/04/2019, pág. 9/40
4/34 altas freqüências, onde os cues espaciais dominantes são determinados pelos envelopes de energia.
[007] Além disso, em implementações práticas, o sinal [008] transmitido, isto é, o canal portador é gerado a partir do sinal de soma do canal esquerdo e do canal direito ao invés de rotacionar ambos os componentes. Também, esse processamento, isto é, a geração de parâmetros intensity stereo para a realização da operação de medição, é feito com seleção de freqüência, isto é, independentemente de cada banda de fator de escala, isto é, da partição de freqüência codificadora. Preferencialmente, ambos os canais são combinados para formarem um canal combinador ou portador, e, além do canal combinador, as informações intensity stereo determinadas dependem da energia do primeiro canal, da energia do segundo canal ou da energia dos canais combinados.
[009] A técnica BCC é descrita no documento convenção da AES 5574, Binaural cue coding applied to stereo and multichannel audio compression, C. Faller, F. Baumgarte, May 2002, Munich. Na codificação BCC, alguns canais de entrada de áudio são convertidos em representação espectral usando uma transformada baseada DTF com janelas superpostas. O espectro uniforme resultante se divide em partições não superpostas, cada qual possuindo um índice. Cada partição tem uma largura de banda proporcional à largura de banda retangular equivalente (ERB). As diferenças de nível intercanais (ICLD) e as diferenças de tempos intercanais (ICTD) são estimadas para cada partição para o mesmo quadro k. O ICLD e o ICTD são quantificados e codificados,
Petição 870190031598, de 02/04/2019, pág. 10/40
5/34 resultando em um bit stream BCC. As diferenças de nível intercanais e as diferenças de tempos intercanais são dadas para cada canal com relação a um canal de referência. Então, os parâmetros são calculados de acordo com as formulas indicadas, que dependem de determinadas partições do sinal a ser processado.
[0010] No lado decodificador, este recebe um monosinal e o bit stream BCC. O mono-sinal é transformado em um domínio de freqüência e entra em um bloco de síntese espacial, que também recebe valores ICLD e ICTD decodificados. No bloco de síntese espacial, os valores dos parâmetros BCC (ICLD e ICTD) são usados para realizar uma operação de pesagem do mono-sinal para sintetizar os sinais multicanais, que após uma conversão freqüência/tempo, representam uma reconstrução do sinal original de áudio multicanais.
[0011] No caso BCC, o módulo joint stereo 60 é operativo para a saída das informações colaterais de canal, de maneira que os dados do canal paramétrico sejam parâmetros ICLD ou ICTD quantificados e codificados, considerando o fato de que um dos canais originais é usado como canal de referência para a codificação das informações colaterais de canal.
[0012] Normalmente, o canal portador é formado pela soma dos canais originais participantes.
[0013] Naturalmente, as técnicas acima somente provêem uma mono representação para um decodificador, que pode somente processar o canal portador, mas não consegue processar os dados paramétricos para a geração de uma ou mais aproximações de mais de um canal de entrada.
Petição 870190031598, de 02/04/2019, pág. 11/40
6/34 [0014] Para a transmissão dos cinco canais de maneira compatível, isto é, em formato bitstream, que também é compreensível para um decodificador estéreo normal, a denominada técnica de matrixing foi usada como descrito em MUSICAM surround: a universal multi-channel coding system compatible with ISO 11172-3, G. Theile and G. Stoll, AES preprint 3403, October 1992, San Francisco. Os cinco canais de entrada L, R, C,
Ls, e Rs são abastecidos em um dispositivo de matrixing e realizam uma operação de matrixing para calcular os canais estéreo compatíveis ou básicos Lo, Ro, a partir dos cinco canais
de entrada. Em particular, esses canais estéreo básicos Lo/Ro
são calculados como indicado abaixo:
Lo = L + xC + yLs
Ro = R + xC + yRs
[0015] x e y sendo constantes. Os outros três canais
C, Ls, Rs são transmitidos como são em uma camada de extensão, além da camada estéreo básica, que inclui uma versão codificada dos sinais estéreo básicos Lo/Ro. Com respeito ao bitstream, essa camada estéreo básica Lo/Ro inclui um cabeçalho, informações como os fatores de escala e as amostras de subbanda. A camada de extensão multicanais, isto é, o canal central e os dois canais surround estão incluídos no campo de extensão multicanais, que também é denominado canal de dados auxiliares.
[0016]
No lado decodificador, é realizada uma operação matrixing inversa para formar reconstruções dos canais esquerdo e direito na representação de cinco canais usando os canais estéreo básicos Lo, Ro e os três canais adicionais. Além disso, os três canais adicionais são decodificados a partir das
Petição 870190031598, de 02/04/2019, pág. 12/40
7/34 informações auxiliares para obter uma representação de cinco canais decodificados ou surround do sinal de áudio multicanais original.
[0017] Outra abordagem de codificação multicanais está descrita na publicação Improved MPEG-2 audio multi-channel encoding, B. Grill, J. Herre, K. H. Brandenburg, E. Eberlein, J. Koller, J. Mueller, AES preprint 3865, February 1994, Amsterdam, na qual, para se obter uma compatibilidade backward, são considerados os modos compatíveis backward. Para esse fim, é usada uma matriz de compatibilidade para obter os dois chamados canais downmix Lc, Rc a partir dos cinco canais originais de entrada. Além disso, é possível selecionar dinamicamente os três canais auxiliares transmitidos como dados auxiliares.
[0018] Para explorar a irrelevância do estéreo, é aplicada uma técnica joint stereo aos grupos de canais, por exemplo, os três canais frontais, isto é, para o canal esquerdo, o canal direito e o canal central. Para isso, esses três canais são combinados para obter um canal combinado. Esse canal combinado é quantificado e embalado no bitstream. Depois, esse canal combinado juntamente com as correspondentes informações joint stereo são colocados em um módulo de decodificação joint stereo para obter os canais decodificados joint stereo isto é, um canal esquerdo decodificado joint stereo, um canal direito decodificado joint stereo e um canal central decodificado joint stereo. Esses canais decodificados joint stereo, juntamente com o canal surround esquerdo e o canal surround direito entram em um bloco matriz de compatibilidade para formar o primeiro e o segundo canais downmix Lc, Rc. Depois, as versões quantificadas
Petição 870190031598, de 02/04/2019, pág. 13/40
8/34 do canal combinado são embaladas no bitstream juntamente com os parâmetros de codificação joint stereo.
[0019] Usando codificação intensity stereo, portanto, um grupo de sinais independente de canais originais é transmitido dentro de uma porção dos dados portadores. O decodificador então reconstrói os sinais envolvidos como dados idênticos, que são reescalados de acordo com seus envelopes energia-tempo originais. Como conseqüência, uma combinação linear dos canais transmitidos conduzirá aos resultados, que são bastante diferentes do downmix original. Isto se aplica a qualquer tipo de codificação joint stereo baseada no conceito de intensity stereo. Para um sistema de codificação que provê canais downmix compatíveis, existe uma conseqüência direta: A reconstrução por dematrixing, como descrita na publicação anterior, sofre por problemas causados pela reconstrução imperfeita. Usando o denominado esquema de pré-distorção joint stereo, no qual é feita uma codificação joint stereo dos canais da esquerda, da direita e do centro antes de ser feito o matrixing no codificador, ameniza o problema. Assim, o esquema de dematrixing para a reconstrução introduz menos problemas, já que no lado do codificador, os sinais decodificados joint stereo foram usados para gerar os canais downmix. Assim, o processo de reconstrução imperfeito é alterado para os canais downmix compatíveis Lc e Rc, onde tem muito mais probabilidades de ser mascarado pelo próprio sinal de áudio.
[0020] Apesar desse sistema ter resultado em menos problemas devido ao dematrixing no lado do decodificador, tem ainda assim algumas desvantagens. A desvantagem é que os canais
Petição 870190031598, de 02/04/2019, pág. 14/40
9/34 downmix estéreo-compatíveis Lc e Rc se derivam não dos canais originais, mas das versões codificada/decodificada intensity stereo dos canais originais. Portanto, as perdas de dados devidas ao sistema de codificação intensity stereo estão incluídas nos canais downmix compatíveis. O decodificador somente estéreo, que somente decodifica os canais compatíveis ao invés de ampliar os canais codificados intensity stereo, portanto, provê um sinal de saída que é afetado pelas perdas de dados induzidas por intensity stereo.
[0021] Além disso, um outro canal completo tem que ser transmitido além dos dois canais downmix. Esse canal é o canal combinado, que é formado pelos meios de codificação intensity stereo do canal esquerdo, do canal direito e do canal central. Além disso, as informações intensity stereo para a reconstrução dos canais originais L, R, C do canal combinador também devem ser transmitidas ao decodificador. No decodificador, é feita uma matrixing inversa, isto é, é feita uma operação de dematrixing para derivar os canais surround dos dois canais downmix. Também, os canais esquerdo, direito e central originais são aproximados pela decodificação intensity stereo usando o canal combinado transmitido e os parâmetros intensity stereo transmitidos. Deve ser notado que os canais esquerdo, direito e central originais são derivados pela decodificação intensity stereo do canal combinado.
Sumário da Invenção [0022] É o objeto da presente invenção prover um conceito para um processamento bit-eficiente e com a redução de
Petição 870190031598, de 02/04/2019, pág. 15/40
10/34 problemas ou o processamento inverso de um sinal de áudio multicanais.
[0023] De acordo com um primeiro aspecto da presente invenção, este objeto é alcançado por um equipamento para processamento de um sinal de áudio multicanais, o sinal de áudio multicanais tendo pelo menos três canais originais, compreendendo: meios para prover um primeiro canal downmix e um segundo canal downmix, o primeiro e o segundo canais downmix sendo derivados dos canais originais; meios para calcular as informações colaterais de canal de um canal original selecionado dos sinais originais, os meios para cálculo sendo operativos para o cálculo das informações colaterais de canal, como de um canal downmix ou de um canal downmix combinado, incluindo o primeiro e o segundo canais downmix, quando pesados usando as informações colaterais de canal, resulta em uma aproximação do canal original selecionado; e meios para a geração de dados de saída, os dados de saída incluindo as informações colaterais de canal, o primeiro canal downmix ou um sinal derivado do primeiro canal downmix e do segundo canal downmix ou um sinal derivado do segundo canal downmix.
[0024] De acordo com um Segundo aspecto da presente invenção, este objeto é alcançado por um método para o processamento de um sinal de áudio multicanais, o sinal de áudio multicanais tendo pelo menos três canais originais, compreendendo: prover um primeiro canal downmix e um segundo canal downmix, o primeiro e o Segundo canais downmix sendo derivados dos canais originais; calcular as informações colaterais de canal para um canal original selecionado dos
Petição 870190031598, de 02/04/2019, pág. 16/40
11/34 sinais originais, de maneira que um canal downmix ou um canal downmix combinado, incluindo o primeiro e o segundo canais downmix, quando pesados usando as informações colaterais de canal, resulta em uma aproximação do canal original selecionado; e gerar dados de saída, os dados de saída incluindo as informações colaterais de canal, o primeiro canal downmix ou o sinal derivado do primeiro canal downmix e do segundo canal downmix ou um sinal derivado do segundo canal downmix.
[0025] De acordo com um terceiro aspecto da presente invenção, este objeto é alcançado por um equipamento para o processamento inverso dos dados de entrada, os dados de entrada incluindo as informações colaterais de canal, um primeiro canal downmix ou um sinal derivado do primeiro canal downmix e um segundo canal downmix ou um sinal derivado do segundo canal downmix, caracterizado pelo fato de que o primeiro canal downmix e o segundo canal downmix são derivados de pelo menos três canais originais de um sinal de áudio multicanais, e caracterizado pelo fato de que as informações colaterais de canal são calculadas de maneira que um canal downmix ou um canal downmix combinado, incluindo o primeiro canal downmix e o segundo canal downmix, quando pesados usando as informações colaterais de canal, resultam em uma aproximação do canal original selecionado, o equipamento compreendendo: uma leitora de dados de entrada para ler os dados de entrada de maneira a obter o primeiro canal downmix ou um sinal derivado do primeiro canal downmix e o segundo canal downmix ou um sinal derivado do segundo canal downmix e as informações colaterais de canal; e um reconstrutor de canais para a reconstrução da aproximação do
Petição 870190031598, de 02/04/2019, pág. 17/40
12/34 canal original selecionado usando as informações colaterais de canal e o canal downmix ou o canal downmix combinado para obter a aproximação do canal original selecionado.
[0026] De acordo com um quarto aspecto da presente invenção, este objeto é alcançado por um método de processamento inverso dos dados de entrada, os dados de entrada incluindo as informações colaterais de canal, um primeiro canal downmix ou um sinal derivado de um primeiro canal downmix e um segundo canal downmix ou um sinal derivado de um segundo canal downmix, caracterizado pelo fato de que o primeiro canal downmix e o segundo canal downmix são derivados de pelo menos três canais originais de um sinal de áudio multicanais, e caracterizado pelo fato de que as informações colaterais de canal são calculadas de maneira que um canal downmix ou um canal downmix combinado, incluindo o primeiro canal downmix e o segundo canal downmix, quando pesados usando as informações colaterais de canal, resultam em uma aproximação do canal original selecionado, o método compreendendo: leitura dos dados de entrada para obter o primeiro canal downmix ou um sinal derivado do primeiro canal downmix e um segundo canal downmix ou um sinal derivado do segundo canal downmix e as informações colaterais de canal; e reconstruir a aproximação do canal original selecionado usando as informações colaterais de canal e o canal downmix ou o canal downmix combinado para obter a aproximação do canal original selecionado.
[0027] De acordo com um quinto aspecto e sexto aspecto da presente invenção, este objeto é alcançado por um programa de
Petição 870190031598, de 02/04/2019, pág. 18/40
13/34 computador incluindo o método de processamento ou o método de processamento inverso.
[0028] A presente invenção se baseia na descoberta de que é obtida uma codificação eficiente e com menos problemas do sinal de áudio multicanais quando dois canais downmix, preferencialmente representando os canais estéreo esquerdo e direito são embalados nos dados de saída.
[0029] Inventivamente, as informações paramétricas colaterais do canal para um ou mais dos canais originais se derivam de maneira a se relacionarem com um dos canais downmix, ao invés de, como na técnica anterior, a um canal joint stereo combinado adicional. Isto significa que as informações paramétricas colaterais do canal são calculadas de maneira que, no lado do decodificador, um reconstrutor de canal usa as informações colaterais de canal e um dos canais downmix ou uma combinação dos canais downmix para reconstruir uma aproximação do canal de áudio original, para o qual as informações colaterais de canal são indicadas.
[0030] O conceito inventivo é vantajoso por prover uma extensão multicanais bit-eficiente, de maneira que possa ser reproduzido em um decodificador o sinal de áudio multicanais.
[0031] Além disso, o conceito inventivo é compatível backward, já que um decodificador de menor escala, que é somente adaptado para o processamento de dois canais, pode simplesmente ignorar a informação da extensão, isto é, as informações colaterais de canal. O decodificador de menor escala somente pode reproduzir os dois canais downmix para obter uma representação estéreo do sinal original de áudio multicanais.
Petição 870190031598, de 02/04/2019, pág. 19/40
14/34
Entretanto, um decodificador de maior escala habilitado para operações multicanais, pode usar as informações colaterais de canal transmitidas para reconstruir aproximações dos canais originais.
[0032] A presente invenção é vantajosa por ser biteficiente, já que, em contraste com a técnica anterior, não é necessário outro canal portador além do primeiro e do segundo canais downmix Lc, Rc. Ao invés disso, as informações colaterais de canal se relacionam com um ou ambos os canais downmix. Isto significa que os próprios canais downmix servem como canais portadores, para os quais as informações colaterais de canal são combinadas para reconstruir um canal de áudio original. Isto significa que as informações colaterais de canal são preferivelmente informações colaterais paramétricas, isto é, informações que não incluem quaisquer amostras de sub-banda ou coeficientes espectrais. Ao invés disso, as informações colaterais paramétricas são informações usadas para pesagem (no tempo e/ou freqüência) do respectivo canal downmix ou da combinação dos respectivos canais downmix para obter uma versão reconstruída de um canal original selecionado.
[0033] Em uma configuração preferida da presente invenção, é obtida uma codificação compatível backward de um sinal multicanais baseada em um sinal estéreo compatível. Preferencialmente, o sinal estéreo compatível (sinal downmix) é gerado usando o matrixing dos canais originais do sinal de áudio multicanais.
[0034] Inventivamente, as informações colaterais de canal de um canal original selecionado são obtidas com base nas
Petição 870190031598, de 02/04/2019, pág. 20/40
15/34 técnicas joint stereo como a codificação intensity stereo ou a binaural cue coding. Assim, no lado do decodificador, não devem ser feitas operações de dematrixing. Os problemas associados com dematrixing, isto é, são evitados alguns problemas relacionados com uma distribuição indesejada de ruídos de quantificação nas operações de dematrixing. Isto se deve ao fato do decodificador usar um reconstrutor de canais, que reconstrói um sinal original, usando um dos canais downmix ou uma combinação dos canais downmix e as informações colaterais de canal transmitidas.
[0035] Preferivelmente, todo conceito inventivo é aplicado a um sinal de áudio multicanais com cinco canais. Esses cinco canais são um canal esquerdo L, um canal direito R, um canal central C, um canal surround esquerdo Ls e um canal surround direito Rs. Preferencialmente, os canais downmix são canais downmix estéreo compatíveis Ls e Rs, que provêem uma representação estéreo do sinal de áudio multicanais original.
[0036] De acordo com a configuração preferida da presente invenção, para cada canal original, são calculadas as informações colaterais de canal em um lado codificador embalado nos dados de saída. As informações colaterais de canal do canal esquerdo original se derivam usando o canal downmix esquerdo. As informações colaterais de canal do canal surround esquerdo original se derivam usando o canal downmix esquerdo. As informações colaterais de canal do canal direito original se derivam do canal downmix direito. As informações colaterais de
Petição 870190031598, de 02/04/2019, pág. 21/40
16/34 canal para o canal surround direito original se derivam do canal downmix direito.
[0037] De acordo com a configuração preferida da presente invenção, as informações de canal do canal central original se derivam usando o primeiro canal downmix assim como o segundo canal downmix, isto é, usando uma combinação dos dois canais downmix. Preferencialmente, essa combinação é uma soma.
[0038] Assim, os subgrupos, isto é, a relação entre as informações colaterais de canal e o sinal portador, isto é, o canal downmix usado para prover as informações colaterais de canal para um canal original selecionado é de tal modo que, para a qualidade ideal, é selecionado um determinado canal downmix, que contém a maior quantidade relativa possível do respectivo sinal multicanais original que é representado por meio das informações colaterais de canal. Como um sinal portador joint stereo, são usados o primeiro e o segundo canais downmix. Preferencialmente, também a soma do primeiro e do segundo canais downmix pode ser usada. Naturalmente, a soma do primeiro e do segundo canais downmix pode ser usada para o cálculo das informações colaterais de canal de cada um dos canais originais. Preferencialmente, entretanto, a soma dos canais downmix é usada para calcular as informações colaterais de canal do canal central original em um ambiente surround, como o surround de cinco canais, surround de sete canais, surround 5.1 ou surround 7.1. Usar a soma do primeiro e do segundo canais downmix é especialmente vantajoso, já que não precisa ser realizado nenhum outro cabeçalho de transmissão. Isto se deve ao fato de que ambos os canais downmix estão presentes no decodificador, de
Petição 870190031598, de 02/04/2019, pág. 22/40
17/34 maneira que a soma desses canais downmix pode ser facilmente feita no decodificador sem a exigência de outros bits de transmissão.
[0039] Preferencialmente, as informações colaterais de canal que formam a extensão multicanais são inseridas no bit stream dos dados de saída de maneira compatível, de maneira que o decodificador de menor escala simplesmente ignora os dados de extensão multicanais e somente fornece uma representação estéreo do sinal de áudio multicanais. Não obstante, um codificador de maior escala não somente usa dois canais downmix, mas, além disso, emprega as informações colaterais de canal para reconstruir uma representação completa multicanais do sinal original de áudio.
[0040] Um decodificador inventivo é operativo para primeiramente decodificar ambos os canais downmix e ler as informações colaterais de canal dos canais originais selecionados. Depois, as informações colaterais de canal e os canais downmix são usados para reconstruir aproximações dos canais originais. Para essa finalidade, preferencialmente, não é feita nenhuma operação de dematrixing. Isto significa que, nesta configuração, cada um dos, por exemplo, cinco canais originais de entrada são reconstruídos usando, por exemplo, cinco conjuntos de diferentes informações colaterais de canal. No codificador, é realizado o mesmo agrupamento que no codificador para calcular a aproximação do canal reconstruído. Em um ambiente surround de cinco canais, isto significa que, para reconstruir o canal original esquerdo, são usados o canal downmix esquerdo e as informações colaterais de canal do canal
Petição 870190031598, de 02/04/2019, pág. 23/40
18/34 esquerdo. Para reconstruir o canal direito original, são usados o canal downmix direito e as informações colaterais de canal do canal direito. Para reconstruir o canal surround esquerdo original, são usados o canal downmix esquerdo e as informações colaterais do canal surround esquerdo. Para reconstruir o canal surround direito original, são usadas as informações colaterais de canal do canal surround direito e o canal downmix direito. Para reconstruir o canal central original, são usados um canal combinado formado a partir do primeiro canal downmix e o segundo canal downmix e as informações colaterais do canal central.
[0041] Naturalmente, também é possível reproduzir o primeiro e o Segundo canais downmix como os canais esquerdo e direito, de maneira que somente três conjuntos (entre, por exemplo, cinco) de parâmetros de informações colaterais do canal tenham que ser transmitidos. Isto é, entretanto, somente aconselhável em situações onde existam regras menos rigorosas com respeito à qualidade. Isto se deve ao fato que, normalmente, o canal downmix esquerdo e o canal downmix direito são diferentes do canal esquerdo original ou do canal direito original. Somente em situações em que não se possa transmitir as informações colaterais do canal para cada um dos canais originais, esse processo é vantajoso.
Breve Descrição dos Desenhos [0042] As configurações preferidas da presente invenção são agora discutidas com referência às figuras anexas, nas quais:
Fig. 1 é um diagrama de blocos de uma configuração preferida do decodificador do invento;
Petição 870190031598, de 02/04/2019, pág. 24/40
19/34
Fig. 2 é um diagrama de blocos de uma configuração preferida do decodificador do invento;
Fig. 3A é um diagrama de blocos de uma implementação preferida do meio de cálculo para obter informações colaterais de canal seletivo de freqüência;
Fig. 3B é uma configuração preferida de um calculador para a implementação de um processamento joint stereo como intensity coding ou binaural cue coding;
Fig. 4 ilustra outra configuração preferida do meio para calcular as informações colaterais de canal, na qual as informações colaterais de canal são fatores de ganho;
Fig. 5 ilustra uma configuração preferida de uma implementação do decodificador, quando o codificador é implementado como na Fig. 4;
Fig. 6 ilustra uma implementação preferida de um meio para prover canais downmix;
Fig. 7 ilustra agrupamentos de canais originais e downmix para o cálculo das informações colaterais de canal dos respectivos canais originais;
Fig. 8 ilustra outra configuração preferida do codificador do invento;
Fig. 9 ilustra outra implementação de um decodificador do invento; e
Fig. 10 ilustra um codificador joint stereo da técnica anterior.
Descrição____Detalhada____das____Configurações
Preferidas
Petição 870190031598, de 02/04/2019, pág. 25/40
20/34 [0043] A Fig. 1 mostra um equipamento para o processamento de um sinal de áudio multicanais 10 tendo pelo menos três canais originais como R, L e C. Preferencialmente, o sinal de áudio original tem mais do que três canais, como cinco canais no ambiente surround, que está ilustrado na Fig. 1. Os cinco canais são o canal esquerdo L, o canal direito R e o canal central C, o canal surround esquerdo Ls e o canal surround direito Rs. O equipamento do invento inclui o meio 12 para prover um primeiro canal downmix Lc e um segundo canal downmix Rc, o primeiro e o segundo canais downmix sendo derivados dos canais originais. Para derivar os canais downmix dos canais originais, existem várias possibilidades. Uma possibilidade é derivar os canais downmix Lc e Rc por meio de matrixing dos canais originais usando uma operação de matrixing como ilustrada na Fig. 6. Essa operação de matrixing é realizada no domínio do tempo.
[0044] Os parâmetros de matrixing a, b e t são selecionados de maneira que sejam menores ou iguais a 1. Preferencialmente, a e b são 0,7 ou 0,5. O parâmetro geral de pesagem t é, preferencialmente, escolhido de maneira que seja evitado o clipping de canais.
[0045] Alternativamente, como indicado na Fig. 1, os canais downmix Lc e Rc podem também ser fornecidos externamente. Isto pode ser feito, quando os canais downmix Lc e Rc forem o resultado de uma operação de “mistura manual”. Nesse cenário, o próprio engenheiro de som faz a mixagem dos canais downmix ao invés de usar uma operação automatizada de matrixing. O engenheiro de som faz uma mixagem criativa para obter os canais
Petição 870190031598, de 02/04/2019, pág. 26/40
21/34
downmix otimizados Lc e Rc, que proporcionam a melhor
representação estéreo possível do sinal de áudio multicanais
original.
[0046] No caso de um suprimento externo de canais
downmix, os meios não realizam uma operação matrixing, mas simplesmente encaminha os canais downmix supridos externamente para um meio subseqüente de cálculo 14.
[0047] O meio de cálculo 14 é operativo para calcular as informações colaterais de canal como li, lsi, ri ou rsi para os canais selecionados originais como L, Ls, R ou Rs, respectivamente. Em particular, o meio 14 para cálculo está operativo para calcular as informações colaterais de canal como de um canal downmix, quando pesado usando as informações colaterais de canal, resultando em uma aproximação do canal selecionado original.
[0048] Alternativa ou adicionalmente, o meio de cálculo das informações colaterais de canal é ainda operativo e para calcular as informações colaterais de canal para um canal original selecionado como um canal downmix combinador, incluindo uma combinação do primeiro e do segundo canais downmix, quando pesados usando as informações colaterais de canal calculadas, resulta em uma aproximação do canal original selecionado. Para mostrar essa característica na figura, são mostrados um somador 14a e um calculador de informações colaterais de canal combinado 14b.
[0049] Está claro para os peritos na técnica que esses
elementos não precisam ser implementados como elementos
distintos. Ao invés disso, toda a funcionalidade dos blocos 14,
Petição 870190031598, de 02/04/2019, pág. 27/40
22/34
14a e 14b pode ser implementada por meio de um determinado processador que pode ser um processador genérico ou qualquer outro meio para a realização da funcionalidade necessária.
[0050] Além disso, deve ser notado aqui que os sinais de canal sendo amostras sub-banda ou valores de domínio de freqüência estão indicados em letras maiúsculas. As informações colaterais do canal são, em contraste aos próprios canais, indicadas em letras minúsculas. As informações colaterais de canal ci são, portanto, as informações colaterais de canal do canal central original C.
[0051] As informações colaterais de canal, assim como os canais downmix Lc e Rc ou uma versão codificada Lc' e Rc', como produzidas por um codificador de áudio 16 são inseridas em um formatador de dados de saída 18. Em geral, o formatador de dados de saída 18 atua como meio para a geração dos dados de saída, os dados de saída incluindo as informações colaterais de canal de pelo menos um canal original, o primeiro canal downmix ou um sinal derivado do primeiro canal downmix (como uma versão codificada deste) e o segundo canal downmix ou um sinal derivado do segundo canal downmix (como uma versão codificada deste).
[0052] Os dados de saída ou o bitstream de saída 20 pode então ser transmitidos para um decodificador bitstream ou pode ser armazenado ou distribuído. Preferencialmente, o bitstream de saída 20 é um bitstream compatível que também pode ser lido por um decodificador de pequena escala não tendo capacidade de extensão multicanais. Esses codificadores de pequena escala, como a maioria dos decodificadores existentes MP3 da técnica atual, simplesmente ignoram os dados de extensão
Petição 870190031598, de 02/04/2019, pág. 28/40
23/34 multicanais, isto é, as informações colaterais de canal. Somente decodificarão o primeiro e o Segundo canais downmix para produzir uma saída estéreo. Os decodificadores de maior escala, como os decodificadores habilitados para multicanais lerão as informações colaterais de canal e então gerarão uma aproximação dos canais originais de áudio, como é obtida uma impressão de áudio multicanais.
[0053] A Fig. 8 mostra uma configuração preferida da presente invenção no ambiente de cinco canais surround / MP3. Aqui, é preferível escrever os dados de ampliação surround no campo de dados auxiliares na sintaxe bit stream MP3 padronizada, como um bitstream “MP3 surround” é obtido.
[0054] A Fig. 2 mostra uma ilustração de um decodificador do invento atuando como um equipamento de dados de entrada para processamento inverso recebido em uma porta de dados de entrada 22. Os dados recebidos na porta dos dados de entrada 22 são os mesmos dados de saída da porta dos dados de saída 20 da Fig. 1. De maneira alternativa, quando os dados não são transmitidos por canal com fio mas por canal sem fio, os dados recebidos na porta de entrada de dados 22 são derivados dos dados dos dados originais produzidos pelo codificador.
[0055] Os dados de entrada do decodificador são inseridos na leitora data stream 24 para a leitura dos dados de entrada e finalmente obter as informações colaterais de canal 26 e do canal downmix esquerdo 28 e do canal downmix direito 30. Caso os dados de entrada incluírem versões codificadas dos canais downmix, que correspondam ao caso em que o codificador de áudio 16 da Fig. 1 está presente, a leitora data stream 24
Petição 870190031598, de 02/04/2019, pág. 29/40
24/34 também inclui um decodificador de áudio, adaptado ao codificador de áudio usado para a codificação dos canais downmix. Nesse caso, o decodificador de áudio, que faz parte da leitora data stream 24, é operativo para gerar o primeiro canal downmix Lc e o segundo canal downmix Rc, ou, melhor explicado, uma versão decodificada desses canais. Para uma descrição mais fácil, a distinção entre sinais e suas versões decodificadas é feita
somente quando explicitamente declarada.
[0056] As informações colaterais de canal 26 e os
canais downmix esquerdo e direito 28 e 30 produzidos pela
leitora data stream 24 são alimentados em um reconstrutor
multicanais 32 para prover uma versão reconstruída 34 dos sinais originais de áudio, que podem ser reproduzidos por meio de um player multicanais 36. No caso em que o reconstrutor multicanais estiver operativo no domínio da freqüência, o player multicanais 36 receberá os dados de entrada do domínio de freqüência, que devem ser de certa forma decodificados como convertidos no domínio de tempo antes de serem reproduzidos. Para essa finalidade, o player multicanais 36 pode também incluir dispositivos para decodificação.
[0057] Deve ser notado aqui que o decodificador de menor escala somente terá a leitora data stream 24, que somente reproduz os canais downmix esquerdo e direito 28 e 30 em saída estéreo 38. Entretanto, o decodificador ampliado da invenção extrairá as informações colaterais de canal 26 e usará essas informações colaterais e os canais downmix 28 e 30 para reconstruir as versões reconstruídas 34 dos canais originais usando o reconstrutor multicanais 32.
Petição 870190031598, de 02/04/2019, pág. 30/40
25/34 [0058] A Fig. 3A mostra uma configuração da calculadora do invento 14 para o cálculo das informações colaterais de canal que, um codificador de áudio por um lado e a calculadora de informações colaterais de canal pelo outro lado operam na mesma representação espectral do sinal multicanais. Entretanto, a Fig. 1 mostra a outra alternativa, na qual o codificador de áudio por um lado e a calculadora de informações colaterais de canal pelo outro lado operam em diferentes representações espectrais do sinal multicanais.
Quando a computação de recursos não é tão importante quanto a qualidade de áudio, é preferida alternativa da Fig.1, já que podem ser usados os bancos de filtros otimizados individualmente para codificação de áudio cálculo de informações colaterais. Entretanto, quando os recursos de computação forem um problema, é preferida alternativa da Fig. 3A, já que essa alternativa requer menos potência de computação devido à utilização compartilhada dos elementos.
[0059] dispositivo mostrado na Fig. 3A é operativo para a recepção de dois canais
A, B. O dispositivo mostrado na
Fig. 3A é operativo para calcular as informações colaterais para o canal B, de maneira que usando essas informações colaterais de canal para o canal original selecionado B, pode ser calculada uma versão reconstruída do canal B a partir do sinal do canal A. Além disso, o dispositivo mostrado na Fig. 3A é operativo para formar informações colaterais de canal no domínio de freqüência, como parâmetros para a pesagem (multiplicando ou processando no tempo como na codificação BCC, p. exemplo) de valores espectrais
Petição 870190031598, de 02/04/2019, pág. 31/40
26/34 ou amostras sub-banda. Para essa finalidade, a calculadora do invento inclui meios de janelamento e de conversão tempo/freqüência 140a para obter uma representação de freqüência de canal A em uma saída 140b ou uma representação de domínio de freqüência do canal B em uma saída 140c.
[0060] Na configuração preferida, a determinação das informações colaterais (pelo meio de determinação de informações colaterais 140f) é feita usando valores espectrais quantificados. Depois, também está presente um quantificador 140d que, preferencialmente é controlado usando um modelo psicoacústico tendo uma entrada de controle de modelo psicoacústico
140e.
Não obstante, não é necessário um quantificador quando os meios de determinação de informações colaterais 140c usam uma representação não quantificada do canal
A para determinar as informações colaterais de canal do canal
B.
Caso as informações colaterais de canal do canal B forem calculadas por meio de uma representação de domínio de freqüência do canal A e da representação de domínio de freqüência do canal
B, os meios de janelamento e de conversão tempo/freqüência 140a podem ser os mesmos que os usados no codificador de áudio baseado no banco de filtros. Nesse caso, quando é considerada a AAC (ISO/IEC 13818-3), são implementados os meios 140a como um banco de filtros MDCT (MDCT = transformada co-seno discreta modificada) com 50% de funcionalidade overlapand-add [sobrepõe e soma].
[0062] Nesse caso, o quantificador 140d é um quantificador iterativo como o usado quando são gerados sinais de áudio codificados mp3 ou AAC. A representação do domínio de
Petição 870190031598, de 02/04/2019, pág. 32/40
27/34 freqüência do canal A que, preferencialmente já está
quantificado, pode então ser usada diretamente para a
codificação entrópica usando um codificador de entropia 140g, que pode ser um codificador base Huffman ou um codificador de entropia implementando codificação aritmética.
[0063] Quando comparada à Fig. 1, a saída do
dispositivo na Fig. 3A são as informações colaterais como a li
para um canal original (correspondendo às informações colaterais de B na saída do dispositivo 140f). O bitstream com codificação entrópica do canal A corresponde, por ex., ao canal codificado downmix esquerdo Lc' na saída do bloco 16 da Fig. 1. Na Fig. 3A
torna-se claro que o elemento 14 (Fig. 1), i.e., a calculadora
para o cálculo das informações colaterais de canal e do
codificador de áudio 16 (Fig. 1) pode ser implementado como um
meio separado ou pode ser implementado como uma versão
compartilhada, de maneira que ambos os dispositivos compartilhem
vários elementos como o banco de filtros MDCT 140a, o
quantificador 140e e o codificador de entropia 140g.
Naturalmente, caso seja necessário uma transformada diferente, etc., para determinar as informações colaterais de canal, então o codificador 16 e a calculadora 14 (Fig. 1) serão implementados
em diferentes dispositivos, tais como ambos os elementos não
compartilharem o banco de filtros etc.
[0064] Em geral, o real determinante para o cálculo
das informações colaterais (ou geralmente indicados pela calculadora 14) pode ser implementado como um módulo joint stereo como mostrado na Fig. 3B, que opera de acordo com
Petição 870190031598, de 02/04/2019, pág. 33/40
28/34 quaisquer das técnicas de joint stereo como a codificação intensity stereo ou o binaural cue coding.
[0065] Em contraste com esses codificadores intensity stereo da técnica anterior, o meio de determinação do invento 140f não tem que calcular o canal combinado. O “canal combinador ou canal portador, como se pode dizer, já existe e é o canal downmix compatível esquerdo Lc ou o canal downmix compatível direito Rc ou uma versão combinada desses canais downmix como Lc + Rc. Portanto, o dispositivo do invento 140f somente tem que calcular as medições de escala para escalar o canal downmix respectivo, de maneira que seja obtido o envelope energia/tempo do respectivo canal original, quando o canal downmix é pesado usando as informações de medição ou, como se pode dizer, as informações direcionais de intensidade.
[0066] Portanto, o módulo joint stereo 140f da Fig. 3B está ilustrado de maneira a receber, como entrada, o canal A combinado, que é o primeiro ou o segundo canal downmix ou uma combinação dos canais downmix, e o canal original selecionado. Esse módulo, naturalmente, reproduz o canal A combinado e os parâmetros joint stereo como informações colaterais de canal de maneira que, usando o canal A combinado e os parâmetros joint stereo possa ser calculada uma aproximação do canal original selecionado.
[0067] De maneira alternativa, o módulo joint stereo 140f pode ser implementado para realizar o binaural cue coding.
[0068] No caso do BCC, o módulo joint stereo 140f é operativo para reproduzir as informações colaterais de canal de maneira que as informações colaterais de canal sejam
Petição 870190031598, de 02/04/2019, pág. 34/40
29/34 quantificadas e codificados os parâmetros ICLD ou ICTD, caracterizado pelo fato de que o canal original selecionado serve como o canal real a ser processado, enquanto o canal downmix respectivo usado para calcular as informações colaterais, como o primeiro, o segundo ou uma combinação do primeiro e do segundo canais downmix seja usada como o canal de referência no sentido da técnica
BCC de codificação/decodificação.
Com referência à Fig. 4, é dada uma simples implementação direcionada para energia do elemento
140f. Esse dispositivo inclui um seletor de banda de freqüência 44 que seleciona uma banda de freqüência do canal
A e uma banda de freqüência correspondente do canal
B. Depois, em ambas as bandas de freqüência, é calculada uma energia por meio de uma calculadora de energia 42 para cada ramal. A implementação detalhada da calculadora de energia 42 dependerá de ser o sinal do bloco 40 é um sinal de sub-banda ou são coeficientes de freqüência. Em outras implementações, onde são calculados os fatores de escala para as bandas de fator de escala, pode-se usar já os fatores de escala do primeiro e do segundo canais A,
B como valores de energia EA e EB ou pelo menos como estimativas de energia. Em um dispositivo de cálculo de fator de ganho 44, é determinado um fator de ganho gB para a banda selecionada de freqüência com base em uma determinada regra, como a regra de determinação de ganho ilustrada no bloco 44 da Fig. 4. Aqui, o fator de ganho gB pode ser usado diretamente para pesar amostras de domínio de tempo ou coeficientes de freqüência, como será descrito posteriormente na Fig. 5. Para esse fim, o fator de
Petição 870190031598, de 02/04/2019, pág. 35/40
30/34 ganho gB, que é válido para a banda selecionada de freqüência é usado como informações colaterais de canal para o canal B sendo o canal original selecionado. Esse canal original selecionado B não será transmitido ao decodificador, mas será representado pelas informações colaterais de canal paramétrico calculadas pela calculadora 14 da Fig. 1.
[0070] Deve ser aqui notado que não é necessário transmitir valores de ganho como informações colaterais de canal. É também suficiente transmitir valores dependentes de freqüência relativos à energia absoluta do canal original selecionado. Depois, o decodificador deve calcular a energia real do canal downmix e o fator de ganho baseado na energia do canal downmix e na energia transmitida para o canal B.
[0071] A Fig. 5 mostra uma possível implementação de uma montagem de decodificador em conexão com um codificador de áudio perceptual baseado em transformada. Comparado com a Fig. 2, as funcionalidades do decodificador de entropia e do quantificador inverso 50 (Fig. 5) serão incluídas no bloco 24 da Fig. 2. A funcionalidade dos elementos conversores de freqüência/tempo 52a, 52b (Fig. 5) será, entretanto implementada no item 36 da Fig. 2. O elemento 50 da Fig. 5 recebe uma versão codificada do primeiro ou do segundo sinal downmix Lc' ou Rc'. Na saída do elemento 50, uma versão pelo menos parcialmente decodificada do primeiro e do segundo canais downmix está presente, sendo subseqüentemente denominada de canal A. O canal A é uma entrada em um seletor de banda de freqüência 54 para a seleção de uma determinada banda de freqüência do canal A. Essa banda selecionada de freqüência é pesada usando um multiplicador
Petição 870190031598, de 02/04/2019, pág. 36/40
31/34
56. O multiplicador 56 recebe, para a multiplicação, um determinado fator de ganho gB, que é indicado para a banda de freqüência selecionada pelo seletor de banda de freqüência 54, que corresponde ao seletor de banda de freqüência 40 da Fig. 4 no lado do codificador. Na entrada do conversor freqüência tempo 52a, existe, juntamente com outras bandas, uma representação de domínio de freqüência do canal A. Na saída do multiplicador 56 e, em particular na entrada do meio de conversão freqüência/tempo 52b será reconstruída a representação de domínio de freqüência do canal B. Portanto, na saída do elemento 52a, será feita uma representação de domínio de tempo para o canal A, enquanto na saída do elemento 52b, haverá uma representação de domínio de tempo do canal B reconstruído.
[00 72] Deve ser aqui notado que, dependendo de uma determinada implementação, o canal downmix decodificado Lc ou Rc não tem playback em um decodificador ampliado multicanais. Em tal decodificador ampliado multicanais, os canais downmix decodificados são somente usados para reconstruir os canais originais. Os canais downmix originais são somente reproduzidos em decodificadores somente estéreo de menor escala.
[0073] Para isso, é feita referência à Fig. 9, que mostra a implementação preferida da presente invenção em um ambiente surround/mp3. Um bitstream surround ampliado mp3 é inserido em um decodificador mp3 padrão 24, que reproduz versões decodificadas dos canais downmix originais. Esses canais downmix podem então ser diretamente reproduzidos por meio de um decodificador de baixo nível. De maneira alternativa, esses dois canais são inseridos no dispositivo decodificador joint stereo
Petição 870190031598, de 02/04/2019, pág. 37/40
32/34 avançado 32, que também recebe os dados de extensão multicanais, que são, preferencialmente, inseridos no campo de dados auxiliares em um bitstream conforme mp3.
[0074] Subseqüentemente, é feita referência à Fig. 7 mostrando o agrupamento do canal original selecionado e o respectivo canal downmix ou canal downmix combinado. A esse respeito, a coluna direita da tabela da Fig. 7 corresponde ao canal A da Fig. 3A, 3B, 4 e 5, enquanto a coluna do meio corresponde ao canal B nessas figuras. Na coluna esquerda da Fig. 7, as respectivas informações colaterais de canal são explicitamente declaradas. De acordo com a tabela da Fig. 7, as informações colaterais de canal li do canal original esquerdo L
são calculadas usando o canal downmix esquerdo Lc. As
informações colaterais do canal surround esquerdo lsi são
determinadas por meio do canal surround esquerdo original
selecionado Ls e o canal downmix esquerdo Lc é o portador. As informações colaterais do canal direito ri do canal direito original R são determinadas usando o canal downmix direito Rc. Além disso, as informações colaterais de canal do canal surround direito Rs são determinadas usando o canal downmix direito Rc como portador. Finalmente, as informações colaterais de canal ci do canal central C são determinadas usando o canal downmix combinado, que são obtidas por meio de uma combinação do primeiro e do segundo canais downmix, que podem ser facilmente calculadas tanto em um codificador como em um decodificador e que não exigem bits extra para transmissão.
[0075] Naturalmente, também é possível calcular as informações colaterais de canal para os canal esquerdo, por
Petição 870190031598, de 02/04/2019, pág. 38/40
33/34 exemplo, baseado em um canal downmix combinado ou mesmo em um canal downmix, que é obtido por uma adição pesada do primeiro e do segundo canais downmix, como 0,7 Lc e 0,3 Rc, enquanto os parâmetros de pesagem são conhecidos de um decodificador ou transmitidos de acordo. Para a maioria das aplicações, entretanto, será preferível somente derivar informações colaterais de canal para o canal central a partir do canal downmix combinado, i.e., a partir de uma combinação do primeiro e do segundo canais downmix.
[0076] Para demonstrar o potencial de economia de bits da presente invenção, é dado o seguinte exemplo típico. No caso de um sinal de áudio de cinco canais, um codificador comum precisa de uma taxa de bit de 64 kbit/s para cada canal, totalizando uma taxa de bit total de 320 kbit/s para o sinal dos cinco canais. Os sinais estéreo esquerdo e direito requerem uma taxa de bit de 128 kbit/s. As informações colaterais dos canais para um canal ficam entre 1,5 e 2 kbit/s. Portanto, mesmo em um caso em que sejam transmitidas as informações colaterais de canal dos cinco canais, esses dados adicionais somam-se a somente 7,5 a 10 kbit/s. Portanto, o conceito inventivo permite a transmissão de um sinal de áudio de cinco canais usando uma taxa de bit de 138 kbit/s (comparado a 320 (!) kbit/s) com boa qualidade, já que o decodificador não usa a problemática operação de dematrixing. Provavelmente ainda mais importante é o fato de que o conceito inventivo é totalmente compatível backward, já que cada um dos mp3 players pode reproduzir o primeiro canal downmix e o segundo canal downmix para produzir uma reprodução estéreo convencional.
Petição 870190031598, de 02/04/2019, pág. 39/40
34/34 [0077] Dependendo do ambiente da aplicação, o método inventivo para o processamento ou para o processamento inverso pode ser implementado em hardware ou software. A implementação pode ser um meio de armazenagem digital como um disco ou um CD com sinais de controle de leitura eletrônica, que pode cooperar com um sistema de computador programável de maneira que o método do invento para o processamento ou o processamento inverso seja realizado. No geral, portanto, a invenção também se relaciona com um produto de programa de computador dotado de um código de programa armazenado em um portador com leitura por máquina, o código do programa sendo adaptado para realizar o método inventivo, quando o produto de programa de computador opera em um computador. Em outras palavras, a invenção, portanto, também se relaciona com um programa de computador dotado de um código de programa para a realização do método, quando o programa de computador é operado em um computador.

Claims (4)

  1. R E I V I N D I C A Ç Õ E S
    1. Equipamento para o processamento inverso dos dados de entrada, os dados de entrada incluindo informações colaterais de canal, um canal downmix esquerdo ou um sinal derivado do canal downmix esquerdo e um canal downmix direito ou um sinal derivado do canal downmix direito, onde o canal downmix esquerdo e o canal downmix direito se derivam de pelo menos três canais originais de um sinal de áudio multicanais e resultado, quando reproduzido, em uma representação estéreo do sinal de áudio multicanais, e onde as informações colaterais de canal são calculadas de maneira que um canal downmix ou um canal downmix combinado incluindo o canal downmix esquerdo e o canal downmix direito, quando pesados usando as informações colaterais de canal, resultam em uma aproximação do canal original selecionado, o equipamento compreendendo:
    uma leitora de dados de entrada (24) para ler os dados de entrada para obter o canal downmix esquerdo ou um sinal derivado do canal downmix esquerdo e o canal downmix direito ou a sinal derivado do canal downmix direito e as informações colaterais de canal; e um reconstrutor de canais (32) para a reconstrução da aproximação do canal original selecionado usando as informações colaterais de canal e o canal downmix ou o canal downmix combinado para obter a aproximação do canal original selecionado,
    Petição 870180134901, de 26/09/2018, pág. 43/116
  2. 2/3 caracterizado pelo reconstrutor (32) de canal ser configurado para reconstruir a aproximação de um canal direito original selecionado usando informação colateral de canal direito.
    2. Equipamento em conformidade com a reivindicação 1, caracterizado pelo fato de compreender ainda um decodificador perceptual (24) para a decodificação do sinal derivado do canal downmix esquerdo para obter a versão decodificada do canal downmix esquerdo e para a decodificação do sinal derivado do canal downmix direito para obter uma versão decodificada do canal downmix direito.
  3. 3. Equipamento em conformidade com a reivindicação 1 ou 2, caracterizado pelo fato de compreender ainda um combinador para combinar o canal downmix esquerdo e o canal downmix direito para obter o canal downmix combinado.
  4. 4. Método para o processamento inverso dos dados de entrada, o método incluindo informação colateral do canal, um canal de downmix esquerdo ou um sinal derivado do canal de downmix esquerdo e um canal de downmix direito ou um sinal derivado do canal de downmix direito, onde o canal de downmix esquerdo e o canal de downmix direito serem derivados de, pelo menos, três canais originais de um sinal de áudio multicanal e resultado, quando reproduzido, em uma representação estéreo do sinal de áudio multicanal e em que a informação colateral do canal é calculada, de modo que um
    Petição 870180134901, de 26/09/2018, pág. 44/116
    3/3 canal de downmix ou um canal de downmix combinado, incluindo o canal de downmix esquerdo e o canal de downmix direito, quando ponderados utilizando a informação colateral do canal, resulte em uma aproximação do canal original selecionado, o método compreendendo:
    leitura (24) dos dados de entrada para obter o canal de downmix esquerdo ou um sinal derivado do canal de downmix esquerdo e o canal de downmix direito ou um sinal derivado do canal de downmix direito e a informação colateral do canal; e reconstrução (32) da aproximação do canal original selecionado, utilizando a informação colateral do canal e do canal de downmix ou do canal de downmix combinado para obter a aproximação do canal original selecionado;
    caracterizado pelo reconstrutor (32) de canais ser configurado para reconstruir a aproximação de um canal direito original selecionado usando informação colateral de canal direito.
BR122018069731-8A 2003-10-02 2004-09-30 Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada. BR122018069731B1 (pt)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US10/679,085 2003-10-02
US10/679,085 US7447317B2 (en) 2003-10-02 2003-10-02 Compatible multi-channel coding/decoding by weighting the downmix channel
BRPI0414757A BRPI0414757B1 (pt) 2003-10-02 2004-09-30 equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada
PCT/EP2004/010948 WO2005036925A2 (en) 2003-10-02 2004-09-30 Compatible multi-channel coding/decoding

Publications (1)

Publication Number Publication Date
BR122018069731B1 true BR122018069731B1 (pt) 2019-07-09

Family

ID=34394093

Family Applications (5)

Application Number Title Priority Date Filing Date
BR122018069726-1A BR122018069726B1 (pt) 2003-10-02 2004-09-30 Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada
BRPI0414757A BRPI0414757B1 (pt) 2003-10-02 2004-09-30 equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada
BR122018069728-8A BR122018069728B1 (pt) 2003-10-02 2004-09-30 Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada
BR122018069731-8A BR122018069731B1 (pt) 2003-10-02 2004-09-30 Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada.
BR122018069730-0A BR122018069730B1 (pt) 2003-10-02 2004-09-30 Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada.

Family Applications Before (3)

Application Number Title Priority Date Filing Date
BR122018069726-1A BR122018069726B1 (pt) 2003-10-02 2004-09-30 Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada
BRPI0414757A BRPI0414757B1 (pt) 2003-10-02 2004-09-30 equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada
BR122018069728-8A BR122018069728B1 (pt) 2003-10-02 2004-09-30 Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada

Family Applications After (1)

Application Number Title Priority Date Filing Date
BR122018069730-0A BR122018069730B1 (pt) 2003-10-02 2004-09-30 Equipamento e método para o processamento de um sinal de áudio multicanais, equipamento para o processamento inverso dos dados de entrada e método de processamento inverso dos dados de entrada.

Country Status (18)

Country Link
US (11) US7447317B2 (pt)
EP (1) EP1668959B1 (pt)
JP (1) JP4547380B2 (pt)
KR (1) KR100737302B1 (pt)
CN (1) CN1864436B (pt)
AT (1) ATE350879T1 (pt)
BR (5) BR122018069726B1 (pt)
CA (1) CA2540851C (pt)
DE (1) DE602004004168T2 (pt)
DK (1) DK1668959T3 (pt)
ES (1) ES2278348T3 (pt)
HK (1) HK1092001A1 (pt)
IL (1) IL174286A (pt)
MX (1) MXPA06003627A (pt)
NO (8) NO347074B1 (pt)
PT (1) PT1668959E (pt)
RU (1) RU2327304C2 (pt)
WO (1) WO2005036925A2 (pt)

Families Citing this family (152)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
KR100648760B1 (ko) 2001-11-29 2006-11-23 코딩 테크놀러지스 에이비 고주파 재생 기술 향상을 위한 방법들 및 그를 수행하는 프로그램이 저장된 컴퓨터 프로그램 기록매체
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US20060171542A1 (en) * 2003-03-24 2006-08-03 Den Brinker Albertus C Coding of main and side signal representing a multichannel signal
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US20070168183A1 (en) * 2004-02-17 2007-07-19 Koninklijke Philips Electronics, N.V. Audio distribution system, an audio encoder, an audio decoder and methods of operation therefore
DE102004009628A1 (de) * 2004-02-27 2005-10-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Beschreiben einer Audio-CD und Audio-CD
KR101079066B1 (ko) 2004-03-01 2011-11-02 돌비 레버러토리즈 라이쎈싱 코오포레이션 멀티채널 오디오 코딩
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
WO2005098821A2 (en) * 2004-04-05 2005-10-20 Koninklijke Philips Electronics N.V. Multi-channel encoder
EP1895512A3 (en) * 2004-04-05 2014-09-17 Koninklijke Philips N.V. Multi-channel encoder
ES2426917T3 (es) * 2004-04-05 2013-10-25 Koninklijke Philips N.V. Aparato codificador, aparato decodificador, sus métodos y sistema de audio asociado
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
KR101117336B1 (ko) * 2004-05-19 2012-03-08 파나소닉 주식회사 오디오 신호 부호화 장치 및 오디오 신호 복호화 장치
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
JPWO2006004048A1 (ja) * 2004-07-06 2008-04-24 松下電器産業株式会社 オーディオ信号符号化装置、オーディオ信号復号化装置、方法、及びプログラム
US7751804B2 (en) * 2004-07-23 2010-07-06 Wideorbit, Inc. Dynamic creation, selection, and scheduling of radio frequency communications
TWI497485B (zh) * 2004-08-25 2015-08-21 Dolby Lab Licensing Corp 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法
WO2006035705A1 (ja) * 2004-09-28 2006-04-06 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
SE0402652D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
JP4369957B2 (ja) * 2005-02-01 2009-11-25 パナソニック株式会社 再生装置
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
BRPI0608945C8 (pt) * 2005-03-30 2020-12-22 Coding Tech Ab codificador de áudio de multi-canal, decodificador de áudio de multi-canal, método de codificar n sinais de áudio em m sinais de áudio e dados paramétricos associados, método de decodificar k sinais de áudio e dados paramétricos associados, método de transmitir e receber um sinal de áudio de multi-canal codificado, mídia de armazenamento legível por computador, e, sistema de transmissão
US7840411B2 (en) * 2005-03-30 2010-11-23 Koninklijke Philips Electronics N.V. Audio encoding and decoding
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
RU2007139784A (ru) * 2005-04-28 2009-05-10 Мацусита Электрик Индастриал Ко., Лтд. (Jp) Устройство кодирования звука и способ кодирования звука
US8090586B2 (en) * 2005-05-26 2012-01-03 Lg Electronics Inc. Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
KR101251426B1 (ko) * 2005-06-03 2013-04-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법
AU2006266655B2 (en) * 2005-06-30 2009-08-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8494667B2 (en) * 2005-06-30 2013-07-23 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8185403B2 (en) * 2005-06-30 2012-05-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
MX2008000504A (es) * 2005-07-14 2008-03-07 Koninkl Philips Electronics Nv Codificacion y decodificacion de audio.
US8626503B2 (en) * 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
JP5171622B2 (ja) * 2005-07-19 2013-03-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャンネルオーディオ信号の生成
JP5173811B2 (ja) * 2005-08-30 2013-04-03 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
US7761303B2 (en) 2005-08-30 2010-07-20 Lg Electronics Inc. Slot position coding of TTT syntax of spatial audio coding application
JP4859925B2 (ja) * 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
US8019614B2 (en) * 2005-09-02 2011-09-13 Panasonic Corporation Energy shaping apparatus and energy shaping method
TWI462086B (zh) * 2005-09-14 2014-11-21 Lg Electronics Inc 音頻訊號之解碼方法及其裝置
KR100857106B1 (ko) * 2005-09-14 2008-09-08 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
WO2007037613A1 (en) * 2005-09-27 2007-04-05 Lg Electronics Inc. Method and apparatus for encoding/decoding multi-channel audio signal
CN102663975B (zh) * 2005-10-03 2014-12-24 夏普株式会社 显示装置
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
KR100878828B1 (ko) 2005-10-05 2009-01-14 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
KR20070038439A (ko) * 2005-10-05 2007-04-10 엘지전자 주식회사 신호 처리 방법 및 장치
US8068569B2 (en) * 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
US7672379B2 (en) * 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7761289B2 (en) * 2005-10-24 2010-07-20 Lg Electronics Inc. Removing time delays in signal paths
KR100644715B1 (ko) * 2005-12-19 2006-11-10 삼성전자주식회사 능동적 오디오 매트릭스 디코딩 방법 및 장치
US8111830B2 (en) * 2005-12-19 2012-02-07 Samsung Electronics Co., Ltd. Method and apparatus to provide active audio matrix decoding based on the positions of speakers and a listener
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
KR100803212B1 (ko) 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
JP5147727B2 (ja) * 2006-01-19 2013-02-20 エルジー エレクトロニクス インコーポレイティド 信号デコーディング方法及び装置
TWI469133B (zh) * 2006-01-19 2015-01-11 Lg Electronics Inc 媒體訊號處理方法及裝置
KR20080110920A (ko) * 2006-02-07 2008-12-19 엘지전자 주식회사 부호화/복호화 장치 및 방법
US20090177479A1 (en) * 2006-02-09 2009-07-09 Lg Electronics Inc. Method for Encoding and Decoding Object-Based Audio Signal and Apparatus Thereof
ATE456261T1 (de) 2006-02-21 2010-02-15 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
TWI447707B (zh) * 2006-02-23 2014-08-01 Lg Electronics Inc 音頻訊號之處理方法及其裝置
KR100773560B1 (ko) * 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
KR100773562B1 (ko) * 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
EP1999745B1 (en) * 2006-03-30 2016-08-31 LG Electronics Inc. Apparatuses and methods for processing an audio signal
WO2007114624A1 (en) * 2006-04-03 2007-10-11 Lg Electronics, Inc. Apparatus for processing media signal and method thereof
US8027479B2 (en) 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
PL2038878T3 (pl) * 2006-07-07 2012-06-29 Fraunhofer Ges Forschung Urządzenie i sposób do łączenia wielu zakodowanych parametrycznie źródeł audio
KR101438387B1 (ko) 2006-07-12 2014-09-05 삼성전자주식회사 서라운드 확장 데이터 부호화 및 복호화 방법 및 장치
KR100763920B1 (ko) 2006-08-09 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치
US7907579B2 (en) * 2006-08-15 2011-03-15 Cisco Technology, Inc. WiFi geolocation from carrier-managed system geolocation of a dual mode device
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US9233301B2 (en) 2006-09-07 2016-01-12 Rateze Remote Mgmt Llc Control of data presentation from multiple sources using a wireless home entertainment hub
US9319741B2 (en) 2006-09-07 2016-04-19 Rateze Remote Mgmt Llc Finding devices in an entertainment system
US8005236B2 (en) * 2006-09-07 2011-08-23 Porto Vinci Ltd. Limited Liability Company Control of data presentation using a wireless home entertainment hub
US9386269B2 (en) 2006-09-07 2016-07-05 Rateze Remote Mgmt Llc Presentation of data on multiple display devices using a wireless hub
US8966545B2 (en) 2006-09-07 2015-02-24 Porto Vinci Ltd. Limited Liability Company Connecting a legacy device into a home entertainment system using a wireless home entertainment hub
US8935733B2 (en) 2006-09-07 2015-01-13 Porto Vinci Ltd. Limited Liability Company Data presentation using a wireless home entertainment hub
US20080061578A1 (en) * 2006-09-07 2008-03-13 Technology, Patents & Licensing, Inc. Data presentation in multiple zones using a wireless home entertainment hub
US8607281B2 (en) 2006-09-07 2013-12-10 Porto Vinci Ltd. Limited Liability Company Control of data presentation in multiple zones using a wireless home entertainment hub
AU2007312597B2 (en) * 2006-10-16 2011-04-14 Dolby International Ab Apparatus and method for multi -channel parameter transformation
UA94117C2 (ru) * 2006-10-16 2011-04-11 Долби Свиден Ав Усовершенстованное кодирование и отображение параметров многоканального кодирования микшированных объектов
KR100847453B1 (ko) * 2006-11-20 2008-07-21 주식회사 대우일렉트로닉스 입체 음향을 위한 적응 간섭 제거 방법
EP2102855A4 (en) * 2006-12-07 2010-07-28 Lg Electronics Inc METHOD AND APPARATUS FOR DECODING AUDIO SIGNAL
CN101578656A (zh) * 2007-01-05 2009-11-11 Lg电子株式会社 用于处理音频信号的装置和方法
EP2278582B1 (en) * 2007-06-08 2016-08-10 LG Electronics Inc. A method and an apparatus for processing an audio signal
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
US8170218B2 (en) 2007-10-04 2012-05-01 Hurtado-Huyssen Antoine-Victor Multi-channel audio treatment system and method
EP2128856A4 (en) * 2007-10-16 2011-11-02 Panasonic Corp DEVICE FOR PRODUCING A STREAM AND DECODING DEVICE AND CORRESPONDING METHOD
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
KR101438389B1 (ko) * 2007-11-15 2014-09-05 삼성전자주식회사 오디오 매트릭스 디코딩 방법 및 장치
BRPI0820488A2 (pt) * 2007-11-21 2017-05-23 Lg Electronics Inc método e equipamento para processar um sinal
WO2009075510A1 (en) * 2007-12-09 2009-06-18 Lg Electronics Inc. A method and an apparatus for processing a signal
TWI424755B (zh) * 2008-01-11 2014-01-21 Dolby Lab Licensing Corp 矩陣解碼器
US8615088B2 (en) * 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal using preset matrix for controlling gain or panning
EP2083585B1 (en) 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
KR100998913B1 (ko) * 2008-01-23 2010-12-08 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
WO2009116280A1 (ja) * 2008-03-19 2009-09-24 パナソニック株式会社 ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法
KR101614160B1 (ko) * 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
EP2154911A1 (en) 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
US8705749B2 (en) * 2008-08-14 2014-04-22 Dolby Laboratories Licensing Corporation Audio signal transformatting
JP5635502B2 (ja) * 2008-10-01 2014-12-03 ジーブイビービー ホールディングス エス.エイ.アール.エル. 復号装置、復号方法、符号化装置、符号化方法、及び編集装置
EP2175670A1 (en) 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
EP2345027B1 (en) * 2008-10-10 2018-04-18 Telefonaktiebolaget LM Ericsson (publ) Energy-conserving multi-channel audio coding and decoding
KR101513042B1 (ko) * 2008-12-02 2015-04-17 엘지전자 주식회사 신호 전송 방법 및 전송 장치
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
US8774417B1 (en) * 2009-10-05 2014-07-08 Xfrm Incorporated Surround audio compatibility assessment
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
AU2011240239B2 (en) * 2010-04-13 2014-06-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
DE102010015630B3 (de) * 2010-04-20 2011-06-01 Institut für Rundfunktechnik GmbH Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates
TWI480860B (zh) * 2011-03-18 2015-04-11 Fraunhofer Ges Forschung 音訊編碼中之訊框元件長度傳輸技術
CN103890841B (zh) * 2011-11-01 2017-10-17 皇家飞利浦有限公司 音频对象编码和解码
US9131313B1 (en) * 2012-02-07 2015-09-08 Star Co. System and method for audio reproduction
EP2645748A1 (en) * 2012-03-28 2013-10-02 Thomson Licensing Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal
WO2013156814A1 (en) * 2012-04-18 2013-10-24 Nokia Corporation Stereo audio signal encoder
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
US9479886B2 (en) 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
CN104737557A (zh) * 2012-08-16 2015-06-24 乌龟海岸公司 多维参数音频系统和方法
JP6096934B2 (ja) * 2013-01-29 2017-03-15 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 周波数拡張されたオーディオ信号を生成するためのデコーダ、復号化方法、符号化された信号を生成するためのエンコーダ、およびコンパクトな選択サイド情報を使用する符号化方法
CA3211308A1 (en) 2013-05-24 2014-11-27 Dolby International Ab Coding of audio scenes
WO2014187987A1 (en) 2013-05-24 2014-11-27 Dolby International Ab Methods for audio encoding and decoding, corresponding computer-readable media and corresponding audio encoder and decoder
US9716959B2 (en) 2013-05-29 2017-07-25 Qualcomm Incorporated Compensating for error in decomposed representations of sound fields
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
EP2830051A3 (en) * 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
TWI713018B (zh) * 2013-09-12 2020-12-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
KR102160254B1 (ko) * 2014-01-10 2020-09-25 삼성전자주식회사 액티브다운 믹스 방식을 이용한 입체 음향 재생 방법 및 장치
US9344825B2 (en) 2014-01-29 2016-05-17 Tls Corp. At least one of intelligibility or loudness of an audio program
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
CN104486033B (zh) * 2014-12-03 2017-09-29 重庆邮电大学 一种基于c‑ran平台的下行多模信道编码系统及方法
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
ES2830954T3 (es) * 2016-11-08 2021-06-07 Fraunhofer Ges Forschung Mezclador descendente y método para la mezcla descendente de al menos dos canales y codificador multicanal y decodificador multicanal
KR102128281B1 (ko) 2017-08-17 2020-06-30 가우디오랩 주식회사 앰비소닉 신호를 사용하는 오디오 신호 처리 방법 및 장치
CN111615044B (zh) * 2019-02-25 2021-09-14 宏碁股份有限公司 声音信号的能量分布修正方法及其系统
JP7416816B2 (ja) * 2019-03-06 2024-01-17 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ダウンミキサ及びダウンミックス方法
US10779105B1 (en) 2019-05-31 2020-09-15 Apple Inc. Sending notification and multi-channel audio over channel limited link for independent gain control

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
DE69428939T2 (de) 1993-06-22 2002-04-04 Thomson Brandt Gmbh Verfahren zur Erhaltung einer Mehrkanaldekodiermatrix
EP0631458B1 (en) * 1993-06-22 2001-11-07 Deutsche Thomson-Brandt Gmbh Method for obtaining a multi-channel decoder matrix
CA2124379C (en) 1993-06-25 1998-10-27 Thomas F. La Porta Distributed processing architecture for control of broadband and narrowband communications networks
DE4409368A1 (de) 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
JP3397001B2 (ja) * 1994-06-13 2003-04-14 ソニー株式会社 符号化方法及び装置、復号化装置、並びに記録媒体
EP0688113A2 (en) 1994-06-13 1995-12-20 Sony Corporation Method and apparatus for encoding and decoding digital audio signals and apparatus for recording digital audio
DE69610859T2 (de) 1995-10-09 2001-03-15 Matsushita Electric Ind Co Ltd Optische Scheibe und optisches Wiedergabegerät
SI0820663T1 (en) 1996-02-08 2004-10-31 Koninklijke Philips Electronics N.V. 7-channel transmission, compatible with 5-channel transmission and 2-channel transmission
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
SG54379A1 (en) * 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
US6449368B1 (en) * 1997-03-14 2002-09-10 Dolby Laboratories Licensing Corporation Multidirectional audio decoding
JP3657120B2 (ja) 1998-07-30 2005-06-08 株式会社アーニス・サウンド・テクノロジーズ 左,右両耳用のオーディオ信号を音像定位させるための処理方法
JP2000214887A (ja) * 1998-11-16 2000-08-04 Victor Co Of Japan Ltd 音声符号化装置、光記録媒体、音声復号装置、音声伝送方法及び伝送媒体
US6928169B1 (en) * 1998-12-24 2005-08-09 Bose Corporation Audio signal processing
US6442517B1 (en) * 2000-02-18 2002-08-27 First International Digital, Inc. Methods and system for encoding an audio sequence with synchronized data and outputting the same
JP4304401B2 (ja) * 2000-06-07 2009-07-29 ソニー株式会社 マルチチャンネルオーディオ再生装置
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
JP4062905B2 (ja) * 2001-10-24 2008-03-19 ヤマハ株式会社 ディジタル・ミキサ
US7333930B2 (en) * 2003-03-14 2008-02-19 Agere Systems Inc. Tonal analysis for perceptual audio coding using a compressed spectral representation
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
KR101215868B1 (ko) * 2004-11-30 2012-12-31 에이저 시스템즈 엘엘시 오디오 채널들을 인코딩 및 디코딩하는 방법, 및 오디오 채널들을 인코딩 및 디코딩하는 장치

Also Published As

Publication number Publication date
RU2006114742A (ru) 2007-11-20
US20190110146A1 (en) 2019-04-11
US20050074127A1 (en) 2005-04-07
NO344635B1 (no) 2020-02-17
IL174286A0 (en) 2006-08-01
ATE350879T1 (de) 2007-01-15
AU2004306509A1 (en) 2005-04-21
NO342804B1 (no) 2018-08-06
NO345265B1 (no) 2020-11-23
NO344760B1 (no) 2020-04-14
US20130016843A1 (en) 2013-01-17
CN1864436A (zh) 2006-11-15
WO2005036925A2 (en) 2005-04-21
PT1668959E (pt) 2007-04-30
NO20180980A1 (no) 2006-06-30
US20180359588A1 (en) 2018-12-13
US10425757B2 (en) 2019-09-24
CA2540851A1 (en) 2005-04-21
US20090003612A1 (en) 2009-01-01
US20190239018A1 (en) 2019-08-01
DK1668959T3 (da) 2007-04-10
US10165383B2 (en) 2018-12-25
US7447317B2 (en) 2008-11-04
NO20180990A1 (no) 2006-06-30
US10237674B2 (en) 2019-03-19
EP1668959A2 (en) 2006-06-14
US9462404B2 (en) 2016-10-04
BR122018069726B1 (pt) 2019-03-19
US10455344B2 (en) 2019-10-22
JP2007507731A (ja) 2007-03-29
NO20180978A1 (no) 2006-06-30
IL174286A (en) 2010-12-30
US20190379990A1 (en) 2019-12-12
CN1864436B (zh) 2011-05-11
US20160078872A1 (en) 2016-03-17
NO344091B1 (no) 2019-09-02
MXPA06003627A (es) 2006-06-05
RU2327304C2 (ru) 2008-06-20
US20180359589A1 (en) 2018-12-13
NO344483B1 (no) 2020-01-13
US10299058B2 (en) 2019-05-21
US20190239017A1 (en) 2019-08-01
KR20060060052A (ko) 2006-06-02
EP1668959B1 (en) 2007-01-03
US10433091B2 (en) 2019-10-01
WO2005036925A3 (en) 2005-07-14
CA2540851C (en) 2012-05-01
BRPI0414757A (pt) 2006-11-28
BR122018069728B1 (pt) 2019-03-19
KR100737302B1 (ko) 2007-07-09
US10206054B2 (en) 2019-02-12
NO20200106A1 (no) 2006-06-30
NO20191058A1 (no) 2006-06-30
DE602004004168D1 (de) 2007-02-15
US20190239016A1 (en) 2019-08-01
NO20061898L (no) 2006-06-30
NO20180991A1 (no) 2006-06-30
BRPI0414757B1 (pt) 2018-12-26
HK1092001A1 (en) 2007-01-26
NO344093B1 (no) 2019-09-02
JP4547380B2 (ja) 2010-09-22
DE602004004168T2 (de) 2007-10-11
ES2278348T3 (es) 2007-08-01
NO20180993A1 (no) 2006-06-30
US8270618B2 (en) 2012-09-18
NO347074B1 (no) 2023-05-08
BR122018069730B1 (pt) 2019-03-19
US11343631B2 (en) 2022-05-24

Similar Documents

Publication Publication Date Title
US11343631B2 (en) Compatible multi-channel coding/decoding
US7394903B2 (en) Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
AU2004306509B2 (en) Compatible multi-channel coding/decoding

Legal Events

Date Code Title Description
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 09/07/2019, OBSERVADAS AS CONDICOES LEGAIS. (CO) 10 (DEZ) ANOS CONTADOS A PARTIR DE 09/07/2019, OBSERVADAS AS CONDICOES LEGAIS