BR122019023924B1 - Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo - Google Patents

Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo Download PDF

Info

Publication number
BR122019023924B1
BR122019023924B1 BR122019023924-0A BR122019023924A BR122019023924B1 BR 122019023924 B1 BR122019023924 B1 BR 122019023924B1 BR 122019023924 A BR122019023924 A BR 122019023924A BR 122019023924 B1 BR122019023924 B1 BR 122019023924B1
Authority
BR
Brazil
Prior art keywords
signal
stereo
encoder
encoding
decoder
Prior art date
Application number
BR122019023924-0A
Other languages
English (en)
Inventor
Heiko Purnhagen
Pontus Carlsson
Kristofer Kjorling
Original Assignee
Dolby International Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=42562759&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=BR122019023924(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Dolby International Ab filed Critical Dolby International Ab
Publication of BR122019023924B1 publication Critical patent/BR122019023924B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/02Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

a presente invenção refere-se a sistemas codificadores e decodificadores de áudio. uma modalidade do sistema codificador compreende um estágio de submixagem para gerar um sinal de submixagem e um sinal residual com base em um sinal estéreo. além do mais, o sistema codificador compreende um estágio de determinação de parâmetro para determinar parâmetros estéreos paramétricos tais como uma diferença de intensidade entre canais e uma correlação cruzada entre canais. preferivelmente, os parâmetros estéreos paramétricos são variáveis com tempo e com frequência. além disso, o sistema codificador compreende um estágio de transformação. o estágio de transformação gera um pseudossinal estéreo esquerdo/direito ao executar uma transformação baseada no sinal de submixagem e no sinal residual. o pseudossinal estéreo é processado por um codificador estéreo perceptivo. com relação à codificação estéreo, codificação esquerda/direita ou codificação central/lateral é selecionável. preferivelmente, a seleção entre codificação estéreo esquerda/direita e codificação estéreo central/lateral é variável com tempo e com frequência.

Description

Campo Técnico
[0001] O pedido refere-se à codificação de áudio, em particular acodificação de áudio estéreo combinando técnicas de codificação paramétricas e baseadas em forma de onda.
Antecedentes da Invenção
[0002] Juntar codificação dos canais esquerdo (L) e direito (R) deum sinal estéreo capacita codificação mais eficiente quando comparada à codificação independente de L e R. Uma abordagem comum para juntar codificação estéreo é codificação central/lateral (M/S). Aqui, um sinal central (M) é formado ao somar os sinais L e R; por exemplo, o sinal M pode ter a forma
Figure img0001
[0003] Também, um sinal lateral (S) é formado ao subtrair os doiscanais L e R, por exemplo, o sinal S pode ter a forma
Figure img0002
[0004] No caso de codificação M/S, os sinais M e S são codificados em vez dos sinais L e R.
[0005] No padrão AAC (Codificação Avançada de Áudio) MPEG(Grupo de Especialistas de Imagens em Movimento) (ver o documento padrão ISO/IEC 13818-7), codificação estéreo L/R e codificaçãoestéreo M/S podem ser escolhidas em um modo variável com tempo e variável com frequência. Assim, o codificador estéreo pode aplicar co- dificação L/R a algumas bandas de frequência do sinal estéreo, enquanto que codificação M/S é usada para codificar outras bandas de frequência do sinal estéreo (variável com frequência). Além disso, o codificador pode comutar ao longo do tempo entre codificação L/R e M/S (variável com tempo). Em AAC MPEG, a codificação estéreo é executada no domínio de frequência, mais particularmente no domínio MDCT (transformada discreta de cosseno modificada). Isto permite escolha adaptativa se codificação L/R ou M/S em um modo variável com frequência e também com tempo. A decisão entre codificação estéreo L/R e M/S pode ser baseada ao avaliar o sinal lateral: quando a energia do sinal lateral é baixa, codificação estéreo M/S é mais eficiente e deve ser usada. Alternativamente, para decidir entre ambos os esquemas de codificação estéreo, ambos os esquemas de codificação podem ser testados e a seleção pode ser baseada nos esforços de quantificação resultantes, isto é, a entropia perceptiva observada.
[0006] Uma abordagem alternativa para juntar codificação estéreoé codificação estéreo paramétrica (PS). Aqui, o sinal estéreo é transportado como um sinal de submixagem mono após codificar o sinal de submixagem com um codificador de áudio convencional tal como um codificador AAC. O sinal de submixagem é uma superposição dos canais L e R. O sinal de submixagem mono é transportado em combinação com parâmetros PS variáveis com tempo e variáveis com frequência adicionais, tais como a diferença de intensidade (IID) entre canais (isto é, entre L e R) e a correlação cruzada entre canais (ICC). No de- codificador, com base no sinal de submixagem decodificado e nos parâmetros estéreos paramétricos um sinal estéreo é reconstruído que se aproxima da imagem estéreo perceptiva do sinal estéreo original. Para reconstrução, uma versão descorrelacionada do sinal de submi- xagem é gerada por um descorrelacionador. Tal descorrelacionador pode ser concretizado por meio de um filtro passa tudo apropriado. Codificação e decodificação PS estão descritas no documento "Low Complexity Parametric Stereo Coding in MPEG-4", H. Purnhagen, Proc. da 7th Int. Conference on Digital Audio Effects (DAFx'04), Nápoles, Itália, 5-8 de outubro de 2004, páginas 163-168. A revelação deste documento está incorporada neste documento pela referência.
[0007] O padrão MPEG Envolvente (ver o documento ISO/IEC23003-1) faz uso do conceito da codificação PS. Em um decodifica- dor MPEG Envolvente uma pluralidade de canais de saída é criada com base em canais de entrada inferiores e parâmetros de controle. Decodificadores e codificadores MPEG Envolvente são construídos ao cascatear módulos estéreos paramétricos, os quais em MPEG Envolvente são referidos como módulos OTT (módulos Um Para Dois) para o decodificador e módulos R-OTT (módulos Um Para Dois Inversos) para o codificador. Um módulo OTT determina dois canais de saída por meio de um único canal de entrada (sinal de submixa- gem) acompanhado por parâmetros PS. Um módulo OTT corresponde a um decodificador PS e um módulo R-OTT corresponde a um codificador PS. Estéreo paramétrico pode ser realizado ao usar MPEG Envolvente com um único módulo OTT no lado de decodificador e um único módulo R-OTT no lado de codificador; isto também é referido como modo "MPEG Envolvente 2-1-2". A sintaxe de fluxo de bits pode diferir, mas a teoria e o processamento de sinal subjacentes são os mesmos. Portanto, no exposto a seguir todas as referências para PS também incluem estéreo paramétrico baseado em "MPEG Envolvente 2-1-2" ou MPEG Envolvente.
[0008] Em um codificador PS (por exemplo, em um codificador PSde MPEG Envolvente) um sinal residual (RES) pode ser determinado e transmitido além do sinal de submixagem. Tal sinal residual indica o erro associado com representar canais originais por seus parâmetros de submixagem e PS. No decodificador o sinal residual pode ser usa- do em vez de a versão descorrelacionada do sinal de submixagem. Isto permite reconstruir de modo melhor as formas de ondas dos canais originais L e R. O uso de um sinal residual adicional é descrito, por exemplo, no padrão MPEG Envolvente (ver o documento ISO/IEC 23003-1) e no documento "MPEG Surround - The ISO/MPEG Standard for Efficient and Compatible Multi-Channel Audio Coding", J. Her- re e outros, Audio Engineering Paper 7084, 122nd Convention, 5-8 de maio de 2007. A revelação de ambos os documentos, em particular as observações para o sinal residual nos mesmos, está incorporada neste documento pela referência.
[0009] Codificação PS com residual é uma abordagem mais geralpara juntar codificação estéreo do que codificação M/S: codificação M/S executa uma rotação de sinal ao transformar sinais L/R em sinais M/S. Também, codificação PS com residual executa uma rotação de sinal ao transformar os sinais L/R em sinais de submixagem e residuais. Entretanto, no último caso a rotação de sinal é variável e depende dos parâmetros PS. Por causa da abordagem mais geral da codificação PS com residual, codificação PS com residual permite uma codificação mais eficiente de certos tipos de sinais tais como um sinal mono tendo panes do que codificação M/S. Assim, o codificador proposto permite combinar de forma eficiente técnicas de codificação estéreo paramétrica com técnicas de codificação estéreo baseada em formas de onda.
[0010] Frequentemente, codificadores estéreos perceptivos, taiscomo um codificador estéreo perceptivo AAC MPEG, podem decidir entre codificação estéreo L/R e codificação estéreo M/S, onde no último caso um sinal central/lateral é gerado com base no sinal estéreo. Tal seleção pode ser variável com frequência, isto é, para algumas bandas de frequência codificação estéreo L/R pode ser usada, enquanto que para outras bandas de frequência codificação estéreo M/S pode ser usada.
[0011] Em uma situação onde os canais L e R são sinais basicamente independentes, tal codificador estéreo perceptivo tipicamente não usaria codificação estéreo M/S uma vez que nesta situação tal esquema de codificação não ofereceria qualquer ganho de codificação em comparação com codificação estéreo L/R. O codificador recuaria para codificação estéreo L/R simples, processando basicamente L e R de forma independente.
[0012] Na mesma situação, um sistema codificador PS criariaum sinal de submixagem que contivesse ambos os canais L e R, o que impediria processamento independente dos canais L e R. Com relação a codificação PS com um sinal residual, isto pode indicar codificação menos eficiente quando comparada à codificação estéreo, onde codificação estéreo L/R ou codificação estéreo M/S é se- lecionável adaptativamente.
[0013] Assim, existem situações onde um codificador PS superaem desempenho um codificador estéreo perceptivo com seleção adap- tativa entre codificação estéreo L/R e codificação estéreo M/S, enquanto que em outras situações o último codificador supera em desempenho o codificador PS.
Sumário da Invenção
[0014] O presente pedido descreve um sistema codificador de áudio e um método de codificação que são baseados na idéia de combinar codificação PS usando um residual com codificação estéreo per- ceptiva L/R ou M/S adaptativa (por exemplo, codificação estéreo de junção perceptiva AAC no domínio MDCT). Isto permite combinar as vantagens da codificação estéreo L/R ou M/S adaptativa (por exemplo, usada em AAC MPEG) com as vantagens da codificação PS com um sinal residual (por exemplo, usada em MPEG Envolvente). Além disso, o pedido descreve um sistema decodificador de áudio correspondente e um método de decodificação.
[0015] Um primeiro aspecto da aplicação diz respeito a um sistema codificador para codificar um sinal estéreo para um sinal de fluxo de bits. De acordo com uma modalidade do sistema codificador, o sistema codificador compreende um estágio de submixagem para gerar um sinal de submixagem e um sinal residual com base no sinal estéreo. O sinal residual pode cobrir toda ou somente uma parte da faixa de frequências de áudio usada. Além do mais, o sistema codificador compreende um estágio de determinação de parâmetro para determinar parâmetros PS tais como uma diferença de intensidade entre canais e uma correlação cruzada entre canais. Preferivelmente, os parâmetros PS são variáveis com frequência. Tal estágio de submixagem e o estágio de determinação de parâmetro tipicamente são partes de um codificador PS.
[0016] Além do mais, o sistema codificador compreende dispositivos de codificação perceptiva a jusante do estágio de submixagem, em que dois esquemas de codificação são selecionáveis:- codificação baseada em uma soma do sinal de submixa- gem e o sinal residual e baseada em uma diferença do sinal de submi- xagem e o sinal residual, ou- codificação baseada no sinal de submixagem e baseada no sinal residual.
[0017] Deve ser notado que no caso de codificação baseada nosinal de submixagem e no sinal residual, o sinal de submixagem e o sinal residual podem ser codificados ou sinais proporcionais a eles podem ser codificados. No caso de codificação baseada em uma soma e em uma diferença, a soma e diferença podem ser codificadas ou sinais proporcionais a elas podem ser codificados.
[0018] A seleção pode ser variável com frequência (e variável comtempo), isto é, para uma primeira banda de frequência ela pode ser selecionada em que a codificação é baseada em um sinal de soma e em um sinal de diferença, enquanto que para uma segunda banda de frequência ela pode ser selecionada em que a codificação é baseada no sinal de submixagem e baseada no sinal residual.
[0019] Tal sistema codificador tem a vantagem em que ele permitecomutar entre codificação estéreo L/R e codificação PS com residual (preferivelmente em um modo variável com frequência): Se os dispositivos de codificação perceptiva selecionarem (para uma banda particular ou para a faixa de frequências usadas total) codificação baseada em sinais de submixagem e residuais, o sistema de codificação se comporta tal como um sistema usando codificação PS padrão com residual. Entretanto, se os dispositivos de codificação perceptiva selecionarem (para uma banda particular ou para a faixa de frequências usadas total) codificação baseada em um sinal de soma do sinal de submixagem e o sinal residual e baseada em um sinal de diferença do sinal de submixagem e o sinal residual, sob certas circunstâncias as operações de soma e diferença compensam essencialmente a operação de submixagem anterior (exceto para um fator de ganho possivelmente diferente) de tal maneira que o sistema total pode executar re-almente codificação L/R do sinal estéreo total ou para uma banda de frequência do mesmo. Por exemplo, tais circunstâncias ocorrem quando os canais L e R do sinal estéreo são independentes e têm o mesmo nível tal como será explicado detalhadamente mais tarde.
[0020] Preferivelmente, a adaptação do esquema de codificação édependente de tempo e frequência. Assim, preferivelmente algumas bandas de frequência do sinal estéreo são codificadas por meio de um esquema de codificação L/R, enquanto que outras bandas de frequência do sinal estéreo são codificadas por meio de um esquema de codificação PS com residual.
[0021] Deve ser notado que no caso de a codificação ser baseadano sinal de submixagem e baseada no sinal residual tal como discutido anteriormente, o sinal real que é introduzido no codificador central pode ser formado por meio de duas operações seriais no sinal de submi- xagem e no sinal residual que são inversas (exceto para um fator de ganho possivelmente diferente). Por exemplo, um sinal de submixa- gem e um sinal residual são fornecidos para um estágio de transformação de M/S para L/R e então a saída do estágio de transformação é fornecida para um estágio de transformação de L/R para M/S. O sinal resultante (que é então usado para codificação) corresponde ao sinal de submixagem e ao sinal residual (exceto para um fator de ganho possivelmente diferente).
[0022] A modalidade seguinte faz uso desta idéia. De acordo comuma modalidade do sistema codificador, o sistema codificador compreende um estágio de submixagem e um estágio de determinação de parâmetro tal como discutido anteriormente. Além disso, o sistema codificador compreende um estágio de transformação (por exemplo, como parte dos dispositivos de codificação discutidos anteriormente). O estágio de transformação gera um pseudossinal estéreo L/R ao executar uma transformação do sinal de submixagem e do sinal residual. O estágio de transformação preferivelmente executa uma transformação de soma e diferença, onde o sinal de submixagem e os sinais residuais são somados para gerar um canal do pseudossinal estéreo (possivelmente, a soma também é multiplicada por um fator) e subtraídos uns dos outros para gerar o outro canal do pseudossinal estéreo (possivelmente, a diferença também é multiplicada por um fator). Preferivelmente, um primeiro canal (por exemplo, o pseudocanal esquerdo) do pseudossinal estéreo é proporcional à soma dos sinais de submi- xagem e residuais, onde um segundo canal (por exemplo, o pseudocanal direito) é proporcional à diferença dos sinais de submixagem e residuais. Assim, o sinal de submixagem DMX e o sinal residual RES do codificador PS podem ser convertidos em um pseudossinal estéreo Lp, Rp de acordo com as seguintes equações:Lp = g(DMX + RES) Rp = g(DMX - RES).
[0023] Nas equações acima o fator de normalização de ganho gtem, por exemplo, um valor de g = 712.
[0024] O pseudossinal estéreo preferivelmente é processado porum codificador estéreo perceptivo (por exemplo, como parte dos dispositivos de codificação). Com relação à codificação, codificação estéreo L/R ou codificação estéreo M/S é selecionável. O codificador estéreo perceptivo L/R ou M/S adaptativo pode ser um codificador baseado em AAC. Preferivelmente, a seleção entre codificação estéreo L/R e codificação estéreo M/S é variável com frequência; assim, a seleção pode variar para diferentes bandas de frequência tal como discutido anteriormente. Também, a seleção entre codificação L/R e codificação M/S preferivelmente é variável com tempo. A decisão entre codificação L/R e codificação M/S preferivelmente é tomada pelo codificador estéreo perceptivo.
[0025] Tal codificador perceptivo tendo a opção para codificaçãoM/S pode computar internamente (pseudo) sinais M e S (no domínio de tempo ou em bandas de frequência selecionadas) com base no pseudossinal L/R estéreo. Tais pseudossinais M e S correspondem aos sinais de submixagem e residuais (exceto para um fator de ganho possivelmente diferente). Consequentemente, se o codificador estéreo perceptivo selecionar codificação M/S, ele realmente codifica os sinais de submixagem e residuais (que correspondem aos pseudossinais M e S) tal como seria feito em um sistema usando codificação PS padrão com residual.
[0026] Além disso, sob circunstâncias especiais, o estágio detransformação compensa essencialmente a operação de submixagem anterior (exceto para um fator de ganho possivelmente diferente) de tal maneira que o sistema codificador total pode executar realmente codificação L/R do sinal estéreo total ou para uma banda de frequência do mesmo (se codificação L/R for selecionada no codificador perceptivo). Isto é, por exemplo, o caso em que os canais L e R do sinal estéreo são independentes e têm o mesmo nível tal como será explicado detalhadamente mais tarde. Assim, para uma dada banda de frequência o pseudossinal estéreo corresponde essencialmente ou é proporcional ao sinal estéreo, se - para a banda de frequência - os canais esquerdo e direito do sinal estéreo forem essencialmente independentes e tiverem essencialmente o mesmo nível.
[0027] Assim, o sistema codificador permite realmente comutarentre codificação estéreo L/R e codificação PS com residual, a fim de ser capaz de se adaptar às propriedades do dado sinal de entrada estéreo. Preferivelmente, a adaptação do esquema de codificação é dependente de tempo e frequência. Assim, preferivelmente algumas bandas de frequência do sinal estéreo são codificadas por meio de um esquema de codificação L/R, enquanto que outras bandas de frequên-cia do sinal estéreo são codificadas por meio de um esquema de codificação PS com residual. Deve ser notado que codificação M/S é basicamente um caso especial da codificação PS com residual (uma vez que a transformação de L/R para M/S é um caso especial da operação de submixagem PS) e assim o sistema codificador também pode executar codificação M/S total.
[0028] A dita modalidade tendo o estágio de transformação a jusante do codificador PS e a montante do codificador estéreo percepti- vo L/R ou M/S tem a vantagem em que um codificador PS convencional e um codificador perceptivo convencional podem ser usados. Apesar disso, o codificador PS ou o codificador perceptivo pode ser adaptado aqui por causa do uso especial.
[0029] O conceito inédito melhora o desempenho de codificação estéreo ao capacitar uma combinação eficiente de codificação PS e codificação estéreo de junção.
[0030] De acordo com uma modalidade alternativa, os dispositivosde codificação, tal como discutido anteriormente, compreendem um estágio de transformação para executar uma transformação de soma e diferença com base no sinal de submixagem e no sinal residual para uma ou mais bandas de frequência (por exemplo, para a faixa de frequências usadas total ou somente para uma faixa de frequências). A transformação pode ser executada em um domínio de frequência ou em um domínio de tempo. O estágio de transformação gera um pseu- dossinal estéreo esquerdo/direito para a uma ou mais bandas de frequência. Um canal do pseudossinal estéreo corresponde à soma e o outro canal corresponde à diferença.
[0031] Assim, no caso em que codificação é baseada nos sinaisde soma e de diferença a saída do estágio de transformação pode ser usada para codificação, enquanto que no caso em que codificação é baseada no sinal de submixagem e no sinal residual os sinais a montante do estágio de codificação podem ser usados para codificação. Assim, esta modalidade não usa duas transformações de soma e de diferença seriais no sinal de submixagem e no sinal residual, resultando no sinal de submixagem e sinal residual (exceto para um fator de ganho possivelmente diferente).
[0032] Ao selecionar codificação baseada no sinal de submixageme no sinal residual, codificação estéreo paramétrica do sinal estéreo é selecionada. Ao selecionar codificação baseada na soma e na diferença (isto é, codificação baseada no pseudossinal estéreo) codificação L/R do sinal estéreo é selecionada.
[0033] O estágio de transformação pode ser um estágio de transformação de L/R para M/S como parte de um codificador perceptivo com seleção adaptativa entre codificação estéreo L/R e M/S (possi- velmente o fator de ganho é diferente em comparação com um estágio de transformação de L/R para M/S convencional). Deve ser notado que a decisão entre codificação estéreo L/R e M/S deve ser invertida. Assim, codificação baseada no sinal de submixagem e no sinal residual é selecionada (isto é, o sinal codificado não passou pelo estágio de transformação) quando os dispositivos de decisão decidem por decodi- ficação perceptiva M/S, e codificação baseada no pseudossinal estéreo tal como gerado pelo estágio de transformação é selecionada (isto é, o sinal codificado passou pelo estágio de transformação) quando os dispositivos de decisão decidem por decodificação perceptiva L/R.
[0034] O sistema codificador de acordo com qualquer uma das modalidades discutidas anteriormente pode compreender um codificador SBR (reprodução de banda espectral) adicional. SBR é uma forma de HFR (Reconstrução de Alta frequência). Um codificador SBR determina informação lateral para a reconstrução da faixa de frequências mais altas do sinal de áudio no decodificador. Somente a faixa de frequências mais baixas é codificada pelo codificador perceptivo, reduzindo assim a taxa de bits. Preferivelmente, o codificador SBR é conectado a montante do codificador PS. Assim, o codificador SBR pode estar no domínio de estéreo e gerar parâmetros SBR para um sinal estéreo. Isto será discutido detalhadamente em conexão com os desenhos.
[0035] Preferivelmente, o codificador PS (isto é, o estágio de sub-mixagem e o estágio de determinação de parâmetro) opera em um domínio de frequência superamostrado (o decodificador PS, tal como discutido a seguir, preferivelmente também opera em um domínio de frequência superamostrado). Para transformação de tempo para frequência, por exemplo, um banco de filtros híbridos avaliados em complexos tendo um QMF (filtro em espelho de quadratura) e um filtro de Nyquist pode ser usado a montante do codificador PS tal como descrito no padrão MPEG Envolvente (ver o documento ISO/IEC 23003-1). Isto permi te processamento de sinal adaptativo de tempo e frequência sem artefatos serrilhados audíveis. A codificação L/R ou M/S adaptativa, por outro lado, preferivelmente é executada no domínio MDCT amostrado criticamente (por exemplo, tal como descrito em AAC) a fim de assegurar uma representação de sinal quantificada eficiente.
[0036] A conversão entre sinais de submixagem e residuais e opseudossinal estéreo L/R pode ser executada no domínio de tempo uma vez que o codificador PS e o codificador estéreo perceptivo tipicamente são conectados no domínio de tempo em qualquer modo. Assim, o estágio de transformação para gerar o pseudossinal L/R pode operar no domínio de tempo.
[0037] Em outras modalidades, tal como discutido em conexãocom os desenhos, o estágio de transformação opera em um domínio de frequência superamostrado ou em um domínio MDCT amostrado criticamente.
[0038] Um segundo aspecto do pedido diz respeito a um sistemadecodificador para decodificar um sinal de fluxo de bits tal como gerado pelo sistema codificador discutido anteriormente.
[0039] De acordo com uma modalidade do sistema decodificador,o sistema decodificador compreende dispositivos de decodificação perceptiva para decodificação baseada no sinal de fluxo de bits. Os dispositivos de decodificação são configurados para gerar por meio de decodificação um primeiro sinal (interno) e um segundo sinal (interno) e para produzir um sinal de submixagem e um sinal residual. O sinal de submixagem e o sinal residual são seletivamente- baseados na soma do primeiro sinal e do segundo sinal e baseados na diferença do primeiro sinal e do segundo sinal ou- baseados no primeiro sinal e baseados no segundo sinal.
[0040] Tal como discutido anteriormente em conexão com o sistema codificador, também aqui a seleção pode ser variável com fre- quência ou invariável com frequência.
[0041] Além disso, o sistema compreende um estágio de supermi-xagem para gerar o sinal estéreo com base no sinal de submixagem e no sinal residual, com a operação de supermixagem do estágio de su- permixagem sendo dependente do um ou mais parâmetros estéreos paramétricos.
[0042] Analogamente ao sistema codificador, o sistema decodifi-cador permite realmente comutar entre decodificação L/R e decodifi- cação PS com residual, preferivelmente em um modo variável com tempo e frequência.
[0043] De acordo com uma outra modalidade, o sistema decodifi-cador compreende um decodificador estéreo perceptivo (por exemplo, como parte dos dispositivos de decodificação) para decodificar o sinal de fluxo de bits, com o decodificador gerando um pseudossinal estéreo. O decodificador perceptivo pode ser um decodificador baseado em AAC. Com relação ao decodificador estéreo perceptivo, decodifi- cação perceptiva L/R ou decodificação perceptiva M/S é selecionável em um modo variável com frequência ou invariável com frequência (a seleção real preferivelmente é controlada pela decisão no codificador que é transportada como informação lateral no fluxo de bits). O decodi- ficador seleciona o esquema de decodificação com base no esquema de codificação usado para codificação. O esquema de codificação usado pode ser indicado para o decodificador por meio de informação contida no fluxo de bits recebido.
[0044] Além disso, um estágio de transformação é fornecido paragerar um sinal de submixagem e um sinal residual ao executar uma transformação do pseudossinal estéreo. Em outras palavras: O pseu- dossinal estéreo tal como obtido do decodificador perceptivo é convertido de volta para os sinais de submixagem e residuais. Tal transformação é uma transformação de soma e diferença: O sinal de submi- xagem resultante é proporcional à soma de um canal esquerdo e um canal direito do pseudossinal estéreo. O sinal resultante residual é proporcional à diferença do canal esquerdo e o canal direito do pseu- dossinal estéreo. Assim, quase que uma transformação de L/R para M/S foi executada. O pseudossinal estéreo com os dois canais Lp, Rp pode ser convertido nos sinais de submixagem e residuais de acordo com as seguintes equações:
Figure img0003
[0045] Nas equações acima o fator de normalização de ganho gpode ter, por exemplo, um valor de g = ^12. O sinal residual RES usado no decodificador pode cobrir a faixa de frequências de áudio usada total ou somente uma parte da faixa de frequências de áudio usada.
[0046] Os sinais de submixagem e residuais são então processados por meio de um estágio de supermixagem de um decodificador PS para obter o sinal de saída estéreo final. A supermixagem dos sinais de submixagem e residuais para o sinal estéreo é dependente dos parâmetros PS recebidos.
[0047] De acordo com uma modalidade alternativa, os dispositivosde decodificação perceptiva podem compreender um estágio de transformação de soma e diferença para executar uma transformação com base no primeiro sinal e no segundo sinal para uma ou mais bandas de frequência (por exemplo, para a faixa de frequências usadas total). Assim, o estágio de transformação gera o sinal de submixagem e o sinal residual para o caso em que o sinal de submixagem e o sinal residual são baseados na soma do primeiro sinal e do segundo sinal e baseados na diferença do primeiro sinal e do segundo sinal. O estágio de transformação pode operar no domínio de tempo ou em um domí- nio de frequência.
[0048] Tal como discutido de forma similar em conexão com o sistema codificador, o estágio de transformação pode ser um estágio de transformação de M/S para L/R como parte de um decodificador per- ceptivo com seleção adaptativa entre decodificação estéreo L/R e M/S (possivelmente o fator de ganho é diferente em comparação com um estágio de transformação de M/S para L/R convencional). Deve ser notado que a seleção entre decodificação estéreo L/R e M/S deve ser invertida.
[0049] O sistema decodificador de acordo com qualquer uma dasmodalidades precedentes pode compreender um decodificador SBR adicional para decodificar a informação lateral proveniente do codificador SBR e gerar um componente de alta frequência do sinal de áudio. Preferivelmente, o decodificador SBR é localizado a jusante do decodificador PS. Isto será discutido detalhadamente em conexão com desenhos.
[0050] Preferivelmente, o estágio de supermixagem opera em umdomínio de frequência superamostrado; por exemplo, um banco de filtros híbridos tal como discutido anteriormente pode ser usado a montante do decodificador PS.
[0051] A transformação de L/R para M/S pode ser executada nodomínio de tempo uma vez que o decodificador perceptivo e o decodi- ficador PS (incluindo o estágio de supermixagem) tipicamente são conectados no domínio de tempo.
[0052] Em outras modalidades, tal como discutido em conexãocom os desenhos, a transformação de L/R para M/S é executada em um domínio de frequência superamostrado (por exemplo, QMF), ou em um domínio de frequência amostrado criticamente (por exemplo, MDCT).
[0053] Um terceiro aspecto do pedido diz respeito a um métodopara codificar um sinal estéreo para um sinal de fluxo de bits. O méto- do opera analogamente ao sistema codificador discutido anteriormente. Assim, as observações anteriores relacionadas com o sistema codificador basicamente também são aplicáveis ao método de codificação.
[0054] Um quarto aspecto da invenção diz respeito a um métodopara decodificar um sinal de fluxo de bits incluindo parâmetros PS para gerar um sinal estéreo. O método opera no mesmo modo que o sistema decodificador discutido anteriormente. Assim, as observações anteriores relacionadas com o sistema decodificador basicamente também são aplicáveis ao método de decodificação.
[0055] A invenção é explicada a seguir por meio de exemplos ilustrativos com referência aos desenhos anexos, em que:
[0056] A figura 1 ilustra uma modalidade de um sistema codificador, onde opcionalmente os parâmetros PS ajudam no controle fisico- acústico no codificador estéreo perceptivo;
[0057] A figura 2 ilustra uma modalidade do codificador PS;
[0058] A figura 3 ilustra uma modalidade de um sistema decodifi-cador;
[0059] A figura 4 ilustra uma modalidade adicional do codificadorPS incluindo um detector para desativar codificação PS se codificação L/R for benéfica;
[0060] A figura 5 ilustra uma modalidade de um sistema codificador PS convencional tendo um codificador SBR adicional para a sub- mixagem;
[0061] A figura 6 ilustra uma modalidade de um sistema codificador tendo um codificador SBR adicional para o sinal de submixagem;
[0062] A figura 7 ilustra uma modalidade de um sistema codificador tendo um codificador SBR adicional no domínio de estéreo;
[0063] As figuras 8a-8d ilustram várias representações tempo-frequência de um dos dois canais de saída na saída de decodificador;
[0064] A figura 9a ilustra uma modalidade do codificador central;
[0065] A figura 9b ilustra uma modalidade de um codificador quepermite comutar entre codificação em um domínio preditivo linear (tipicamente só para sinais mono) e codificação em um domínio de transformação (tipicamente para ambos os sinais mono e estéreo);
[0066] A figura 10 ilustra uma modalidade de um sistema codificador;
[0067] A figura 11a ilustra uma parte de uma modalidade de umsistema codificador;
[0068] A figura 11b ilustra uma implementação exemplar da modalidade na figura 11a;
[0069] A figura 11c ilustra uma alternativa para a modalidade nafigura 11a;
[0070] A figura 12 ilustra uma modalidade de um sistema codificador;
[0071] A figura 13 ilustra uma modalidade do codificador estéreocomo parte do sistema codificador da figura 12;
[0072] A figura 14 ilustra uma modalidade de um sistema decodifi-cador para decodificar o sinal de fluxo de bits tal como gerado pelo sistema codificador da figura 6;
[0073] A figura 15 ilustra uma modalidade de um sistema decodifi-cador para decodificar o sinal de fluxo de bits tal como gerado pelo sistema codificador da figura 7;
[0074] A figura 16a ilustra uma parte de uma modalidade de umsistema decodificador;
[0075] A figura 16b ilustra uma implementação exemplar da modalidade na figura 16a;
[0076] A figura 16c ilustra uma alternativa para a modalidade nafigura 16a;
[0077] A figura 17 ilustra uma modalidade de um sistema codificador; e
[0078] A figura 18 ilustra uma modalidade de um sistema decodifi-cador.
[0079] A figura 1 mostra uma modalidade de um sistema codificador que combina codificação PS usando um residual com codificação estéreo perceptiva L/R ou M/S adaptativa. Esta modalidade é meramente ilustrativa para os princípios do presente pedido. É entendido que modificações e variações da modalidade estarão aparentes para os versados na técnica. O sistema codificador compreende um codificador PS 1 recebendo um sinal estéreo L, R. O codificador PS 1 tem um estágio de submixagem para gerar submixagem DMX e sinais residuais RES com base no sinal estéreo L, R. Esta operação pode ser descrita por meio de uma matriz de submixagem 2-2 H-1 que converte os sinais L e R no sinal de submixagem DMX e no sinal residual RES:
Figure img0004
[0080] Tipicamente, a matriz H-1 é variável com frequência e variável com tempo, isto é, os elementos da matriz H-1 variam por causa de frequência e variam de intervalo de tempo para intervalo de tempo. A matriz H-1 pode ser atualizada a cada quadro (por exemplo, a cada 21 ou 42 ms) e pode ter uma resolução de frequência de uma pluralidade de bandas, por exemplo, 28, 20, ou 10 bandas (nomeadas "bandas de parâmetro") em uma escala de frequências orientada de forma percep- tiva (tal como de Bark).
[0081] Os elementos da matriz H-1 dependem dos parâmetros PSvariáveis com tempo e com frequência IID (diferença de intensidade entre canais; também chamada de CLD - diferença de nível de canal) e de ICC (correlação cruzada entre canais). Para determinar os parâmetros PS 5, por exemplo, IID e ICC, o codificador PS 1 compreende um estágio de determinação de parâmetro. Um exemplo para computar os elementos de matriz da matriz inversa H é dado pelo exposto a seguir e descrito no documento de especificação MPEG Envolvente ISO/IEC 23003-1, subcláusula 6.5.3.2 que está incorporado neste do- cumento pela referência:
Figure img0005
e onde p = ICC.
[0082] Além disso, o sistema codificador compreende um estágiode transformação 2 que converte o sinal de submixagem DMX e o sinal residual RES provenientes do codificador PS 1 em um pseudossi- nal estéreo Lp, Rp, por exemplo, de acordo com as seguintes equações:Lp = g(DMX + RES)Rp = g(DMX - RES).
[0083] Nas equações acima o fator de normalização de ganho gtem, por exemplo, um valor de g-712 • Para g-712, as duas equa-ções para o pseudossinal estéreo Lp, Rp podem ser reescritas como:
Figure img0006
[0084] O pseudossinal estéreo Lp, Rp é então fornecido para umcodificador estéreo perceptivo 3, o qual seleciona adaptativamente codificação estéreo L/R ou M/S. A codificação M/S é uma forma de codificação estéreo de junção. A codificação L/R também pode ser baseada em aspectos de codificação de junção; por exemplo, bits podem ser alocados conjuntamente para os canais L e R a partir de um depósito de bits comum.
[0085] A seleção entre codificação estéreo L/R ou M/S preferivelmente é variável com frequência, isto é, algumas bandas de frequência podem ser codificadas por L/R, enquanto que outras bandas de frequência podem ser codificadas por M/S. Uma modalidade para implementar a seleção entre codificação estéreo L/R ou M/S está descrita no documento "Sum-Difference Stereo Transform Coding", J. D. Johnston e outros, IEEE International Conference on Acoustic, Speech, and Signal Processing (ICASSP) 1992, páginas 569-572. A discussão da seleção entre codificação estéreo L/R ou M/S no mesmo, nas seções particulares 5.1 e 5.2, está incorporada neste documento pela referência.
[0086] Com base no pseudossinal estéreo Lp, Rp, o codificadorperceptivo 3 pode computar internamente os (pseudo) sinais cen- trais/laterais Mp, Sp. Tais sinais correspondem basicamente ao sinal de submixagem DMX e ao sinal residual RES (exceto para um fator de ganho possivelmente diferente). Consequentemente, se o codificador perceptivo 3 selecionar codificação M/S para uma banda de frequência, o codificador perceptivo 3 codifica basicamente o sinal de submi- xagem DMX e o sinal residual RES para essa banda de frequência (exceto para um fator de ganho possivelmente diferente) tal como também seria feito em um sistema codificador perceptivo convencional usando codificação PS com residual convencional. Os parâmetros PS 5 e o fluxo de bits de saída 4 do codificador perceptivo 3 são multiple- xados para um único fluxo de bits 6 por um multiplexador 7.
[0087] Além da codificação PS do sinal estéreo, o sistema codificador na figura 1 permite codificação L/R do sinal estéreo tal como será explicado no seguinte: Tal como discutido anteriormente, os elementos da matriz de submixagem H-1 do codificador (e também da matriz de supermixagem H usada no decodificador) dependem dos parâmetros PS variáveis com tempo e com frequência IID (diferença de intensidade entre canais; também chamada de CLD - diferença de nível de canal) e de ICC (correlação cruzada entre canais). Um exemplo para computar os elementos de matriz da matriz de supermixagem H está descrito acima. No caso de usar codificação residual, a colunadireita da matriz de supermixagem 2-2 H é dada por
Figure img0007
[0088] Entretanto, preferivelmente, a coluna direita da matriz 2^2 Hem vez disto deve ser modificada para
Figure img0008
[0089] A coluna esquerda preferivelmente é computada tal comofornecido na especificação MPEG Envolvente.
[0090] Modificar a coluna direita da matriz de supermixagem H assegura que para IID = 0 dB e ICC = 0 (isto é, o caso onde para a respectiva banda os canais estéreos L e R são independentes e têm o mesmo nível) a seguinte matriz de supermixagem H é obtida para a banda:
Figure img0009
[0091] Deve-se notar que a matriz de supermixagem H e tambéma matriz de submixagem H-1 tipicamente são variáveis com frequência e variáveis com tempo. Assim, os valores das matrizes são diferentes para diferentes posicionamentos lado a lado de tempo/frequência (um posicionamento lado a lado corresponde à interseção de uma banda de frequência particular e um período de tempo particular). No caso mencionado anteriormente a matriz de submixagem H-1 é idêntica à matriz de supermixagem H. Assim, para a banda o pseudossinal estéreo Lp, Rp pode ser computado pela seguinte equação:
Figure img0010
[0092] Consequentemente, neste caso a codificação PS com residual usando a matriz de submixagem H-1 seguida pela geração do pseudossinal L/R no estágio de transformação 2 corresponde à matriz unidade e não muda o sinal estéreo para a respectiva banda de frequência de qualquer modo, isto é,Lp = LRp = R.
[0093] Em outras palavras: o estágio de transformação 2 compensa a matriz de submixagem H-1 de tal maneira que o pseudossinal estéreo Lp, Rp corresponde ao sinal estéreo de entrada L, R. Isto permite codificar o sinal estéreo de entrada original L, R pelo codificador per- ceptivo 3 para a banda particular. Quando codificação L/R é selecionada pelo codificador perceptivo 3 para codificar a banda particular, o sistema codificador se comporta como um codificador perceptivo L/R para codificar a banda do sinal de entrada estéreo L, R.
[0094] O sistema codificador na figura 1 permite comutação seminterrupção e adaptativa entre codificação L/R e codificação PS com residual em um modo variável com frequência e com tempo. O sistema codificador evita descontinuidades na forma de onda quando comutando o esquema de codificação. Isto impede artefatos. A fim de alcançar transições suaves, interpolação linear pode ser aplicada aos elementos da matriz H-1 no codificador e da matriz H no decodificador para amostras entre duas atualizações de parâmetros estéreos.
[0095] A figura 2 mostra uma modalidade do codificador PS 1. Ocodificador PS 1 compreende um estágio de submixagem 8 que gera o sinal de submixagem DMX e o sinal residual RES com base no sinal estéreo L, R. Adicionalmente, o codificador PS 1 compreende um estágio de estimativa de parâmetro 9 para estimar os parâmetros PS 5 com base no sinal estéreo L, R.
[0096] A figura 3 ilustra uma modalidade de um sistema decodifi- cador correspondente configurado para decodificar o fluxo de bits 6 tal como gerado pelo sistema codificador da figura 1. Esta modalidade é meramente ilustrativa para os princípios do presente pedido. É entendido que modificações e variações da modalidade estarão aparentes para os versados na técnica. O sistema decodificador compreende um demultiplexador 10 para separar os parâmetros PS 5 e o fluxo de bits de áudio 4 tal como gerado pelo codificador perceptivo 3. O fluxo de bits de áudio 4 é fornecido para um decodificador estéreo perceptivo 11, o qual pode decodificar seletivamente um fluxo de bits codificado L/R ou um fluxo de bits de áudio codificado M/S. A operação do deco- dificador 11 é o inverso da operação do codificador 3. Analogamente para o codificador perceptivo 3, o decodificador perceptivo 11 preferivelmente permite um esquema de decodificação variável com frequên-cia e variável com tempo. Algumas bandas de frequência que são codificadas por L/R pelo codificador 3 são decodificadas por L/R pelo de- codificador 11, enquanto que outras bandas de frequência que são codificadas por M/S pelo codificador 3 são decodificadas por M/S pelo decodificador 11. O decodificador 11 produz o pseudossinal estéreo Lp, Rp que foi introduzido no codificador perceptivo 3 anteriormente. O pseudossinal estéreo Lp, Rp tal como obtido do decodificador percepti- vo 11 é convertido de volta para o sinal de submixagem DMX e o sinal residual RES por meio de um estágio de transformação de L/R para M/S 12. A operação do estágio de transformação de L/R para M/S 12 no lado de decodificador é o inverso da operação do estágio de transformação 2 no lado de codificador. Preferivelmente, o estágio de transformação 12 determina o sinal de submixagem DMX e o sinal residual RES de acordo com as seguintes equações:
Figure img0011
[0097] Nas equações acima, o fator de normalização de ganho g éidêntico ao fator de normalização de ganho g no lado de codificador e tem, por exemplo, um valor de g = 712.
[0098] O sinal de submixagem DMX e o sinal residual RES sãoentão processados pelo decodificador PS 13 para obter os sinais de saída L e R finais. A etapa de supermixagem no processo de decodifi- cação para codificação PS com um residual pode ser descrita por meio da matriz de supermixagem 2^2 H que converte o sinal de submixa- gem DMX e o sinal residual RES de volta para os canais L e R:
Figure img0012
[0099] A computação dos elementos da matriz de supermixagemH já foi discutida anteriormente.
[00100] O processo de codificação PS e de decodificação PS no codificador PS 1 e no decodificador PS 13 preferivelmente é executado em um domínio de frequência superamostrado. Para transformação de tempo para frequência, por exemplo, um banco de filtros híbridos avaliados em complexos tendo um QMF (filtro em espelho de quadratura) e um filtro de Nyquist pode ser usado a montante do codificador PS, tal como o banco de filtros descrito no padrão MPEG Envolvente (ver o documento ISO/IEC 23003-1). A representação QMF complexa do sinal é superamostrada com fator 2 uma vez que ela é avaliada em complexos e não avaliada em reais. Isto permite processamento de sinal adaptativo de tempo e frequência sem artefatos serrilhados audíveis. Tal banco de filtros híbridos tipicamente fornece alta resolução de frequência (banda estreita) em frequências baixas, enquanto que em frequência alta diversas bandas QMF são agrupadas em uma banda mais larga. O documento "Low Complexity Parametric Stereo Coding in MPEG-4", H. Purnhagen, Proc. da 7th Int. Conference on Digital Audio Effects (DAFx'04), Nápoles, Itália, 5-8 de outubro de 2004, páginas 163-168 descreve uma modalidade de um banco de filtros híbridos (ver a seção 3.2 e a figura 4). Esta revelação está incorporada neste documento pela referência. Neste documento uma taxa de amostragem de 48 kHz é assumida, com a largura de banda (nominal) de uma banda de um banco QMF de 64 bandas sendo 375 Hz. A escala de frequências de Bark perceptiva, entretanto, solicita uma largura de banda de aproximadamente 100 Hz para frequências abaixo de 500 Hz. Consequentemente, as 3 primeiras bandas QMF podem ser divididas adicionalmente em sub-bandas mais estreitas por meio de um banco de filtros de Nyquist. A primeira banda QMF pode ser dividida em 4 bandas (mais duas para frequências negativas), e as segunda e terceira bandas QMF podem ser divididas em duas bandas cada.
[00101] Preferivelmente, a codificação L/R ou M/S adaptativa, por outro lado, é executada no domínio MDCT amostrado criticamente (por exemplo, tal como descrito em AAC) a fim de assegurar uma representação de sinal quantificada eficiente. A conversão do sinal de submi- xagem DMX e do sinal residual RES para o pseudossinal estéreo Lp, Rp no estágio de transformação 2 pode ser executada no domínio de tempo uma vez que o codificador PS 1 e o codificador perceptivo 3 podem ser conectados no domínio de tempo em qualquer modo. Também no sistema de decodificação, o decodificador estéreo perceptivo 11 e o decodificador PS 13 preferivelmente são conectados no domínio de tempo. Assim, a conversão do pseudossinal estéreo Lp, Rp para o sinal de submixagem DMX e o sinal residual RES no estágio de transformação 12 também pode ser executada no domínio de tempo.
[00102] Um codificador estéreo L/R ou M/S adaptativo tal como mostrado como o codificador 3 na figura 1 tipicamente é um codificador de áudio perceptivo que incorpora um modelo fisicoacústico para capacitar alta eficiência de codificação em baixas taxas de bits. Um exemplo para tal codificador é um codificador AAC, o qual emprega codificação de transformação em um domínio MDCT amostrado criticamente em combinação com quantificação variável com tempo e com frequência controlada ao usar um modelo fisicoacústico. Também, a decisão variável com tempo e com frequência entre codificação L/R e M/S é tipicamente controlada com ajuda de medidas de entropia per- ceptiva que são calculadas usando um modelo fisicoacústico.
[00103] O codificador estéreo perceptivo (tal como o codificador 3 na figura 1) opera em um pseudossinal estéreo L/R (ver Lp, Rp na figura 1). Para otimizar a eficiência de codificação do codificador estéreo (em particular para tomar a decisão correta entre codificação L/R e codificação M/S) é vantajoso modificar o mecanismo de controle fisicoa- cústico (incluindo o mecanismo de controle que decide entre codificação estéreo L/R e M/S e o mecanismo de controle que controla a quantificação variável com tempo e com frequência) no codificador estéreo perceptivo a fim de considerar as modificações de sinal (conversão de pseudo L/R em DMX e RES, seguida por decodificação PS) que são aplicadas no decodificador ao gerar o sinal de saída estéreo final L, R. Estas modificações de sinal podem afetar fenômenos de mascaramento birauricular que são explorados no mecanismos de controle fisicoacústico. Portanto, estes mecanismos de controle fisico- acústico preferivelmente devem ser adaptados desta maneira. Para isto, pode ser benéfico se os mecanismos de controle fisicoacústico não terem acesso somente ao pseudossinal L/R (ver Lp, Rp na figura 1), mas também aos parâmetros PS (ver 5 na figura 1) e/ou ao sinal estéreo original L, R. O acesso dos mecanismos de controle fisicoa- cústico aos parâmetros PS e ao sinal estéreo L, R está indicado na figura 1 pelas linhas tracejadas. Com base nesta informação, por exemplo, o(s) limiar(s) de mascaramento pode(m) ser adaptado(s).
[00104] Uma abordagem alternativa para otimizar controle fisicoa- cústico é aumentar o sistema codificador com um detector formando um estágio de desativação que seja capaz de desativar efetivamente codificação PS quando apropriado, preferivelmente em um modo variável com tempo e com frequência. Desativar codificação PS, por exemplo, é apropriado quando é suposto que codificação estéreo L/R é benéfica ou quando o controle fisicoacústico teria problemas para codificar o pseudossinal L/R de forma eficiente. Codificação PS pode ser desativada efetivamente ao estabelecer a matriz de submixagem H-1 de uma tal maneira que a matriz de submixagem H-1 seguida pela transformação (ver o estágio 2 na figura 1) corresponda à matriz unidade (isto é, a uma operação de identidade) ou à matriz unidade vezes um fator. Por exemplo, codificação PS pode ser desativada efetivamente ao forçar os parâmetros PS IID e/ou ICC para IID = 0 dB e ICC = 0. Neste caso o pseudossinal estéreo Lp, Rp corresponde ao sinal estéreo L, R tal como discutido anteriormente.
[00105] Tal detector controlando uma modificação de parâmetro PS está mostrado na figura 4. Aqui, o detector 20 recebe os parâmetros PS 5 determinados pelo estágio de estimativa de parâmetro 9. Quando o detector não desativa a codificação PS, o detector 20 passa os parâmetros PS para o estágio de submixagem 8 e para o multiplexador 7, isto é, neste caso os parâmetros PS 5 correspondem aos parâmetros PS 5' fornecidos para o estágio de submixagem 8. No caso de o detector detectar que codificação PS é desvantajosa e codificação PS deve ser desativada (para uma ou mais bandas de frequência), o detector modifica os parâmetros PS 5 afetados (por exemplo, estabelece os parâmetros PS IID e/ou ICC para IID = 0 dB e ICC = 0) e fornece os parâmetros PS modificados 5' para estágio de submixagem 8. O detector opcionalmente também pode considerar os sinais esquerdo e direito L, R para decidir a respeito de uma modificação de parâmetro PS (ver as linhas tracejadas na figura 4).
[00106] Nas figuras seguintes, o termo QMF (filtro ou banco de fil- tros em espelho de quadratura) também inclui um banco de filtros de sub-banda QMF em combinação com um banco de filtros de Nyquist, isto é, uma estrutura de banco de filtros híbridos. Além disso, todos os valores na descrição a seguir podem ser dependentes de frequência, por exemplo, diferentes matrizes de submixagem e de supermixagem podem ser extraídas para diferentes faixas de frequências. Além disso, a codificação residual pode abranger somente parte da faixa de frequências de áudio usada (isto é, o sinal residual é codificado somente para uma parte da faixa de frequências de áudio usada). Aspectos de submixagem, tal como será delineado a seguir, podem ocorrer para algumas faixas de frequências no domínio QMF (por exemplo, de acordo com técnica anterior), enquanto que para outras faixas de frequências, por exemplo, somente aspectos de fase serão tratados no domínio QMF complexo, enquanto que transformação de amplitude é tratada no domínio MDCT de valores reais.
[00107] Na figura 5, um sistema codificador PS convencional está representado. Cada um dos canais estéreos L, R, a princípio é analisado por um QMF complexo 30 com M sub-bandas, por exemplo, um QMF com M = 64 sub-bandas. Os sinais de sub-banda são usados para estimar os parâmetros PS 5 e um sinal de submixagem DMX em um codificador PS 31. O sinal de submixagem DMX é usado para estimar os parâmetros SBR (Reprodução de Largura de Banda Espectral) 33 em um codificador SBR 32. O codificador SBR 32 extrai os parâmetros SBR 33 representando o envoltório espectral do sinal de banda alta original, possivelmente em combinação com medidas de ruído e tonalidade. Tal como o oposto ao codificador PS 31, o codificador SBR 32 não afeta o sinal passado para o codificador central 34. O sinal de submixagem DMX do codificador PS 31 é sintetizado usando um QMF inverso 35 com N sub-bandas. Por exemplo, um QMF complexo com N = 32 pode ser usado, onde somente as 32 sub bandas mais baixas das 64 sub-bandas usadas pelo codificador PS 31 e pelo codificador SBR 32 são sintetizadas. Assim, ao usar metade do número de sub-bandas para o mesmo tamanho de quadro, um sinal de domínio de tempo de metade da largura de banda quando comparado à entrada é obtido, e passado para o codificador central 34. Por causa da largura de banda reduzida a taxa de amostragem pode ser reduzida pela metade (não mostrado). O codificador central 34 executa codificação perceptiva do sinal de entrada mono para gerar um fluxo de bits 36. Os parâmetros PS 5 são embutidos no fluxo de bits 36 por um mul- tiplexador (não mostrado).
[00108] A figura 6 mostra uma modalidade adicional de um sistema codificador que combina codificação PS usando um residual com um codificador estéreo central 48, com o codificador estéreo central 48 sendo capaz de codificação estéreo perceptiva L/R ou M/S adaptativa. Esta modalidade é meramente ilustrativa para os princípios do presente pedido. É entendido que modificações e variações da modalidade estarão aparentes para os versados na técnica. Os canais de entrada L, R representando os canais originais esquerdo e direito são analisados por um QMF complexo 30, em um modo similar tal como discutido em conexão com a figura 5. Ao contrário do codificador PS 31 na figura 5, o codificador PS 41 na figura 6 não somente produz um sinal de submi- xagem DMX, mas também produz um sinal residual RES. O sinal de submixagem DMX é usado por um codificador SBR 32 para determinar os parâmetros SBR 33 do sinal de submixagem DMX. Um DMX/RES fixado para pseudotransformação L/R (isto é, uma transformação de M/S para L/R) é aplicado ao sinal de submixagem DMX e ao sinal residual RES em um estágio de transformação 2. O estágio de transformação 2 na figura 6 corresponde ao estágio de transformação 2 na figura 1. O estágio de transformação 2 cria um "pseudossinal" de canal es-querdo e direito Lp, Rp para o codificador central 48 operar. Nesta moda- lidade, a transformação de L/R para M/S inversa é aplicada no domínio QMF, antes da síntese de sub-banda pelos bancos de filtros 35. Preferivelmente, o número N (por exemplo, N = 32) de sub-bandas para a síntese corresponde à metade do número M (por exemplo, M = 64) de subbandas usadas para a análise e o codificador central 48 opera na metade da taxa de amostragem. Deve ser notado que não existe restrição para usar 64 canais de sub-bandas para a análise QMF no codificador e 32 sub-bandas para a síntese, e outros valores são possíveis igualmente, dependendo de qual taxa de amostragem é desejada para o sinal recebido pelo codificador central 48. O codificador estéreo central 48 executa codificação perceptiva do sinal dos bancos de filtros 35 para gerar um sinal de fluxo de bits 46. Os parâmetros PS 5 são embutidos no sinal de fluxo de bits 46 por um multiplexador (não mostrado). Opcionalmente, os parâmetros PS e/ou o sinal de entrada L/R original podem ser usados pelo codificador central 48. Tal informação indica para o codificador central 48 como o codificador PS 41 girou o espaço estéreo. A informação pode guiar o codificador central 48 para como controlar quantificação em um modo ideal de forma perceptiva. Isto está indicado na figura 6 pelas linhas tracejadas.
[00109] A figura 7 ilustra uma modalidade adicional de um sistema codificador que é similar à modalidade na figura 6. Em comparação com a modalidade da figura 6, na figura 7 o codificador SBR 42 está conectado a montante do codificador PS 41. Na figura 7 o codificador SBR 42 foi deslocado para antes do codificador PS 41, operando assim nos canais esquerdo e direito (aqui: no domínio QMF), em vez de operar no sinal de submixagem DMX tal como na figura 6.
[00110] Por causa do rearranjo do codificador SBR 42, o codificador PS 41 pode ser configurado para operar não na largura total de banda do sinal de entrada, mas, por exemplo, somente na faixa de frequências abaixo da frequência de cruzamento SBR. Na figura 7, os parâ- metros SBR 43 são em estéreo para a faixa SBR, e a saída do decodi- ficador PS correspondente tal como será discutido mais tarde em conexão com a figura 15 produz uma faixa de frequências de fonte de estéreo para o decodificador SBR operar. Esta modificação, isto é, conectar o módulo codificador SBR 42 a montante do módulo codificador PS 41 no sistema codificador e colocar correspondentemente o módulo decodificador SBR após o módulo decodificador PS no sistema de- codificador (ver a figura 15), tem o benefício em que o uso de um sinal descorrelacionado para gerar a saída estéreo pode ser reduzido. Deve-se notar que no caso de não existir sinal residual em qualquer modo ou para uma banda de frequência particular, uma versão descorre- lacionada do sinal de submixagem DMX é usada em vez de o decodi- ficador PS. Entretanto, uma reconstrução baseada em um sinal des- correlacionado reduz a qualidade de áudio. Assim, reduzir o uso do sinal descorrelacionado aumenta a qualidade de áudio.
[00111] Esta vantagem da modalidade na figura 7 em comparação com a modalidade na figura 6 será agora explicada mais detalhadamente com referência às figuras 8a a 8d.
[00112] Na figura 8a, uma representação tempo-frequência de um dos dois canais de saída L, R (no lado de decodificador) é visualizada. No caso da figura 8a, um codificador é usado onde o módulo de codificação PS é colocado na frente do módulo de codificação SBR tal como o codificador na figura 5 ou na figura 6 (no decodificador o decodi- ficador PS é colocado após o decodificador SBR; ver a figura 14). Além disso, o residual é codificado somente em uma faixa de frequências de baixa largura de banda 50, a qual é menor que a faixa de frequências 51 do codificador central. Tal como está evidente a partir da visualização de espectrograma na figura 8a, a faixa de frequências 52 onde um sinal descorrelacionado é para ser usado pelo decodificador PS abrange toda a faixa de frequências a partir da faixa de frequências mais baixas 50 coberta pelo uso do sinal residual. Além disso, a SBR abrange uma faixa de frequências 53 iniciando significativamente maior que aquela do sinal descorrelacionado. Assim, a faixa de frequências total é separada nas seguintes faixas de frequências: na faixa de frequências mais baixas (ver a faixa 50 na figura 8a), codificação de forma de onda é usada; na faixa de frequências central (ver interseção das faixas de frequências 51 e 52), codificação de forma de onda em combinação com um sinal descorrelacionado é usada; e na faixa de frequências mais altas (ver a faixa de frequências 53), um sinal SBR restaurado que é restaurado a partir das frequências menores é usado em combinação com o sinal descorrelacionado produzido pelo decodi- ficador PS.
[00113] Na figura 8b, uma representação tempo-frequência de um dos dois canais de saída L, R (no lado de decodificador) é visualizada para o caso em que o codificador SBR é conectado a montante do codificador PS no sistema codificador (e o decodificador SBR é localizado após o decodificador PS no sistema decodificador). Na figura 8b um cenário de baixa taxa de bits está ilustrado, com a largura de banda de sinal residual 60 (onde codificação residual é executada) sendo menor que a largura de banda do codificador central 61. Uma vez que o processo de decodificação SBR opera no lado de decodificador após o decodificador PS (ver a figura 15), o sinal residual usado para as frequências baixas também é usado para a reconstrução de pelo menos uma parte (ver a faixa de frequências 64) das frequências mais altas na faixa SBR 63.
[00114] A vantagem se torna ainda mais aparente ao operar em taxas de bits intermediárias onde a largura de banda de sinal residual se aproxima ou é igual à largura de banda de codificador central. Neste caso, a representação tempo-frequência da figura 8a (onde a ordem de codificação PS e codificação SBR tal como mostrada na figura 6 é usada) resulta na representação tempo-frequência mostrada na figura 8c. Na figura 8c, o sinal residual cobre essencialmente a faixa de banda baixa total 51 do codificador central; na faixa de frequências SBR 53 o sinal descorrelacionado é usado pelo decodificador PS. Na figura 8d, a representação tempo-frequência no caso da ordem preferida dos módulos de codificação/decodificação (isto é, codificação SBR operando em um sinal estéreo antes da codificação PS, tal como mostrado na figura 7) é visualizada. Aqui, o módulo de decodificação PS opera antes do módulo de decodificação SBR no decodificador, tal como mostrado na figura 15. Assim, o sinal residual é parte da banda baixa usada para reconstrução de frequência alta. Quando a largura de banda de sinal residual se iguala àquela largura de banda de sinal de submixagem mono, nenhuma informação de sinal descorrelacionada não será necessária para decodificar o sinal de saída (ver a faixa de frequências total que está hachurada na figura 8d).
[00115] Na figura 9a, está ilustrada uma modalidade do codificador central estéreo 48 com codificação estéreo L/R ou M/S selecionável adaptativamente no domínio de transformação MDCT. Tal codificador estéreo 48 pode ser usado nas figuras 6 e 7. Um codificador central mono 34 tal como mostrado na figura 5 pode ser considerado como um caso especial do codificador central estéreo 48 na figura 9a, onde somente um único canal de entrada mono é processado (isto é, onde o segundo canal de entrada, mostrado como linha tracejada na figura 9a, não está presente).
[00116] Na figura 9b, está ilustrada uma modalidade de um codificador mais generalizado. Para sinais mono, codificação pode ser comutada entre codificação em um domínio preditivo linear (ver o bloco 71) e codificação em um domínio de transformação (ver o bloco 48). Tal tipo de codificador central introduz diversos métodos de codificação que podem ser usados de forma adaptativa dependentes das características do sinal de entrada. Aqui, o codificador pode escolher para codificar o sinal usando um codificador de transformação estilo AAC 48 (disponível para sinais mono e estéreo, com codificação L/R ou M/S selecionável adaptativamente no caso de sinais estéreos) ou um codificador central estilo AMR-WB+ (Multitaxa Adaptativa - Banda Larga Mais) 71 (somente disponível para sinais mono). O codificador central AMR-WB+ 71 avalia o residual de um preditor linear 72, e por sua vez escolhe também entre uma abordagem de codificação de transformação do residual de predição linear ou uma abordagem ACELP (Predição Linear por Excitação com Código Algébrico) de codificador de fala clássico para codificar o residual de predição linear. Para decidir entre o codificador de transformação estilo AAC 48 e o codificador central estilo AMR-WB+ 71, um estágio de decisão de modo 73 é usado que decide com base no sinal de entrada entre ambos os codificadores 48 e 71.
[00117] O codificador 48 é um codificador baseado em MDCT estilo AAC estéreo. Quando a decisão de modo 73 direciona o sinal de entrada para usar codificação baseada em MDCT, o sinal de entrada mono ou os sinais de entrada estéreos são codificados pelo codificador MDCT baseado em AAC 48. O codificador MDCT 48 faz uma análise MDCT do um ou dois sinais nos estágios MDCT 74. No caso de um sinal estéreo, adicionalmente, uma decisão M/S ou L/R em uma base de banda de frequência é executada em um estágio 75 antes de quantificação e codificação. Codificação estéreo L/R ou codificação estéreo M/S é seleci- onável em um modo variável com frequência. O estágio 75 também executa uma transformação de L/R para M/S. Se codificação M/S for decidida para uma banda de frequência particular, o estágio 75 produz um sinal M/S para esta banda de frequência. De outro modo, o estágio 75 produz um sinal L/R para esta banda de frequência.
[00118] Consequentemente, quando o modo de codificação de transformação é usado, a eficiência total da funcionalidade de codifi- cação estéreo do codificador central subjacente pode ser usada para estéreo.
[00119] Quando a decisão de modo 73 direciona o sinal mono para o codificador de domínio preditivo linear 71, o sinal mono é analisado subsequentemente por meio de análise preditiva linear no bloco 72. Subsequentemente, uma decisão é tomada para definir se é para codificar o residual LP por meio de um codificador estilo ACELP de domínio de tempo 76 ou de um codificador estilo TCX 77 (Excitação Codificada Transformada) operando no domínio MDCT. O codificador de domínio preditivo linear 71 não tem qualquer capacidade de codificação estéreo inerente. Consequentemente, para permitir codificação de sinal estéreo com o codificador de domínio preditivo linear 71, uma configuração de codificador similar àquela mostrada na figura 5 pode ser usada. Nesta configuração, um codificador PS gera os parâmetros PS 5 e um sinal de submixagem mono DMX, o qual é então codificado pelo codificador de domínio preditivo linear.
[00120] A figura 10 ilustra uma modalidade adicional de um sistema codificador, em que partes da figura 7 e da figura 9 são combinadas em um novo modo. O DMX/RES para o pseudobloco L/R 2, tal como delineado na figura 7, é arranjado dentro do codificador de submixa- gem estilo AAC 70 antes da análise MDCT estéreo 74. Esta modalidade tem a vantagem em que o DMX/RES para a pseudotransformação L/R 2 é aplicado somente quando o codificador central MDCT estéreo é usado. Consequentemente, quando a modo de codificação de transformação é usado, a eficiência total da funcionalidade de codificação estéreo do codificador central subjacente pode ser usada para codificação estéreo da faixa de frequências coberta pelo sinal residual.
[00121] Enquanto a decisão de modo 73 na figura 9b opera no sinal de entrada mono ou no sinal estéreo de entrada, a decisão de modo 73' na figura 10 opera no sinal de submixagem DMX e no sinal residual RES. No caso de um sinal de entrada mono, o sinal mono pode ser usado diretamente como o sinal DMX, o sinal RES é estabelecido para zero, e os parâmetros PS podem ser predeterminados como IID = 0 dB e ICC = 1.
[00122] Quando a decisão de modo 73' direciona o sinal de submi- xagem DMX para o codificador de domínio preditivo linear 71, o sinal de submixagem DMX é analisado subsequentemente por meio de análise preditiva linear no bloco 72. Subsequentemente, uma decisão é tomada para definir se é para codificar o residual LP por meio de um codificador estilo ACELP de domínio de tempo 76 ou um codificador estilo TCX 77 (Excitação Codificada Transformada) operando no domínio MDCT. O codificador de domínio preditivo linear 71 não tem qualquer capacidade de codificação estéreo inerente que possa ser usada para codificar o sinal residual além do sinal de submixagem DMX. Consequentemente, um codificador de residual codificado 78 é empregado para codificar o sinal residual RES quando o sinal de sub- mixagem DMX é codificado pelo codificador de domínio preditivo 71. Por exemplo, tal codificador 78 pode ser um codificador AAC mono.
[00123] Deve ser notado que o codificador 71 e o 78 na figura 10 podem ser omitidos (neste caso o estágio de decisão de modo 73' não é mais necessário).
[00124] A figura 11a ilustra um detalhe de uma modalidade alternativa adicional de um sistema codificador que alcança a mesma vantagem que a modalidade na figura 10. Ao contrário da modalidade da figura 10, na figura 11a o DMX/RES para a pseudotransformação L/R 2 é colocado após a análise MDCT 74 do codificador central 70, isto é, a transformação opera no domínio MDCT. A transformação no bloco 2 é linear e invariável com tempo e assim pode ser colocada após a análise MDCT 74. Os blocos restantes da figura 10 que não estão mostrados na figura 11 podem ser adicionados opcionalmente no mesmo modo na figura 11a. Os blocos de análise MDCT 74 também podem ser colocados alternativamente após o bloco de transformação 2.
[00125] A figura 11b ilustra uma implementação da modalidade na figura 11a. Na figura 11b está mostrada uma implementação exemplar do estágio 75 para selecionar entre codificação M/S ou L/R. O estágio 75 compreende um estágio de transformação de soma e diferença 98 (mais precisamente um estágio de transformação de L/R para M/S) que recebe o pseudossinal estéreo Lp, Rp. O estágio de transformação 98 gera um pseudossinal central/lateral Mp, Sp ao executar uma transformação de L/R para M/S. Exceto para um possível fator de ganho, o seguinte se aplica: Mp = DMX e Sp = RES.
[00126] O estágio 75 decide entre codificação L/R ou M/S. Com base na decisão, o pseudossinal estéreo Lp, Rp ou o pseudossinal cen- tral/lateral Mp, Sp é selecionado (ver comutação de seleção) e codificado no bloco AAC 97. Também deve ser notado que dois blocos AAC 97 podem ser usados (não mostrado na figura 11b), com o primeiro bloco AAC 97 designado para o pseudossinal estéreo Lp, Rp e o segundo bloco AAC 97 designado para o pseudossinal central/lateral Mp, Sp. Neste caso, a seleção L/R ou M/S é executada ao selecionar a saída do primeiro bloco AAC 97 ou a saída do segundo bloco AAC 97.
[00127] A figura 11c mostra uma alternativa para a modalidade na figura 11a. Aqui, nenhum estágio de transformação 2 explícito é usado. Em vez disto, o estágio de transformação 2 e o estágio 75 são combinados em um único estágio 75'. O sinal de submixagem DMX e o sinal residual RES são fornecidos para um estágio de transformação de soma e diferença 99 (mais precisamente um estágio de transformação de DMX/RES para pseudo L/R) como parte do estágio 75'. O estágio de transformação 99 gera um pseudossinal estéreo Lp, Rp. O estágio de transformação de DMX/RES para pseudo L/R 99 na figura 11c é similar ao estágio de transformação de L/R para M/S 98 na figura 11b (exceto para um fator de ganho possivelmente diferente). Apesar disso, na figura 11c a seleção entre decodificação M/S e L/R necessita ser invertida em comparação com a figura 11b. Deve-se notar que tanto na figura 11b quanto na figura 11c a posição do comutador para a seleção L/R ou M/S está mostrada na posição Lp/Rp, a qual é a posição superior na figura 11b e a posição inferior na figura 11c. Isto visualiza a noção do significado de invertido da seleção L/R ou M/S.
[00128] Deve ser notado que o comutador nas figuras 11b e 11c preferivelmente existe de forma individual para cada banda de frequência no domínio MDCT de tal maneira que a seleção entre L/R e M/S pode ser tanto variável com tempo quanto com frequência. Em outras palavras: a posição do comutador preferivelmente é variável com frequência. Os estágios de transformação 98 e 99 podem transformar a faixa de frequências usadas total ou podem transformar somente uma única banda de frequência.
[00129] Além disso, deve ser notado que todos os blocos 2, 98 e 99 podem ser chamados de "blocos de transformação de soma e diferença" uma vez que todos os blocos implementam uma matriz de trans- ( - f (1 1 'Iformação na forma de
Figure img0013
[00130] Simplesmente, o fator de ganho c pode ser diferente nos blocos 2, 98, 99.
[00131] Na figura 12, uma modalidade adicional de um sistema codificador é delineada. Ela usa um conjunto estendido dos parâmetros PS que, além de IID e ICC (descritas anteriormente), inclui dois parâmetros adicionais IPD (diferença de fase entre canais, ver Φipd abaixo) e OPD (diferença de fase total, ver Φopd abaixo) que permitem caracterizar a relação de fase entre os dois canais L e R de um sinal estéreo. Um exemplo para estes parâmetros de fase é dado na subcláusula 8.6.4.6.3 da ISO/IEC 14496-3 que está incorporada neste documento pela referência. Quando parâmetros de fase são usados, a matriz de supermixagem resultante HC0MPLEX (e sua inversa H-1C0MPLEX) se torna avaliada em complexos de acordo com:
Figure img0014
[00132] O estágio 80 do codificador PS que opera no domínio QMF complexo cuida somente das dependências de fases entre os canais L, R. A rotação de submixagem (isto é, a transformação do domínio L/R para o domínio DMX/RES que foi descrita pela matriz H-1 acima) é cuidada no domínio MDCT como parte do codificador central estéreo 81. Consequentemente, as dependências de fases entre os dois canais são extraídas no domínio QMF complexo, enquanto que outras dependências de forma de onda avaliadas em reais são extraídas no domínio MDCT amostrado criticamente avaliado em real como parte do mecanismo de codificação estéreo do codificador central usado. Isto tem a vantagem em que a extração de dependências lineares entre os canais pode ser integrada firmemente na codificação estéreo do codificador central (embora, para impedir serrilhado no domínio MDCT amostrado criticamente, somente para a faixa de frequências que seja coberta por codificação residual, possivelmente menos que uma "banda de proteção" no eixo de frequência).
[00133] O estágio de ajuste de fase 80 do codificador PS na figura 12 extrai os parâmetros PS relacionados com fase, por exemplo, os parâmetros IPD (diferença de fase entre canais) e OPD (diferença de fase total). Consequentemente, a matriz de ajuste de fase H-1Φ que ele produz pode ser de acordo com o seguinte:
Figure img0015
[00134] Talsubmixagem do módulo PS é distribuída no módulo de codificação estéreo 81 do codificador central na figura 12. O módulo de codificação estéreo 81 opera no domínio MDCT e está mostrado na figura 13. O módulo de codificação estéreo 81 recebe o sinal estéreo de fase ajustada LΦ, RΦ no domínio MDCT. Este sinal é submixado em um estágio de submixagem 82 por uma matriz de rotação de submixagem H-1 que é a parte avaliada em real de uma matriz de submixagem complexa H- 1COMPLEX tal como discutido anteriormente, gerando assim o sinal de submixagem DMX e o sinal residual RES. A operação de submixagem é seguida pela transformação de L/R para M/S inversa de acordo com o presente pedido (ver o estágio de transformação 2), gerando assim um pseudossinal estéreo Lp, Rp. O pseudossinal estéreo Lp, Rp é processado pelo algoritmo de codificação estéreo (ver o codificador estéreo M/S ou L/R adaptativo 83), e nesta modalidade particular um me-canismo de codificação estéreo que depende de critérios de entropia perceptiva decide se codificar uma representação L/R ou uma representação M/S do sinal. Esta decisão preferivelmente é variável com tempo e com frequência.
[00135] Na figura 14 está mostrada uma modalidade de um sistema decodificador que é adequado para decodificar um fluxo de bits 46 tal como gerado pelo sistema codificador mostrado na figura 6. Esta modalidade é meramente ilustrativa para os princípios do presente pedido. É entendido que modificações e variações da modalidade estarão aparentes para os versados na técnica. Um decodificador central 90 decodifica o fluxo de bits 46 para pseudocanais esquerdo e direito, os quais são transformados no domínio QMF pelos bancos de filtros 91. Subsequentemente, uma pseudotransformação L/R para DMX/RES fixada do pseudossinal estéreo resultante Lp, Rp é executada no estágio de transformação 12, criando assim um sinal de submixagem DMX e um sinal residual RES. Ao usar codificação SBR, estes sinais são sinais de banda baixa; por exemplo, o sinal de submixagem DMX e o sinal residual RES podem conter somente informação de áudio para a banda de frequência baixa de até aproximadamente 8 kHz. O sinal de submixagem DMX é usado por um decodificador SBR 93 para reconstruir a banda de frequência alta com base em parâmetros SBR recebidos (não mostrados). Tanto o sinal de saída (incluindo as bandas de frequência baixa e alta reconstruída do sinal de submixagem DMX) do decodificador SBR 93 quanto o sinal residual RES são introduzidos em um decodificador PS 94 operando no domínio QMF (em particular no domínio de filtro QMF + Nyquist híbrido). O sinal de submixagem DMX na entrada do decodificador PS 94 também contém informação de áudio na banda de frequência alta (por exemplo, até 20 kHz), enquanto que o sinal residual RES na entrada do decodificador PS 94 é um sinal de banda baixa (por exemplo, limitado até 8 kHz). Assim, para a banda de frequência alta (por exemplo, para a banda de 8 kHz a 20 kHz), o decodificador PS 94 usa uma versão descorrelacionada do sinal de submixagem DMX em vez de usar o sinal residual de banda limitada RES. Os sinais decodificados na saída do decodificador PS 94, portanto, são baseados em um sinal residual somente de até 8 kHz. Após decodificação PS, os dois canais de saída do decodificador PS 94 são transformados no domínio de tempo pelos bancos de filtros 95, gerando assim o sinal de saída estéreo L, R.
[00136] Na figura 15 está mostrada uma modalidade de um sistema decodificador que é adequado para decodificar o fluxo de bits 46 tal como gerado pelo sistema codificador mostrado na figura 7. Esta modalidade é meramente ilustrativa para os princípios do presente pedi- do. É entendido que modificações e variações da modalidade estarão aparentes para os versados na técnica. O princípio de operação da modalidade na figura 15 é similar àquele do sistema decodificador delineado na figura 14. Ao contrário da figura 14, o decodificador SBR 96 na figura 15 é localizado na saída do decodificador PS 94. Além disso, o decodificador SBR faz uso de parâmetros SBR (não mostrados) formando dados de envoltório estéreo ao contrário dos parâmetros SBR mono na figura 14. O sinal de submixagem e o residual na entrada do decodificador PS 94 tipicamente são sinais de banda baixa; por exemplo, o sinal de submixagem DMX e o sinal residual RES podem conter informação de áudio somente para a banda de frequência baixa, por exemplo, até aproximadamente 8 kHz. Com base no sinal de submi- xagem DMX e no sinal residual RES de banda baixa, o codificador PS 94 determina um sinal estéreo de banda baixa, por exemplo, até aproximadamente 8 kHz. Com base no sinal estéreo de banda baixa e nos parâmetros SBR estéreos, o decodificador SBR 96 reconstrói a parte de frequência alta do sinal estéreo. Em comparação com a modalidade na figura 14, a modalidade na figura 15 oferece a vantagem em que nenhum sinal descorrelacionado não é necessário (ver também a figura 8d) e assim uma qualidade de áudio aprimorada é alcançada, enquanto que na figura 14 para a parte frequência alta um sinal descorre- lacionado é necessário (ver também a figura 8c), reduzindo assim a qualidade de áudio.
[00137] A figura 16a mostra uma modalidade de um sistema de de- codificação que é o inverso para o sistema de codificação mostrado na figura 11a. O sinal de fluxo de bits de entrada é fornecido para um bloco decodificador 100, o qual gera um primeiro sinal decodificado 102 e um segundo sinal decodificado 103. No codificador uma ou outra de codificação M/S e codificação L/R é selecionada. Isto está indicado no fluxo de bits recebido. Com base nesta informação, M/S ou L/R é sele- cionada no estágio de seleção 101. No caso de M/S ter sido selecionada no codificador, os primeiro e segundo sinais 102 e 103 são convertidos em um (pseudo) sinal L/R. No caso de L/R ter sido selecionada no codificador, os primeiro e segundo sinais 102 e 103 podem passar pelo estágio 101 sem transformação. O pseudossinal L/R Lp, Rp na saída do estágio 101 é convertido em um sinal DMX/RES pelo estágio de transformação 12 (este estágio quase executa uma transformação de L/R para M/S). Preferivelmente, os estágios 100, 101 e 12 na figura 16a operam no domínio MDCT. Para transformar o sinal de submixa- gem DMX e os sinais residuais RES para o domínio de tempo, os blocos de conversão 104 podem ser usados. Em seguida, o sinal resultante é fornecido para um decodificador PS (não mostrado) e opcionalmente para um decodificador SBR tal como mostrado nas figuras 14 e 15. Os blocos 104 alternativamente também podem ser colocados antes do bloco 12.
[00138] A figura 16b ilustra uma implementação da modalidade na figura 16a. Na figura 16b está mostrada uma implementação exemplar do estágio 101 para selecionar entre decodificação M/S ou L/R. O estágio 101 compreende um estágio de transformação de soma e diferença 105 (transformação de M/S para L/R) que recebe os primeiro e segundo sinais 102 e 103.
[00139] Com base na informação de codificação dada no fluxo de bits, o estágio 101 seleciona decodificação L/R ou M/S. Quando deco- dificação L/R é selecionada, o sinal de saída do bloco de decodifica- ção 100 é fornecido para o estágio de transformação 12.
[00140] A figura 16c mostra uma alternativa para a modalidade na figura 16a. Aqui, nenhum estágio de transformação 12 explícito não é usado. Em vez disto, o estágio de transformação 12 e o estágio 101 são fundidos em um único estágio 101'. Os primeiro e segundo sinais 102 e 103 são fornecidos para um estágio de transformação de soma e diferença 105' (mais precisamente um estágio de pseudotransforma- ção L/R para DMX/RES) como parte do estágio 101'. O estágio de transformação 105' gera um sinal DMX/RES. O estágio de transformação 105' na figura 16c é similar ou idêntico ao estágio de transformação 105 na figura 16b (exceto para um fator de ganho possivelmente diferente). Na figura 16c a seleção entre decodificação M/S e L/R necessita ser invertida em comparação com a figura 16b. Na figura 16c o comutador está na posição inferior, enquanto que na figura 16b o comutador está na posição superior. Isto visualiza a inversão da seleção L/R ou M/S (o sinal de seleção pode ser simplesmente invertido por um inversor).
[00141] Deve ser notado que o comutador nas figuras 16b e 16c preferivelmente existe de forma individual para cada banda de frequência no domínio MDCT de tal maneira que a seleção entre L/R e M/S pode ser tanto variável com tempo quanto com frequência. Os estágios de transformação 105 e 105' podem transformar a faixa de frequências usadas total ou pode transformar somente uma única banda de frequência.
[00142] A figura 17 mostra uma modalidade adicional de um sistema de codificação para codificar um sinal estéreo L, R para um sinal de fluxo de bits. O sistema de codificação compreende um estágio de submixagem 8 para gerar um sinal de submixagem DMX e um sinal residual RES com base no sinal estéreo. Adicionalmente, o sistema de codificação compreende um estágio de determinação de parâmetro 9 para determinar um ou mais parâmetros estéreos paramétricos 5. Adicionalmente, o sistema de codificação compreende os dispositivos 110 para codificação perceptiva a jusante do estágio de submixagem 8. A codificação é selecionável:- codificação baseada em um sinal de soma do sinal de submixagem DMX e o sinal residual RES e baseada em um sinal de diferença do sinal de submixagem DMX e o sinal residual RES, ou- codificação baseada no sinal de submixagem DMX e no sinal residual RES.
[00143] Preferivelmente, a seleção é variável com tempo e com frequência.
[00144] Os dispositivos de codificação 110 compreendem um estágio de transformação de soma e diferença 111 que gera os sinais de soma e de diferença. Adicionalmente, os dispositivos de codificação 110 compreendem um bloco de seleção 112 para selecionar codificação baseada nos sinais de soma e de diferença ou baseada no sinal de submixagem DMX e no sinal residual RES. Além disso, um bloco de codificação 113 é fornecido. Alternativamente, dois blocos de codificação 113 podem ser usados, com o primeiro bloco de codificação 113 codificando os sinais DMX e RES e o segundo bloco de codificação 113 codificando os sinais de soma e de diferença. Neste caso a seleção 112 é a jusante dos dois blocos de codificação 113.
[00145] A transformação de soma e diferença no bloco 111 é daforma
Figure img0016
[00146] O bloco de transformação 111 pode corresponder ao bloco de transformação 99 na figura 11c.
[00147] A saída do codificador perceptivo 110 é combinada com os parâmetros estéreos paramétricos 5 no multiplexador 7 para formar o fluxo de bits resultante 6.
[00148] Ao contrário da estrutura na figura 17, codificação baseada no sinal de submixagem DMX e no sinal residual RES pode ser realizada ao codificar um sinal resultante que é gerado ao transformar o sinal de submixagem DMX e o sinal residual RES por meio de duas transformações de soma e de diferença seriais tal como mostrado na figura 11b (ver os dois blocos de transformação 2 e 98). O sinal resul- tante após duas transformações de soma e de diferença corresponde ao sinal de submixagem DMX e ao sinal residual RES (exceto para um possível fator de ganho diferente).
[00149] A figura 18 mostra uma modalidade de um sistema decodi- ficador que é o inverso para o sistema codificador na figura 17. O sistema decodificador compreende os dispositivos 120 para decodifica- ção perceptiva baseada em sinal de fluxo de bits. Antes da decodifica- ção os parâmetros PS são separados do sinal de fluxo de bits 6 no demultiplexador 10. Os dispositivos de decodificação 120 compreendem um decodificador central 121 que gera um primeiro sinal 122 e um segundo sinal 123 (por meio de decodificação). Os dispositivos de decodificação produzem um sinal de submixagem DMX e um sinal residual RES.
[00150] O sinal de submixagem DMX e o sinal residual RES são seletivamente- baseados na soma do primeiro sinal 122 e do segundo sinal 123 e baseados na diferença do primeiro sinal 122 e do segundo sinal 123 ou- baseados no primeiro sinal 122 e baseados no segundo sinal 123.
[00151] Preferivelmente, a seleção é variável com tempo e com frequência. A seleção é executada no estágio de seleção 125.
[00152] Os dispositivos de decodificação 120 compreendem um estágio de transformação de soma e diferença 124 que gera sinais de soma e de diferença.
[00153] A transformação de soma e diferença no bloco 124 é daforma
Figure img0017
[00154] O bloco de transformação 124 pode corresponder ao bloco de transformação 105' na figura 16c.
[00155] Após seleção, os sinais DMX e RES são fornecidos para um estágio de supermixagem 126 para gerar o sinal estéreo L, R com base no sinal de submixagem DMX e no sinal residual RES. A operação de supermixagem é dependente dos parâmetros PS 5.
[00156] Preferivelmente, nas figuras 17 e 18 a seleção é variável com frequência. Na figura 17, por exemplo, uma transformação de tempo para frequência (por exemplo, por meio de uma MDCT ou banco de filtros de análise) pode ser executada como primeira etapa nos dispositivos de codificação perceptiva 110. Na figura 18, por exemplo, uma transformação de frequência para tempo (por exemplo, por meio de uma MDCT inversa ou banco de filtros de síntese) pode ser executada como a última etapa nos dispositivos de decodificação perceptiva 120.
[00157] Deve ser notado que, nas modalidades descritas anteriormente, os sinais, parâmetros e matrizes podem ser variáveis com frequência ou invariáveis com frequência e/ou variáveis com tempo ou invariáveis com tempo. As etapas de computação descritas podem ser executadas no sentido de frequência ou para a banda áudio completa.
[00158] Além disso, deve ser notado que as várias transformações de soma e de diferença, isto é, o DMX/RES para a pseudotransforma- ção L/R, a pseudotransformação L/R para DMX/RES, a transformação de L/R para M/S e a transformação de M/S para L/R, são todas da ( (1 1forma
Figure img0018
[00159] Simplesmente, o fator de ganho c pode ser diferente. Portanto, em princípio, cada uma destas transformações pode ser trocada por uma transformação diferente destas transformações. Se o ganho não estiver correto durante o processamento de codificação, isto pode ser compensado no processo de decodificação. Além disso, ao colocar duas iguais ou duas diferentes das transformações de soma e de diferença em série, a transformação resultante corresponde à matriz de identidade (possivelmente, multiplicada por um fator de ganho).
[00160] Em um sistema codificador compreendendo tanto um codificador PS quanto um codificador SBR, diferentes configurações PS/SBR são possíveis. Em uma primeira configuração, mostrada na figura 6, o codificador SBR 32 é conectado a jusante do codificador PS 41. Em uma segunda configuração, mostrada na figura 7, o codificador SBR 42 é conectado a montante do codificador PS 41. Dependendo, por exemplo, da taxa de bits alvo desejada, as propriedades do codificador central e/ou de um ou mais vários outros fatores, uma das configurações pode ser preferida em relação à outra a fim de fornecer melhor desempenho. Tipicamente, para taxas de bits menores a primeira configuração pode ser preferida, enquanto que para taxas de bits maiores a segunda configuração pode ser preferida. Consequentemente, é desejável que um sistema codificador suporte ambas as configurações diferentes para ser capaz de escolher uma configuração preferida dependendo, por exemplo, de taxa de bits alvo desejada e/ou de um ou mais outros critérios.
[00161] Também em um sistema decodificador compreendendo tanto um decodificador PS quanto um decodificador SBR, diferentes configurações PS/SBR são possíveis. Em uma primeira configuração, mostrada na figura 14, o decodificador SBR 93 é conectado a montante do decodificador PS 94. Em uma segunda configuração, mostrada na figura 15, o decodificador SBR 96 é conectado a jusante do decodi- ficador PS 94. A fim de alcançar operação correta a configuração do sistema decodificador tem que casar com aquela do sistema codificador. Se o codificador estiver configurado de acordo com a figura 6, então o decodificador é configurado correspondentemente de acordo com a figura 14. Se o codificador estiver configurado de acordo com a figura 7, então o decodificador é configurado correspondentemente de acordo com a figura 15. A fim de assegurar operação correta, o codifi- cador preferivelmente sinaliza para o decodificador que a configuração PS/SBR foi escolhida para codificação (e assim que a configuração PS/SBR é para ser escolhida para decodificar). Com base nesta informação, o decodificador seleciona a configuração de decodificador apropriada.
[00162] Tal como discutido anteriormente, a fim de assegurar operação de decodificação correta, preferivelmente existe um mecanismo para sinalizar do codificador para o decodificador qual configuração é para ser usada no decodificador. Isto pode ser feito explicitamente (por exemplo, por meio de um bit ou campo dedicado no cabeçalho de configuração do fluxo de bits tal como discutido a seguir) ou implicitamente (por exemplo, ao verificar se os dados SBR são mono ou estéreo no caso de dados PS estarem presentes).
[00163] Tal como discutido anteriormente, para sinalizar a configuração PS/SBR escolhida, um elemento dedicado no cabeçalho de fluxo de bits do fluxo de bits transportado do codificador para o decodifi- cador pode ser usado. Um cabeçalho de fluxo de bits como este carrega informação de configuração suficiente que é necessária para capacitar o decodificador para decodificar corretamente os dados no fluxo de bits. O elemento dedicado no cabeçalho de fluxo de bits pode ser, por exemplo, uma sinalização de um bit, um campo, ou ele pode ser um índice apontando para uma entrada específica em uma tabela que especifica diferentes configurações de decodificadores.
[00164] Em vez de incluir no cabeçalho de fluxo de bits um elemento dedicado adicional para sinalizar a configuração PS/SBR, informação já presente no fluxo de bits pode ser avaliada no sistema de deco- dificação para selecionar a configuração PS/SBR correta. Por exemplo, a configuração PS/SBR escolhida pode ser derivada da informação de configuração de cabeçalho de fluxo de bits para o decodificador PS e o decodificador SBR. Esta informação de configuração tipica- mente indica se o decodificador SBR é para ser configurado para operação mono ou operação estéreo. Se, por exemplo, um decodificador PS estiver capacitado e o decodificador SBR for configurado para operação mono (tal como indicado na informação de configuração), a configuração PS/SBR de acordo com a figura 14 pode ser selecionada. Se um decodificador PS estiver capacitado e o decodificador SBR for configurado para operação estéreo, a configuração PS/SBR de acordo com a figura 15 pode ser selecionada.
[00165] As modalidades descritas anteriormente são meramente ilustrativas para os princípios do presente pedido. É entendido que modificações e variações dos arranjos e dos detalhes descritos neste documento estarão aparentes para os versados na técnica. Portanto, a intenção é que o escopo do pedido não seja limitado pelos detalhes específicos apresentados por meio de descrição e explicação das modalidades neste documento.
[00166] Os sistemas e métodos revelados no pedido podem ser im-plementados como software, firmware, hardware ou uma combinação dos mesmos. Certos componentes ou todos os componentes podem ser implementados como software executando em um processador de sinal digital ou microprocessador, ou implementados como hardware e ou como circuitos integrados de aplicação específica.
[00167] Dispositivos típicos que fazem uso dos sistemas e métodos revelados são reprodutores de áudio portáteis, dispositivos móveis de comunicação, aparelhos conversores de sinais, aparelhos de televisão, AVRs (receptores de áudio e vídeo), computadores pessoais, etc.

Claims (4)

1. Sistema codificador configurado para codificar um sinal estéreo para um sinal de fluxo de bits (6), o sistema codificador carac-terizado pelo fato de que compreende:- um meio de submixagem (8) configurado para gerar um sinal de submixagem e um sinal residual com base no sinal estéreo;- um meio de determinação de parâmetro (9) configurado para determinar um ou mais parâmetros estéreos paramétricos (5);- um meio de transformação (2) configurado para executar uma transformação baseada no sinal de submixagem e no sinal residual, gerando assim um pseudossinal estéreo esquerdo/direito, em que o meio de transformação é configurado para executar a transformação em um domínio de frequência sobreamostrada ou no domínio do tempo; e- um codificador estéreo perceptivo (3) configurado para codificar o pseudossinal estéreo esquerdo/direito, em que o codificador estéreo perceptivo (3) é configurado para selecionar- codificação perceptiva esquerda/direita ou- codificação perceptiva central/lateralem um modo variável com frequência ou invariável com frequência.
2. Sistema decodificador configurado para decodificar um sinal de fluxo de bits (6) incluindo um ou mais parâmetros estéreos paramétricos (5) para um sinal estéreo, o sistema decodificador caracterizado pelo fato de que compreende:- um decodificador estéreo perceptivo (11) configurado para decodificação baseada no sinal de fluxo de bits (6), o decodificador gerando um pseudossinal estéreo, em que o decodificador é configurado para executar seletivamente- decodificação perceptiva esquerda/direita ou - decodificação perceptiva central/lateralem um modo variável com frequência ou invariável com frequência;- um meio de transformação de esquerda/direita para cen- tral/lateral (12) configurado para executar uma transformação de es- querda/direita para central/lateral com base no pseudossinal estéreo, gerando assim um sinal de submixagem e um sinal residual, em que o meio de transformação é configurado para executar a transformação em um domínio de frequência sobreamostrada ou no domínio do tempo; e- meio de supermixagem (13) configurado para gerar o sinal estéreo com base no sinal de submixagem e no sinal residual, com a operação de supermixagem do meio de supermixagem sendo dependente do um ou mais parâmetros estéreos paramétricos (5).
3. Método para codificar um sinal estéreo para um sinal de fluxo de bits (6), o método caracterizado pelo fato de que compreende as etapas de:- gerar um sinal de submixagem e um sinal residual com base no sinal estéreo;- determinar um ou mais parâmetros estéreos paramétricos (5);- gerar um pseudossinal estéreo esquerdo/direito ao executar uma transformação baseada no sinal de submixagem e no sinal residual, em que a transformação é executada em um domínio de frequência sobreamostrada ou no domínio do tempo; e- executar codificação estéreo perceptiva do pseudossinal estéreo esquerdo/direito, em que- codificação perceptiva esquerda/direita ou- codificação perceptiva central/lateralé selecionável em um modo variável com frequência ou in-variável com frequência.
4. Método para decodificar um sinal de fluxo de bits (6) in-cluindo parâmetros estéreos paramétricos (5) para um sinal estéreo, o método caracterizado pelo fato de que compreende as etapas de:- executar decodificação estéreo perceptiva baseada no sinal de fluxo de bits (6) para gerar um pseudossinal estéreo, em que- decodificação perceptiva esquerda/direita ou- decodificação perceptiva central/lateralé selecionável em um modo variável com frequência ou in-variável com frequência;- gerar um sinal de submixagem e um sinal residual ao executar uma transformação com base no pseudossinal estéreo, em que a transformação é executada em um domínio de frequência sobreamos- trada ou no domínio do tempo; e- gerar o sinal estéreo com base no sinal de submixagem e no sinal residual por meio de uma operação de supermixagem, com a operação de supermixagem sendo dependente dos parâmetros estéreos paramétricos (5).
BR122019023924-0A 2009-03-17 2010-03-05 Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo BR122019023924B1 (pt)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US16070709P 2009-03-17 2009-03-17
US61/160,707 2009-03-17
US21948409P 2009-06-23 2009-06-23
US61/219,484 2009-06-23
BRPI1009467-9A BRPI1009467B1 (pt) 2009-03-17 2010-03-05 Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
PCT/EP2010/052866 WO2010105926A2 (en) 2009-03-17 2010-03-05 Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding

Publications (1)

Publication Number Publication Date
BR122019023924B1 true BR122019023924B1 (pt) 2021-06-01

Family

ID=42562759

Family Applications (4)

Application Number Title Priority Date Filing Date
BR122019023924-0A BR122019023924B1 (pt) 2009-03-17 2010-03-05 Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
BRPI1009467-9A BRPI1009467B1 (pt) 2009-03-17 2010-03-05 Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
BR122019023877-4A BR122019023877B1 (pt) 2009-03-17 2010-03-05 Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
BR122019023947-9A BR122019023947B1 (pt) 2009-03-17 2010-03-05 Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo

Family Applications After (3)

Application Number Title Priority Date Filing Date
BRPI1009467-9A BRPI1009467B1 (pt) 2009-03-17 2010-03-05 Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
BR122019023877-4A BR122019023877B1 (pt) 2009-03-17 2010-03-05 Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
BR122019023947-9A BR122019023947B1 (pt) 2009-03-17 2010-03-05 Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo

Country Status (13)

Country Link
US (10) US9082395B2 (pt)
EP (2) EP2626855B1 (pt)
JP (1) JP5214058B2 (pt)
KR (2) KR101367604B1 (pt)
CN (2) CN102388417B (pt)
AU (1) AU2010225051B2 (pt)
BR (4) BR122019023924B1 (pt)
CA (6) CA2754671C (pt)
ES (2) ES2415155T3 (pt)
HK (2) HK1166414A1 (pt)
MX (1) MX2011009660A (pt)
RU (3) RU2520329C2 (pt)
WO (1) WO2010105926A2 (pt)

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR122019023924B1 (pt) 2009-03-17 2021-06-01 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
JP5267257B2 (ja) * 2009-03-23 2013-08-21 沖電気工業株式会社 音声ミキシング装置、方法及びプログラム、並びに、音声会議システム
TWI433137B (zh) 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
RU2683175C2 (ru) 2010-04-09 2019-03-26 Долби Интернешнл Аб Стереофоническое кодирование на основе mdct с комплексным предсказанием
TWI516138B (zh) * 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
JP5581449B2 (ja) * 2010-08-24 2014-08-27 ドルビー・インターナショナル・アーベー Fmステレオ無線受信機の断続的モノラル受信の隠蔽
WO2012150482A1 (en) 2011-05-04 2012-11-08 Nokia Corporation Encoding of stereophonic signals
UA107771C2 (en) * 2011-09-29 2015-02-10 Dolby Int Ab Prediction-based fm stereo radio noise reduction
BR112014007481A2 (pt) * 2011-09-29 2017-04-04 Dolby Int Ab detecção de alta qualidade em sinais de rádio fm estéreo
CN103918029B (zh) * 2011-11-11 2016-01-20 杜比国际公司 使用过采样谱带复制的上采样
WO2013106322A1 (en) * 2012-01-11 2013-07-18 Dolby Laboratories Licensing Corporation Simultaneous broadcaster -mixed and receiver -mixed supplementary audio services
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US20150371643A1 (en) * 2012-04-18 2015-12-24 Nokia Corporation Stereo audio signal encoder
WO2013186343A2 (en) * 2012-06-14 2013-12-19 Dolby International Ab Smooth configuration switching for multichannel audio
EP2862370B1 (en) * 2012-06-19 2017-08-30 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
JP5949270B2 (ja) * 2012-07-24 2016-07-06 富士通株式会社 オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム
EP2743922A1 (en) * 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
MY172752A (en) * 2013-01-29 2019-12-11 Fraunhofer Ges Forschung Decoder for generating a frequency enhanced audio signal, method of decoding encoder for generating an encoded signal and method of encoding using compact selection side information
JP6179122B2 (ja) * 2013-02-20 2017-08-16 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
JP6250071B2 (ja) * 2013-02-21 2017-12-20 ドルビー・インターナショナル・アーベー パラメトリック・マルチチャネル・エンコードのための方法
KR20230020553A (ko) 2013-04-05 2023-02-10 돌비 인터네셔널 에이비 스테레오 오디오 인코더 및 디코더
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
WO2014161996A2 (en) 2013-04-05 2014-10-09 Dolby International Ab Audio processing system
US8804971B1 (en) * 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
EP2830050A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhanced spatial audio object coding
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
EP2830045A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP3503095A1 (en) * 2013-08-28 2019-06-26 Dolby Laboratories Licensing Corp. Hybrid waveform-coded and parametric-coded speech enhancement
TWI579831B (zh) 2013-09-12 2017-04-21 杜比國際公司 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統
EP3561809B1 (en) 2013-09-12 2023-11-22 Dolby International AB Method for decoding and decoder.
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
KR102160254B1 (ko) * 2014-01-10 2020-09-25 삼성전자주식회사 액티브다운 믹스 방식을 이용한 입체 음향 재생 방법 및 장치
BR112017006325B1 (pt) 2014-10-02 2023-12-26 Dolby International Ab Método de decodificação e decodificador para o realce de diálogo
KR20160081844A (ko) * 2014-12-31 2016-07-08 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
WO2016108655A1 (ko) * 2014-12-31 2016-07-07 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
EP3067886A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
CA2997334A1 (en) * 2015-09-25 2017-03-30 Voiceage Corporation Method and system for encoding left and right channels of a stereo sound signal selecting between two and four sub-frames models depending on the bit budget
FR3045915A1 (fr) * 2015-12-16 2017-06-23 Orange Traitement de reduction de canaux adaptatif pour le codage d'un signal audio multicanal
PL3405949T3 (pl) 2016-01-22 2020-07-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób szacowania międzykanałowej różnicy czasowej
SG11201806256SA (en) * 2016-01-22 2018-08-30 Fraunhofer Ges Forschung Apparatus and method for mdct m/s stereo with global ild with improved mid/side decision
US10157621B2 (en) * 2016-03-18 2018-12-18 Qualcomm Incorporated Audio signal decoding
US10210871B2 (en) * 2016-03-18 2019-02-19 Qualcomm Incorporated Audio processing for temporally mismatched signals
BR112019009424A2 (pt) * 2016-11-08 2019-07-30 Fraunhofer Ges Forschung mixador de redução, método para mixagem de redução de pelo menos dois canais, codificador multicanal, método para codificar um sinal multicanal, sistema e método de processamento de áudio
CA3127805C (en) * 2016-11-08 2023-12-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
US10224045B2 (en) * 2017-05-11 2019-03-05 Qualcomm Incorporated Stereo parameters for stereo decoding
JP7149936B2 (ja) * 2017-06-01 2022-10-07 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置及び符号化方法
US10431231B2 (en) 2017-06-29 2019-10-01 Qualcomm Incorporated High-band residual prediction with time-domain inter-channel bandwidth extension
CN109300480B (zh) 2017-07-25 2020-10-16 华为技术有限公司 立体声信号的编解码方法和编解码装置
CN109389987B (zh) 2017-08-10 2022-05-10 华为技术有限公司 音频编解码模式确定方法和相关产品
US10580420B2 (en) * 2017-10-05 2020-03-03 Qualcomm Incorporated Encoding or decoding of audio signals
US10839814B2 (en) * 2017-10-05 2020-11-17 Qualcomm Incorporated Encoding or decoding of audio signals
TWI812658B (zh) 2017-12-19 2023-08-21 瑞典商都比國際公司 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統
BR112020012654A2 (pt) 2017-12-19 2020-12-01 Dolby International Ab métodos, aparelhos e sistemas para aprimoramentos de decodificação e codificação de fala e áudio unificados com transpositor de harmônico com base em qmf
KR20200099561A (ko) 2017-12-19 2020-08-24 돌비 인터네셔널 에이비 통합 음성 및 오디오 디코딩 및 인코딩 개선을 위한 방법, 장치 및 시스템
KR20200116968A (ko) 2018-02-01 2020-10-13 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 하이브리드 인코더/디코더 공간 분석을 사용한 오디오 장면 인코더, 오디오 장면 디코더 및 관련 방법들
RU2762302C1 (ru) * 2018-04-05 2021-12-17 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство, способ или компьютерная программа для оценки разности во времени между каналами
CN114242090A (zh) 2018-04-25 2022-03-25 杜比国际公司 具有减少后处理延迟的高频重建技术的集成
WO2019207036A1 (en) 2018-04-25 2019-10-31 Dolby International Ab Integration of high frequency audio reconstruction techniques
CN110556118B (zh) * 2018-05-31 2022-05-10 华为技术有限公司 立体声信号的编码方法和装置
CN110556117B (zh) 2018-05-31 2022-04-22 华为技术有限公司 立体声信号的编码方法和装置
CN112352277B (zh) * 2018-07-03 2024-05-31 松下电器(美国)知识产权公司 编码装置及编码方法
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
EP3928315A4 (en) * 2019-03-14 2022-11-30 Boomcloud 360, Inc. SPATIALLY SENSITIVE MULTIBAND COMPRESSION SYSTEM WITH PRIORITY
EP3719799A1 (en) * 2019-04-04 2020-10-07 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation

Family Cites Families (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4790016A (en) 1985-11-14 1988-12-06 Gte Laboratories Incorporated Adaptive method and apparatus for coding speech
WO1986003873A1 (en) 1984-12-20 1986-07-03 Gte Laboratories Incorporated Method and apparatus for encoding speech
US5222189A (en) 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5357594A (en) 1989-01-27 1994-10-18 Dolby Laboratories Licensing Corporation Encoding and decoding using specially designed pairs of analysis and synthesis windows
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5274740A (en) 1991-01-08 1993-12-28 Dolby Laboratories Licensing Corporation Decoder for variable number of channel presentation of multidimensional sound fields
US5583962A (en) 1991-01-08 1996-12-10 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
JP2693893B2 (ja) 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
US5812971A (en) 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
JP3765622B2 (ja) 1996-07-09 2006-04-12 ユナイテッド・モジュール・コーポレーション オーディオ符号化復号化システム
JP4478220B2 (ja) 1997-05-29 2010-06-09 ソニー株式会社 音場補正回路
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US5890125A (en) 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
DE19742655C2 (de) 1997-09-26 1999-08-05 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals
US6959220B1 (en) * 1997-11-07 2005-10-25 Microsoft Corporation Digital audio signal filtering mechanism and method
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6539357B1 (en) 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
CN1100113C (zh) 1999-06-04 2003-01-29 中国科学院山西煤炭化学研究所 一种道路及表面涂层沥青的制备方法
US6978236B1 (en) 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
JP3951690B2 (ja) * 2000-12-14 2007-08-01 ソニー株式会社 符号化装置および方法、並びに記録媒体
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
GB0119569D0 (en) * 2001-08-13 2001-10-03 Radioscape Ltd Data hiding in digital audio broadcasting (DAB)
WO2003046891A1 (en) 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
KR20040080003A (ko) * 2002-02-18 2004-09-16 코닌클리케 필립스 일렉트로닉스 엔.브이. 파라메트릭 오디오 코딩
RU2316154C2 (ru) * 2002-04-10 2008-01-27 Конинклейке Филипс Электроникс Н.В. Кодирование стереофонических сигналов
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7191136B2 (en) 2002-10-01 2007-03-13 Ibiquity Digital Corporation Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband
KR100923297B1 (ko) * 2002-12-14 2009-10-23 삼성전자주식회사 스테레오 오디오 부호화 방법, 그 장치, 복호화 방법 및그 장치
KR100528325B1 (ko) 2002-12-18 2005-11-15 삼성전자주식회사 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치
SE0301273D0 (sv) 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
US7809579B2 (en) 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
CN1677491A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
WO2005098824A1 (en) * 2004-04-05 2005-10-20 Koninklijke Philips Electronics N.V. Multi-channel encoder
KR20070056081A (ko) * 2004-08-31 2007-05-31 마츠시타 덴끼 산교 가부시키가이샤 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법
CN101124626B (zh) 2004-09-17 2011-07-06 皇家飞利浦电子股份有限公司 用于最小化感知失真的组合音频编码
WO2006035705A1 (ja) * 2004-09-28 2006-04-06 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
MX2007005261A (es) * 2004-11-04 2007-07-09 Koninkl Philips Electronics Nv Codificacion y descodificacion de un conjunto de senales.
EP1691348A1 (en) 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7573912B2 (en) 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
ATE521143T1 (de) 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
US9626973B2 (en) 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
US7961890B2 (en) 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
FR2888699A1 (fr) 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US8284961B2 (en) * 2005-07-15 2012-10-09 Panasonic Corporation Signal processing device
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
US20080004883A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Scalable audio coding
EP2054875B1 (en) * 2006-10-16 2011-03-23 Dolby Sweden AB Enhanced coding and parameter representation of multichannel downmixed object coding
WO2008046530A2 (en) 2006-10-16 2008-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
KR20080052813A (ko) 2006-12-08 2008-06-12 한국전자통신연구원 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법
KR101312470B1 (ko) 2007-04-26 2013-09-27 돌비 인터네셔널 에이비 출력 신호 합성 장치 및 방법
CN101802907B (zh) * 2007-09-19 2013-11-13 爱立信电话股份有限公司 多信道音频的联合增强
CA2705968C (en) 2007-11-21 2016-01-26 Lg Electronics Inc. A method and an apparatus for processing a signal
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
US9330671B2 (en) * 2008-10-10 2016-05-03 Telefonaktiebolaget L M Ericsson (Publ) Energy conservative multi-channel audio coding
BR122019023924B1 (pt) 2009-03-17 2021-06-01 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo

Also Published As

Publication number Publication date
US20180144751A1 (en) 2018-05-24
CA3152894C (en) 2023-09-26
RU2020122022A (ru) 2022-01-04
US20240127829A1 (en) 2024-04-18
US20150269948A1 (en) 2015-09-24
US11315576B2 (en) 2022-04-26
US20190287538A1 (en) 2019-09-19
CA2949616C (en) 2019-11-26
KR101433701B1 (ko) 2014-08-28
HK1166414A1 (en) 2012-10-26
US20120002818A1 (en) 2012-01-05
US11133013B2 (en) 2021-09-28
RU2017108988A (ru) 2018-09-17
KR101367604B1 (ko) 2014-02-26
AU2010225051B2 (en) 2013-06-13
WO2010105926A3 (en) 2010-12-23
RU2614573C2 (ru) 2017-03-28
ES2519415T3 (es) 2014-11-06
CA2754671C (en) 2017-01-10
EP2409298A2 (en) 2012-01-25
BRPI1009467B1 (pt) 2020-08-18
US10796703B2 (en) 2020-10-06
RU2730469C2 (ru) 2020-08-24
BR122019023877B1 (pt) 2021-08-17
CA3057366C (en) 2020-10-27
US20190318748A1 (en) 2019-10-17
EP2626855A1 (en) 2013-08-14
CA3057366A1 (en) 2010-09-23
BR122019023947B1 (pt) 2021-04-06
HK1187145A1 (en) 2014-03-28
US11017785B2 (en) 2021-05-25
WO2010105926A2 (en) 2010-09-23
CA3209167A1 (en) 2010-09-23
EP2626855B1 (en) 2014-09-10
JP2012521012A (ja) 2012-09-10
RU2520329C2 (ru) 2014-06-20
BRPI1009467A2 (pt) 2017-05-16
KR20130095851A (ko) 2013-08-28
CA2949616A1 (en) 2010-09-23
JP5214058B2 (ja) 2013-06-19
CA3093218A1 (en) 2010-09-23
RU2017108988A3 (pt) 2020-05-21
CN105225667B (zh) 2019-04-05
US20220246155A1 (en) 2022-08-04
CA3152894A1 (en) 2010-09-23
US10297259B2 (en) 2019-05-21
US11322161B2 (en) 2022-05-03
EP2409298B1 (en) 2013-05-08
CN102388417A (zh) 2012-03-21
ES2415155T3 (es) 2013-07-24
CN102388417B (zh) 2015-10-21
CN105225667A (zh) 2016-01-06
CA3093218C (en) 2022-05-17
US9905230B2 (en) 2018-02-27
RU2014112936A (ru) 2015-10-10
US20190392844A1 (en) 2019-12-26
US9082395B2 (en) 2015-07-14
US20190228782A1 (en) 2019-07-25
MX2011009660A (es) 2011-09-30
CA2754671A1 (en) 2010-09-23
KR20120006010A (ko) 2012-01-17
AU2010225051A1 (en) 2011-09-15
US20190378521A1 (en) 2019-12-12

Similar Documents

Publication Publication Date Title
US11133013B2 (en) Audio encoder with selectable L/R or M/S coding
JP7469350B2 (ja) マルチチャンネル信号を符号化するためのオーディオエンコーダおよび符号化されたオーディオ信号を復号化するためのオーディオデコーダ
RU2804032C1 (ru) Устройство обработки звуковых сигналов для кодирования стереофонического сигнала в сигнал битового потока и способ декодирования сигнала битового потока в стереофонический сигнал, осуществляемый с использованием устройства обработки звуковых сигналов
RU2799400C2 (ru) Устройство обработки звуковых сигналов для кодирования стереофонического сигнала в сигнал битового потока и способ декодирования сигнала битового потока в стереофонический сигнал, осуществляемый с использованием устройства обработки звуковых сигналов
AU2018200340A1 (en) Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding

Legal Events

Date Code Title Description
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B06J Correction of requirement [chapter 6.10 patent gazette]

Free format text: REPPUBLICACAO.

B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 05/03/2010, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF

B25G Requested change of headquarter approved

Owner name: DOLBY INTERNATIONAL AB (IE)