BRPI0520053B1 - Esquema de codificador/decodificador de canais múltiplos quase-transparente ou transparente - Google Patents

Esquema de codificador/decodificador de canais múltiplos quase-transparente ou transparente Download PDF

Info

Publication number
BRPI0520053B1
BRPI0520053B1 BRPI0520053-9A BRPI0520053A BRPI0520053B1 BR PI0520053 B1 BRPI0520053 B1 BR PI0520053B1 BR PI0520053 A BRPI0520053 A BR PI0520053A BR PI0520053 B1 BRPI0520053 B1 BR PI0520053B1
Authority
BR
Brazil
Prior art keywords
channel
signal
downmix
residual
channels
Prior art date
Application number
BRPI0520053-9A
Other languages
English (en)
Inventor
Jonas Lindblom
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. filed Critical Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Publication of BRPI0520053A2 publication Critical patent/BRPI0520053A2/pt
Publication of BRPI0520053B1 publication Critical patent/BRPI0520053B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Error Detection And Correction (AREA)
  • Dc Digital Transmission (AREA)
  • Glass Compositions (AREA)
  • Optical Measuring Cells (AREA)
  • Structure Of Printed Boards (AREA)
  • Piezo-Electric Transducers For Audible Bands (AREA)
  • Electroluminescent Light Sources (AREA)
  • Devices For Indicating Variable Information By Combining Individual Elements (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

esquema de codificador/decodificador de canais múltiplos quase-transparente ou transparente. esquema de codificador/decodificador de canais múltiplos preferivelmente gera adicionalmente um sinal residual do tipo de forma de onda (16) . este sinal residual é transmitido (18) juntamente com um ou mais parâmetros de canais múltiplos (14) para um decodificador. em contraste com um decodificador de canais múltiplos puramente paramétrico, o decodificador melhorado gera um sinal de saída de canais múltiplos tendo uma qualidade de saída melhorada devido ao sinal residual adicional.

Description

ESQUEMA DE CODIFICADOR/DECODIFICADOR DE CANAIS
MÚLTIPLOS QUASE-TRANSPARENTE OU TRANSPARENTE
Descrição
Campo da Invenção
A presente invenção refere-se a esquemas de codificação de canais múltiplos e, em especial, a esquemas de codificação paramétrica de canais múltiplos.
Histórico da Invenção e Técnica Anterior
Atualmente, duas técnicas dominam a exploração da redundância e irrelevância do estéreo contida em sinais de áudio estereofônicos. Codificação de estéreo Mid-Side (M/S) [1] , primariamente objetiva a remoção de redundância, e é baseada no fato de que, visto que freqüentemente os dois canais estão razoavelmente correlacionados, é melhor codificar a soma e a diferença entre os dois. Mais bits (relativamente) podem, então, ser gastos no sinal de soma de alta energia, do que no sinal do * lado de baixa energia (ou diferença). Codificação de estéreo de intensidade [2, 3] , por outro lado, atinge remoção de irrelevância, em cada sub-banda, pela substituição dos dois sinais por um sinal de soma e um ângulo azimute. No decodificador, o parâmetro azimute é usado para controlar a localização espacial do evento auditivo representado pelo sinal de soma de sub-banda. Estéreo Mid-Side e estéreo de Intensidade são ambos usados extensivamente nos padrões de codificação de áudio existentes [4].
Um problema com a abordagem M/S na direção da exploração de redundância é que, se os dois componentes estiverem fora de fase (um estiver atrasado em relação ao outro), o ganho de codificação M/S desaparece. Este é um problema conceituai, visto que atrasos de tempo são frequentes em sinais de áudio reais. Por exemplo, a audição espacial se baseia muito nas diferenças de tempo entre sinais (especialmente em baixas frequências) [5] . Nos registros de áudio, atrasos de tempo podem originar-se de ajustes 5 de microfone estereofônico e de processamento de poste artificial (efeitos sonoros). Na codificação de Mid-Side, uma solução ad-hoc é freqüentemente usada para o fator de atraso de tempo: codificação M/S é empregada apenas quando a energia do sinal de diferença for menor que um fator constante daquela do sinal de 10 soma [1]. O problema de alinhamento é mais bem resolvido [6] onde um dos componentes do sinal for previsto do outro. Os filtros de predição são derivados em uma base de quadro a quadro no codificador, e são transmitidos como informação de lado. Na referência [7], uma alternativa adaptativa retrógrada é 15 considerada. Ê observado que o ganho de desempenho é grandemente dependente do tipo de sinal, mas para certos tipos de sinais, é obtido um ganho drástico comparado com codificação de estéreo de M/S.
Codificação paramétrica de estéreo tem recebido 2 0 muita atenção nos últimos tempos [8-11] . Com base em um codificador mono de núcleo (canal único), estes esquemas paramétricos extraem o componente estéreo (canais múltiplos), e o codificam separadamente em uma taxa de bits relativamente baixa. Isto pode ser observado como uma generalização de codificação de 25 estéreo de intensidade. Métodos de codificação paramétrica de estéreo são especificamente úteis na faixa de taxa de bits baixa de codificação de áudio, onde resultam em um aumento significativo na qualidade, gastando apenas uma pequena parte do orçamento de bit total no componente estéreo. Métodos paramétricos são, também, atraentes visto que eles são extensíveis ao caso de canais múltiplos (mais que dois canais), e têm a capacidade para oferecer compatibilidade retrógrada: MP3 surround[12] é um exemplo onde os dados de canais múltiplos são codificados e transmitidos no campo auxiliar da corrente de dados. Isto permite que receptores sem capacidades de canais múltiplos decodifiquem um sinal estéreo * normal, enquanto receptores com capacidade surround podem desfrutar de áudio de canais múltiplos. Métodos paramétricos freqüent emente se baseiam em extração e codificação de cue psicoacústico, primariamente Diferenças de Nível Entre Canais (ICLDs) e Diferenças de Tempo Entre Canais (ICTDs) . Na referência [11] , é relatado que um parâmetro de coerência é importante para um resultado de som natural. Entretanto, métodos paramétricos são limitados no sentido de que em taxas de bit mais elevadas, os codificadores não são capazes de atingir qualidade transparente • devido à restrição de modelagem inerente.
Os problemas relacionados com codificadores de canais múltiplos paramétricos são que seu valor máximo de qualidade obtido é limitado a um valor que está significativamente abaixo da qualidade de transparente. 0 limite de qualidade paramétrica é mostrado em 1100 na Figura 11. Como pode ser observado de uma curva esquemática representando a qualidade/dependência de taxa de bits de um codificador mono BCC melhorado (1102) , a qualidade não pode atravessar o limite de qualidade paramétrica 1100 independente da taxa de bits. Isto significa que mesmo com uma taxa de bits aumentada, a qualidade deste codificador de canais múltiplos paramétricos não pode ser
aumentada adicionalmente.
O codificador mono BCC melhorado é um exemplo dos codificadores de estéreo ou codificadores de canais múltiplos atualmente existentes, nos quais um downmix estéreo ou um downmix de canais múltiplos é efetuado. Adicionalmente, parâmetros são derivados descrevendo relações de nível entre canais, relações de tempo entre canais, relações de coerência entre canais, etc.
. Os parâmetros são diferentes de sinal de forma de onda tal como um sinal de lado de um codificador Mid/Side, visto que o sinal de lado descreve uma diferença entre dois canais em um formato de estilo de forma de onda, comparado com a representação paramétrica, que descreve similaridades ou diversidades entre dois canais provendo certos parâmetros em vez de uma representação de forma de onda de amostra. Embora os parâmetros requeiram um número baixo de bits para serem transmitidos de um codificador para um decodificador, descrições de forma de onda, isto é, sinais * residuais sendo derivados em um estilo de forma de onda requerem mais bits e permitem, em princípio, uma reconstrução transparente.
A Figura 11 mostra uma qualidade/ dependência de taxa de bits típica deste codificador estéreo convencional baseado em forma de onda (1104) . Fica claro a partir da Figura 11 que, através do aumento crescente da taxa de bits, a qualidade do codificador estéreo convencional como codificador estéreo Mid/Side aumenta cada vez mais até a qualidade atingir a qualidade transparente. É um tipo de taxa de bits de travessia, na qual a curva característica 1102 para o codificador de canais múltiplos paramétricos e a curva 1104 para o codificador estéreo baseado em forma de onda se cruzam.
/0
Abaixo desta taxa de bits de cruzamento, o codificador de canais múltiplos paramétricos é muito melhor que o codificador estéreo convencional. Quando a mesma taxa de bits para ambos os codificadores é considerada, o codificador de canais 5 múltiplos paramétricos provê uma qualidade, que é mais elevada que a qualidade do codificador estéreo a base de forma de onda convencional, pela diferença de qualidade 1108. Dito de forma , diferente, quando é desejado ter certa qualidade 1110, esta qualidade pode ser obtida usando o codificador paramétrico em uma taxa de bits que seja reduzida por uma taxa de bits de diferença 1112, em comparação com um codificador estéreo baseado em forma de onda convencional.
Acima da taxa de bits de cruzamento, entretanto, a situação é completamente diferente. Visto que o codificador paramétrico está em seu limite máximo de qualidade de codificador paramétrico 1100, uma qualidade melhor pode apenas ser obtida pelo * uso de um codificador estéreo baseado em forma de onda convencional usando o mesmo número de bits que no codificador paramétrico.
Sumário da Invenção
É objetivo da presente invenção prover um esquema de codificação/decodificação que permita qualidade aumentada e taxa de bits reduzida se comparado com os esquemas de codificação
de canais múltiplos existentes.
25 De acordo com o primeiro aspecto da presente
invenção, este objetivo é atingido por um codificador de canais
múltiplos para codificação de um sinal de canais múltiplos
original tendo pelo menos dois canais, compreendendo: provedor de
Jl parâmetro para prover um ou mais parâmetros, os referidos um ou mais parâmetros sendo formados de modo que um sinal de canais múltiplos reconstruído possa ser formado usando um ou mais canais de downmix derivados do sinal de canais múltiplos e dos referidos 5 um ou mais parâmetros; codificador residual para gerar um sinal residual codificado com base no sinal de canais múltiplos original, nos referidos um ou mais canais de downmix ou nos referidos um ou mais parâmetros, de modo que o sinal de canais múltiplos reconstruído, quando formado usando o sinal residual, 10 seja mais similar ao sinal de canais múltiplos original do que quando formado sem o uso do sinal residual; e formador de corrente de dados para formar uma corrente de dados tendo o sinal residual e os referidos um ou mais parâmetros.
De acordo com um segundo aspecto da presente 15 invenção, este objetivo é atingido por um decodificador de canais múltiplos para decodificar um sinal de canais múltiplos tendo um ou mais canais de downmix, um ou mais parâmetros e um sinal residual codificado, compreendendo: um decodificador residual para gerar um sinal residual decodificado baseado no sinal residual 20 codificado; e um decodificador de canais múltiplos para gerar um primeiro sinal de canais múltiplos reconstruído usando um ou mais canais de downmix e os referidos um ou mais parâmetros, onde o decodificador de canais múltiplos é adicionalmente operativo para gerar um segundo sinal de canais múltiplos reconstruído usando os
25 referidos um ou mais canais de downmix e o sinal residual
decodificado em vez do primeiro sinal de canais múltiplos
reconstruído ou, adicionalmente ao primeiro sinal de canais
múltiplos, onde o segundo sinal de canais múltiplos reconstruído é
mais similar a um sinal de canais múltiplos original do que o primeiro sinal de canais múltiplos reconstruído.
De acordo com um terceiro aspecto da presente invenção, este objetivo é atingido por um codificador de canais múltiplos para codificar um sinal de canais múltiplos original tendo pelo menos dois canais, compreendendo: um dispositivo de alinhamento de tempo para alinhar um primeiro canal e um segundo canal dos pelo menos dois canais usando um parâmetro de alinhamento; um dispositivo para efetuar downmix para gerar um 10 canal de downmix usando os canais alinhados; um calculador de ganho para calcular um parâmetro de ganho diferente daquele para pesagem de um canal alinhado, de modo que a diferença entre os canais alinhados seja reduzida, se comparado com um valor de ganho de 1; e um formador de corrente de dados para formar uma corrente 15 de dados tendo informação sobre o canal de downmix, informação sobre o parâmetro de alinhamento e informação sobre o parâmetro de ganho.
De acordo com um quarto aspecto da presente invenção, este objetivo é atingido por um decodificador de canais 20 múltiplos para decodificar um sinal de canais múltiplos codificado tendo informação sobre um ou mais canais de downmix, informação sobre um parâmetro de ganho, e informação sobre um parâmetro de alinhamento, compreendendo: um decodificador de canal de downmix para gerar um sinal de downmix decodificado; e um processador para 25 processar o canal de downmix decodificado usando o parâmetro de ganho para obter um primeiro canal de saída decodificado e para processar o canal de downmix decodificado usando o parâmetro de ganho e para desalinhar usando o parâmetro de alinhamento para
obter um segundo canal de saída decodificado.
Aspectos adicionais da presente invenção incluem métodos correspondentes, correntes/arquivos de dados e programas de computador.
A presente invenção é baseada na descoberta de que os problemas relacionados com codificadores paramétricos convencionais e codificadores baseados em forma de onda são solucionados pela combinação de codificação paramétrica e codificação baseada em forma de onda. Este codificador inventivo gera uma corrente de dados escalonada tendo, como uma primeira camada de aumento, uma representação de parâmetro codificado, e tendo, como uma segunda camada de aumento, um sinal residual codificado, que é, preferivelmente, um sinal do estilo de forma de onda. De forma geral, um sinal residual adicional, que não é provido em um codificador de canais múltiplos paramétricos puros permite melhorar a qualidade atingível, especificamente entre as taxas de bits de cruzamento na Figura 11 e a qualidade transparente máxima. Como pode ser observado na Figura 11, mesmo abaixo da taxa de bits de cruzamento, o algoritmo do codificador da invenção excede em desempenho um codificador de canais múltiplos paramétricos puros com relação à qualidade em taxas de bits comparáveis. Comparado a um codificador estéreo convencional baseado totalmente em forma de onda, entretanto, o esquema de decodificação/codificação de parâmetro/forma de onda combinado é muito mais eficiente em relação aos bits. Dito de outra forma, os dispositivos da invenção combinam de forma ideal as vantagens da codificação paramétrica e da codificação baseada em forma de onda de modo que, mesmo acima da taxa de bits de cruzamento, o
codificador inventivo se beneficia do conceito paramétrico, mas excede o desempenho do codificador paramétrico puro.
Dependendo de certas configurações, as vantagens da presente invenção excedem mais ou menos o desempenho do codificador paramétrico ou codificador baseado em forma de onda convencional da técnica anterior. Configurações mais avançadas provêem uma característica melhor de qualidade/taxa de bits, enquanto configurações de nível baixo da presente invenção requerem menos energia de processamento no lado do codificador e/ou decodificador, mas, devido aos sinais residuais adicionalmente codificados, permitem uma qualidade melhor do que um codificador paramétrico puro, visto que a qualidade do codificador paramétrico puro está limitada pela qualidade limite 1100 na Figura 11.
esquema de codificação/decodificação inventivo é vantajoso por ser capaz de mover-se, sem costura, da codificação paramétrica para a codificação próxima de forma de onda ou de forma de onda transparente perfeita.
Preferivelmente, codificação paramétrica estéreo e codificação Mid/Side estéreo são combinadas em um esquema que tem a capacidade para convergir na direção da qualidade transparente. Neste esquema relacionado a Mid/Side estéreo preferido, a correlação entre os componentes de sinal, isto é, o canal esquerdo e o canal direito, é mais eficientemente explorada.
De forma geral, a idéia inventiva pode ser aplicada em várias configurações a um codificador de canais múltiplos paramétricos. Em uma configuração, o sinal residual é derivado do sinal original sem usar a informação de parâmetro )5 também disponível no codificador. Esta configuração é preferível em situações onde a energia de processamento e, possivelmente, o consumo de energia do processador sejam um problema. Esta situação pode ocorrer em dispositivos portáteis tendo possibilidades de 5 energia restritas tais como telefones móveis, palm-tops, etc. 0 sinal residual é derivado apenas do sinal original e não se baseia em um downmix ou nos parâmetros. Portanto, no lado do . decodificador, o primeiro sinal de canais múltiplos reconstruído, que é gerado usando o canal de downmix e os parâmetros, não é usado para gerar o segundo sinal de canais múltiplos reconstruído.
No entanto, existe alguma redundância nos parâmetros por um lado e no sinal residual por outro lado. Uma redução de redundância pode ser obtida por outros sistemas de codificadores/decodificadores, que, para calcular o sinal residual codificado, fazem uso da informação de parâmetro disponível no codificador e, opcionalmente, também do canal de downmix, que pode também estar disponível no codificador.
Dependendo da situação, o codificador residual pode ser uma análise por dispositivo de síntese que calcula um sinal de canais múltiplos reconstruído completo usando o canal de downmix e a informação de parâmetro. Então, com base no sinal reconstruído, um sinal de diferença para cada canal pode ser gerado, de modo que uma representação de erro de canais múltiplos é obtida, que pode ser processada de diferentes maneiras. Uma maneira poderia ser aplicar um outro esquema de codificação de canais múltiplos paramétricos à representação de erro de canais múltiplos. Uma outra possibilidade poderia ser executar um esquema de matriz para efetuar downmix da representação de erro de canais
múltiplos. Uma outra possibilidade podería ser deletar os sinais de erro dos canais surround esquerdo e direito e codificar apenas o sinal de erro do canal central ou, adicionalmente, codificar também o sinal de erro do canal esquerdo e o sinal de erro do canal direito.
Dessa maneira, existem muitas possibilidades para implementar um processador residual com base em uma representação de erro.
A configuração mencionada acima permite alta 10 flexibilidade para codificar de forma escalonada o sinal residual.
Isto demanda, entretanto, muita energia de processamento, visto que uma reconstrução completa de canais múltiplos é executada no codificador e uma representação de erro para cada canal do sinal de canais múltiplos deve ser gerada e inserida no processador 15 residual. No lado do decodificador, é necessário, primeiramente, calcular o primeiro sinal de canais múltiplos reconstruído e, então, baseado no sinal residual decodificado, que é qualquer representação do sinal de erro, o segundo sinal reconstruído tem que ser gerado. Dessa maneira, independente do fato de o primeiro 2 0 sinal reconstruído ter que ser enviado ou não, ele tem que ser calculado no lado do decodificador.
Em uma outra configuração preferida da presente invenção, a análise por abordagem de síntese no lado do codificador e o cálculo do primeiro sinal de canais múltiplos 25 reconstruído, independente do fato de que ele tenha que ser enviado ou não, são substituídos por um cálculo do lado do codificador direto do sinal residual. Isto é baseado em um canal original pesado, que depende de um parâmetro de canais múltiplos
ou é baseado em um tipo de downmix modificado cujo ganho depende de um parâmetro de alinhamento. Neste esquema, a informação adicional, isto é, o sinal residual é calculado de forma não iterativa usando os parâmetros e os sinais originais, mas sem usar 5 um ou mais canais de downmix.
Este esquema ê muito eficiente nos lados do codificador e decodificador. Quando o sinal residual não é transmitido ou foi extraído de uma corrente de dados escalonável devido a requisitos de largura de banda, o decodificador inventivo 10 automaticamente gera um primeiro sinal de canais múltiplos reconstruído baseado no canal de downmix e nos parâmetros de ganho e alinhamento, embora, quando um sinal residual diferente de zero é inserido, o reconstrutor de canais múltiplos não calcule o primeiro sinal de canais múltiplos reconstruído, mas calcule 15 apenas o segundo sinal de canais múltiplos reconstruído. Dessa maneira, este esquema de codificador/decodificador é vantajoso por permitir um cálculo bastante eficiente no lado do codificador, assim como no lado do decodificador, e usa a representação de parâmetro para reduzir a redundância no sinal residual, de modo 20. que um esquema de processamento bastante eficiente em energia e de codificação/decodificação eficiente em taxa de bits é obtido.
Breve Descrição dos Desenhos
Configurações preferidas da presente invenção são descritas em detalhe com relação às Figuras em anexo, nas quais:
A Fig. 1 é um diagrama de bloco de uma representação geral do codificador de canais múltiplos da invenção;
A Fig. 2 é um diagrama de bloco de uma *
representação geral do decodificador de canais múltiplos da invenção;
A Fig. 3 é um diagrama de bloco de uma
configuração do lado do codificador de baixa energia de
processamento í
A . Fig. 4 é um diagrama de bloco de uma
configuração de decodificador para o sistema de codificador da
Figura 3;
A Fig. 5 ê um diagrama de bloco de uma
configuração de codificador baseado em análise por síntese;
A Fig. 6 é um diagrama de bloco de uma
configuração de decodificador correspondente à configuração do codificador da Figura 5;
A Fig. 7 é um diagrama de bloco geral de uma
configuração de codificador direto tendo redundância reduzida no
sinal residual codificado;
A Fig. 8 ê uma configuração preferida de um
decodificador correspondente ao codificador da Figura 7;
A Fig. 9a ê uma configuração preferida de um
esquema de codificador/decodificador baseado no conceito da Figura 7 e Figura 8;
A Fig. 9b é uma configuração preferida da configuração da Figura 9a, quando nenhum sinal residual, mas apenas parâmetros de alinhamento e ganho são transmitidos;
A Fig. 9c é um conjunto de equações usadas no lado do codificador na Figura 9a e Figura 9b;
A Fig. 9d é um conjunto de equações usadas no lado do decodificador na Figura 9a e Figura 9b;
A Fig. 10 é uma configuração baseada em banco de filtro de análise /banco de filtro de síntese da Figura 9a até a Figura 9d; e
A Fig. 11 ilustra uma comparação entre o desempenho típico de codificadores paramétricos e convencionais baseados em forma de onda e o codificador melhorado da invenção.
Descrição Detalhada das configurações preferidas
A Figura 1 mostra uma configuração preferida de um codificador de canais múltiplos para codificar um sinal de 10 canais múltiplos original tendo pelo menos dois canais. O primeiro canal pode ser um canal esquerdo 10a, e o segundo canal pode ser um canal direito 10b em um ambiente estéreo. Embora as configurações inventivas sejam descritas no contexto de um esquema estéreo, a extensão para um esquema de canais múltiplos é direta, 15 visto que uma representação de canais múltiplos tendo, por exemplo, cinco canais, possui vários pares de um primeiro canal e um segundo canal. No contexto de um esquema surround 5.1, o primeiro canal pode ser o canal esquerdo frontal e o segundo canal pode ser o canal direito frontal. Alternativamente, o primeiro 20 canal pode ser o canal esquerdo frontal e o segundo canal pode ser o canal central. Alternativamente, o primeiro canal pode ser o canal central e o segundo canal pode ser o canal direito frontal.
Alternativamente, o primeiro canal pode ser o canal esquerdo traseiro (canal surround esquerdo), e o segundo canal pode ser o 25 canal direito traseiro (canal surround direito).
Um codificador inventivo pode incluir um dispositivo de downmix 12 para gerar um ou mais canais de downmix. No ambiente estéreo, o dispositivo de downmix 12 gerará um canal de downmix único. Em um ambiente de canais múltiplos, entretanto, o dispositivo de downmix 12 pode gerar vários canais de downmix.
Em um ambiente de canais múltiplos 5.1, o dispositivo de downmix
13, preferivelmente, gera dois canais de downmix. De forma geral, o número de canais de downmix é menor que o número de canais no sinal de canais múltiplos original.
O codificador de canais múltiplos inventivo também inclui um provedor de parâmetro 14 para prover um ou mais parâmetros, os referidos um ou mais parâmetros sendo formados de 10 modo que um sinal de canais múltiplos reconstruído possa ser formado usando os referidos um ou mais canais de downmix, derivados do sinal de canais múltiplos e dos referidos um ou mais parâmetros.
De forma importante, o codificador de canais 15 múltiplos inventivo inclui ainda um codificador residual 16 para gerar um sinal residual codificado. 0 sinal residual codificado é gerado com base no sinal de canais múltiplos original, nos referidos um ou mais canais de downmix e nos referidos um ou mais parâmetros. De forma geral, o sinal residual codificado é gerado 20 de modo que o sinal de canais múltiplos reconstruído, quando formado usando o sinal residual, é mais similar ao sinal de canais múltiplos original do que quando formado sem o sinal residual. Dessa maneira, o sinal residual codificado permite que o decodificador gere um sinal de canais múltiplos reconstruído tendo 25 uma qualidade melhor que o limite de qualidade paramétrica 1100 mostrado na Figura 11. Os referidos um ou mais parâmetros e o sinal residual codificado são inseridos em um formador de corrente de dados 18, que forma uma corrente de dados tendo o sinal residual e o referido um ou mais parâmetros. Preferivelmente, a corrente de dados enviada pelo formador de corrente de dados 18 é uma corrente de dados escalonada tendo uma primeira camada de aumento incluindo informação sobre os referidos um ou mais 5 parâmetros e uma segunda camada de aumento incluindo informação sobre o sinal residual codificado. Como é conhecido na técnica, as camadas de escalonamento diferentes em uma corrente de dados escalonada podem ser decodificadas individualmente, de modo que um dispositivo de nível baixo tal como um decodificador paramétrico 10 puro está em posição para decodificar a corrente de dados escalonada simplesmente ignorando a segunda camada de aumento.
Em uma configuração da presente invenção, a corrente de dados escalonada inclui ainda, como uma camada base, o referido um ou mais canais de downmix. A presente invenção é, entretanto, aplicável também em um ambiente no qual o usuário já está em posse do canal de downmix. Esta situação pode ocorrer quando o canal de downmix é um sinal mono ou estéreo, que o usuário já recebeu através de um outro canal de transmissão ou através do mesmo canal de transmissão, mas mais cedo se comparado 20 com a recepção da primeira camada de aumento e a segunda camada de aumento. Quando existe uma transmissão separada do(s) canal(is) de downmix e da primeira e segunda camadas de aumento, o codificador não tem, necessariamente, que incluir o dispositivo de downmix 12. Esta situação é indicada pela linha pontilhada no bloco do 25 dispositivo de downmix.
Adicionalmente, o provedor de parâmetro 14 não tem, necessariamente, que calcular realmente os parâmetros com base no primeiro e segundo canal original. Em situações nas quais >
os parâmetros para certo sinal de canal já existe, ê suficiente prover os parâmetros já gerados para o codificador da Figura 1, de modo que estes parâmetros sejam supridos para o formador de corrente de dados 18 e para o codificador residual para serem opcionalmente usados para cálculo do sinal residual e para serem introduzidos na corrente de dados escalonada. Preferivelmente, entretanto, o codificador residual usa adicionalmente os parâmetros conforme mostrado por uma linha de conexão pontilhada 19.
Em uma configuração preferida da codificador residual 16 pode ser controlado presente por uma entrada de controle de taxa de bits separada. Neste caso, o codificador residual compreende certo codificador de perda tal como um quantizador t endo um t amanho de etapa de quantizador controlável. Quando um tamanho de etapa de sinalizado através da entrada de controle de quantizador grande é taxa de bits, o sinal residual codificado terá uma faixa de valor menor (a saída de índice de quantizaçao mais elevada pelo quantizador) comparada a um caso no qual um tamanho de etapa de quantizador menor é sinalizado através da entrada de controle de taxa de bits. 0 tamanho de etapa de quantizador grande resultará em uma demanda menor de bits para o sinal residual codificado e, portanto, resultará em uma corrente de dados escalonada tendo uma taxa de bit reduzida se comparado com o caso no qual o quantizador dentro do codificador residual 16 tem um tamanho de etapa de quantizador menor resultando em um sinal residual codificado que necessita de mais bits.
Expressamente falando, as observações acima se *
aplicam a quantização escalar. De forma geral, entretanto, é preferido usar um codificador tendo resolução controlável, que é baseada em uma técnica de quantização de vetor. Quando a resolução é alta, mais bits são requeridos para codificação do sinal residual, se comparado com o caso no qual a resolução é baixa.
A Figura 2 mostra uma configuração preferida de um decodificador de canais múltiplos inventivo, que pode ser usado em conexão com o codificador da Figura 1. Em especial, a Figura 2 mostra um decodificador de canais múltiplos para decodificar um sinal de canais múltiplos codificado tendo um ou mais canais de downmix, um ou mais parâmetros Toda esta informação, isto é, o os sinais residuais codificados
corrente de dados escalonada
corrente de dados que extrai
corrente de dados escalonada
e um sinal residual codificado, canal de downiriix, os parâmetros e são incluídos em uma entrada de 20 em um ana lis ador 1 éxi co de o sinal residual codificado da e envia o sinal residual codificado para um decodificador residual 22. Analogamente, o referido um ou mais canais de downmix preferivelmente codificados são providos para um decodificador de downmix 24. Adicionalmente, os referidos um ou mais parâmetros preferivelmente codificados são providos para um decodificador de parâmetro 23 para prover o referido um ou mais parâmetros em uma forma decodificada. A saída de informação pelos blocos 22, 23 e 24 são inseridas em um decodificador de canais múltiplos 25 para gerar um primeiro sinal de canais múltiplos reconstruído 26 ou um segundo sinal de canais múltiplos reconstruído 27. 0 primeiro sinal de canais múltiplos reconstruído é gerado pelo decodificador de canais múltiplos 25 usando os referidos um ou mais canais de downmix e os referidos um
ou mais parâmetros, mas sem usar o sinal residual. O segundo sinal de canais múltiplos reconstruído 27, entretanto, é gerado usando os referidos um ou mais canais de downmix e o sinal residual decodificado. Visto que o sinal residual inclui informação adicional, e, preferivelmente, informação de forma de onda, o segundo sinal de canais múltiplos reconstruído 27 ê mais similar a um sinal de canais múltiplos original (tais como os canais 10a e 10b da Figura 1) do que o primeiro sinal de canais múltiplos reconstruído.
Dependendo da implementação do decodificador de canais múltiplos 25, o decodificador de canais múltiplos 25 enviará tanto o primeiro canal reconstruído 26 quanto o segundo sinal de canais múltiplos reconstruído 27. Alternativamente, o decodificador de canais múltiplos 25 calcula o primeiro sinal de canais múltiplos reconstruído em adição ao segundo sinal de canais múltiplos reconstruído. Naturalmente, em todas as implementações o decodificador de canais múltiplos 25 enviará apenas o primeiro sinal de canais múltiplos reconstruído, quando a corrente de dados escalonada incluir o sinal residual codificado. Quando, entretanto, a corrente de dados escalonada é processada em seu caminho a partir do codificador para o decodificar por meio de separação da segunda camada de aumento, o decodificador de canais múltiplos 25 enviará apenas o primeiro sinal de canais múltiplos reconstruído. Esta separação da segunda camada de aumento pode ocorrer quando existir um canal de transmissão no caminho entre o codificador e o decodificador, que tinha recursos de largura de banda altamente limitados, de modo que a transmissão da corrente de dados escalonada é possível apenas sem a segunda camada de aumento.
A Figura 3 e Figura 4 ilustram uma configuração do conceito inventivo que requer apenas uma energia de processamento reduzida no lado do codificador (Figura 3) , assim 5 como no lado do decodificador (Figura 4) . O codificador da Figura 3 inclui um codificador de estéreo de intensidade 30, que envia um sinal de downmix mono por um lado e informação de direção de estéreo de intensidade paramétrica por outro lado. 0 downmix mono, que é preferivelmente formado pela adição do primeiro e do segundo canal de entrada é inserido em um redutor de taxa de dados 31. Para o canal de downmix mono, o redutor de taxa de dados 31 pode incluir qualquer um dos codificadores de áudio bem conhecidos tal como um codificador de MP3, um codificador AAC ou qualquer outro codificador de áudio para sinais mono. Para a informação paramétrica de direção, o redutor de taxa de dados 31 pode incluir qualquer um dos codificadores conhecidos para informação • paramétrica, tal como um codificador de diferença, um quantizador e/ou um codificador de entropia tal como um codificador Huffman ou um codificador aritmético. Dessa maneira, os blocos 30 e 31 da
Figura 3 provêem as funcionalidades esquematicamente ilustradas pelos blocos 12 e 14 do codificador da Figura 1.
O codificador residual 16 inclui um calculador de sinal de lado 32 e um redutor de taxa de dados subseqüentemente aplicado 33. O calculador de sinal de lado 32 executa um cálculo de sinal de lado conhecido de codificadores estéreos Mid/Side da técnica anterior. Um exemplo preferido é um cálculo de diferença relativo à amostra entre o primeiro canal 10a e o segundo canal
10b para obter um sinal de lado do tipo de forma de onda, que é,
então, enviado para o redutor de taxa de dados 33 para compressão de taxa de dados. O redutor de taxa de dados 33 pode incluir os mesmos elementos descritos acima com relação ao redutor de taxa de dados 31. Na saída do bloco 33, um sinal residual codificado é 5 obtido, que é enviado para o formador de corrente de dados 18, de modo que uma corrente de dados preferivelmente escalonada seja obtida.
A saída da corrente de dados pelo bloco 18 agora inclui, em adição ao downmix mono, informação de direção de 10 estéreo de intensidade paramétrica assim como um sinal residual codificado do tipo de forma de onda.
O redutor de taxa de dados 31 pode ser controlado por uma entrada de controle de taxa de bits conforme discutido anteriormente em conexão com a Figura 1. Em uma outra 15 configuração, o redutor de taxa de dados 33 é arranjado para gerar uma corrente de dados de saída escalonada que tem, em sua camada base, um residual codificado com um número baixo de bits por amostra, e que tem, em sua primeira camada de aumento, um residual codificado com um número médio de bits por amostra, e que tem, em 20 sua próxima camada de aumento, um residual codificado com um número novamente mais elevado de bits por amostra. Para a camada base da saída do redutor de taxa de dados, pode-se, por exemplo, usar 0,5 bit por amostra. Para a primeira camada de aumento podem ser usados, por exemplo, 4 bits por amostra, e para a segunda 2 5 camada de aumento podem ser usados, por exemplo, 16 bits por amostra.
Um decodificador correspondente é mostrado na Figura 4. A entrada da corrente de dados no analisador léxico da
corrente de dados 21 é analisada para enviar separadamente informação de parâmetro para o descompressor 23. A informação de downmix codificada é enviada para o descompressor 24, e o sinal residual codificado é enviado para o descompressor residual 22. 0 5 decodificador da figura 4 inclui ainda um decodificador de estéreo de intensidade direto 40 e, adicionalmente, um decodificador
Mid/Side 41. Ambos os decodificadores 40 e 41 executam as funções do decodificador de canais múltiplos 25 para enviar o primeiro sinal de canais múltiplos reconstruído 26, que é gerado unicamente 10 pelo decodificador de estéreo de intensidade 40, e para enviar o segundo sinal de canais múltiplos reconstruído 27, que é unicamente gerado pelo decodificador MS 41.
Quando a corrente de dados inclui um sinal residual codificado, a implementação direta na Figura 4 poderia 15 enviar o primeiro sinal de canais múltiplos reconstruído 26 assim como o segundo sinal de canais múltiplos reconstruído.
Naturalmente, apenas o menor segundo sinal de canais múltiplos reconstruído 27 é interessante para o usuário nesta situação.
Portanto, um controle de decodificador 42 pode ser provido para 20 captar se existe um sinal residual codificado na corrente de dados. Quando for captado que não existe este sinal residual codificado na corrente de dados, o controle de decodificador 42 está operativo para desativar o decodificador Mid/Side 40 para economizar energia de processamento e, portanto, energia da 25 bateria, que é especialmente útil em dispositivo portátil de baixa energia, tal como um telefone móvel, etc.
A Figura 5 mostra uma outra configuração da presente invenção, na qual o sinal residual codificado é gerado
com base em uma abordagem de análise por síntese. Novamente, os primeiro e segundo canais 10a, 10b são inseridos em um dispositivo de downmix 50, que é seguido por um redutor de taxa de dados 51. Na saída do bloco 51, um sinal de downmix preferivelmente comprimido tendo um ou mais canais de downmix é obtido e suprido para o formador de corrente de dados 18. Dessa maneira, os blocos 50 e 51 provêem a funcionalidade do dispositivo de downmix 12 da Figura 1. Adicionalmente, os primeiro e segundo canais de entrada 10a, 10b são supridos para um calculador de parâmetro 53 e a saída dos parâmetros pelo calculador de parâmetro é direcionada para um outro redutor de taxa de dados 54 para comprimir os referidos um ou mais parâmetros. Dessa maneira, os blocos 53 e 54 provêem a mesma funcionalidade que o provedor de parâmetro 14 na Figura 1.
Em contraste à configuração da Figura 3, entretanto, o codificador residual 16 é mais sofisticado. Em especial, o codificador residual 16 inclui um reconstrutor de canais múltiplos paramétricos 55. O reconstrutor de canais múltiplos gera, para o exemplo de dois canais, um primeiro canal reconstruído e um segundo canal reconstruído. Visto que o reconstrutor de canais múltiplos paramétricos apenas usa os canais de downmix e os parâmetros, a qualidade da saída do sinal de canais múltiplos reconstruído pelo bloco 55 corresponderá à curva 1102 na Figura 11 e sempre estará abaixo do limite paramétrico 1100 na Figura 11.
sinal de canais múltiplos reconstruído é enviado para um calculador de erro 56. O calculador de erro 56 está operativo para receber também o primeiro e o segundo canal de entrada 10a e 10b, e envia um primeiro sinal de erro e um segundo *
sinal de erro. Preferivelmente, o calculador de erro calcula uma diferença relativa à amostra entre o canal original e um canal reconstruído correspondente (bloco de saída 55). Este procedimento é executado para cada par de canais originais e canais reconstruídos. A saída do calculador de erro 56 é - novamente uma representação de canais múltiplos, mas agora, em contraste com o sinal de canais múltiplos original, um sinal de erro de canais múltiplos. Este sinal de erro de canais múltiplos, que tem o mesmo número de canais que o sinal de canais múltiplos originais, é enviado para um processador residual 57 para gerar o sinal residual codificado.
Existem numerosas implementações do processador residual 57, todas as quais dependem de requisitos de largura de banda, grau requerido de capacidade de escalonamento, requisitos de qualidade, etc.
Em uma implementação preferida, o processador residual 57 é novamente implementado como um codificador de canais múltiplos que gera um ou mais canais de downmix de erro e parâmetros de downmix de erro. Esta configuração pode ser considerada como sendo um tipo de codificador de canais múltiplos iterativo, visto que o processador residual 57 pode incluir blocos 50, 51, 53 e 54.
Alternativamente, o processador residual 57 pode ser operativo apenas para selecionar um único canal de erro ou dois canais de erro de seu sinal de entrada, que tem a maior energia, e processar apenas o sinal de erro de energia mais elevada para obter o sinal residual codificado. Além deste critério, ou em vez dele, critérios mais avançados podem ser .
*
usados, os quais são baseados em medidas de erro motivadas com maior percepção. Alternativamente, o processador residual pode incluir um esquema de matriz para efetuar o donwmix dos canais de entrada em um ou mais canais de downmix, de modo que um dispositivo decodificador correspondente executasse um procedimento de inversão de processo de matriz análogo. Os referidos um ou mais canais de downmix podem, então, ser processados usando um dos elementos de um codificador mono ou estéreo bem conhecido, ou podem ser completamente processados usando um dos codificadores mono/estéreo mencionados acima para obter o sinal residual codificado.
Um decodificador para o codificador da Figura 5 é mostrado na Figura 6. Comparado à configuração da Figura 2, a Figura 6 revela que o decodificador de canais múltiplos 25 inclui um reconstrutor de canais múltiplos paramétricos 60 e um combinador 61. O reconstrutor de canais múltiplos paramétricos 60 gera o primeiro sinal de canais múltiplos reconstruído 26 apenas com base em um downmix decodificado e informação de parâmetro decodificada. 0 primeiro sinal reconstruído 26 pode ser enviado, quando nenhum sinal residual codificado estiver incluído na corrente de dados. Quando, entretanto, um sinal residual codificado estiver incluído na corrente de dados, o primeiro sinal reconstruído não é enviado, mas inserido em um combinador 61 para combinação do sinal de canais múltiplos parametricamente reconstruído 26 ao sinal residual decodificado, que é uma das representações da representação de erro na saída do calculador de erro 56 da Figura 5, conforme discutido acima. O combinador 61 combina o sinal residual decodificado, isto é, qualquer *
representação do sinal de erro e o sinal de canais múltiplos parametricamente reconstruído para enviar o segundo sinal reconstruído 27. Quando o decodificador da Figura 6 é considerado com relação à Figura 11, se torna claro que, para certa taxa de bits, o primeiro sinal reconstruído tem uma qualidade determinada pela linha 1102, enquanto o segundo sinal reconstruído 27 tem uma qualidade mais elevada determinada pela linha 1114 para a mesma taxa de bits.
A configuração da Figura 5/Figura 6 é preferível em relação à configuração da Figura 3/Figura 4, visto que a redundância no sinal residual codificado é reduzida. Entretanto, a configuração da Figura 5/Figura 6 requer uma quantidade mais elevada de energia de processamento, armazenagem, recursos de batería e atraso algorítmico.
Um compromisso preferido entre a configuração da Figura 3/Figura 4 e da configuração da Figura 5/Figura 6 é subseqüentemente descrito com referência à Figura 7 com relação a uma representação de codificador e Figura 8 com relação a uma representação de decodificador. 0 codificador inclui certo dispositivo de downmix 74 para executar um downmix usando o primeiro e o segundo canais de entrada 10a, 10b. Em contraste com um downmix simples, que é gerado apenas pela adição de ambos os canais originais 10a, 10b para obter um sinal mono, o dispositivo de downmix 70 é controlado por um parâmetro de alinhamento gerado por um calculador de parâmetro 71. Aqui, ambos os canais de entrada 10a, 10b, são alinhados no tempo entre si antes de ambos os sinais serem adicionados um ao outro. Desta maneira, um sinal mono especial é obtido na saída do dispositivo de downmix 70, cujo
3CL sinal mono é diferente de um sinal mono, por exemplo, gerado por um codificador estéreo de intensidade de baixo nível, conforme mostrado em 30 na Figura 3.
Adicionalmente ao parâmetro de alinhamento, ou invés do parâmetro de alinhamento, o calculador de parâmetro 71 é operativo para gerar um parâmetro de ganho. O parâmetro de ganho é inserido em um dispositivo de pesagem 72 para, preferivelmente, pesar o segundo canal 10b usando o parâmetro de ganho, antes do cálculo de um sinal de lado ser executado. A pesagem do segundo canal antes de calcular a diferença de tipo de forma de onda entre o primeiro e o segundo canal resulta em um sinal residual menor, que é mostrado como o sinal de lado especial inserido em qualquer redutor de taxa de dados adequado 33. 0 redutor da taxa de dados 33 mostrado na Figura 7 pode ser exatamente implementado como o redutor de taxa de dados 33 mostrado na Figura 3.
A configuração da Figura 7 é diferente da configuração da Figura 3 pela informação de parâmetro ser considerada, preferivelmente, para o dispositivo de downmix 70, assim como o cálculo de sinal residual, de modo que a saída do sinal residual pelo redutor de taxa de dados 33 na Figura 7 pode ser representada por um número inferior de bits do que saída de sinal enviada pelo redutor da taxa de dados 33. Isto se deve ao fato do sinal residual da figura 7 incluir menos redundância do que o sinal residual da Figura 3.
A Figura 8 mostra uma configuração preferida de uma implementação de decodificador correspondendo à implementação de codificador na Figura 7. Contrariamente ao decodificador da Figura 6, o reconstrutor de canais múltiplos 25 é operativo para enviar automaticamente o primeiro sinal de canais múltiplos reconstruído 26, quando o sinal de lado, isto é, o sinal residual for zero, ou para enviar automaticamente o segundo sinal de canais múltiplos reconstruído 27 quando o sinal residual não for igual a 5 zero. Dessa maneira, o reconstrutor de canais múltiplos 25 da
Figura 8 não pode enviar ambos os sinais 26 e 27 simultaneamente, mas pode enviar apenas um primeiro dentre os dois sinais ou um segundo dentre os dois sinais. Dessa maneira, a configuração da Figura 8 não requer qualquer controle de decodificador tal como 10 mostrado na Figura 4.
Em especial, o decodificador de sinal residual 22 na Figura 8 envia o sinal de lado especial conforme gerado pelo elemento 72 do codificador correspondente na Figura 7. Adicionalmente, o decodificador de downmix 24 envia o sinal mono 15 especial conforme gerado pelo dispositivo de downmix 70 na Figura
7.
Então, o sinal de lado especial e o sinal mono especial são enviados para o decodificador de canais múltiplos juntamente com o parâmetro de ganho e o parâmetro de alinhamento 20 de tempo. O parâmetro de ganho é operativo para controlar o estágio de ganho 84, aplicando um ganho de acordo com a primeira regra de ganho. Adicionalmente, o parâmetro de ganho controla estágios de ganho adicionais 82, 83 para aplicar um ganho de acordo com uma segunda regra de ganho diferente. Adicionalmente, o 25 reconstrutor de canais múltiplos inclui um subtraidor 84 e um adicionador 85, assim como um bloco de desalinhamento de tempo 86 para gerar um primeiro canal reconstruído e um segundo canal reconstruído.
Subseqüentemente, é feito referencia a uma configuração preferida do esquema de codificador/decodificador da Figura 7 e Figura 8. A Figura 9a mostra um esquema de codificador/decodificador completo de acordo com um aspecto da presente invenção, no qual o sinal residual d(n) não é igual a zero. Adicionalmente, a Figura 9b indica o codificador/decodificador escalonável da Figura 9a, quando nenhum sinal de diferença d(n) foi calculado, ou quando a corrente de dados foi separada para reduzir o sinal residual, por exemplo, devido a um requerimento relacionado com a largura de banda de transmissão. No caso de separação do sinal residual codificado da corrente de dados transmitida de um codificador para um decodificador na configuração da Figura 9a, a configuração da Figura 9a se torna um cenário de canais múltiplos paramétricos puro, no qual o parâmetro de alinhamento e o parâmetro de ganho são os parâmetros de canais múltiplos, e o sinal mono especial é o canal de downmix transmitido de um lado do codificador para um lado do decodificador.
A reconstrução de canais múltiplos no lado do decodificador é executada usando apenas os parâmetros de alinhamento e ganho, visto que nenhum sinal residual é recebido no lado do decodificador, isto é, d(n) é igual a zero.
A Figura 9c mostra as equações subjacentes ao codificador inventivo, enquanto a Figura 9d indica a equação subjacente ao decodificador inventivo.
Em especial, o codificador inventivo inclui, como um provedor de parâmetro 14 da Figura 1, um calculador de parâmetro 71. O calculador de parâmetro 71 é operativo para calcular um parâmetro de alinhamento de tempo para alinhamento do canal direito r (n) ao canal esquerdo 1 (n) . Na Figura 9a até a Figura 9d, o canal direito alinhado é indicado por ra(n). O parâmetro de alinhamento é preferivelmente extraído de blocos sobrepostos do sinal de entrada. O parâmetro de alinhamento corresponde ao atraso de tempo entre o canal esquerdo e o canal direito e é estimado, preferivelmente, usando técnicas de correlação cruzada de domínio de tempo. Para o caso, quando não existe ganho de alinhamento em uma sub-banda, por exemplo, no caso de sinais independentes, o parâmetro de atraso é ajustado como zero. Preferivelmente, um parâmetro de atraso (alinhamento de tempo) é estimado por sub-banda em uma estrutura da sub-banda. Em uma configuração preferida, uma taxa de análise fixa de 46 ms e 50% de janelas de Hamming de sobreposição foram empregados.
O calculador de parâmetro 71 calcula adicionalmente o valor de ganho. O valor de ganho é também, preferivelmente, extraído de blocos de sobreposição do sinal. Normalmente, o parâmetro de ganho é idêntico ao parâmetro de diferença de nível comumente usado na codificação paramétrica, tal como o esquema de codificação de cue biauricular bem conhecido. Alternativamente, o valor de ganho pode ser calculado usando uma abordagem iterativa, na qual o sinal de diferença é retroalimentado para o calculador de parâmetro, e o valor de ganho é ajustado de modo que o sinal de diferença atinja um valor mínimo conforme mostrado por uma linha pontilhada 90 na Figura 9a. Tão logo o alinhamento e ganho do parâmetro são calculados, o dispositivo de downmix 70 na Figura 7, assim como o codificador residual 16 na Figura 7, podem ser iniciados. Em especial, o dispositivo de downmix 70 na Figura 7 inclui um bloco de alinhamento 91 para atrasar um canal pelo parâmetro de alinhamento de tempo calculado. O segundo canal atrasado ra(n) é, então, adicionado ao primeiro canal usando um dispositivo adicionador 92.
Na saída do adicionador 92, o canal de downmix está presente.
Dessa maneira, o dispositivo de downmix 70 na Figura 7 inclui os blocos 91 e 92 para formar o sinal mono especial.
O codificador residual 16 na Figura 7 inclui, ainda, o dispositivo de pesagem 93 e o calculador de sinal de lado subseqüente 94, que calcula a diferença entre o primeiro canal original e o segundo canal alinhado e pesado. Em especial, para pesagem do segundo canal alinhado, a primeira regra de pesagem usada em um bloco de lado de decodificador correspondente 80 é executada. Desse modo, o codificador residual 16 inclui o dispositivo de alinhamento 91, o dispositivo de pesagem 93e calculador de sinal de lado 94. Visto que o segundo canal alinhado é usado para o downmix, assim como o cálculo residual,é suficiente calcular apenas o canal direito alinhado uma veze enviar o resultado para o dispositivo de downmix 70, assim como para o calculador de sinal de dispositivo de peso/lado 72 na
Figura 7.
Preferivelmente, os fatores de alinhamento e ganho são escolhidos de modo que o processo seja reversível e assim as equações da Figura 9d sejam bem definidas e numericamente 25 bem condicionadas.
Um codificador mono genérico pode ser usado como o codificador mono 51 para codificar o sinal de soma, e um codificador residual preferivelmente dedicado 33 é empregado para o residual.
Quando o codificador mono 51 de perda pequena, isto é, quando o sinal mono não for adicionalmente quantizado, e o codificador residual for também de perda pequena ou o modelo de sinal de alinhamento corresponder ao sinal de fonte perfeitamente, então a estrutura de codificação inventiva mostrada na Figura 9a terá a propriedade de reconstrução perfeita, também presumindo que os parâmetros de alinhamento e ganho sejam apenas submetidos a um esquema de codificação de perda pequena.
sistema inventivo na Figura 9a provê uma estrutura para um esquema que pode operar com degradação graciosa em uma variedade de faixas, conforme indicado na Figura 11, linha 1114. Em especial, sem codificação residual, isto é, d(n) =0, o esquema reduz para codificação paramétrica estéreo, pela transmissão apenas dos parâmetros de alinhamento e ganho (como parâmetros de canais múltiplos) em adição ao sinal mono (como o canal de Downmix} . Esta situação é ilustrada na Figura 9b. Adicionalmente, o sistema inventivo tem a vantagem de que o método de alinhamento se dirige automaticamente para o problema de downmix mono.
Subseqüentemente, é feito referência à Figura 10, que ilustra uma implementação da configuração inventiva ilustrada nas Figuras 9a a 9d em uma estrutura de codificação de sub-banda. Os canais esquerdo e direito originais são inseridos em um banco de filtro de análise 1000 para obter vários sinais de sub-banda. Para cada sinal de sub-banda, é usado um esquema de codificação/decodificação conforme mostrado nas Figuras 9a a 9d. No lado do decodificador, sinais de sub-banda reconstruídos são
combinados em um banco de filtro de síntese 1010 para finalmente chegar aos sinais de canais múltiplos reconstruídos de banda total. Naturalmente, para cada sub-banda, um parâmetro de alinhamento e um parâmetro de ganho deve ser transmitido a partir 5 do lado do codificador para o lado do decodificador conforme ilustrado por uma seta 1020 na Figura 10.
A implementação preferida da estrutura de codificação de sub-banda da Figura 10 é baseada em um banco de filtro modulado de co-seno com dois estágios, de modo a atingir 10 larguras de bandas de sub-banda desiguais (em um escala motivada por percepção). 0 primeiro estágio separa o sinal em M bandas. Os M sinais de sub-banda são criticamente dizimados, e alimentados para o banco de filtro do segundo estágio. 0 k-ésimo filtro do segundo estágio, k e {1, . . ., M}, tem Mk bandas. Em uma 15 implementação preferida, M = 8 bandas é usado, e uma estrutura de sub-banda, como na tabela na Figura 10, resultando em 3 6 subbandas efetivas após dois estágios, é preferida. Os filtros de protótipo são designados de acordo com [13] com pelo menos 100 kB de amortecimento na banda de parada. A ordem do filtro no primeiro 20 estágio é 116, e a ordem de filtro máxima no segundo estágio é 256. A estrutura de codificação é, então, aplicada aos pares de sub-banda (correspondendo aos canais de sub-banda esquerdo e direito).
agrupamento correspondendo das sub-bandas entre 25 o banco de filtro do primeiro e do segundo estágio é mostrado na tabela â direita da Figura 10, que torna claro que a primeira subbanda k inclui 16 sub-sub-bandas. Adicionalmente, a segunda subbanda inclui 8 sub-sub-bandas, etc.
Codificação paramétrica eficiente é atingida utilizando técnicas de quantização de vetor (VQ) de mistura de Gaussian (GM) . Quantização baseada em modelos GM é popular na área de codificação de voz [14-16], e facilita a implementação de baixa complexidade de VQ dimensional elevado. Em uma implementação preferida, nós efetuamos a quantização por vetor de vetores dimensionais 36 de parâmetros de ganho e atraso. Todos os modelos GM têm 16 componentes de mistura, e são treinados em um banco de dados de parâmetros extraídos de 60 minutos de dados de áudio (com teor variado, e desligados de sinais de teste de avaliação subseqüente). Métodos baseados em modelos estatísticos explícitos são usados com menor freqüência em codificação de áudio do que na codificação de voz. Uma razão é a descrença na capacidade de modelos estatísticos para capturar toda informação relevante contida em áudio geral. Em um caso preferido, avaliação preliminar usando procedimentos de teste aberto e fechado de modelos de parâmetro indica, entretanto, que este não é um problema neste caso. A taxa de bits resultante para os parâmetros de ganho e atraso é 2,3 kbps.
A estrutura de sub-banda é explorada para codificação dos sinais residuais. Com o mesmo processamento de bloco conforme descrito acima, a variância em cada sub-banda é estimada e as variâncias são quantizadas por vetor usando GM VQ através das sub-bandas (isto é, um vetor dimensional 36 é codificado de uma vez). As variâncias facilitam a alocação de bits entre as sub-bandas empregando um algoritmo de alocação de bits voraz [17, pág. 234]. Os sinais de sub-banda são, então, codificados usando quantizadores escalares uniformes.
O ganho instantâneo g(n) e atraso τ (n) são obtidos por interpolação linear das estimativas de bloco. 0 atraso de variação de tempo é executado através de um filtro de atraso de fração da 73- ordem, baseado em uma resposta de impulso sinc. truncado e de janela Hamming [18] . Os coeficientes de filtro são atualizados em uma base por amostra usando o parâmetro de atraso interpolado.
Uma estrutura para codificação flexível da imagem de estéreo em áudio geral é proposta. Com a nova estrutura, é possível mover sem costura de um modo de estéreo paramétrico, para codificação de aproximação de forma de onda. Uma implementação exemplificativa das idéias foi testada, usando um residual não codificado para avaliar o efeito do aumento da taxa de bits do codificador residual, e usando um codificador de núcleo MP3, de modo a avaliar o esquema em um cenário mais realista.
Para estabilização da imagem estéreo, é preferido passagem baixa de filtro dos parâmetros em um sistema paramétrico puro ou em um sistema escalonável tendo uma parte paramétrica pura que pode ser usada por um decodificador sem processamento do sinal residual, conforme é feito, por exemplo, na referência [9] . Isto reduz o ganho de alinhamento do sistema. Pela codificação do residual usando codificação de sub-banda escalar, a qualidade é adicionalmente melhorada, e se aproxima da qualidade transparente. Em especial, adicionar bits ao residual estabiliza a imagem de estéreo, e a largura do estéreo é também aumentada. Além do mais, segmentação de tempo flexível, e técnicas de taxa variável (por exemplo, reservatório de bit) são preferidas para explorar melhor a natureza dinâmica do áudio geral. Um parâmetro de coerência é preferivelmente incluído no filtro de alinhamento para aumentar o modo paramétrico. Codificação residual melhorada empregando máscara de percepção, quantização de vetor, e codificação diferencial, conduz a remoção de irrelevância e redundância mais eficiente.
Embora o sistema inventivo tenha sido descrito no contexto de codificação estéreo e no contexto de um esquema de codificação Mid/Side parametricamente aumentado, deve ser observado aqui que cada esquema de codificação/decodificação paramétrico de canais múltiplos, tal como um tipo generalizado de estéreo de intensidade de codificação, pode se beneficiar de um componente de lado fechado adicionalmente para, finalmente, atingir a propriedade de reconstrução perfeita. Embora uma configuração preferida de um esquema de codificador/decodificador inventivo tenha sido descrita usando um alinhamento de tempo no lado do codificador, transmitindo o parâmetro de alinhamento, e usando um desalinhamento de tempo no lado do decodificador, existem alternativas adicionais, que executam o alinhamento de tempo no lado do codificador para gerar um sinal de diferença pequeno, mas que não executam o desalinhamento de tempo no lado do decodificador, de modo que o parâmetro de alinhamento não seja transmitido do codificador para o decodificador. Nesta configuração, a negligência do desalinhamento de tempo inclui naturalmente um artefato. Entretanto, este artefato não é, na maioria dos casos, muito grave, de modo que esta configuração é especialmente adequada para decodificadores de canais múltiplos de baixo preço.
A presente invenção, portanto, pode também ser
considerada como uma extensão de um esquema de codificação paramétrica de estéreo preferivelmente do tipo BCC ou qualquer outro esquema de codificação de canais múltiplos, que completamente retorne para um esquema paramétrico puro, quando o sinal residual codificado é separado. De acordo com a presente invenção, um sistema puramente paramétrico é aumentado pela transmissão de vários tipos de informação adicional que preferivelmente incluem o sinal residual em um estilo de forma de onda, o parâmetro de ganho e/ou o parâmetro de alinhamento de tempo. Dessa maneira, uma operação de decodificação usando a informação adicional resulta em uma qualidade mais elevada do que estaria disponível somente com as técnicas paramétricas.
Dependendo dos requerimentos, os métodos inventivos de codificação ou decodificação podem ser implementados em hardware, software ou em firmware. Portanto, a invenção também se refere a um meio legível por computador tendo armazenado um código de programa que, quando operando em um computador, resulta em um dos métodos inventivos. Dessa maneira, a presente invenção é um programa de computador tendo um código de programa que, quando
operando em um computador, resulta em um método inventivo. . Sum-
Lista de Referências Ferreira,
[1] J.D. Johnston e A. J.
difference stereo
transform coding, no Proc. IEEE Int. Conf.
Acoust., Speech, Signal Processing (ICASSP), 1992, vol. 2, pág.
569.572.
[2] R. Waal e R. Veldhuis, .Subband coding of stereophonic digital audio signals, no Proc. IEEE Int. Conf.
Acoust., Speech, Signal Processing (ICASSP), 1991, pág. 3601.3604.
[3] J. Herre, K. Brandenburg, e D. Lederer, .Intensity stereo coding, na Pré-publicação 3799, 96th AES Convention, 1994.
[4] K. Brandenburg, .MP3 and AAC explained, no Proc. of the AES 17th International Conference, documento número 17-009, 1999.
[5] J. Blauert, Spatial hearing: the psychophysics of human sound localization, The MIT Press, Cambridge, Massachusetts, 1997.
[6] H. Fuchs, .Improving joint stereo audio coding by adaptive inter-channel prediction, no Proc. of IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, 1993, pág. 39.42.
[7] H. Fuchs, .Improving MPEG audio coding by backward adaptive linear stereo prediction, na Prépublicação 4086, 99th AES Convention, 1995.
[8] F. Baumgarte e C. Faller, .Binaural cue coding. part I: Psychoacoustic fundamentais and design principies, IEEE
Trans. Speech Audio Processing, vol. 11, n2 6, pág. 509.519, 2003.
[9] C. Faller e F. Baumgarte, .Binaural cue coding. part II: Schemes and applications, IEEE Trans. Speech Audio Processing, vol. 11, ns 6, pág. 520.531, 2003.
[10] C. Faller, Parametric Coding of Spatial Audio, Tese de Doutorado, Ecole Polytechnique Federale de
Lausanne, 2004.
[11] J. Breebaart, S. van de Par, A. Kohlrausch, e E. Schuijers, High-quality parametric spatial audio coding at low bitrates, na Pré-publicação 6072, 116th AES Convention, 2004.
[12] J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, e C. Spenger, .MP3 surround: Efficient and compatible coding of multi-channel audio, na Pré-publicação 6049, 116th AES Convention, 2004.
[13] Y-P. Lin e P.P. Vaidyanaythan, .A Kaiser
window approach for the design of prototype filters of cosine
modulated filterbanks , IEEE Signal Processing Letters, vol. 5, n2
6, pág. 132.134, 1998
[14] P. Hedelin e J. Skoglund, Vector
quantization based on Gaussian mixture models, IEEE Trans. Speech Audio Processing, vol. 8, n2 4, pág. 385.401, 2000.
[15] A.D. Subramaniam e B.D. Rao, .PDF optimized parametric vector quantization of speech line spectral frequencies, IEEE Trans. Speech Audio Processing, vol. 11, n2 2, pág. 130.142, 2003.
[16] J. Lindblom e P. Hedelin, .Variabledimension quantization of sinusoidal amplitudes using Gaussian mixture models, no Proc. IEEE Int. Conf. Acoust., Speech, Signal Processing (ICASSP), 2004, vol. 1, pág. 153.156.
[17] A. Gersho e R. M. Gray, Vector Quantization and Signal Compression, Kluwer Academic Publishers, Boston, 1992.
[18] T.I. Laakso, V. Vàlimãki, M. Karjalainen, e U.K. Laine, Tools for fractional delay filter design, IEEE Signal Processing Magazine, pág. 30.60, January 1996.
[19] ITU-R Recommendation BS.1534, Method for the Subjective Assessment of Intermediate Quality Levei of Coding Systems, ITU-T, 2001.
[20] The LAME project, http://lame.sourceforge.

Claims (25)

1. Codificador de canais múltiplos para codificação de um sinal de canais múltiplos original tendo pelo menos dois canais, caracterizado pelo fato de que compreende: um provedor de parâmetro para prover um ou mais parâmetros, os referidos um ou mais parâmetros sendo formados de modo que um sinal de canais múltiplos reconstruído possa ser formado usando um ou mais canais de downmix derivados do sinal de canais múltiplos e dos referidos um ou mais parâmetros; um codificador residual para gerar um sinal residual codificado baseado no sinal de canais múltiplos original, nos referidos um ou mais canais de downmix ou nos referidos um ou mais parâmetros, de modo que o sinal de canais múltiplos reconstruído, quando formado usando o sinal residual, seja mais similar ao sinal de canais múltiplos original do que quando formado sem o uso do sinal residual, o codificador residual incluindo um decodificador de canais múltiplos para gerar um sinal de canais múltiplos decodificado usando os referidos um ou mais canais de downmix e os referidos um ou mais parâmetros; um calculador de erro para calcular uma representação de sinal de erro de canais múltiplos baseada no sinal de canais múltiplos decodificado e no sinal de canais múltiplos original; e um processador residual para processar a representação de sinal de erro de canais múltiplos para obter o sinal residual codificado; e um formador de corrente de dados para formar uma corrente de dados tendo o sinal residual codificado e os referidos um ou mais parâmetros.
Petição 870180068491, de 07/08/2018, pág. 5/16
2/10
2. Codificador de canais múltiplos, de acordo com a reivindicação 1, caracterizado pelo fato de que o formador de corrente de dados está operativo para formar uma corrente de dados escalonável, na qual os referidos um ou mais parâmetros e o sinal residual estão em camadas de escalonamento diferentes.
3. Codificador de canais múltiplos, de acordo com a reivindicação 1, caracterizado pelo fato de que o codificador residual está operativo para calcular o sinal residual codificado como um sinal residual de forma de onda.
4. Codificador de canais múltiplos, de acordo com a reivindicação 1, caracterizado pelo fato de que o codificador residual está operativo para gerar o sinal residual com base nos referidos um ou mais parâmetros e no sinal de canais múltiplos original sem os referidos um ou mais canais de downmix, de modo que o sinal residual tem uma energia menor em comparação com a geração do sinal residual sem o uso dos referidos um ou mais parâmetros.
5. Codificador de canais múltiplos, de acordo com a reivindicação 4, no qual o provedor de parâmetro caracterizado pelo fato de que compreende: um calculador de alinhamento para calcular um parâmetro de alinhamento de tempo a ser provido para um dispositivo de alinhamento de tempo para alinhar um primeiro canal e um segundo canal dentre os pelo menos dois canais; ou um calculador de ganho para calcular um ganho diferente de 1 para pesagem de um canal, de modo que uma diferença entre dois canais seja reduzida, comparado com um valor de ganho de um.
Petição 870180068491, de 07/08/2018, pág. 6/16
3/10
6. Codificador de canais múltiplos, de acordo com a reivindicação 5, caracterizado pelo fato de que o codificador residual está operativo para calcular e codificar um sinal de diferença derivado de um primeiro canal e de um segundo canal alinhado ou pesado.
7. Codificador de canais múltiplos, de acordo com a reivindicação 5, caracterizado pelo fato de que compreende ainda um dispositivo de downmix para gerar um canal de downmix usando os canais alinhados.
8. Codificador de canais múltiplos, de acordo com a reivindicação 1, compreendendo ainda um banco de filtro de análise para dividir o sinal de canais múltiplos em uma pluralidade de bandas de freqüência, caracterizado pelo fato de que o provedor de parâmetro e o codificador residual estão operativos para operar nos sinais de sub-banda, e onde o formador de corrente de dados está operativo coletar sinais residuais codificados e parâmetros para uma pluralidade de bandas de freqüência.
9. Codificador de canais múltiplos, de acordo com a reivindicação 1, caracterizado pelo fato de que o processador residual inclui um codificador de canais múltiplos para gerar uma representação de canais múltiplos da representação de sinal de erro de canais múltiplos.
10. Codificador de canais múltiplos, de acordo com a reivindicação 9, caracterizado pelo fato de que o processador residual está operativo para gerar ainda um ou mais canais de downmix da representação de sinal de erro de canais múltiplos.
Petição 870180068491, de 07/08/2018, pág. 7/16
4/10
11. Codificador de canais múltiplos, de acordo com a reivindicação 1, caracterizado pelo fato de que o provedor de parâmetro está operativo para prover parâmetros de codificação de cue biauricular (BCC) tais como diferenças de nível entre canais, parâmetros de coerência entre canais, diferenças de tempo entre canais ou cues de envelope de canal.
12. Método de codificação de um sinal de canais múltiplos original tendo pelo menos dois canais, caracterizado pelo fato de que compreende: provisão de um ou mais parâmetros, os referidos um ou mais parâmetros sendo formados, de modo que um sinal de canais múltiplos reconstruído possa ser formado usando um ou mais canais de downmix derivados do sinal de canais múltiplos e dos referidos um ou mais parâmetros; geração de um sinal residual codificado baseado no sinal de canais múltiplos original, nos referidos um ou mais canais de downmix ou nos referidos um ou mais parâmetros, de modo que o sinal de canais múltiplos reconstruído, quando formado usando o sinal residual, seja mais similar ao sinal de canais múltiplos original do que quando formado sem o uso do sinal residual, a etapa de geração incluindo gerar um sinal de canais múltiplos decodificado usando os referidos um ou mais canais de downmix e os referidos um ou mais parâmetros, calcular uma representação de sinal de erro de canais múltiplos com base no sinal de canais múltiplos decodificado e no sinal de canais múltiplos original; e processar a representação de sinal de erro de canais múltiplos para obter o sinal residual codificado; e formação de uma corrente de dados tendo o sinal residual codificado e os referidos um ou mais parâmetros.
13. Decodificador de canais múltiplos para
Petição 870180068491, de 07/08/2018, pág. 8/16
5/10 decodificar um sinal de canais múltiplos codificado tendo um ou mais canais de downmix, um ou mais parâmetros e um sinal residual codificado, os referidos um ou mais canais de downmix dependendo de um parâmetro de alinhamento ou de um parâmetro de ganho, compreendendo: um decodificador residual para gerar um sinal residual decodificado baseado no sinal residual codificado; e um decodificador de canais múltiplos para gerar um primeiro sinal de canais múltiplos reconstruído usando um ou mais canais de downmix e os referidos um ou mais parâmetros, caracterizado pelo fato de que o decodificador de canais múltiplos está operativo adicionalmente para gerar um segundo sinal de canais múltiplos reconstruído usando os referidos um ou mais canais de downmix e o sinal residual decodificado, onde o decodificador de canais múltiplos está adicionalmente operativo para pesar o canal de downmix usando o parâmetro de ganho, para adicionar o sinal residual decodificado a um canal de downmix pesado e para novamente pesar um canal resultante para obter o primeiro sinal de canais múltiplos reconstruído, e para subtrair o sinal residual decodificado do canal de downmix e para pesar um canal resultante da subtração usando o parâmetro de ganho, ou para desalinhar uma diferença entre o canal de downmix e o sinal residual decodificado ao obter o segundo sinal de canais múltiplos reconstruído.
14. Decodificador de canais múltiplos, de acordo com a reivindicação 13, no qual o sinal de canais múltiplos codificado está representado por uma corrente de dados escalonada, a corrente de dados escalonada tendo uma primeira camada de escalonamento incluindo os referidos um ou mais parâmetros e uma segunda camada de escalonamento incluindo o sinal residual
Petição 870180068491, de 07/08/2018, pág. 9/16
6/10 codificado, caracterizado pelo fato de que o codificador de canais múltiplos compreende ainda: um analisador léxico de corrente de dados para extrair a primeira camada de escalonamento ou a segunda camada de escalonamento.
15. Decodificador de canais múltiplos, de acordo com a reivindicação 13, caracterizado pelo fato de que o sinal residual codificado depende dos referidos um ou mais parâmetros; e no qual o decodificador de canais múltiplos está operativo para usar os referidos um ou mais canais de downmix, os referidos um ou mais parâmetros e o sinal residual decodificado para gerar o segundo sinal de canais múltiplos reconstruído.
16. Decodificador de canais múltiplos, de acordo com a reivindicação 13, caracterizado pelo fato de que o canal de downmix depende de um parâmetro de alinhamento ou de um parâmetro de ganho, e no qual o decodificador de canais múltiplos está operativo para pesar o canal de downmix usando uma primeira regra de pesagem baseada no parâmetro de ganho e para pesar o canal de downmix usando uma segunda regra de pesagem usando o parâmetro de ganho, ou para desalinhar um canal de saída com relação ao outro canal de saída usando o parâmetro de alinhamento.
17. Decodificador de canais múltiplos, de acordo com a reivindicação 13, caracterizado pelo fato de que os parâmetros incluem parâmetros de codificação de cue biauricular (BCC) tais como diferenças de nível entre canais, parâmetros de coerência entre canais, diferenças de tempo entre canais ou cues de envelope de canal, e no qual o decodificador de canais múltiplos está operativo para executar uma operação de decodificação de canais múltiplos de acordo com um esquema de codificação de cue
Petição 870180068491, de 07/08/2018, pág. 10/16
7/10 biauricular (BCC).
18. Decodificador de canais múltiplos, de acordo com a reivindicação 13, caracterizado pelo fato de que os referidos um ou mais canais de downmix, os referidos um ou mais parâmetros e o sinal residual codificado são representados por dados específicos de sub-banda, adicionalmente compreendendo: um banco de filtro de síntese para combinar dados de sub-banda reconstruídos gerados pelo decodificador de canais múltiplos para obter uma representação de banda total do primeiro ou do segundo sinal de canais múltiplos reconstruído.
19 . Método de decodificação de um sinal de canais múltiplos codificado tendo um ou mais canais de downmix, um ou mais parâmetros e um sinal residual codificado, caracterizado pelo fato de que compreende: geração de um sinal residual decodificado baseado no sinal residual codificado; e geração de um primeiro sinal de canais múltiplos reconstruído usando um ou mais canais de downmix e os referidos um ou mais parâmetros, e gerar um segundo sinal de canais múltiplos reconstruído usando os referidos um ou mais canais de downmix e o sinal residual decodificado, a etapa de geração incluindo pesagem do canal de downmix usando o parâmetro de ganho, adicionando o sinal residual decodificado a um canal de downmix pesado e novamente pesando um canal resultante para obter o primeiro sinal de canais múltiplos reconstruído, e subtrair o sinal residual decodificado do canal de downmix e pesar um canal resultante da subtração usando o parâmetro de ganho, ou dasalinhar uma diferença entre o canal de downmix e o sinal residual decodificado, ao obter o segundo sinal de canais múltiplos reconstruído.
Petição 870180068491, de 07/08/2018, pág. 11/16
8/10
20. Codificador de canais múltiplos para codificar um sinal de canais múltiplos original que tem pelo menos dois canais caracterizado pelo fato de que compreende: um dispositivo de alinhamento de tempo para alinhar um primeiro canal e um segundo canal dentre os pelo menos dois canais usando um parâmetro de alinhamento; um dispositivo de downmix para gerar um canal de downmix usando os canais alinhados; um calculador de ganho para calcular um parâmetro de ganho diferente de um para pesagem de um canal alinhado, de modo que a diferença entre os canais alinhados seja reduzida se comparado a um valor de ganho de 1; e um formador de corrente de dados para formar uma corrente de dados que tem informação sobre o canal de downmix, informação sobre o parâmetro de alinhamento e informação sobre o parâmetro de ganho.
21. Codificador de canais múltiplos, de acordo com a reivindicação 20, compreendendo ainda um codificador residual para calcular e codificar um sinal de diferença derivado do primeiro canal e de um segundo canal alinhado e pesado, caracterizado pelo fato de que o formador de corrente de dados está adicionalmente operativo para incluir um sinal residual codificado na corrente de dados.
22. Decodificador de canais múltiplos para decodificar um sinal de canais múltiplos codificado que tem informação sobre um ou mais canais de downmix, informação sobre um parâmetro de ganho, e informação sobre um parâmetro de alinhamento, e um sinal residual codificado, compreendendo: um decodificador de canal de downmix para gerar um canal de downmix decodificado; um processador para processar o canal de downmix
Petição 870180068491, de 07/08/2018, pág. 12/16
9/10 decodificado usando o parâmetro de ganho para obter um primeiro canal de saída decodificado e para processar o canal de downmix decodificado usando o parâmetro de ganho e para desalinhar usando o parâmetro de alinhamento para obter um segundo canal de saída decodificado; e um decodificador residual para gerar um sinal residual decodificado, caracterizado pelo fato de que o processador está operativo para primariamente pesar o canal de downmix usando o parâmetro de ganho, para adicionar o sinal residual decodificado e para, em segundo lugar, pesar usando o parâmetro de ganho para obter um primeiro canal reconstruído, e para subtrair o sinal residual decodificado do canal de downmix antes da pesagem e para desalinhar de modo a obter o segundo canal reconstruído.
23. Método de codificação de um sinal de canais múltiplos original tendo pelo menos dois canais, caracterizado pelo fato de que compreende: alinhamento de tempo de um primeiro canal e de um segundo canal dentre os pelo menos dois canais usando um parâmetro de alinhamento; geração de um canal de downmix usando os canais alinhados; cálculo de um parâmetro de ganho diferente de um para pesagem de um canal alinhado, de modo que a diferença entre os canais alinhados seja reduzida, comparado com um valor de ganho de 1; e formação de uma corrente de dados tendo informação sobre o canal de downmix, informação sobre o parâmetro de alinhamento e informação sobre o parâmetro de ganho.
24. Método de decodificação de um sinal de canais múltiplos codificado tendo informação sobre um ou mais canais de downmix, informação sobre um parâmetro de ganho, informação sobre um parâmetro de alinhamento, e um sinal residual codificado
Petição 870180068491, de 07/08/2018, pág. 13/16
10/10 compreendendo: geração de um canal de downmix decodificado; processamento do canal de downmix decodificado usando o parâmetro de ganho para obter um primeiro canal de saída decodificado e para processar o canal de downmix decodificado usando o parâmetro de ganho e um desalinhamento baseado no parâmetro de alinhamento para obter um segundo canal de saída decodificado, e decodificação do sinal residual codificado para obter um sinal residual decodificado, caracterizado pelo fato de que a etapa de processamento inclui primariamente pesar o canal de downmix usando o parâmetro de ganho, adicionar o sinal residual decodificado e, em segundo lugar, pesagem usando o parâmetro de ganho para obter um primeiro canal reconstruído, e subtração do sinal residual decodificado do canal de downmix antes da pesagem e desalinhamento para obter o segundo canal reconstruído.
25. Sinal de canais múltiplos codificado tendo informação sobre um ou mais canais de downmix, sobre um ou mais parâmetros resultantes, quando combinados com os referidos um ou mais canais de downmix, em um primeiro sinal de canais múltiplos reconstruído, e um sinal residual codificado resultante, quando combinado com os referidos um ou mais canais de downmix, em um segundo sinal de canais múltiplos reconstruído, caracterizado pelo fato de que o sinal de canais múltiplos codificado é uma corrente de dados escalonável, na qual os referidos um ou mais parâmetros e o sinal residual estão em camadas de escalonamento diferentes, ou os referidos um ou mais parâmetros incluem parâmetros de codificação de cue biauricular (BCC) tais como diferenças de nível entre canais, parâmetros de coerência entre canais, diferenças de tempo entre canais ou cues de envelope de canal.
BRPI0520053-9A 2005-02-22 2005-10-04 Esquema de codificador/decodificador de canais múltiplos quase-transparente ou transparente BRPI0520053B1 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US65521605P 2005-02-22 2005-02-22
US60/655,216 2005-02-22
US11/080,775 2005-03-14
US11/080,775 US7573912B2 (en) 2005-02-22 2005-03-14 Near-transparent or transparent multi-channel encoder/decoder scheme
PCT/EP2005/010685 WO2006089570A1 (en) 2005-02-22 2005-10-04 Near-transparent or transparent multi-channel encoder/decoder scheme

Publications (2)

Publication Number Publication Date
BRPI0520053A2 BRPI0520053A2 (pt) 2009-04-14
BRPI0520053B1 true BRPI0520053B1 (pt) 2019-02-19

Family

ID=35519868

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0520053-9A BRPI0520053B1 (pt) 2005-02-22 2005-10-04 Esquema de codificador/decodificador de canais múltiplos quase-transparente ou transparente

Country Status (19)

Country Link
US (1) US7573912B2 (pt)
EP (1) EP1851997B1 (pt)
JP (1) JP4887307B2 (pt)
KR (1) KR100954179B1 (pt)
CN (2) CN101120615B (pt)
AT (1) ATE406076T1 (pt)
AU (1) AU2005328264B2 (pt)
BR (1) BRPI0520053B1 (pt)
CA (1) CA2598541C (pt)
DE (1) DE602005009262D1 (pt)
ES (1) ES2312025T3 (pt)
HK (1) HK1107495A1 (pt)
IL (1) IL185304A0 (pt)
MX (1) MX2007009887A (pt)
NO (1) NO339907B1 (pt)
PL (1) PL1851997T3 (pt)
PT (1) PT1851997E (pt)
RU (1) RU2388176C2 (pt)
WO (1) WO2006089570A1 (pt)

Families Citing this family (118)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3561810B1 (en) * 2004-04-05 2023-03-29 Koninklijke Philips N.V. Method of encoding left and right audio input signals, corresponding encoder, decoder and computer program product
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
ES2387256T3 (es) * 2004-07-14 2012-09-19 Koninklijke Philips Electronics N.V. Método, dispositivo, aparato codificador, aparato decodificador y sistema de audio
MX2007005261A (es) * 2004-11-04 2007-07-09 Koninkl Philips Electronics Nv Codificacion y descodificacion de un conjunto de senales.
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
EP1858006B1 (en) * 2005-03-25 2017-01-25 Panasonic Intellectual Property Corporation of America Sound encoding device and sound encoding method
PL1866911T3 (pl) * 2005-03-30 2010-12-31 Koninl Philips Electronics Nv Skalowalne, wielokanałowe kodowanie dźwięku
US7840411B2 (en) * 2005-03-30 2010-11-23 Koninklijke Philips Electronics N.V. Audio encoding and decoding
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US8577686B2 (en) * 2005-05-26 2013-11-05 Lg Electronics Inc. Method and apparatus for decoding an audio signal
JP5461835B2 (ja) * 2005-05-26 2014-04-02 エルジー エレクトロニクス インコーポレイティド オーディオ信号の符号化/復号化方法及び符号化/復号化装置
US8082157B2 (en) * 2005-06-30 2011-12-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
WO2007004829A2 (en) * 2005-06-30 2007-01-11 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8214221B2 (en) 2005-06-30 2012-07-03 Lg Electronics Inc. Method and apparatus for decoding an audio signal and identifying information included in the audio signal
US8626503B2 (en) * 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
WO2007055463A1 (en) * 2005-08-30 2007-05-18 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8577483B2 (en) * 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
KR20080049735A (ko) * 2005-08-30 2008-06-04 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
EP1921606B1 (en) * 2005-09-02 2011-10-19 Panasonic Corporation Energy shaping device and energy shaping method
KR100857120B1 (ko) * 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
WO2007040361A1 (en) * 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7672379B2 (en) * 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US8068569B2 (en) * 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7742913B2 (en) * 2005-10-24 2010-06-22 Lg Electronics Inc. Removing time delays in signal paths
US8112286B2 (en) * 2005-10-31 2012-02-07 Panasonic Corporation Stereo encoding device, and stereo signal predicting method
KR100803212B1 (ko) * 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
EP1974347B1 (en) * 2006-01-19 2014-08-06 LG Electronics Inc. Method and apparatus for processing a media signal
EP1989704B1 (en) * 2006-02-03 2013-10-16 Electronics and Telecommunications Research Institute Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue
KR100921453B1 (ko) * 2006-02-07 2009-10-13 엘지전자 주식회사 부호화/복호화 장치 및 방법
EP1987595B1 (en) * 2006-02-23 2012-08-15 LG Electronics Inc. Method and apparatus for processing an audio signal
US7835904B2 (en) * 2006-03-03 2010-11-16 Microsoft Corp. Perceptual, scalable audio compression
KR100773562B1 (ko) 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
US7676374B2 (en) * 2006-03-28 2010-03-09 Nokia Corporation Low complexity subband-domain filtering in the case of cascaded filter banks
AU2007300810B2 (en) 2006-09-29 2010-06-17 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
CA2874454C (en) * 2006-10-16 2017-05-02 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
AU2007312597B2 (en) * 2006-10-16 2011-04-14 Dolby International Ab Apparatus and method for multi -channel parameter transformation
US8571875B2 (en) 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
JP5463143B2 (ja) * 2006-12-07 2014-04-09 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及びその装置
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
US20100119073A1 (en) * 2007-02-13 2010-05-13 Lg Electronics, Inc. Method and an apparatus for processing an audio signal
EP2137824A4 (en) 2007-03-16 2012-04-04 Lg Electronics Inc METHOD AND DEVICE FOR PROCESSING AN AUDIO SIGNAL
GB0705328D0 (en) * 2007-03-20 2007-04-25 Skype Ltd Method of transmitting data in a communication system
CN101689368B (zh) * 2007-03-30 2012-08-22 韩国电子通信研究院 对具有多声道的多对象音频信号进行编码和解码的设备和方法
CN103299363B (zh) 2007-06-08 2015-07-08 Lg电子株式会社 用于处理音频信号的方法和装置
CN101802907B (zh) * 2007-09-19 2013-11-13 爱立信电话股份有限公司 多信道音频的联合增强
GB2453117B (en) 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
RU2452043C2 (ru) * 2007-10-17 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Аудиокодирование с использованием понижающего микширования
JP2011504250A (ja) * 2007-11-21 2011-02-03 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
KR20100096220A (ko) * 2007-12-03 2010-09-01 노키아 코포레이션 패킷 생성 장치, 인코딩 신호의 동기화 장치, 패킷 생성 방법 및 인코딩 신호의 동기화 방법
EP2237267A4 (en) * 2007-12-21 2012-01-18 Panasonic Corp STEREOSIGNALUMSETZER, STEREOSIGNALWANDLER AND METHOD THEREFOR
ES2401817T3 (es) * 2008-01-31 2013-04-24 Agency For Science, Technology And Research Procedimiento y dispositivo de distribución/truncado de la velocidad de transmisión de bits para codificación de audio escalable
US9111525B1 (en) * 2008-02-14 2015-08-18 Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) Apparatuses, methods and systems for audio processing and transmission
MX2010012580A (es) * 2008-05-23 2010-12-20 Koninkl Philips Electronics Nv Aparato de mezcla ascendente estereo parametrico, decodificador estereo parametrico, aparato de mezcla descendente estereo parametrico, codificador estereo parametrico.
US8355921B2 (en) * 2008-06-13 2013-01-15 Nokia Corporation Method, apparatus and computer program product for providing improved audio processing
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
AU2013200578B2 (en) * 2008-07-17 2015-07-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
US8315396B2 (en) * 2008-07-17 2012-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
WO2010017833A1 (en) * 2008-08-11 2010-02-18 Nokia Corporation Multichannel audio coder and decoder
CN102177542B (zh) * 2008-10-10 2013-01-09 艾利森电话股份有限公司 能量保留多通道音频编码
MX2011011399A (es) * 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
EP2395504B1 (en) * 2009-02-13 2013-09-18 Huawei Technologies Co., Ltd. Stereo encoding method and apparatus
WO2010091736A1 (en) * 2009-02-13 2010-08-19 Nokia Corporation Ambience coding and decoding for audio applications
CN101826326B (zh) * 2009-03-04 2012-04-04 华为技术有限公司 一种立体声编码方法、装置和编码器
AU2015246158B2 (en) * 2009-03-17 2017-10-26 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding.
AU2013206557B2 (en) * 2009-03-17 2015-11-12 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
US9082395B2 (en) * 2009-03-17 2015-07-14 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
EP2413314A1 (en) * 2009-03-24 2012-02-01 Huawei Technologies Co., Ltd. Method and device for switching a signal delay
CN101533641B (zh) 2009-04-20 2011-07-20 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法和装置
GB2470059A (en) * 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
CN101556799B (zh) * 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
CN102171754B (zh) * 2009-07-31 2013-06-26 松下电器产业株式会社 编码装置以及解码装置
KR101613975B1 (ko) * 2009-08-18 2016-05-02 삼성전자주식회사 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
JP5345024B2 (ja) * 2009-08-28 2013-11-20 日本放送協会 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム
EP2476113B1 (en) * 2009-09-11 2014-08-13 Nokia Corporation Method, apparatus and computer program product for audio coding
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
JP5511848B2 (ja) * 2009-12-28 2014-06-04 パナソニック株式会社 音声符号化装置および音声符号化方法
JP5333257B2 (ja) * 2010-01-20 2013-11-06 富士通株式会社 符号化装置、符号化システムおよび符号化方法
EP2369861B1 (en) * 2010-03-25 2016-07-27 Nxp B.V. Multi-channel audio signal processing
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
AU2011237882B2 (en) 2010-04-09 2014-07-24 Dolby International Ab MDCT-based complex prediction stereo coding
CA3093517C (en) 2010-07-02 2021-08-24 Dolby International Ab Audio decoding with selective post filtering
US8948403B2 (en) * 2010-08-06 2015-02-03 Samsung Electronics Co., Ltd. Method of processing signal, encoding apparatus thereof, decoding apparatus thereof, and signal processing system
EP2609592B1 (en) * 2010-08-24 2014-11-05 Dolby International AB Concealment of intermittent mono reception of fm stereo radio receivers
CN103262158B (zh) * 2010-09-28 2015-07-29 华为技术有限公司 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
JP5949270B2 (ja) * 2012-07-24 2016-07-06 富士通株式会社 オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム
KR20140017338A (ko) * 2012-07-31 2014-02-11 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 장치 및 방법
KR101903664B1 (ko) * 2012-08-10 2018-11-22 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 파라미터 오디오 오브젝트 코딩을 위한 잔류 개념을 이용하는 인코더, 디코더, 시스템 및 방법
CN104704558A (zh) * 2012-09-14 2015-06-10 杜比实验室特许公司 基于多声道音频内容分析的上混检测
EP2757559A1 (en) * 2013-01-22 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
KR20190134821A (ko) 2013-04-05 2019-12-04 돌비 인터네셔널 에이비 스테레오 오디오 인코더 및 디코더
US8804971B1 (en) * 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
EP3005352B1 (en) * 2013-05-24 2017-03-29 Dolby International AB Audio object encoding and decoding
MY170179A (en) * 2013-06-10 2019-07-09 Fraunhofer Ges Forschung Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding
PL3008726T3 (pl) 2013-06-10 2018-01-31 Fraunhofer Ges Forschung Urządzenie i sposób kodowania obwiedni sygnału audio, przetwarzania i dekodowania przez modelowanie reprezentacji sumy skumulowanej z zastosowaniem kwantyzacji i kodowania rozkładu
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
US10141004B2 (en) * 2013-08-28 2018-11-27 Dolby Laboratories Licensing Corporation Hybrid waveform-coded and parametric-coded speech enhancement
EP2854133A1 (en) * 2013-09-27 2015-04-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Generation of a downmix signal
RU2653858C1 (ru) 2014-05-28 2018-05-15 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Процессор данных и транспорт данных пользовательского управления на устройства декодирования и воспроизведения аудио
EP3067885A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
ES2955962T3 (es) 2015-09-25 2023-12-11 Voiceage Corp Método y sistema que utiliza una diferencia de correlación a largo plazo entre los canales izquierdo y derecho para mezcla descendente en el dominio del tiempo de una señal de sonido estéreo en canales primarios y secundarios
CA3011915C (en) 2016-01-22 2021-07-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for estimating an inter-channel time difference
US10210871B2 (en) * 2016-03-18 2019-02-19 Qualcomm Incorporated Audio processing for temporally mismatched signals
CN106162180A (zh) * 2016-06-30 2016-11-23 北京奇艺世纪科技有限公司 一种图像编解码方法及装置
FI3539125T3 (fi) * 2016-11-08 2023-03-21 Fraunhofer Ges Forschung Laite ja menetelmä monikanavasignaalin koodaamiseksi ja dekoodaamiseksi käyttäen sivuvahvistusta ja jäännösvahvistusta
ES2830954T3 (es) * 2016-11-08 2021-06-07 Fraunhofer Ges Forschung Mezclador descendente y método para la mezcla descendente de al menos dos canales y codificador multicanal y decodificador multicanal
CN109215667B (zh) 2017-06-29 2020-12-22 华为技术有限公司 时延估计方法及装置
PT3776541T (pt) 2018-04-05 2022-03-21 Fraunhofer Ges Forschung Aparelho, método ou programa de computador para estimar uma diferença de tempo entre canais
CN114708874A (zh) 2018-05-31 2022-07-05 华为技术有限公司 立体声信号的编码方法和装置
CN110403582B (zh) * 2019-07-23 2021-12-03 宏人仁医医疗器械设备(东莞)有限公司 一种用于分析脉波波形品质的方法
GB2623516A (en) * 2022-10-17 2024-04-24 Nokia Technologies Oy Parametric spatial audio encoding

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR970005131B1 (ko) * 1994-01-18 1997-04-12 대우전자 주식회사 인간의 청각특성에 적응적인 디지탈 오디오 부호화장치
JP2852862B2 (ja) * 1994-02-01 1999-02-03 株式会社グラフィックス・コミュニケーション・ラボラトリーズ Pcmオーディオ信号の変換方法と装置
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
CN1290104C (zh) 2002-04-09 2006-12-13 皇家飞利浦电子股份有限公司 具有折叠式反射镜的复合物镜
CN1311426C (zh) 2002-04-10 2007-04-18 皇家飞利浦电子股份有限公司 立体声信号的编码、解码方法和装置及其传输设备
EP1500083B1 (en) 2002-04-22 2006-06-28 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
JP4714416B2 (ja) 2002-04-22 2011-06-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間的オーディオのパラメータ表示
DE60311794C5 (de) * 2002-04-22 2022-11-10 Koninklijke Philips N.V. Signalsynthese
US7039204B2 (en) * 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
KR20050021484A (ko) 2002-07-16 2005-03-07 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
JPWO2005081229A1 (ja) * 2004-02-25 2007-10-25 松下電器産業株式会社 オーディオエンコーダ及びオーディオデコーダ
KR101079066B1 (ko) * 2004-03-01 2011-11-02 돌비 레버러토리즈 라이쎈싱 코오포레이션 멀티채널 오디오 코딩
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal

Also Published As

Publication number Publication date
NO339907B1 (no) 2017-02-13
CA2598541C (en) 2012-08-14
KR20070098930A (ko) 2007-10-05
HK1107495A1 (en) 2008-04-03
CN101120615B (zh) 2012-05-23
ATE406076T1 (de) 2008-09-15
JP2008530616A (ja) 2008-08-07
AU2005328264B2 (en) 2009-03-26
IL185304A0 (en) 2008-02-09
US20060190247A1 (en) 2006-08-24
WO2006089570A1 (en) 2006-08-31
EP1851997A1 (en) 2007-11-07
KR100954179B1 (ko) 2010-04-21
ES2312025T3 (es) 2009-02-16
AU2005328264A1 (en) 2006-08-31
US7573912B2 (en) 2009-08-11
MX2007009887A (es) 2007-09-07
PT1851997E (pt) 2008-12-04
DE602005009262D1 (de) 2008-10-02
NO20074829L (no) 2007-09-21
CN102270452B (zh) 2013-11-13
RU2007135178A (ru) 2009-03-27
BRPI0520053A2 (pt) 2009-04-14
RU2388176C2 (ru) 2010-04-27
EP1851997B1 (en) 2008-08-20
PL1851997T3 (pl) 2009-01-30
CN101120615A (zh) 2008-02-06
CN102270452A (zh) 2011-12-07
JP4887307B2 (ja) 2012-02-29
CA2598541A1 (en) 2006-08-31

Similar Documents

Publication Publication Date Title
BRPI0520053B1 (pt) Esquema de codificador/decodificador de canais múltiplos quase-transparente ou transparente
JP7440547B2 (ja) パケット損失補償装置およびパケット損失補償方法、ならびに音声処理システム
JP6626581B2 (ja) 1つの広帯域アライメント・パラメータと複数の狭帯域アライメント・パラメータとを使用して、多チャネル信号を符号化又は復号化する装置及び方法
JP5122681B2 (ja) パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ
TWI602444B (zh) 編碼多通道hoa聲訊訊號以減少雜訊之方法和裝置以及對已減少雜訊的編碼多通道hoa聲訊訊號解碼之方法和裝置
RU2555221C2 (ru) Канальное кодирование на основе комплексного преобразования с частотным кодированием с расширенной полосой
KR101422745B1 (ko) 다채널로 구성된 다객체 오디오 신호의 인코딩 및 디코딩장치 및 방법
JP5185340B2 (ja) マルチチャネルオーディオ信号を表示するための装置と方法
AU2018368589A1 (en) Apparatus and method for encoding or decoding directional audio coding parameters using quantization and entropy coding
BRPI0612218B1 (pt) codificação de áudio residual adaptativa
BR112019009315A2 (pt) aparelho e método para mixagem de redução ou mixagem de aumento de um sinal de múltiplos canais com o uso de compensação de fase
KR20070028481A (ko) 다중-채널 출력 신호를 발생시키기 위한 다중-채널합성장치 및 방법
JP2022084671A (ja) マルチチャネル信号符号化方法、マルチチャネル信号復号化方法、符号器、及び復号器
Lindblom et al. Flexible sum-difference stereo coding based on time-aligned signal components
AU2020291776B2 (en) Packet loss concealment for dirac based spatial audio coding
TWI843389B (zh) 音訊編碼器、降混訊號產生方法及非暫時性儲存單元

Legal Events

Date Code Title Description
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 19/02/2019, OBSERVADAS AS CONDICOES LEGAIS. (CO) 10 (DEZ) ANOS CONTADOS A PARTIR DE 19/02/2019, OBSERVADAS AS CONDICOES LEGAIS