BRPI0419281B1 - Métodos de codificar e de decodificar sinais multicanais, e, aparelhos codificador e decodificador - Google Patents

Métodos de codificar e de decodificar sinais multicanais, e, aparelhos codificador e decodificador Download PDF

Info

Publication number
BRPI0419281B1
BRPI0419281B1 BRPI0419281-8A BRPI0419281A BRPI0419281B1 BR PI0419281 B1 BRPI0419281 B1 BR PI0419281B1 BR PI0419281 A BRPI0419281 A BR PI0419281A BR PI0419281 B1 BRPI0419281 B1 BR PI0419281B1
Authority
BR
Brazil
Prior art keywords
signal
lateral
decoded
xlateral
residual
Prior art date
Application number
BRPI0419281-8A
Other languages
English (en)
Inventor
Stefan Bruhn
Ingemar Johansson
Anisse Taleb
Daniel Enström
Original Assignee
Telefonaktiebolaget Lm Ericsson (Publ)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from SE0303501A external-priority patent/SE0303501D0/xx
Application filed by Telefonaktiebolaget Lm Ericsson (Publ) filed Critical Telefonaktiebolaget Lm Ericsson (Publ)
Publication of BRPI0419281B1 publication Critical patent/BRPI0419281B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Endoscopes (AREA)

Description

(54) Título: MÉTODOS DE CODIFICAR E DE DECODIFICAR SINAIS MULTICANAIS, E, APARELHOS CODIFICADOR E DECODIFICADOR (51) lnt.CI.: G10L 19/00 (30) Prioridade Unionista: 19/12/2003 SE 0303501-1, 20/02/2004 SE 0400417-2 (73) Titular(es): TELEFONAKTIEBOLAGET LM ERICSSON (PUBL) (72) Inventor(es): STEFAN BRUHN; INGEMAR JOHANSSON; ANISSE TALEB; DANIEL ENSTRÕM (85) Data do Início da Fase Nacional: 16/08/2007
1/27 “MÉTODOS DE CODIFICAR E DE DECODIFICAR SINAIS MULTICANAIS, E, APARELHOS CODIFICADOR E DECODIFICADOR”
Dividido do PI0410856-6 depositado em 15/12/2004 CAMPO TÉCNICO [0001] A presente invenção relaciona-se em geral à codificação de sinais de áudio, e em particular à codificação de sinais de áudio multicanais.
FUNDAMENTO [0002] Há uma alta necessidade de mercado para transmitir e armazenar sinais de áudio a baixa taxa de bit enquanto mantendo alta qualidade de áudio. Particularmente, em casos onde recursos de transmissão ou armazenamento são limitados, operação em baixa taxa de bit é um fator de custo essencial. Isto é tipicamente o caso, por exemplo, em aplicações de transmissão em fluxo e de mensagens em sistemas de comunicação móveis tais como GSM, UMTS ou CDMA. [0003] Hoje, não há nenhum codec padronizado disponível provendo alta qualidade de áudio estereofônico a taxas de bit que são interessantes economicamente para uso em sistemas de comunicação móveis. O que é possível com codecs disponíveis é a transmissão monofônica dos sinais de áudio. À alguma extensão também transmissão estereofônica está disponível. Porém, limitações de taxa de bit normalmente requerem limitar a representação estéreo bastante drasticamente.
[0004] O modo mais simples de codificação estereofônica ou multicanal de sinais de áudio é codificar os sinais dos canais diferentes separadamente como sinais individuais e independentes. Outro modo básico usado em transmissão de rádio FM estéreo e que assegura compatibilidade com receptores de rádio mono de legado é transmitir um sinal de soma e diferença dos dois canais envolvidos.
[0005] Codecs de áudio do estado da técnica, tais como MPEG-1/2 Camada III e MPEG-2/4 AAC fazem uso da denominada codificação estéreo conjunta. De acordo com esta técnica, os sinais dos canais diferentes são processados conjuntamente, em lugar de separadamente e individualmente. As duas técnicas de codificação estéreo conjuntas mais comumente usadas são conhecidas como codificação
Petição 870180028417, de 09/04/2018, pág. 7/39
2/27 estéreo de Meio/Lado (M/S) e codificação estéreo de intensidade, que normalmente são aplicadas em sub-bandas dos sinais estéreo ou multicanais a serem codificados.
[0006] Codificação estéreo de M/S é semelhante ao procedimento descrito em rádio FM estéreo, em um sentido que codifica e transmite os sinais de soma e diferença das sub-bandas de canal e por esse meio explora a redundância entre as sub-bandas de canal. A estrutura e a operação de um codificador baseado em codificação estéreo de M/S são descritas, por exemplo na Patente US 5,285,498 por J. D. Johnston.
[0007] Estéreo de intensidade, por outro lado, é capaz de fazer uso de relevância estéreo. Transmite a intensidade conjunta dos canais (das sub-bandas diferentes) junto com alguma informação de local indicando como a intensidade está distribuída entre os canais. Estéreo de intensidade só provê informação de magnitude espectral dos canais. Informação de fase não é levada.
[0008] Por esta razão e como a informação inter-canal temporal (mais especificamente a diferença de tempo inter-canal) é de relevância psico-acústica principal, particularmente em frequências mais baixas, estéreo de intensidade só pode ser usado em altas frequências acima de, por exemplo, 2 kHz. Um método de codificação estéreo de intensidade é descrito, por exemplo, na Patente Europeia 0497413 por R. Veldhuis et al.
[0009] Um método de codificação estéreo recentemente desenvolvido é descrito, por exemplo, em um documento de conferência com o título Binaural cue coding applied to stereo and multi-channel audio compression, 112a Convenção de AES, maio de 2002, Munique, Alemanha, por C. Faller et al. Este método é um método de codificação de áudio multicanal paramétrico. O princípio básico é que no lado de codificação, os sinais de entrada de N canais ci, c2,..., cn são combinados a um sinal mono m. O sinal mono é codificado em áudio usando qualquer codec de áudio monofônico convencional. Em paralelo, parâmetros são derivados dos sinais de canal, que descrevem a imagem multicanal. Os parâmetros são codificados e transmitidos ao decodificador, junto com o fluxo de bits de áudio. O decodificador
Petição 870180028417, de 09/04/2018, pág. 8/39
3/27 primeiro decodifica o sinal mono m' e então regenera os sinais de canal ci', C2',..., Cn', baseado na descrição paramétrica da imagem multicanal.
[0010] O princípio do método de Coding Cue Binaural (BCC) é que ele transmite o sinal mono codificado e denominados parâmetros de BCC. Os parâmetros de BCC incluem diferenças de nível inter-canal codificadas e diferenças de tempo inter-canal para sub-bandas do sinal de entrada multicanal original.
[0011] O decodificador regenera os sinais de canal diferentes aplicando ajustes de nível e fase em sub-banda do sinal mono baseado nos parâmetros de BCC. A vantagem sobre, por exemplo, estéreo de M/S ou de intensidade é que informação estéreo incluindo informação inter-canal temporal é transmitida a taxas de bit muito mais baixas. Porém, esta técnica requer transformadas de tempo-frequência exigentes computacionais em cada um dos canais, ambos no codificador e no decodificador.
[0012] Além disso, BCC não opera o fato que muito da informação estéreo, especialmente em baixas frequências, é difusa, isto é, não vem de qualquer direção específica. Campos de som difusos existem em ambos os canais de uma gravação estéreo, mas eles estão em grande parte fora de fase com respeito entre si. Se um algoritmo tal como BCC for sujeito a gravações com uma grande quantidade de campos de som difusos, a imagem estéreo reproduzida será confusa, saltando da esquerda à direita uma vez que o algoritmo de BCC só pode mover o sinal em bandas de frequência específicas à esquerda ou à direita.
[0013] Um meio possível para codificar o sinal estéreo e assegurar boa reprodução de campos de som difusos é usar um esquema de codificação muito semelhante à técnica usada em radiodifusão de rádio FM estéreo, isto é, codificar os sinais mono (Esquerdo + Direito) e a diferença (Esquerdo - Direito) separadamente. [0014] Uma técnica, descrita na Patente US 5,434,948 por C. E. Holt et al., usa uma técnica semelhante como em BCC para codificar o sinal mono e informação lateral. Neste caso, a informação lateral consiste em filtros de preceptor e opcionalmente um sinal residual. Os filtros de preceptor, estimados por um algoritmo de mínimo quadrado médio, quando aplicado ao sinal mono permitem a predição
Petição 870180028417, de 09/04/2018, pág. 9/39
4/27 dos sinais de áudio multicanais. Com esta técnica, alguém é capaz de alcançar codificação de taxa de bit muito baixa de fontes de áudio multicanais, porém, às custas de uma queda de qualidade, discutida ademais abaixo.
[0015] Finalmente, para conclusão, uma técnica deve ser mencionada que é usada em áudio 3D. Esta técnica sintetiza os sinais de canal direito e esquerdo filtrando sinais de fonte sonora com os denominados filtros relacionados à cabeça. Porém, esta técnica requer os sinais de fonte sonora diferentes serem separados e assim não podem ser aplicados geralmente para codificação estéreo ou multicanal. SUMÁRIO [0016] Um problema com esquemas de codificação existentes baseados em codificação de quadros de sinais, em particular um sinal principal e um ou mais sinais laterais, é a existência do efeito pré-eco. Nas Fig.7a-b, diagramas estão ilustrando tal artefato. Supõe-se um componente de sinal que possui o desenvolvimento de tempo como ilustrado pela curva 100. No começo, iniciando-se a partir de t0, o componente de sinal não está presente na amostra de áudio. Em um tempo t entre t1 e t2, o componente de sinal repentinamente aparece. Quando o componente de sinal é codificado, utilizando um comprimento de quadro de t2-t1, a ocorrência do componente de sinal será “espalhada” por todo o quadro, como indicado na curva 101. Se uma decodificação ocorre na curva 101, o componente de sinal aparece em um tempo At antes da aparição pretendida do componente de sinal e um “pré-eco” é percebido.
[0017] Um objetivo da presente invenção é, portanto, prover um método de codificação e dispositivo que melhoram a qualidade de percepção de sinais de áudio multicanais, em particular para evitar artefatos tal como pré-eco. Um objetivo adicional da presente invenção é prover um método de codificação e dispositivo que requerem menos potência de processamento e tendo requisitos de taxa de bit de transmissão mais constantes.
[0018] Os objetivos acima são alcançados por métodos e dispositivos de acordo com as reivindicações de patente inclusas. Em termos gerais, em um primeiro aspecto, um método de codificação de sinais de áudio multicanal compreende gerar
Petição 870180028417, de 09/04/2018, pág. 10/39
5/27 um primeiro sinal de saída, sendo parâmetros de codificação que representam um sinal principal. O sinal principal é uma primeira combinação linear dos sinais de pelo menos um primeiro e um segundo canal. O método adicionalmente compreende gerar um segundo sinal de saída, sendo parâmetros de codificação que representam um sinal lateral. O sinal lateral é uma segunda combinação linear de sinais de pelo menos o primeiro e o segundo canais dentro de um quadro de codificação. O método é caracterizado pelo fato da geração do segundo sinal de saída adicionalmente compreender o escalonamento do sinal lateral a um contorno de energia do sinal principal.
[0019] Em um segundo aspecto, um método de decodificação de sinais de áudio multicanal compreende a geração de um sinal principal decodificado a partir de parâmetros de codificação que representam um sinal principal. O sinal principal é uma primeira combinação linear de sinais de pelo menos um primeiro e um segundo canal. O método adicionalmente compreende a geração de um sinal lateral decodificado a partir de parâmetros de codificação que representam um sinal lateral. O sinal lateral é uma segunda combinação linear de sinais de pelo menos um primeiro e um segundo canal, dentro de um quadro de codificação. O método adicionalmente compreende a combinação de pelo menos o sinal principal decodificado e o sinal lateral decodificado em sinais de pelo menos o primeiro e o segundo canal. O método é caracterizado pelo fato de a geração de um sinal lateral decodificado adicionalmente compreender o escalonamento do sinal lateral decodificado em um contorno de energia do sinal principal decodificado.
[0020] Em um terceiro aspecto, um aparelho codificador compreende um meio de entrada para sinais de áudio multicanais que compreendem pelo menos um primeiro e um segundo canal. O aparelho de codificação compreende um meio para gerar um primeiro sinal de saída, sendo parâmetros de codificação que representam um sinal principal. O sinal principal é uma primeira combinação linear de sinais de pelo menos o primeiro e o segundo canal. O aparelho codificador adicionalmente compreende um meio para gerar um segundo sinal de saída, sendo parâmetros de codificação que representam um sinal lateral. O sinal lateral é uma segunda
Petição 870180028417, de 09/04/2018, pág. 11/39
6/27 combinação linear de sinais de pelo menos o primeiro e o segundo canal, dentro de um quadro de codificação. O aparelho de codificação adicionalmente compreende um meio de saída. O aparelho de codificação é caracterizado pelo fato e o meio para gerar um segundo sinal de saída adicionalmente compreender um meio para escalonar o sinal lateral para um contorno de energia do sinal principal.
[0021] Em um quarto aspecto, um aparelho decodificador compreende um meio de entrada para codificar parâmetros que representam um sinal principal e parâmetros de codificação que representam um sinal lateral. O sinal principal é uma primeira combinação linear de um primeiro e um segundo canal. O sinal lateral é uma segunda combinação linear de um primeiro e um segundo canal. O aparelho decodificador adicionalmente compreendendo um meio para gerar um sinal principal decodificado a partir de parâmetros de codificação que representam o sinal principal e um meio para gerar um sinal lateral decodificado a partir de parâmetros de codificação que representam o sinal lateral dentro de um quadro de codificação. O aparelho decodificador adicionalmente compreende um meio para combinar pelo menos o sinal principal decodificado e o sinal lateral decodificado em sinais de pelo menos um primeiro e um segundo canal, e um meio de saída. O aparelho decodificador é caracterizado pelo fato de o meio para gerar um sinal lateral decodificado por sua vez compreender um meio para escalonar o sinal lateral decodificado para um contorno de energia do sinal principal decodificado.
[0022] Em um quinto aspecto, um sistema de áudio compreende pelo menos um de um parelho codificador de acordo com o terceiro aspecto e um aparelho decodificador de acordo com o quarto aspecto.
[0023] A vantagem principal com a presente invenção é que a preservação da percepção dos sinais de áudio é melhorada. Além disso, a presente invenção ainda permite transmissão de sinal multicanal a taxas de bit muito baixas.
BREVE DESCRIÇÃO DOS DESENHOS [0024] A invenção, junto com objetivos e vantagens adicionais dela, pode ser melhor entendida fazendo referência à descrição seguinte tomada junto com os desenhos anexos, em que:
Petição 870180028417, de 09/04/2018, pág. 12/39
7/27
Figura 1 é um esquema de blocos de um sistema para transmitir sinais multicanais;
Figura 2a é um diagrama de blocos de um codificador em um transmissor;
Figura 2b é um diagrama de blocos de um decodificador em um receptor;
Figura 3a é um diagrama ilustrando quadros de codificação de comprimentos diferentes;
Figuras 3b e 3c são diagramas de blocos de concretizações de unidades de codificador de sinal lateral de acordo com a presente invenção;
Figura 4 é um diagrama de blocos de uma concretização de um codificador usando codificação de fator de equilíbrio de sinal lateral;
Figura 5 é um diagrama de blocos de uma concretização de um codificador para sistemas de multi-sinal;
Figura 6 é um diagrama de blocos de uma concretização de um decodificador adequado para decodificar sinais do dispositivo da Figura 5;
Figuras 7a e b são diagramas ilustrando um artefato de pré-eco;
Figura 8 é um diagrama de blocos de uma concretização de uma unidade de codificador de sinal lateral de acordo com a presente invenção, empregando princípios de codificação diferentes em subquadros diferentes;
Figura 9 ilustra o uso de princípios de codificação diferentes em subbandas de frequência diferentes;
Figura 10 é um fluxograma das etapas básicas de uma concretização de um método de codificação de acordo com a presente invenção; e
Figura 11 é um fluxograma das etapas básicas de uma concretização de um método de decodificação de acordo com a presente invenção.
DESCRIÇÃO DETALHADA [0025] Figura 1 ilustra um sistema típico 1, no qual a presente invenção pode ser utilizada vantajosamente. Um transmissor 10 inclui uma antena 12 incluindo hardware e software associados para ser capaz de transmitir sinais de rádio 5 para um receptor 20. O transmissor 10 inclui entre outras partes um codificador de
Petição 870180028417, de 09/04/2018, pág. 13/39
8/27 multicanal 14, que transforma sinais de vários canais de entrada 16 em sinais de saída adequados para transmissão de rádio. Exemplos de codificadores de multicanal 14 adequados são descritos em detalhes ademais abaixo. Os sinais dos canais de entrada 16 podem ser providos por exemplo, de um armazenamento de sinal de áudio 18, tal como um arquivo de dados de representação digital de gravações de áudio, gravações de áudio de fita magnética ou disco de vinil, etc. Os sinais dos canais de entrada 16 também podem ser providos ao vivo, por exemplo de um conjunto de microfones 19. Os sinais de áudio são digitalizados, se já não em forma digital, antes de entrarem no codificador de multicanal 14.
[0026] No lado de receptor 20, uma antena 22 com hardware e software associados opera a recepção atual de sinais de rádio 5 representando sinais de áudio multicanais. Aqui, funcionalidades típicas, tal como, por exemplo, correção de erro, são executadas. Um decodificador 24 decodifica os sinais de rádio 5 recebidos e transforma os dados de áudio levados por esse meio em sinais de vários canais de saída 26. Os sinais de saída podem ser providos, por exemplo, para alto-falantes 29 para apresentação imediata, ou podem ser armazenados em um armazenamento de sinal de áudio 28 de qualquer tipo.
[0027] O sistema 1 pode, por exemplo, ser um sistema de conferência por telefone, um sistema para prover serviços de áudio ou outras aplicações de áudio. Em alguns sistemas, tal como, por exemplo, o sistema de conferência por telefone, a comunicação tem que ser de um tipo duplex, enquanto por exemplo, distribuição de música de um provedor de serviço para um assinante pode ser essencialmente de um tipo unidirecional. A transmissão de sinais do transmissor 10 para o receptor 20 também pode ser executada por qualquer outro meio, por exemplo por tipos diferentes de ondas eletromagnéticas, cabos ou fibras como também combinações disso.
[0028] Figura 2a ilustra uma concretização de um codificador de acordo com a presente invenção. Nesta concretização, o sinal multicanal é um sinal estéreo incluindo dois canais a e b, recebidos na entrada 16A e 16B, respectivamente. Os sinais de canal a e b são providos a uma unidade de pré-processamento 32, onde
Petição 870180028417, de 09/04/2018, pág. 14/39
9/27 procedimentos de condicionamento de sinal diferentes podem ser executados.
[0029] Os sinais (talvez modificados) da saída da unidade de pré-processamento 32 são somados em uma unidade de adição 34. Esta unidade de adição 34 também divide a soma por um fator de dois. O sinal xmono produzido deste modo é um sinal principal dos sinais estéreos, uma vez que basicamente inclui todos os dados de ambos os canais. Nesta concretização, o sinal principal assim representa um sinal mono puro. O sinal principal xmono é provido a uma unidade de codificador de sinal principal 38, que codifica o sinal principal de acordo com qualquer princípio de codificação adequado. Tais princípios estão disponíveis dentro da técnica anterior e não são assim discutidos ademais aqui. A unidade de codificador de sinal principal 38 dá um sinal de saída pmono, sendo parâmetros de codificação representando um sinal principal.
[0030] Em uma unidade de subtração 36, uma diferença (dividida por um fator de dois) dos sinais de canal é provida como um sinal lateral xlateral. Nesta concretização, o sinal lateral representa a diferença entre os dois canais no sinal estéreo. O sinal lateral xlateral é provido a uma unidade de codificação de sinal lateral. 30.
[0031] Concretizações preferidas da unidade de codificação de sinal lateral 30 serão discutidas ademais abaixo. De acordo com um procedimento de codificação de sinal lateral, que será descrito em mais detalhes abaixo, o sinal lateral xlateral é transferido nos parâmetros de codificação plateral representando um sinal lateral xlateral. Em certas concretizações, esta codificação acontece utilizando também informação do sinal principal xmono. A seta 42 indica uma tal provisão, onde o sinal principal não codificado original xmono é utilizado. Em outras concretizações adicionais, a informação de sinal principal que é usada na unidade de codificação de sinal lateral 30 pode ser deduzida dos parâmetros de codificação pmono representando o sinal principal, como indicado pela linha interrompida 44.
[0032] Os parâmetros de codificação pmono representando o sinal principal xmono é um primeiro sinal de saída, e os parâmetros de codificação plateral representando o sinal lateral xlateral é um segundo sinal de saída. Em um caso típico, estes dois sinais de saída pmono, plateral, juntos representando o som estéreo completo, são
Petição 870180028417, de 09/04/2018, pág. 15/39
10/27 multiplexados em um sinal de transmissão 52 em uma unidade de multiplexador 40. Porém, em outras concretizações, a transmissão dos primeiro e segundos sinais de saída pmono, plateral pode acontecer separadamente.
[0033] Na Figura 2b, uma concretização de um decodificador 24 de acordo com a presente invenção é ilustrada como um esquema de blocos. O sinal recebido 54, incluindo parâmetros de codificação representando a informação de sinal principal e lateral são providos a uma unidade de demultiplexador 56, que separa um primeiro e um segundo sinal de entrada, respectivamente. O primeiro sinal de entrada, correspondendo a parâmetros de codificação pmono de um sinal principal, é provido a uma unidade de decodificador de sinal principal 64. De uma maneira convencional, os parâmetros de codificação pmono representando o sinal principal são usados para gerar um sinal principal decodificado xmono, sendo tão semelhante quanto possível ao sinal principal xmono (Figura 2a) do codificador 14 (Figura 2a).
[0034] Semelhantemente, o segundo sinal de entrada, correspondendo a um sinal lateral, é provido a uma unidade de decodificador de sinal lateral 60. Aqui, os parâmetros de codificação plateral representando o sinal lateral são usados para recuperar um sinal lateral decodificado x''lateral.
[0035] Em algumas concretizações, o procedimento de decodificação utiliza informação sobre o sinal principal x''mono, como indicado por uma seta.
[0036] Os sinais principal e lateral decodificados xmono, xlateral são providos a uma unidade de adição 70, que provê um sinal de saída que é uma representação do sinal original de canal a. Semelhantemente, uma diferença provida por uma unidade de subtração 68 provê um sinal de saída que é uma representação do sinal original de canal b. Estes sinais de canal podem ser pós-processados em uma unidade de pós-processador 74 de acordo com procedimentos de processamento de sinal da técnica anterior. Finalmente, os sinais de canal a e b são providos nas saídas 26A e 26B do decodificador.
[0037] Como mencionado no sumário, codificação é executada tipicamente em um quadro de cada vez. Um quadro inclui amostras de áudio dentro de um período de tempo predefinido. Na parte de fundo da Figura 3a, um quadro SF2 de duração
Petição 870180028417, de 09/04/2018, pág. 16/39
11/27 de tempo L é ilustrado. As amostras de áudio dentro da porção não hachurada devem ser codificadas juntas. As amostras precedentes e as amostras subsequentes são codificadas em outros quadros. A divisão das amostras em quadros em qualquer caso introduzirá algumas descontinuidades nas bordas de quadro. Deslocar sons dará parâmetros de codificação inconstantes, mudando basicamente em cada borda de quadro. Isto dará origem a erros perceptíveis. Um modo para compensar um pouco disto é basear a codificação não só nas amostras que devem ser codificadas, mas também em amostras na vizinhança absoluta do quadro, como indicado pelas porções hachuradas. De tal modo, haverá uma transferência mais suave entre os quadros diferentes. Como uma alternativa, ou complemento, técnicas de interpolação às vezes também são utilizadas para reduzir artefatos de percepção causados por bordas de quadro. Porém, todos tais procedimentos requerem grandes recursos computacionais adicionais, e para certas técnicas de codificação específicas, também poderia ser difícil prover com quaisquer recursos.
[0038] Nesta visão, é benéfico utilizar tantos quadros longos quanto possível, uma vez que o número de bordas de quadro será pequeno. Também a eficiência de codificação tipicamente se torna alta e a taxa de bit de transmissão necessária tipicamente será minimizada. Porém, quadros longos dão problemas com artefatos de pré-eco e sons como 'fantasma'.
[0039] Em vez de utilizar quadros mais curtos, tal como SF1 ou até mesmo SF0, tendo as durações de L/2 e L/4, respectivamente, qualquer um qualificado na técnica percebe que a eficiência de codificação pode ser diminuída, a taxa de bit de transmissão pode ter que ser mais alta e os problemas com artefatos de borda de quadro aumentarão. Porém, quadros mais curtos sofrem menos de por exemplo, outros artefatos de percepção, tais como sons como 'fantasma' e pré-eco. A fim de ser capaz de minimizar o erro de codificação tanto quanto possível, alguém deveria usar um comprimento de quadro tão curto quanto possível.
[0040] De acordo com a presente invenção, a percepção de áudio será melhorada usando um comprimento de quadro para codificação do sinal lateral que
Petição 870180028417, de 09/04/2018, pág. 17/39
12/27 é dependente do conteúdo de sinal presente. Como a influência de comprimentos de quadro diferentes na percepção de áudio diferirá dependendo da natureza do som a ser codificado, uma melhoria pode ser obtida deixando a natureza do próprio sinal afetar o comprimento de quadro que é usado. A codificação do sinal principal não é o objetivo da presente invenção e, portanto, não é descrita em detalhes. Porém, os comprimentos de quadro usados para o sinal principal podem ou não ser iguais aos comprimentos de quadro usados para o sinal lateral.
[0041] Devido a pequenas variações temporais, pode, por exemplo, em alguns casos, ser benéfico codificar o sinal lateral com o uso de quadros relativamente longos. Isto pode ser o caso com gravações com uma grande quantidade de campo de som difuso tais como gravações de concerto. Em outros casos, tal como conversação de fala estéreo, quadros curtos são provavelmente para preferir. A decisão sobre qual comprimento de quadro deve-se preferir pode ser executada de dois modos básicos.
[0042] Uma concretização de uma unidade de codificador de sinal lateral 30 de acordo com a presente invenção é ilustrada na Figura 3b, na qual uma decisão de malha fechada é utilizada. Um quadro de codificação básico de comprimento L é usado aqui. Vários esquemas de codificação 81, caracterizados por um conjunto separado 80 de subquadros 90, são criados. Cada conjunto 80 de subquadros 90 inclui um ou mais subquadros 90 de comprimentos iguais ou diferentes. O comprimento total do conjunto 80 de subquadros 90 é, porém, sempre igual ao comprimento de quadro de codificação básica L. Com referências à Figura 3b, o esquema de codificação de topo é caracterizado por um conjunto de subquadros que inclui só um subquadro de comprimento L. O próximo conjunto de subquadros inclui dois quadros de comprimento L/2. O terceiro conjunto inclui dois quadros de comprimento L/4 seguidos por um quadro de L/2.
[0043] O sinal xlateral provido à unidade de codificador de sinal lateral 30 é codificado por todos os esquemas de codificação 81. No esquema de codificação de topo, o quadro de codificação básico inteiro é codificado em um pedaço. Porém, nos outros esquemas de codificação, o sinal xlateral é codificado em cada subquadro
Petição 870180028417, de 09/04/2018, pág. 18/39
13/27 separadamente um do outro. O resultado de cada esquema de codificação é provido a um seletor 85. Um meio de medição de fidelidade 83 determina uma medida de fidelidade para cada um dos sinais codificados. A medida de fidelidade é um valor de qualidade objetiva, preferivelmente uma medida de sinal para ruído ou uma relação de sinal para ruído ponderada. As medidas de fidelidade associadas com cada esquema de codificação são comparadas e o resultado controla um meio de comutação 87 para selecionar os parâmetros de codificação representando o sinal lateral do esquema de codificação dando a melhor medida de fidelidade como o sinal de saída piaterai da unidade de codificador de sinal lateral 30.
[0044] Preferivelmente, todas as possíveis combinações de comprimentos de quadro são testadas e o conjunto de subquadros que dá a melhor qualidade objetiva, por exemplo relação de sinal para ruído, é selecionado.
[0045] Na presente concretização, os comprimentos dos subquadros usados são selecionados de acordo com:
onde lSf são os comprimentos dos subquadros, lf é o comprimento do quadro de codificação e n é um inteiro. Na presente concretização, n é selecionado entre 0 e 3. Porém, qualquer comprimento de quadro será possível usar contanto que o comprimento total do conjunto seja mantido constante.
[0046] Na Figura 3c, outra concretização de uma unidade de codificador de sinal lateral 30 de acordo com a presente invenção é ilustrada. Aqui, a decisão de comprimento de quadro é uma decisão de malha aberta, baseada na estatística do sinal. Em outras palavras, as características espectrais do sinal lateral serão usadas como uma base para decidir qual esquema de codificação que está indo ser usado. Como antes, esquemas de codificação diferentes caracterizados por conjuntos diferentes de subquadros estão disponíveis. Porém, nesta concretização, o seletor 85 é colocado antes da codificação atual. O sinal lateral de entrada xiaterai entra no seletor 85 e em uma unidade analisadora de sinal 84. O resultado da análise se torna a entrada de uma chave 86, na qual só um dos esquemas de codificação 81 é
Petição 870180028417, de 09/04/2018, pág. 19/39
14/27 utilizado. A saída desse esquema de codificação também será o sinal de saída piaterai da unidade de codificador de sinal lateral 30.
[0047] A vantagem com uma decisão de malha aberta é que só uma codificação atual tem que ser executada. A desvantagem é, porém, que a análise das características de sinal pode ser realmente muito complicada e pode ser difícil predizer comportamentos possíveis com antecedência para ser capaz de dar uma escolha apropriada na chave 86. Muita análise estatística de som tem que ser executada e incluída na unidade analisadora de sinal 84. Qualquer pequena mudança nos esquemas de codificação pode virar de cabeça para baixo o comportamento estatístico.
[0048] Usando seleção de malha fechada (Figura 3b), os esquemas de codificação podem ser trocados sem fazer qualquer mudança no resto da unidade. Por outro lado, se muitos esquemas de codificação deverem ser investigados, os requisitos computacionais serão altos.
[0049] O benefício com uma tal codificação de comprimento de quadro variável para o sinal lateral é que alguém pode selecionar entre uma resolução temporal fina e resolução de frequência grossa em um lado e resolução temporal grossa e resolução de frequência fina no outro. As concretizações acima preservarão a imagem estéreo da melhor maneira possível.
[0050] Também há alguns requisitos na codificação atual utilizada nos esquemas de codificação diferentes. Em particular, quando a seleção de malha fechada é usada, os recursos computacionais para executar um número de mais ou menos codificações simultâneas têm que ser grandes. Quanto mais complicado o processo de codificação, mais potência computacional é necessária. Além disso, uma baixa taxa de bit em transmissão também é preferida.
[0051] O método apresentado em US 5,434,948 usa uma versão filtrada do sinal mono (principal) para parecer com o sinal lateral ou de diferença. Os parâmetros de filtro são otimizados e permitidos variar em tempo. Os parâmetros de filtro são então transmitidos representando uma codificação do sinal lateral. Em uma concretização, também um sinal lateral residual é transmitido. Em muitos casos, uma tal abordagem
Petição 870180028417, de 09/04/2018, pág. 20/39
15/27 seria possível para usar como método de codificação de sinal lateral dentro da extensão da presente invenção. Esta abordagem tem, porém, algumas desvantagens. A quantização dos coeficientes de filtro e qualquer sinal lateral residual requer frequentemente taxas de bit relativamente altas para transmissão, uma vez que a ordem de filtro tem que ser alta para prover uma estimativa de sinal lateral precisa. A estimação do próprio filtro pode ser problemática, especialmente em casos de música rica em transientes.
[0052] Erros de estimação darão um sinal lateral modificado que às vezes é maior em magnitude do que o sinal inalterado. Isto conduzirá a demandas de taxa de bit mais altas. Além disso, se um novo conjunto de coeficientes de filtro for computado a cada N amostras, os coeficientes de filtro precisam ser interpolados para produzir uma transição suave de um conjunto de coeficientes de filtro para outro, como discutido acima.
[0053] Interpolação de coeficientes de filtro é uma tarefa complexa e erros na interpolação se manifestarão em grandes sinais de erro lateral conduzindo a taxas de bit mais altas necessárias para o codificador de sinal de erro de diferença.
[0054] Um meio para evitar a necessidade por interpolação é atualizar os coeficientes de filtro em uma base de amostra por amostra e confiar em análise retro-adaptável. Para isto funcionar bem, é preciso que a taxa de bit do codificador residual seja bastante alta. Esta não é, portanto, uma boa alternativa para codificação estéreo de baixa taxa de bit.
[0055] Existem casos, por exemplo, bastante comuns com música, onde os sinais mono e de diferença são quase não correlatos. A estimação de filtro então se torna muito problemática com o risco adicionado de apenas piorar as coisas para o codificador de sinal de erro de diferença.
[0056] A solução de acordo com US 5,434,948 pode funcionar muito bem em casos onde os coeficientes de filtro variam muito lentamente em tempo, por exemplo, sistemas de telefonia de conferência. No caso de sinais de música, esta abordagem não funciona muito bem uma vez que os filtros precisam mudar muito rápido para rastrear a imagem estéreo. Isto significa que os comprimentos de
Petição 870180028417, de 09/04/2018, pág. 21/39
16/27 subquadro de magnitude muito diferente tem que ser utilizados, o que significa que o número de combinações para teste aumenta rapidamente. Isto, por sua vez, significa que os requisitos para computar todo os possíveis esquemas de codificação se tornam impraticavelmente altos.
[0057] Portanto, em uma concretização preferida, a codificação do sinal lateral é baseada na idéia de reduzir a redundância entre o sinal mono e lateral usando um simples fator de equilíbrio em vez de um filtro de preceptor consumidor de taxa de bit complexo. O resíduo desta operação é então codificado. A magnitude de um tal resíduo é relativamente pequena e não pede necessidade de taxa de bit muito alta para transferência. Esta idéia é realmente muito adequada para combinar com a abordagem de conjunto de quadro variável descrita anteriormente, uma vez que a complexidade computacional é baixa.
[0058] O uso de um fator de equilíbrio combinado com a abordagem de comprimento de quadro variável remove a necessidade por interpolação complexa e os problemas associados que interpolação pode causar. Além disso, o uso de um simples fator de equilíbrio em vez de um filtro complexo dá menos problemas com estimação como possíveis erros de estimação para o fator de equilíbrio têm menos impacto. A solução preferida será capaz de reproduzir ambos sinais localizados e campos de som difusos com boa qualidade e com requisitos de taxa de bit limitada e recursos computacionais.
[0059] Figura 4 ilustra uma concretização preferida de um codificador estéreo de acordo com a presente invenção. Esta concretização é muito semelhante à mostrada na Figura 2a, porém, com os detalhes da unidade de codificador de sinal lateral 30 revelados. O codificador 14 desta concretização não tem qualquer unidade de pré-processamento, e os sinais de entrada são providos diretamente às unidades de adição e subtração 34, 36. O sinal mono xmono é multiplicado com um certo fator de equilíbrio gsm em um multiplicador 33. Em uma unidade de subtração 35, o sinal mono multiplicado é subtraído do sinal lateral xlateral, isto é, essencialmente a diferença entre os dois canais, para produzir um sinal residual lateral. O fator de equilíbrio gsm é determinado baseado no conteúdo dos sinais mono e lateral pelo
Petição 870180028417, de 09/04/2018, pág. 22/39
17/27 otimizador 37 a fim de minimizar o sinal residual lateral de acordo com um critério de qualidade. O critério de qualidade é preferivelmente um critério de mínimo quadrado médio. O sinal residual lateral é codificado em um codificador residual lateral 39 de acordo com qualquer procedimento de codificador. Preferivelmente, o codificador residual lateral 39 é um codificador de transformada de baixa taxa de bit ou um codificador de CELP (Predição Linear Excitada de Codebook). Os parâmetros de codificação plateral representando o sinal lateral então incluem os parâmetros de codificação plateral residual representando o sinal residual lateral e o fator de equilíbrio otimizado 49.
[0060] Na concretização da Figura 4, o sinal mono 42 usado para sintetizar os sinais laterais é o sinal alvo xmono para o codificador mono 38. Como mencionado acima (com relação à Figura 2a), o sinal de síntese local do codificador mono 38 também pode ser utilizado. No caso anterior, o atraso de codificador total pode ser aumentado e a complexidade computacional para o sinal lateral pode aumentar. Por outro lado, a qualidade pode ser melhor uma vez que é então possível reparar erros de codificação feitos no codificador mono.
[0061] De um modo mais matemático, o esquema de codificação básico pode ser descrito como segue. Denote os dois sinais de canal como a e b, que podem ser o canal esquerdo e direito de um par estéreo. Os sinais de canal são combinados em um sinal mono por adição e a um sinal lateral por uma subtração. Em forma de equação, as operações são descritas como:
xmono (n) = 0,5(a(n) + b (n)) xlateral(n) = 0,5(a(n) - b(n)).
[0062] É benéfico escalonar os sinais xmono e xlateral abaixo por um fator de dois. É aqui subtendido que outros modos de criar os sinais xmono e xlateral existem. Alguém pode, por exemplo, usar:
xmono (n) = ya(n) + (1 - y)b(n) xlateral(n) = ya(n) - (1 - y)b(n) < y < 1,0.
[0063] Em blocos dos sinais de entrada, um sinal modificado ou lateral residual é
Petição 870180028417, de 09/04/2018, pág. 23/39
18/27 computado de acordo com:
Xlateral residual(ri) = Xlateral(n) f(X monoj X|ateral)-X mono (n), onde f (Xmono, xiaterai) é uma função de fator de equilíbrio que baseada no bloco em N amostras, isto é, um subquadro, dos sinais lateral e mono se esforça para remover tanto quanto possível do sinal lateral. Em outras palavras, o fator de equilíbrio é usado para minimizar o sinal lateral residual. No caso especial onde é minimizado em um sentido de quadrado médio, isto é equivalente a minimizar a energia do sinal lateral residual xiaterai residual[0064] No caso especial supracitado, f(xmono, xiaterai) é descrito como:
ΓΤ· τ' fi+ r··!1 n ijtjjtrlrn
Σ·’ onde xiaterai é o sinal lateral e xmono é o sinal mono. Note que a função é baseada em um bloco começando em inicio de quadro e terminando em fim de quadro.
[0065] É possível adicionar ponderação no domínio de frequência à computação do fator de equilíbrio. Isto é feito por convolução dos sinais xiaterai θ Xmono com a resposta de impulso de um filtro de ponderação. É então possível mover o erro de estimação para uma faixa de frequência onde eles são menos fáceis de ouvir. Isto é referido como ponderação perceptiva.
[0066] Uma versão quantizada do valor de fator de equilíbrio dado pela função f(Xmono θ xiaterai) é transmitida ao decodificador. É preferível levar em conta a quantização já quando o sinal lateral modificado é gerado. A expressão abaixo é então alcançada:
Xlateral residual(c) = Xlateral(c) ~ gQXmono (n)
Figure BRPI0419281B1_D0001
Petição 870180028417, de 09/04/2018, pág. 24/39
19/27
Qg (..) é uma função de quantização que é aplicada ao fator de equilíbrio dado pela função f(xmono e xiaterai)· O fator de equilíbrio é transmitido no canal de transmissão. Em sinais localizados esquerdo-direito normais, o fator de equilíbrio é limitado ao intervalo [-1,0 1,0]. Se, por outro lado, os canais estiverem fora de fase com respeito um ao outro, o fator de equilíbrio pode se estender além destes limites. [0067] Como um meio opcional para estabilizar a imagem estéreo, alguém pode limitar o fator de equilíbrio se a correlação cruzada normalizada entre o sinal mono e lateral for pobre como dada pela equação abaixo:
go = Q'6 onde tf
ÜÜL.
JTM-rfm r iiteril
Al· f Flt 1--11 |-| iJT Ί.Τ Γ .1 [0068] Estas situações ocorrem bastante frequentemente com, por exemplo, música clássica ou música de estúdio com uma grande quantidade de sons difusos, onde em alguns casos os canais a e b poderíam quase se cancelar em ocasiões quando um sinal mono é criado. O efeito sobre o fator de equilíbrio é que pode saltar rapidamente, causando uma imagem estéreo confusa. A solução acima alivia este problema.
[0069] A abordagem baseada em filtro em US 5,434,948 tem os problemas semelhantes, mas nesse caso a solução não é tão simples.
[0070] Se Es for a função de codificação (por exemplo, um codificador de transformada) do sinal lateral residual e Em for a função do sinal mono, então os sinais a e b decodificados na ponta de decodificador podem ser descritos como (é assumido aqui que γ= 0,5).
a(n) = (1 - gQ)xmono(n) + xiaterai(n) (o) = (1 - gQ)X mono(n) + X lateral(n)
Petição 870180028417, de 09/04/2018, pág. 25/39
20/27 x lateral — Es (Es(xlateral residual))
X mono — Em (Em(xmono)) [0071] Um benefício importante de computar o fator de equilíbrio para cada quadro é que alguém evita o uso de interpolação. Em vez disso, normalmente, como descrito acima, o processamento de quadro é executado com quadros sobrepostos. [0072] O princípio de codificação usando fatores de equilíbrio que opera particularmente bem no caso de sinais de música, onde mudanças rápidas tipicamente são necessárias para rastrear a imagem estéreo.
[0073] Finalmente, codificação de multicanal se tornou popular. Um exemplo é som circundante de 5 canais em filmes de DVD. Os canais são arranjados lá como: esquerdo dianteiro, central dianteiro, direito dianteiro, esquerdo traseiro, direito traseiro, e alto-falante de sons graves. Na Figura 5, uma concretização de um codificador que codifica os três canais dianteiros em um tal arranjo explorando redundâncias de inter-canal de acordo com a presente invenção é mostrada.
[0074] Três sinais de canal L, C, R são providos em três entradas 16A-C, e o sinal mono xmono é criado por uma soma de todos os três sinais. Uma unidade de codificador de sinal central 130 é adicionada, que recebe o sinal central xcentral. O sinal mono 42 é nesta concretização o sinal mono codificado e decodificado x''mono, e é multiplicado com um certo fator de equilíbrio gQ em um multiplicador 133.
[0075] Em uma unidade de subtração 135, o sinal mono multiplicado é subtraído do sinal central xcentral, para produzir um sinal residual central. O fator de equilíbrio gQ é determinado baseado no conteúdo dos sinais mono e central por um otimizador 137 a fim de minimizar o sinal residual central de acordo com o critério de qualidade. O sinal residual central é codificado em um codificador de residual central 139 de acordo com quaisquer procedimentos de codificador. Preferivelmente, o codificador de residual central 139 é um codificador de transformada de baixa taxa de bit ou um codificador de CELP. Os parâmetros de codificação pcentral representando o sinal central então incluem os parâmetros de codificação pcentral residual representando o sinal residual central e o fator de equilíbrio otimizado 149. O sinal residual central e o sinal mono escalonado são adicionados em uma unidade de adição 235, criando um
Petição 870180028417, de 09/04/2018, pág. 26/39
21/27 sinal central modificado 142 sendo compensado por erros de codificação.
[0076] O sinal lateral xlateral, isto é, a diferença entre os canais esquerdo L e direito R, é provida à unidade de codificador de sinal lateral 30 como em concretizações anteriores. Porém, aqui, o otimizador 37 também depende do sinal central modificado 142 provido pela unidade de codificador de sinal central 130. O sinal residual lateral, portanto, será criado como uma combinação linear ótima do sinal mono 42, do sinal central modificado 142 e do sinal lateral na unidade de subtração. 35.
[0077] O conceito de comprimento de quadro variável descrito acima pode ser aplicado em qualquer dos sinais lateral e central, ou em ambos.
[0078] Figura 6 ilustra uma unidade de decodificador adequada para receber sinais de áudio codificados da unidade de codificador da Figura 5. O sinal recebido 54 é dividido em parâmetros de codificação pmono representando o sinal principal, parâmetros de codificação pcentral representando o sinal central e parâmetros de codificação plateral representando o sinal lateral. No decodificador 64, os parâmetros de codificação pmono representando o sinal principal são usados para gerar um sinal principal x''mono. No decodificador 160, os parâmetros de codificação pcentral representando o sinal central são usados para gerar um sinal central X''central, baseado em sinal principal x''mono. No decodificador 60, os parâmetros de codificação plateral representando o sinal lateral são decodificados, gerando um sinal lateral x''lateral, baseado em sinal principal x''mono e sinal central x''central.
[0079] O procedimento pode ser expresso matematicamente como segue:
[0080] Os sinais de entrada xesquerdo, xdireito e xcentral são combinados a um canal mono de acordo com:
xmono (n) = axesquerdo(n) + f3Xdireito(n) + Xxcentral(n).
α, β e χ estão na seção restante colocados a 1,0 por simplicidade, mas eles podem ser fixados a valores arbitrários. Os valores de α, β e χ podem ser tanto constantes ou dependentes dos conteúdos de sinal a fim de enfatizar um ou dois canais para alcançar uma qualidade ótima.
[0081] A correlação cruzada normalizada entre o sinal mono e o central é
Petição 870180028417, de 09/04/2018, pág. 27/39
22/27 computada como
J?
=£n1 onde
Figure BRPI0419281B1_D0002
JL ft m ijrurtrri i Í/i)a’ , (b) .-n^rn ' c-entco' ?
Η n + 1--11 ·π jTj.rrlm i*tT™ ijrMiirn —
LolQÍ.0 jTM-rfrn “ £ΐίπΐ. JT ?.T .-> Γ |-| |U= I1 F1+ r-T1 n .JT Ί.Τ .-> Γ .1
Xcentrai é o sinal central e xmono é o sinal mono. O sinal mono vem do sinal alvo mono, mas é possível usar a síntese local do codificador mono igualmente. [0082] O sinal residual central a ser codificado é:
Xcentral residual(n) = Xcentral(n) - gQXmono (n) ^4(0
Qg (..) é uma função de quantização que é aplicada ao fator de equilíbrio. O fator de equilíbrio é transmitido no canal de transmissão.
[0083] Se Ec for a função de codificação (por exemplo, um codificador de transformada) do sinal residual central e Em for a função de codificação do sinal mono, então o sinal xcentrai decodificado na ponta de decodificador pode ser escrito como:
X central(n) = gQX mono(n) + X central residual(n)
X central residual = Ec (Ec(Xcentral residual))
X mono = Em (Em(XmOno)) [0084] O sinal residual lateral a ser codificado é:
Xlateral residual(n) = (Xesquerdo(n) - Xdireito(n)) - gQsmX mono (n) gascX central(n), onde gosm, e gasc são valores quantizados dos parâmetros gsm e gsc que minimizam a expressão:
Petição 870180028417, de 09/04/2018, pág. 28/39
23/27
CZ±Q1. iJLLIiÍEl'
Al· ÍD±Q±O .jTTT.^r.n η pode por exemplo ser igual a 2 para uma minimização de quadrado mínimo do erro.
[0085] Os parâmetros gsm θ gsc podem ser quantizados juntamente ou separadamente.
[0086] Se Es for a função de codificação do sinal residual lateral, então os sinais de canal xesquerdo e xdireito decodificados são dados como:
X esquerdo(f0 = X mono (n) X central(fO + X lateral(Ll)
X direito(f0 = X mono(Ll) ~ X central(Ll) ~ X lateral(Ll)
X lateral (n) = X lateral residual + gQsmX mono (θ) + gascX central (θ)
X lateral residual = Es (Es(X|ateral residual))· [0087] Um dos artefatos de percepção que são mais incômodos é o efeito de pré-eco. Na Figura 7a-b, diagramas estão ilustrando um tal artefato. Assuma um componente de sinal tendo o desenvolvimento de tempo como mostrado por curva 100. No começo, partindo de tO, o componente de sinal não está presente na amostra de áudio. Em um tempo t entre t1 e t2, o componente de sinal aparece subitamente. Quando o componente de sinal é codificado, usando um comprimento de quadro de t2-t1, a ocorrência do componente de sinal será borrada sobre o quadro inteiro, como indicado na curva 101. Se uma decodificação acontecer da curva 101, o componente de sinal aparece em tempo At antes do aparecimento pretendido do componente de sinal, e um pré-eco é percebido.
[0088] Os artefatos de pré-eco se tornam mais acentuados se quadros de codificação longos forem usados. Usando quadros mais curtos, o artefato é suprimido um pouco.
[0089] Outro modo de lidar com os problemas de pré-eco descritos acima é utilizar o fato que o sinal mono está disponível em ambas a ponta de codificador e decodificador. Isto torna possível escalonar o sinal lateral de acordo com o contorno de energia do sinal mono. Na ponta de decodificador, o escalonamento inverso é executado e assim alguns dos problemas de pré-eco podem ser aliviados.
Petição 870180028417, de 09/04/2018, pág. 29/39
24/27 [0090] Um contorno de energia do sinal mono é computado através do quadro como:
início de quadro < m < fim de quadro, onde w(n) é uma função de janela. A função de janela mais simples é uma janela retangular, mas outros tipos de janela tal como uma janela de hamming pode ser mais desejável.
[0091] O sinal residual lateral é então escalonado como:
(«)“= litexil
Λ' ífl.
Figure BRPI0419281B1_D0003
início de quadro < n < fim de quadro.
[0092] Em uma forma mais geral, a equação acima pode ser escrita como:
Uteiil j- X xesXAitl |/í J início de quadro < n < fim de quadro, onde f(..) é uma função contínua monotônica. No decodificador, o contorno de energia é computado no sinal mono decodificado e é aplicada ao sinal lateral decodificado como:
xiaterai(n) = xiaterai (n)/f(Ec(n)), início de quadro < n < fim de quadro.
[0093] Como este escalonamento de contorno de energia em algum sentido é alternativo ao uso de comprimentos de quadro mais curtos, este conceito é particularmente bem adequado para ser combinado com o conceito de comprimento de quadro variável, descrito ademais acima. Tendo alguns esquemas de codificação que aplicam escalonamento de contorno de energia, alguns que não aplicam e alguns que aplicam escalonamento de contorno de energia só durante certos subquadros, um conjunto mais flexível de esquemas de codificação pode ser provido. Na Figura 8, uma concretização de uma unidade de codificador de sinal 30 de acordo com a presente invenção é ilustrada. Aqui, os esquemas de codificação
Petição 870180028417, de 09/04/2018, pág. 30/39
25/27 diferentes 81 incluem subquadros hachurados, representando codificação aplicando o escalonamento de contorno de energia, e subquadros não hachurados, representando procedimentos de codificação não aplicando o escalonamento de contorno de energia. Desta maneira, combinações não só de subquadros de comprimentos diferentes, mas subquadros também de princípios de codificação diferentes estão disponíveis. No exemplo explicativo presente, a aplicação de escalonamento de contorno de energia difere entre esquemas de codificação diferentes. Em um caso mais geral, qualquer princípio de codificação pode ser combinado com o conceito de comprimento variável de uma maneira análoga.
[0094] O conjunto de esquemas de codificação da Figura 8 inclui esquemas que operam, por exemplo, artefatos de pré-eco de modos diferentes. Em alguns esquemas, subquadros mais longos com minimização de pré-eco de acordo com o princípio de contorno de energia são usados. Em outros esquemas, subquadros mais curtos sem escalonamento de contorno de energia são utilizados. Dependendo do conteúdo de sinal, uma das alternativas pode ser mais vantajosa. Para casos de pré-eco muito severos, esquemas de codificação utilizando subquadros curtos com escalonamento de contorno de energia podem ser necessários.
[0095] A solução proposta pode ser usada na banda de frequência completa ou em uma ou mais sub-bandas distintas. O uso de sub-banda pode ser aplicado tanto em ambos os sinais principal e lateral, ou em um deles separadamente. Uma concretização preferida inclui uma divisão do sinal lateral em várias bandas de frequência.
[0096] A razão é simplesmente que é mais fácil remover a possível redundância em uma banda de frequência isolada do que na banda de frequência inteira. Isto é particularmente importante ao codificar sinais de música com conteúdo espectral rico.
[0097] Um possível uso é codificar a banda de frequência abaixo de um limiar predeterminado com o método acima. O limiar predeterminado pode ser preferivelmente 2 kHz, ou até mesmo mais preferivelmente 1 kHz. Para a parte restante da faixa de frequência de interesse, alguém pode tanto codificar outra
Petição 870180028417, de 09/04/2018, pág. 31/39
26/27 banda de frequência adicional com o método acima, ou usar um método completamente diferente.
[0098] Uma motivação para usar o método acima preferivelmente para baixas frequências é que os campos de som difusos geralmente têm pouco conteúdo de energia em altas frequências. A razão natural é que absorção de som tipicamente aumenta com frequência. Também, os componentes de campo de som difuso parecem desempenhar um papel menos importante para o sistema audível humano em frequências mais altas.
[0099] Portanto, é benéfico empregar esta solução em baixas frequências (abaixo de 1 ou 2 kHz) e confiar em outros esquemas de codificação até mesmo mais eficientes em bit em frequências mais altas. O fato que o esquema é só aplicado em baixas frequências dá uma grande economia em taxa de bit, como a taxa de bit necessária com o método proposto é proporcional à largura de banda requerida. Na maioria dos casos, o codificador mono pode codificar a banda de frequência inteira, enquanto a codificação de sinal lateral proposta é sugerida para ser executada só na parte inferior da banda de frequência, como ilustrado esquematicamente pela Figura 9. Número de referência 301 se refere a um esquema de codificação de acordo com a presente invenção do sinal lateral, número de referência 302 se refere a qualquer outro esquema de codificação do sinal lateral e número de referência 303 se refere a um esquema de codificação do sinal lateral. [0100] Também existe a possibilidade de usar o método proposto para várias bandas de frequência distintas.
[0101] Na Figura 10, as etapas principais de uma concretização de um método de codificação de acordo com a presente invenção são ilustradas como um fluxograma. O procedimento começa na etapa 200. Na etapa 210, um sinal principal deduzido dos sinais multicanais é codificado. Na etapa 212, esquemas de codificação são providos, que incluem subquadros com comprimentos e/ou ordem diferentes. Um sinal lateral deduzido na etapa 214 dos sinais multicanais é codificado por um esquema de codificação selecionado dependente pelo menos parcialmente do conteúdo de sinal atual dos sinais multicanais presentes. O
Petição 870180028417, de 09/04/2018, pág. 32/39
27/27 procedimento termina na etapa 299.
[0102] Na Figura 11, as etapas principais de uma concretização de um método de decodificação de acordo com a presente invenção são ilustradas como um fluxograma. O procedimento começa na etapa 200. Na etapa 220, um sinal principal codificado recebido é decodificado. Na etapa 222, esquemas de codificação são providos, que incluem subquadros com comprimentos e/ou ordem diferentes. Um sinal lateral recebido é decodificado na etapa 224 por um esquema de codificação selecionado. Na etapa 226, os sinais principal e lateral decodificados são combinados em um sinal multicanal. O procedimento termina na etapa 299.
[0103] As concretizações descritas acima devem ser entendidas como alguns exemplos ilustrativos da presente invenção. Será entendido por aqueles qualificados na técnica que várias modificações, combinações e mudanças podem ser feitas às concretizações sem partir da extensão da presente invenção. Em particular, soluções de parte diferentes nas concretizações diferentes podem ser combinadas em outras configurações, onde tecnicamente possível. A extensão da presente invenção é, porém, definida pelas reivindicações anexas.
REFERÊNCIAS
Patente Europeia 0497413;
Patente US 5,285,498;
Patente US 5,434,948, Binaural cue coding applied to stereo and multichannel audio compression, 112- Convenção de AES, maio de 2002, Munique, Alemanha, por C. Faller et al.
Petição 870180028417, de 09/04/2018, pág. 33/39
1/5

Claims (16)

  1. REIVINDICAÇÕES
    1. Método de codificar sinais multicanais, compreendendo as etapas de: gerar (210) um primeiro sinal de saída (pmono) sendo parâmetros de codificação representando um sinal principal (xmono);
    dito sinal principal (xmono) sendo uma primeira combinação linear de sinais de pelo menos um primeiro e um segundo canal (a, b; L, R); e gerar (214) um segundo sinal de saída (plateral) sendo parâmetros de codificação representando um sinal lateral (xlateral);
    dito sinal lateral (xlateral) sendo uma segunda combinação linear de sinais de pelo menos o primeiro e o segundo canal (a, b; L, R) dentro de um quadro de codificação (80), caracterizado pelo fato de que a etapa de gerar (214) um segundo sinal de saída (plateral) adicionalmente compreende a etapa de:
    escalonar o sinal lateral (xlateral) a um contorno de energia do sinal principal (xmono).
  2. 2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o sinal lateral (xlateral) é escalonado por um fator sendo uma função contínua monotônica do contorno de energia do sinal principal (xmono).
  3. 3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a etapa de gerar um segundo sinal de saída (plateral) compreende a etapa de criar um sinal residual lateral (xlateral residual) baseado em uma diferença equilibrada entre o sinal lateral (xlateral) e o sinal principal (xmono), pelo que o sinal residual (xlateral residual) é escalonado a um contorno de energia do sinal principal (xmono).
  4. 4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que o sinal lateral residual (xlateral residual) é dividido por um fator sendo uma função contínua monotônica do contorno de energia do sinal principal (xmono).
  5. 5. Método de decodificar sinais multicanais, compreendendo as etapas de:
    gerar (220) um sinal principal decodificado (xmono) a partir de parâmetros de codificação (pmono) que representam um sinal principal (xmono);
    Petição 870180028417, de 09/04/2018, pág. 34/39
    2/5 dito sinal principal (xmono) sendo uma primeira combinação linear de sinais de pelo menos um primeiro e um segundo canal (a, b; L, R);
    gerar (224) um sinal lateral decodificado (xlateral) a partir de parâmetros de codificação (plateral) que representam um sinal lateral (xlateral);
    dito sinal lateral (xlateral) sendo uma segunda combinação linear de sinais de pelo menos dito primeiro e dito segundo canal (a, b; L, R); e combinar (226) pelo menos o sinal principal decodificado (xmono) e o sinal lateral decodificado (xlateral) em sinais de pelo menos dito primeiro e dito segundo canal (a, b; L, R);
    caracterizado pela fato de que o dito sinal lateral (xlateral) é escalonado a um contorno de energia do sinal principal (xmono);
    a etapa de gerar (224) um sinal lateral decodificado (xlateral) adicionalmente compreendendo a etapa de:
    escalonar inversamente o sinal lateral decodificado (xlateral) a um contorno de energia do sinal principal decodificado (xmono).
  6. 6. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que o sinal lateral decodificado (xlateral) é escalonado por um fator sendo uma função contínua monotônica do contorno de energia do sinal principal decodificado (xmono).
  7. 7. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que a etapa de gerar (224) um sinal lateral decodificado (xlateral) compreende a etapa de gerar um sinal residual lateral decodificado (xlateral residual) e gerar o sinal lateral decodificado (xlateral) baseado no sinal residual lateral decodificado (xlateral residual), pelo que o sinal residual lateral decodificado (xlateral residual) é escalonado a um contorno de energia do sinal principal decodificado (xmono).
  8. 8. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que o sinal residual lateral decodificado (xlateral residual) é multiplicado por um fator sendo uma função contínua monotônica do contorno de energia do sinal principal decodificado (xmono).
  9. 9. Aparelho codificador (14), compreendendo:
    meio de entrada (16; 16A-C) para sinais multicanais (a, b; L, R, C)
    Petição 870180028417, de 09/04/2018, pág. 35/39
    3/5 compreendendo pelo menos um primeiro e um segundo canal (a, b; L, R), meio (38) para gerar um primeiro sinal de saída (pmono) sendo parâmetros de codificação representando um sinal principal (xmono);
    dito sinal principal (xmono) sendo uma primeira combinação linear de sinais de pelo menos o primeiro e o segundo canal (a, b; L, R);
    meio (30) para gerar um segundo sinal de saída (plateral) sendo parâmetros de codificação representando um sinal lateral (xlateral);
    dito sinal lateral (xlateral) sendo uma segunda combinação linear de sinais de pelo menos o primeiro e o segundo canal (a, b; L, R), dentro de um quadro de codificação (80); e meio de saída (52);
    caracterizado pelo fato de que o meio (30) para gerar um segundo sinal de saída (plateral) adicionalmente compreende:
    um meio para escalonar o sinal lateral (xlateral) a um contorno de energia do sinal principal (xmono).
  10. 10. Aparelho codificador, de acordo com a reivindicação 9, caracterizado pelo fato de que o meio para escalonar o sinal lateral (xlateral) é adaptado para escalonar o sinal lateral (xlateral) por um fator sendo uma função contínua monotônica do contorno de energia do sinal principal (xmono).
  11. 11. Aparelho codificador, de acordo com a reivindicação 9, caracterizado pelo fato de que o meio (30) para gerar um segundo sinal de saída (plateral) adicionalmente compreende um meio para criar um sinal residual lateral (xlateral residual) baseado em uma diferença equilibrada entre o sinal lateral (xlateral) e o sinal principal (xmono), pelo que o meio para escalonar o sinal lateral (xlateral) é adaptado para escalonar o sinal lateral residual (xlateral residual) a um contorno de energia do sinal principal (xmono).
  12. 12. Aparelho codificador, de acordo com a reivindicação 11, caracterizado pelo fato de que o meio para escalonar o sinal lateral (xlateral) é adaptado para dividir o sinal lateral residual (xlateral residual) por um fator sendo uma função contínua monotônica do contorno de energia do sinal principal (xmono).
    Petição 870180028417, de 09/04/2018, pág. 36/39
    4/5
  13. 13. Aparelho decodificador (24), compreendendo:
    meio de entrada (54) para codificar parâmetros (pmono) representando um sinal principal (xmono) e parâmetros de codificação (plateral) representando um sinal lateral(xlateral); dito sinal principal (xmono) sendo uma primeira combinação linear de um primeiro e um segundo canal (a, b; L, R);
    dito sinal lateral (xlateral) sendo uma segunda combinação linear do dito primeiro e do dito segundo canal (a, b; L, R);
    meio (64) para gerar um sinal principal decodificado (xmono) a partir dos parâmetros de codificação (pmono) representando o sinal principal (xmono);
    meio (60) para gerar um sinal lateral decodificado (x''lateral) a partir dos parâmetros de codificação (plateral) representando o sinal lateral (xlateral) dentro de um quadro de codificação (80);
    meio (68, 70) para combinar pelo menos o sinal principal decodificado (x''mono) e o sinal lateral decodificado (x''lateral) em sinais de pelo menos dito primeiro e dito segundo canal (a, b; L, R); e meio de saída (26; 26A-C), caracterizado pelo fato de que o dito sinal lateral (xlateral) é escalonado a um contorno de energia do sinal principal (xmono);
    o meio (60) para gerar um sinal lateral decodificado (x''lateral) por sua vez compreende:
    meio para escalonar inversamente o sinal lateral decodificado (x’’lateral) a um contorno de energia do sinal principal decodificado (x''mono).
  14. 14. Aparelho decodificador, de acordo com a reivindicação 13, caracterizado pelo fato de que o meio para escalonar o sinal lateral decodificado (x''lateral) é adaptado para escalonar o sinal lateral decodificado (x''lateral) por um fator sendo uma função contínua monotônica do contorno de energia do sinal principal (x''mono).
  15. 15. Aparelho decodificador, de acordo com a reivindicação 13, caracterizado pelo fato de que o meio (60) para gerar um sinal lateral decodificado
    Petição 870180028417, de 09/04/2018, pág. 37/39
    5/5 (x''iaterai) adicionalmente compreende meio para gerar um sinal residual lateral decodificado (xateral residual) e para gerar o sinal lateral decodificado (x’’lateral) baseado no sinal lateral residual decodificado (x''lateral residual), pelo que o meio para escalonar o sinal lateral decodificado (x''lateral) é adaptado para escalonar o sinal residual lateral decodificado (x''lateral residual) por um fator sendo uma função contínua monotônica do contorno de energia do sinal principal decodificado (x''mono).
  16. 16. Aparelho decodificador, de acordo com a reivindicação 15, caracterizado pelo fato de que o meio para escalonar o sinal lateral decodificado (x''lateral) é adaptado para multiplicar o sinal lateral residual decodificado (x''lateral residual) por um fator sendo uma função contínua monotônica do contorno de energia do sinal principal decodificado (x''mono).
    Petição 870180028417, de 09/04/2018, pág. 38/39
    1/7
BRPI0419281-8A 2003-12-19 2004-12-15 Métodos de codificar e de decodificar sinais multicanais, e, aparelhos codificador e decodificador BRPI0419281B1 (pt)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
SE0303501-1 2003-12-19
SE0303501A SE0303501D0 (sv) 2003-12-19 2003-12-19 Filter-based parametric multi-channel coding
SE0400417A SE527670C2 (sv) 2003-12-19 2004-02-20 Naturtrogenhetsoptimerad kodning med variabel ramlängd
SE0400417-2 2004-02-20
BRPI0410856A BRPI0410856B8 (pt) 2003-12-19 2004-12-15 métodos de codificar e de decodificar sinais multicanais, aparelho codificador, e, aparelho decodificador
PCT/SE2004/001867 WO2005059899A1 (en) 2003-12-19 2004-12-15 Fidelity-optimised variable frame length encoding

Publications (1)

Publication Number Publication Date
BRPI0419281B1 true BRPI0419281B1 (pt) 2018-08-14

Family

ID=31996354

Family Applications (2)

Application Number Title Priority Date Filing Date
BRPI0419281-8A BRPI0419281B1 (pt) 2003-12-19 2004-12-15 Métodos de codificar e de decodificar sinais multicanais, e, aparelhos codificador e decodificador
BRPI0410856A BRPI0410856B8 (pt) 2003-12-19 2004-12-15 métodos de codificar e de decodificar sinais multicanais, aparelho codificador, e, aparelho decodificador

Family Applications After (1)

Application Number Title Priority Date Filing Date
BRPI0410856A BRPI0410856B8 (pt) 2003-12-19 2004-12-15 métodos de codificar e de decodificar sinais multicanais, aparelho codificador, e, aparelho decodificador

Country Status (15)

Country Link
EP (2) EP1845519B1 (pt)
JP (2) JP4335917B2 (pt)
CN (2) CN101118747B (pt)
AT (2) ATE443317T1 (pt)
AU (1) AU2004298708B2 (pt)
BR (2) BRPI0419281B1 (pt)
CA (2) CA2690885C (pt)
DE (2) DE602004023240D1 (pt)
HK (2) HK1091585A1 (pt)
MX (1) MXPA05012230A (pt)
PL (1) PL1623411T3 (pt)
RU (2) RU2305870C2 (pt)
SE (1) SE527670C2 (pt)
WO (1) WO2005059899A1 (pt)
ZA (1) ZA200508980B (pt)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100981699B1 (ko) * 2002-07-12 2010-09-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
US8214220B2 (en) 2005-05-26 2012-07-03 Lg Electronics Inc. Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal
JP4639966B2 (ja) * 2005-05-31 2011-02-23 ヤマハ株式会社 オーディオデータ圧縮方法およびオーディオデータ圧縮回路並びにオーディオデータ伸張回路
JP2009500657A (ja) 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
WO2007004833A2 (en) 2005-06-30 2007-01-11 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
EP1946294A2 (en) 2005-06-30 2008-07-23 LG Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US7411528B2 (en) * 2005-07-11 2008-08-12 Lg Electronics Co., Ltd. Apparatus and method of processing an audio signal
US7788107B2 (en) 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
KR20080049735A (ko) 2005-08-30 2008-06-04 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
US8577483B2 (en) 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
US7765104B2 (en) 2005-08-30 2010-07-27 Lg Electronics Inc. Slot position coding of residual signals of spatial audio coding application
WO2007040365A1 (en) 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7751485B2 (en) 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7672379B2 (en) 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
KR100857120B1 (ko) 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7646319B2 (en) 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7716043B2 (en) 2005-10-24 2010-05-11 Lg Electronics Inc. Removing time delays in signal paths
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
US7752053B2 (en) 2006-01-13 2010-07-06 Lg Electronics Inc. Audio signal processing using pilot based coding
EP1982328A1 (en) 2006-02-06 2008-10-22 Telefonaktiebolaget LM Ericsson (publ) Variable frame offset coding
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US7889103B2 (en) 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
US8639519B2 (en) 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
EP2124486A1 (de) * 2008-05-13 2009-11-25 Clemens Par Winkelabhängig operierende Vorrichtung oder Methodik zur Gewinnung eines pseudostereophonen Audiosignals
BR122020009732B1 (pt) 2008-05-23 2021-01-19 Koninklijke Philips N.V. Método para a geração de um sinal esquerdo e de um sinal direito a partir de um sinal de downmix mono com base em parâmetros espaciais, meio legível por computador não transitório, aparelho de downmix estéreo paramétrico para a geração de um sinal de downmix mono a partir de um sinal esquerdo e de um sinal direito com base em parâmetros espaciais e método para a geração de um sinal residual de previsão para um sinal de diferença a partir de um sinal esquerdo e de um sinal direito com base em parâmetros espaciais
WO2010016270A1 (ja) * 2008-08-08 2010-02-11 パナソニック株式会社 量子化装置、符号化装置、量子化方法及び符号化方法
RU2481650C2 (ru) * 2008-09-17 2013-05-10 Франс Телеком Ослабление опережающих эхо-сигналов в цифровом звуковом сигнале
JP5309944B2 (ja) 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
US8200496B2 (en) 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8175888B2 (en) 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8219408B2 (en) 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8140342B2 (en) 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
WO2011013381A1 (ja) * 2009-07-31 2011-02-03 パナソニック株式会社 符号化装置および復号装置
WO2011048798A1 (ja) * 2009-10-20 2011-04-28 パナソニック株式会社 符号化装置、復号化装置およびこれらの方法
EP2346028A1 (en) * 2009-12-17 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
CN102770913B (zh) * 2009-12-23 2015-10-07 诺基亚公司 稀疏音频
US8442837B2 (en) 2009-12-31 2013-05-14 Motorola Mobility Llc Embedded speech and audio coding using a switchable model core
US8428936B2 (en) 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
EP2544465A1 (en) 2011-07-05 2013-01-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral weights generator
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
KR102259112B1 (ko) * 2012-11-15 2021-05-31 가부시키가이샤 엔.티.티.도코모 음성 부호화 장치, 음성 부호화 방법, 음성 부호화 프로그램, 음성 복호 장치, 음성 복호 방법 및 음성 복호 프로그램
KR102636396B1 (ko) 2015-09-25 2024-02-15 보이세지 코포레이션 스테레오 사운드 신호를 1차 및 2차 채널로 시간 영역 다운 믹싱하기 위해 좌측 및 우측 채널들간의 장기 상관 차이를 이용하는 방법 및 시스템
CN107742521B (zh) 2016-08-10 2021-08-13 华为技术有限公司 多声道信号的编码方法和编码器
CN109215668B (zh) 2017-06-30 2021-01-05 华为技术有限公司 一种声道间相位差参数的编码方法及装置
CN110728986B (zh) 2018-06-29 2022-10-18 华为技术有限公司 立体声信号的编码方法、解码方法、编码装置和解码装置
CN112233682A (zh) * 2019-06-29 2021-01-15 华为技术有限公司 一种立体声编码方法、立体声解码方法和装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434948A (en) * 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
NL9100173A (nl) * 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
US5694332A (en) * 1994-12-13 1997-12-02 Lsi Logic Corporation MPEG audio decoding system with subframe input buffering
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US5796842A (en) * 1996-06-07 1998-08-18 That Corporation BTSC encoder
US6463410B1 (en) * 1998-10-13 2002-10-08 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
JP3335605B2 (ja) * 2000-03-13 2002-10-21 日本電信電話株式会社 ステレオ信号符号化方法
ATE320651T1 (de) * 2001-05-08 2006-04-15 Koninkl Philips Electronics Nv Kodieren eines audiosignals
JP2003084790A (ja) * 2001-09-17 2003-03-19 Matsushita Electric Ind Co Ltd 台詞成分強調装置
CN1219415C (zh) * 2002-07-23 2005-09-14 华南理工大学 一种5.1通路环绕声的耳机重发的信号处理方法

Also Published As

Publication number Publication date
JP4589366B2 (ja) 2010-12-01
EP1623411B1 (en) 2007-08-29
CN101118747A (zh) 2008-02-06
WO2005059899A1 (en) 2005-06-30
SE527670C2 (sv) 2006-05-09
RU2007121143A (ru) 2008-12-10
EP1845519A2 (en) 2007-10-17
CN101118747B (zh) 2011-02-23
DE602004008613T2 (de) 2008-06-12
JP2008026914A (ja) 2008-02-07
EP1623411A1 (en) 2006-02-08
AU2004298708B2 (en) 2008-01-03
JP2007529021A (ja) 2007-10-18
MXPA05012230A (es) 2006-02-10
AU2004298708A1 (en) 2005-06-30
EP1845519A3 (en) 2007-11-07
DE602004023240D1 (de) 2009-10-29
DE602004008613D1 (de) 2007-10-11
CA2690885A1 (en) 2005-06-30
SE0400417D0 (sv) 2004-02-20
BRPI0410856B1 (pt) 2019-10-01
JP4335917B2 (ja) 2009-09-30
HK1115665A1 (en) 2008-12-05
CA2527971C (en) 2011-03-15
ATE371924T1 (de) 2007-09-15
BRPI0410856B8 (pt) 2019-10-15
RU2005134365A (ru) 2006-05-27
SE0400417L (sv) 2005-06-20
ATE443317T1 (de) 2009-10-15
BRPI0410856A (pt) 2006-07-04
RU2425340C2 (ru) 2011-07-27
PL1623411T3 (pl) 2008-01-31
CA2527971A1 (en) 2005-06-30
CN1816847A (zh) 2006-08-09
EP1845519B1 (en) 2009-09-16
CA2690885C (en) 2014-01-21
RU2305870C2 (ru) 2007-09-10
HK1091585A1 (en) 2007-01-19
CN100559465C (zh) 2009-11-11
ZA200508980B (en) 2007-03-28

Similar Documents

Publication Publication Date Title
BRPI0419281B1 (pt) Métodos de codificar e de decodificar sinais multicanais, e, aparelhos codificador e decodificador
US7809579B2 (en) Fidelity-optimized variable frame length encoding
JP5277508B2 (ja) マルチ・チャンネル音響信号をエンコードするための装置および方法
RU2361288C2 (ru) Устройство и способ для формирования сигнала управления многоканальным синтезатором и устройство и способ многоканального синтеза
US8218775B2 (en) Joint enhancement of multi-channel audio
RU2491657C2 (ru) Способы и устройства для эффективного использования поэтапно передаваемой информации в кодировании и декодировании звука
US9269361B2 (en) Stereo parametric coding/decoding for channels in phase opposition
KR100462615B1 (ko) 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
JP4664431B2 (ja) アンビエンス信号を生成するための装置および方法
PT1603118T (pt) Recetor e método para descodificar o fluxo de bits codificado em estéreo paramétrico
JP2013050540A (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
KR100763919B1 (ko) 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2 채널의 바이노럴 신호로 복호화하는 방법 및 장치
KR20220034102A (ko) 오디오 스트림에 있어서의 메타데이터를 코딩하고 가요성 객체간 및 객체내 비트레이트 적응화를 위한 방법 및 시스템
EP4179530B1 (en) Comfort noise generation for multi-mode spatial audio coding
EP2360684A1 (en) Audio playback device and audio playback method
KR102654181B1 (ko) 예측 코딩에서 저비용 에러 복구를 위한 방법 및 장치
AU2007237227B2 (en) Fidelity-optimised pre-echo suppressing encoding
KR20090066186A (ko) 음원 간 상호상관을 이용한 멀티트랙 다운믹싱 장치 및 그방법

Legal Events

Date Code Title Description
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]
B21F Lapse acc. art. 78, item iv - on non-payment of the annual fees in time

Free format text: EXTINCAO DA PATENTE POR FALTA DE PAGAMENTO DA 18A E 19A RETRIBUICAO ANUAL, POR PAGAMENTO DA RETRIBUICAO ANUAL FORA DO PRAZO OU POR NAO CUMPRIMENTO DE EXIGENCIA DE COMPLEMENTACAO DE PAGAMENTO DA RETRIBUICAO ANUA