BRPI0410856B1 - Métodos de codificar e de decodificar sinais multicanais, aparelho codificador, e, aparelho decodificador - Google Patents

Métodos de codificar e de decodificar sinais multicanais, aparelho codificador, e, aparelho decodificador Download PDF

Info

Publication number
BRPI0410856B1
BRPI0410856B1 BRPI0410856-6A BRPI0410856A BRPI0410856B1 BR PI0410856 B1 BRPI0410856 B1 BR PI0410856B1 BR PI0410856 A BRPI0410856 A BR PI0410856A BR PI0410856 B1 BRPI0410856 B1 BR PI0410856B1
Authority
BR
Brazil
Prior art keywords
signal
coding
subframes
signals
encoding
Prior art date
Application number
BRPI0410856-6A
Other languages
English (en)
Inventor
Stefan Bruhn
Ingemar Johansson
Anisse Taleb
Daniel Enström
Original Assignee
Telefonaktiebolaget Lm Ericsson (Publ)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from SE0303501A external-priority patent/SE0303501D0/xx
Application filed by Telefonaktiebolaget Lm Ericsson (Publ) filed Critical Telefonaktiebolaget Lm Ericsson (Publ)
Priority to BRPI0419281-8A priority Critical patent/BRPI0419281B1/pt
Publication of BRPI0410856A publication Critical patent/BRPI0410856A/pt
Publication of BRPI0410856B1 publication Critical patent/BRPI0410856B1/pt
Publication of BRPI0410856B8 publication Critical patent/BRPI0410856B8/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Endoscopes (AREA)

Abstract

"métodos de codificar e de decodificar sinais polifônicos, aparelho de codificador, e, sistema de áudio". sinais polifônicos são usados para criar um sinal principal, tipicamente um sinal mono, e um sinal lateral (x~ lateral~). vários esquemas de codificação (81) para o sinal lateral (x~ lateral~) são providos. cada esquema de codificação (81) é caracterizado por um conjunto de subquadros (90) de comprimentos diferentes. o comprimento total dos subquadros (90) corresponde ao comprimento do quadro de codificação (80) do esquema de codificação (81). o esquema de codificação (81) a ser usado no sinal lateral (x~ lateral~) é selecionado dependente do conteúdo de sinal presente dos sinais polifônicos. em uma concretização preferida, um sinal residual lateral é criado como a diferença entre o sinal lateral e o sinal principal graduado com um fator de equilíbrio. o fator de equilíbrio é selecionado para minimizar o sinal residual lateral. o sinal residual lateral otimizado e o fator de equilíbrio são codificados e providos como parâmetros de codificação representando o sinal lateral.

Description

MÉTODOS DE CODIFICAR E DE DECODIFICAR SINAIS MULTICANAIS, APARELHO CODIFICADOR, E, APARELHO DECODIFICADOR [0001] A presente invenção relaciona-se em geral a codificação de sinais de áudio, e em particular a codificação de sinais de áudio de multicanais.
FUNDAMENTO [0002] Há uma alta necessidade de mercado para transmitir e armazenar sinais de áudio a baixa taxa de bit enquanto mantendo alta qualidade de áudio. Particularmente, em casos onde recursos de transmissão ou armazenamento são limitados, operação em baixa taxa de bit é um fator de custo essencial. Isto é tipicamente o caso, por exemplo, em aplicações de transmissão em fluxo e de mensagens em sistemas de comunicação móveis, tais como GSM, UMTS ou CDMA.
[0003] Hoje, não há nenhum codec padronizado disponível provendo alta qualidade de áudio estereofônico a taxas de bit que são interessantes economicamente para uso em sistemas de comunicação móveis. O que é possível com codecs disponíveis e a transmissão monofônica dos sinais de áudio. A alguma extensão, também transmissão estereofônica está disponível. Porém, limitações de taxa de bit normalmente requerem limitar a representação estéreo bastante drasticamente.
[0004] O modo mais simples de codificação estereofônica ou multicanal de sinais de áudio é codificar os sinais dos canais diferentes separadamente como sinais individuais e independentes. Outro modo básico usado em transmissão de rádio FM estéreo e que assegura compatibilidade com receptores de rádio mono de legado é transmitir um sinal de soma e diferença dos dois canais envolvidos.
[0005] Codecs de áudio do estado da técnica, tais como MPEG-1/2 Camada III e MPEG-2/4 AAC fazem uso da denominada codificação estéreo conjunta. De acordo com esta técnica, os sinais dos canais diferentes são processados conjuntamente, em lugar de separadamente e individualmente. As duas mais geralmente usadas técnicas de codificação estéreo conjuntas são conhecidas como codificação estéreo de Meio/Lado (M/S) e codificação estéreo de intensidade, que normalmente são
Petição 870190015803, de 15/02/2019, pág. 10/18
2/27 aplicadas em sub-bandas dos sinais estéreo ou multicanais a serem codificados. [0006] Codificação estéreo de M/S é semelhante ao procedimento descrito em rádio FM estéreo, em um sentido que codifica e transmite os sinais de soma e diferença das sub-bandas de canal e por esse meio explora a redundância entre as sub-bandas de canal. A estrutura e a operação de um codificador com base em codificação estérea de M/S são descritas, por exemplo, na Patente US 5,285,498 por J.D. Johnston.
[0007] Estéreo de intensidade, por outro lado, é capaz de fazer uso de irrelevância de estéreo. Ele transmite a intensidade conjunta dos canais (das subbandas diferentes) junto com alguma informação de local indicando como a intensidade está distribuída entre os canais. Estéreo de intensidade só provê informação de magnitude espectral dos canais. Informação de fase não é transportada.
[0008] Por esta razão, e como a informação inter-canal temporal (mais especificamente, a diferença de tempo inter-canal) é de relevância psico-acústica principal, particularmente em frequências mais baixas, estéreo de intensidade só pode ser usado em altas frequências acima de, por exemplo, 2 kHz. Um método de codificação estéreo de intensidade é descrito, por exemplo, na Patente Européia 0497413 por R. Veldhuis et al.
[0009] Um método de codificação estéreo recentemente desenvolvido é descrito, por exemplo, em um documento de conferência com o título Binaural cue coding applied to stereo and multi-channel audio compression, 112ã Convenção de AES, maio de 2002, Munique, Alemanha, por C. Faller et al. Este método é um método de codificação de áudio multicanal paramétrico. O princípio básico é que, no lado de codificação, os sinais de entrada de N canais Ci, c2,..., Cn são combinados a um sinal mono m. O sinal mono é codificado em áudio usando qualquer codec de áudio monofônico convencional. Em paralelo, parâmetros são derivados dos sinais de canal, que descrevem a imagem multicanal. Os parâmetros são codificados e transmitidos ao decodificador, junto com o fluxo de bits de áudio. O decodificador primeiro decodifica o sinal mono rri e então regenera os sinais de canal Ci', c2',---,
Petição 870180028425, de 09/04/2018, pág. 8/41
3/27
Cn', baseado na descrição paramétrica da imagem multicanal.
[0010] O princípio do método de Coding Cue Binaural (BCC) é que ele transmite o sinal mono codificado e denominados parâmetros de BCC. Os parâmetros de BCC incluem diferenças de nível inter-canal codificadas e diferenças de tempo inter-canal para sub-bandas do sinal de entrada multicanal original.
[0011] O decodificador regenera os sinais de canal diferentes aplicando ajustes de nível e fase em sub-banda do sinal mono baseado nos parâmetros de BCC. A vantagem sobre, por exemplo, estéreo de M/S ou de intensidade é que informação estéreo incluindo informação inter-canal temporal é transmitida a taxas de bit muito mais baixas. Porém, esta técnica requer transformadas de tempo-frequência exigentes computacionais em cada um dos canais, ambos no codificador e no decodificador.
[0012] Além disso, BCC não opera o fato que muito da informação estéreo, especialmente em baixas frequências, é difusa, isto é, não vem de qualquer direção específica. Campos de som difusos existem em ambos os canais de uma gravação estéreo, mas eles estão em grande parte fora de fase com respeito entre si. Se um algoritmo tal como BCC for sujeito a gravações com uma grande quantidade de campos de som difusos, a imagem estéreo reproduzida será confusa, saltando da esquerda à direita como o algoritmo de BCC só pode mover o sinal em bandas de frequência específicas à esquerda ou direita.
[0013] Um meio possível para codificar o sinal estéreo e assegurar boa reprodução de campos de som difusos é usar um esquema de codificação muito semelhante à técnica usada em radiodifusão de rádio FM estéreo, isto é, codificar os sinais mono (Esquerdo + Direito) e a diferença (Esquerdo - Direito) separadamente.
[0014] Uma técnica, descrita na Patente US 5,434,948 por C. E. Holt et al., usa uma técnica semelhante como em BCC para codificar o sinal mono e informação lateral. Neste caso, a informação lateral consiste em filtros de preceptor e opcionalmente um sinal residual. Os filtros de preceptor, estimados por um algoritmo de mínimo quadrado médio, quando aplicado ao sinal mono, permitem a predição dos sinais de áudio multicanal. Com esta técnica, alguém é capaz de alcançar
Petição 870180028425, de 09/04/2018, pág. 9/41
4/27 codificação de taxa de bit muito baixa de fontes de áudio multicanal, porém, às custas de uma queda de qualidade, discutida adicionalmente abaixo.
[0015] Finalmente, para conclusão, uma técnica deve ser mencionada que é usada em áudio 3D. Esta técnica sintetiza os sinais de canal direito e esquerdo filtrando sinais de fonte sonora com os denominados filtros relacionados à cabeça. Porém, esta técnica requer os sinais de fonte sonora diferentes serem separados e assim não podem ser aplicados geralmente para codificação estéreo ou multicanal. SUMÁRIO [0016] Um problema com esquemas de codificação existentes baseados em codificação de quadros de sinais, em particular um sinal principal e um ou mais sinais laterais, é que a divisão de informação de áudio em quadros pode introduzir artefatos perceptivos não atraentes. Dividir a informação em quadros de duração relativamente longa geralmente reduz a taxa de bit pedida média. Isto pode ser benéfico, por exemplo, para música contendo uma grande quantidade de som difuso. Porém, para música ou fala rica em transientes, as variações temporais rápidas serão cobertas através da duração de quadro, dando origem a sons como 'fantasma' ou até mesmo problemas de pré-eco. Codificar quadros curtos ao invés dará uma representação mais precisa do som, minimizando a energia, mas requer taxas de bit de transmissão mais altas e recursos computacionais mais altos. A eficiência de codificação como tal também pode diminuir com comprimentos de quadro muito curtos. A introdução de mais limites de quadro também pode introduzir descontinuidades em parâmetros de codificação, que podem aparecer como artefatos perceptivos.
[0017] Um problema adicional com esquemas baseados em codificação de um sinal principal e um ou vários sinais laterais é que eles requerem frequentemente recursos computacionais relativamente grandes. Em particular, quando quadros curtos são usados, operar descontinuidades em parâmetros de um quadro para outro é uma tarefa complexa.
[0018] Quando quadros longos são usados, erros de estimação de som transiente podem causar sinais laterais muito grandes, por sua vez aumentando a
Petição 870180028425, de 09/04/2018, pág. 10/41
5/27 demanda de taxa de transmissão.
[0019] Um objetivo da presente invenção é, portanto, prover um método de codificação e dispositivo melhorando a qualidade de percepção de sinais de áudio multicanais, em particular para evitar artefatos tal como pré-eco, sons como 'fantasma' ou artefatos de descontinuidade de quadro. Um objetivo adicional da presente invenção é prover um método de codificação e dispositivo requerendo menos potência de processamento e tendo requisitos de taxa de bit de transmissão mais constantes.
[0020] Os objetivos acima são alcançados por métodos e dispositivos de acordo com as reivindicações de patente inclusas. Em termos gerais, sinais multicanais são usados para criar um sinal principal, tipicamente um sinal mono, e um sinal lateral. O sinal principal é codificado de acordo com princípios de codificação da técnica anterior. Vários esquemas de codificação para o sinal lateral são providos. Cada esquema de codificação é caracterizado por um conjunto de subquadros de comprimentos diferentes. O comprimento total dos subquadros corresponde ao comprimento do quadro de codificação do esquema de codificação. Os conjuntos de subquadros incluem pelo menos um subquadro. O esquema de codificação a ser usado no sinal lateral é selecionado pelo menos parcialmente dependendo do conteúdo de sinal presente dos sinais multicanais.
[0021] Em uma concretização, a seleção acontece antes da codificação, baseada em análise de características de sinal. Em outra concretização, o sinal lateral é codificado por cada um dos esquemas de codificação, e baseado nas medições da qualidade da codificação, o melhor esquema de codificação é selecionado. Em uma concretização preferida, um sinal residual lateral é criado como a diferença entre o sinal lateral e o sinal principal escalonado com um fator de equilíbrio.
[0022] O fator de equilíbrio é selecionado para minimizar o sinal residual lateral. O sinal residual lateral otimizado e o fator de equilíbrio são codificados e providos como parâmetros representando o sinal lateral. No lado de decodificador, o fator de equilíbrio, o sinal residual lateral e o sinal principal são usados para recuperar o sinal
Petição 870180028425, de 09/04/2018, pág. 11/41
6/27 lateral.
[0023] Em uma concretização preferida adicional, a codificação do sinal lateral inclui um escalonamento de contorno de energia a fim de evitar efeitos de pré-eco. Além disso, esquemas de codificação diferentes podem incluir procedimentos de codificação diferentes nos subquadros separados.
[0024] A vantagem principal com a presente invenção é que a preservação da percepção dos sinais de áudio é melhorada. Além disso, a presente invenção ainda permite transmissão de sinal multicanal a taxas de bit muito baixas.
BREVE DESCRIÇÃO DOS DESENHOS [0025] A invenção, junto com objetivos e vantagens adicionais dela, pode ser entendida melhor fazendo referência à descrição seguinte tomada junto com os desenhos anexos, em que:
Figura 1 é um esquema de blocos de um sistema para transmitir sinais multicanais;
Figura 2a é um diagrama de blocos de um codificador em um transmissor;
Figura 2b é um diagrama de blocos de um decodificador em um receptor;
Figura 3a é um diagrama ilustrando quadros de codificação de comprimentos diferentes;
Figuras 3b e 3c são diagramas de blocos de concretizações de unidades de codificador de sinal lateral de acordo com a presente invenção;
Figura 4 é um diagrama de blocos de uma concretização de um codificador usando codificação de fator de equilíbrio de sinal lateral;
Figura 5 é um diagrama de blocos de uma concretização de um codificador para sistemas de multi-sinal;
Figura 6 é um diagrama de blocos de uma concretização de um decodificador adequado para decodificar sinais do dispositivo da Figura 5;
Figuras 7a e b são diagramas ilustrando um artefato de pré-eco;
Figura 8 é um diagrama de blocos de uma concretização de uma unidade de codificador de sinal lateral de acordo com a presente invenção, empregando
Petição 870180028425, de 09/04/2018, pág. 12/41
7/27 princípios de codificação diferentes em subquadros diferentes;
Figura 9 ilustra o uso de princípios de codificação diferentes em subbandas de frequência diferentes;
Figura 10 é um fluxograma das etapas básicas de uma concretização de um método de codificação de acordo com a presente invenção; e
Figura 11 é um fluxograma das etapas básicas de uma concretização de um método de decodificação de acordo com a presente invenção.
DESCRIÇÃO DETALHADA [0026] Figura 1 ilustra um sistema típico 1, no qual a presente invenção pode ser utilizada vantajosamente. Um transmissor 10 inclui uma antena 12 incluindo hardware e software associados para ser capaz de transmitir sinais de rádio 5 para um receptor 20. O transmissor 10 inclui entre outras partes um codificador multicanal 14, que transforma sinais de vários canais de entrada 16 em sinais de saída adequados para transmissão de rádio. Exemplos de codificadores multicanais 14 adequados são descritos em detalhes adicionalmente abaixo. Os sinais dos canais de entrada 16 podem ser providos, por exemplo, de um armazenamento de sinal de áudio 18, tal como um arquivo de dados de representação digital de gravações de áudio, gravações de áudio de fita magnética ou disco de vinil, etc. Os sinais dos canais de entrada 16 também podem ser providos ao vivo, por exemplo de um conjunto de microfones 19. Os sinais de áudio são digitalizados, se já não em forma digital, antes de entrarem no codificador multicanal 14.
[0027] No lado de receptor 20, uma antena 22 com hardware e software associados opera a recepção atual de sinais de rádio 5 representando sinais de áudio multicanais. Aqui, funcionalidades típicas, tal como, por exemplo, correção de erro, são executadas. Um decodificador 24 decodifica os sinais de rádio 5 recebidos e transforma os dados de áudio levados por esse meio em sinais de vários canais de saída 26. Os sinais de saída podem ser providos, por exemplo, para alto-falantes 29 para apresentação imediata, ou podem ser armazenados em um armazenamento de sinal de áudio 28 de qualquer tipo.
[0028] O sistema 1 pode, por exemplo, ser um sistema de conferência por
Petição 870180028425, de 09/04/2018, pág. 13/41
8/27 telefone, um sistema para prover serviços de áudio ou outras aplicações de áudio. Em alguns sistemas, tal como, por exemplo, o sistema de conferência por telefone, a comunicação tem que ser de um tipo duplex, enquanto por exemplo, distribuição de música de um provedor de serviço para um assinante pode ser essencialmente de um tipo unidirecional. A transmissão de sinais do transmissor 10 para o receptor 20 também pode ser executada por qualquer outro meio, por exemplo, por tipos diferentes de ondas eletromagnéticas, cabos ou fibras como também combinações disso.
[0029] Figura 2a ilustra uma concretização de um codificador de acordo com a presente invenção. Nesta concretização, o sinal multicanal é um sinal estéreo incluindo dois canais a e b, recebidos na entrada 16A e 16B, respectivamente. Os sinais de canal a e b são providos a uma unidade de pré-processamento 32, onde procedimentos de condicionamento de sinal diferentes podem ser executados.
[0030] Os sinais (talvez modificados) da saída da unidade de pré-processamento 32 são somados em uma unidade de adição 34. Esta unidade de adição 34 também divide a soma por um fator de dois. O sinal xmono produzido deste modo é um sinal principal dos sinais estéreos, uma vez que basicamente inclui todos os dados de ambos os canais. Nesta concretização, o sinal principal assim representa um sinal mono puro. O sinal principal xmono é provido a uma unidade de codificador de sinal principal 38, que codifica o sinal principal de acordo com qualquer princípio de codificação adequado. Tais princípios estão disponíveis dentro da técnica anterior e não são assim discutidos adicionalmente aqui. A unidade de codificador de sinal principal 38 dá um sinal de saída pmono, sendo parâmetros de codificação representando um sinal principal.
[0031] Em uma unidade de subtração 36, uma diferença (dividida por um fator de dois) dos sinais de canal é provida como um sinal lateral xiaterai· Nesta concretização, o sinal lateral representa a diferença entre os dois canais no sinal estéreo. O sinal lateral xiaterai é provido a uma unidade de codificação de sinal lateral 30.
[0032] Concretizações preferidas da unidade de codificação de sinal lateral 30 serão discutidas adicionalmente abaixo. De acordo com um procedimento de
Petição 870180028425, de 09/04/2018, pág. 14/41
9/27 codificação de sinal lateral, que será descrito em mais detalhes abaixo, o sinal lateral xiaterai é transferido nos parâmetros de codificação piaterai representando um sinal lateral xiaterai· Em certas concretizações, esta codificação acontece utilizando também informação do sinal principal xmono· A seta 42 indica uma tal provisão, onde o sinal principal não codificado original xmono é utilizado. Em outras concretizações adicionais, a informação de sinal principal que é usada na unidade de codificação de sinal lateral 30 pode ser deduzida dos parâmetros de codificação pmono representando o sinal principal, como indicado pela linha interrompida 44.
[0033] Os parâmetros de codificação pmono representando o sinal principal xmono é um primeiro sinal de saída, e os parâmetros de codificação piaterai representando o sinal lateral xiaterai é um segundo sinal de saída. Em um caso típico, estes dois sinais de saída Pmono, Piaterai, juntos representando o som estéreo completo, são multiplexados em um sinal de transmissão 52 em uma unidade de multiplexador 40. Porém, em outras concretizações, a transmissão do primeiro e segundos sinais de saída Pmono, Piaterai pode acontecer separadamente.
[0034] Na Figura 2b, uma concretização de um decodificador 24 de acordo com a presente invenção é ilustrada como um esquema de blocos. O sinal recebido 54, incluindo parâmetros de codificação representando a informação de sinal principal e lateral são providos a uma unidade de demultiplexador 56, que separa um primeiro e um segundo sinal de entrada, respectivamente. O primeiro sinal de entrada, correspondendo a parâmetros de codificação pmono de um sinal principal, é provido a uma unidade de decodificador de sinal principal 64. De uma maneira convencional, os parâmetros de codificação pmono representando o sinal principal são usados para gerar um sinal principal decodificado xmono, sendo tão semelhante quanto possível ao sinal principal xmono (Figura 2a) do codificador 14 (Figura 2a).
[0035] Semelhantemente, o segundo sinal de entrada, correspondendo a um sinal lateral, é provido a uma unidade de decodificador de sinal lateral 60. Aqui, os parâmetros de codificação piaterai representando o sinal lateral são usados para recuperar um sinal lateral decodificado xiaterai· [0036] Em algumas concretizações, o procedimento de decodificação utiliza
Petição 870180028425, de 09/04/2018, pág. 15/41
10/27 informação sobre o sinal principal xmono, como indicado por seta 65.
[0037] Os sinais principal e lateral decodificados xmono, xiaterai são providos a uma unidade de adição 70, que provê um sinal de saída que é uma representação do sinal original de canal a. Semelhantemente, uma diferença provida por uma unidade de subtração 68 provê um sinal de saída que é uma representação do sinal original de canal b. Estes sinais de canal podem ser pós-processados em uma unidade de pós-processador 74 de acordo com procedimentos de processamento de sinal da técnica anterior. Finalmente, os sinais de canal a e b são providos nas saídas 26A e 26B do decodificador.
[0038] Como mencionado no sumário, codificação é executada tipicamente em um quadro de cada vez. Um quadro inclui amostras de áudio dentro de um período de tempo predefinido. Na parte de fundo da Figura 3a, um quadro SF2 de duração de tempo L é ilustrado. As amostras de áudio dentro da porção não hachurada devem ser codificadas juntas. As amostras precedentes e as amostras subsequentes são codificadas em outros quadros. A divisão das amostras em quadros em qualquer caso introduzirá algumas descontinuidades nas bordas de quadro. Deslocar sons dará parâmetros de codificação inconstantes, mudando basicamente em cada borda de quadro. Isto dará origem a erros perceptíveis. Um modo para compensar um pouco disto é basear a codificação não só nas amostras que devem ser codificadas, mas também em amostras na vizinhança absoluta do quadro, como indicado pelas porções hachuradas. De tal modo, haverá uma transferência mais suave entre os quadros diferentes. Como uma alternativa, ou complemento, técnicas de interpolação às vezes também são utilizadas para reduzir artefatos de percepção causados por bordas de quadro. Porém, todos tais procedimentos requerem grandes recursos computacionais adicionais, e para certas técnicas de codificação específicas, também poderia ser difícil prover com quaisquer recursos.
[0039] Nesta visão, é benéfico utilizar tantos quadros longos quanto possível, uma vez que o número de bordas de quadro será pequeno. Também a eficiência de codificação tipicamente se torna alta e a taxa de bit de transmissão necessária
Petição 870180028425, de 09/04/2018, pág. 16/41
11/27 tipicamente será minimizada. Porém, quadros longos dão problemas com artefatos de pré-eco e sons como 'fantasma'.
[0040] Em vez de utilizar quadros mais curtos, tal como SF1 ou até mesmo SFO, tendo as durações de L/2 e L/4, respectivamente, qualquer um qualificado na técnica percebe que a eficiência de codificação pode ser diminuída, a taxa de bit de transmissão pode ter que ser mais alta e os problemas com artefatos de borda de quadro aumentarão. Porém, quadros mais curtos sofrem menos de, por exemplo, outros artefatos de percepção, tais como sons como 'fantasma' e pré-eco. A fim de ser capaz de minimizar o erro de codificação tanto quanto possível, alguém deveria usar um comprimento de quadro tão curto quanto possível.
[0041] De acordo com a presente invenção, a percepção de áudio será melhorada usando um comprimento de quadro para codificação do sinal lateral que é dependente do conteúdo de sinal presente. Como a influência de comprimentos de quadro diferentes na percepção de áudio diferirá dependendo da natureza do som a ser codificado, uma melhoria pode ser obtida deixando a natureza do próprio sinal afetar o comprimento de quadro que é usado. A codificação do sinal principal não é o objetivo da presente invenção e, portanto, não é descrita em detalhes. Porém, os comprimentos de quadro usados para o sinal principal podem ou não ser iguais aos comprimentos de quadro usados para o sinal lateral.
[0042] Devido a pequenas variações temporais, pode, por exemplo, em alguns casos ser benéfico codificar o sinal lateral com o uso de quadros relativamente longos. Isto pode ser o caso com gravações com uma grande quantidade de campo de som difuso tais como gravações de concerto. Em outros casos, tal como conversação de fala estéreo, quadros curtos são provavelmente para preferir. A decisão sobre qual comprimento de quadro deve-se preferir pode ser executada de dois modos básicos.
[0043] Uma concretização de uma unidade de codificador de sinal lateral 30 de acordo com a presente invenção é ilustrada na Figura 3b, na qual uma decisão de malha fechada é utilizada. Um quadro de codificação básico de comprimento L é usado aqui. Vários esquemas de codificação 81, caracterizados por um conjunto
Petição 870180028425, de 09/04/2018, pág. 17/41
12/27 separado 80 de subquadros 90, são criados. Cada conjunto 80 de subquadros 90 inclui um ou mais subquadros 90 de comprimentos iguais ou diferentes. O comprimento total do conjunto 80 de subquadros 90 é, porém, sempre igual ao comprimento de quadro de codificação básica L. Com referências à Figura 3b, o esquema de codificação de topo é caracterizado por um conjunto de subquadros que inclui só um subquadro de comprimento L. O próximo conjunto de subquadros inclui dois quadros de comprimento L/2. O terceiro conjunto inclui dois quadros de comprimento L/4 seguidos por um quadro de L/2.
[0044] O sinal Xiaterai provido à unidade de codificador de sinal lateral 30 é codificado por todos os esquemas de codificação 81. No esquema de codificação de topo, o quadro de codificação básico inteiro é codificado em um pedaço. Porém, nos outros esquemas de codificação, o sinal xiaterai é codificado em cada subquadro separadamente um do outro. O resultado de cada esquema de codificação é provido a um seletor 85. Um meio de medição de fidelidade 83 determina uma medida de fidelidade para cada um dos sinais codificados. A medida de fidelidade é um valor de qualidade objetiva, preferivelmente uma medida de sinal para ruído ou uma relação de sinal para ruído ponderada. As medidas de fidelidade associadas com cada esquema de codificação são comparadas e o resultado controla um meio de comutação 87 para selecionar os parâmetros de codificação representando o sinal lateral do esquema de codificação dando a melhor medida de fidelidade como o sinal de saída piaterai da unidade de codificador de sinal lateral 30.
[0045] Preferivelmente, todas as possíveis combinações de comprimentos de quadro são testadas e o conjunto de subquadros que dá a melhor qualidade objetiva, por exemplo, relação de sinal para ruído, é selecionado.
[0046] Na presente concretização, os comprimentos dos subquadros usados são selecionados de acordo com:
onde lSf são os comprimentos dos subquadros, lf é o comprimento do quadro de codificação e n é um inteiro. Na presente concretização, n é selecionado
Petição 870180028425, de 09/04/2018, pág. 18/41
13/27 entre 0 e 3. Porém, qualquer comprimento de quadro será possível usar contanto que o comprimento total do conjunto seja mantido constante.
[0047] Na Figura 3c, outra concretização de uma unidade de codificador de sinal lateral 30 de acordo com a presente invenção é ilustrada. Aqui, a decisão de comprimento de quadro é uma decisão de malha aberta, baseada na estatística do sinal. Em outras palavras, as características espectrais do sinal lateral serão usadas como uma base para decidir qual esquema de codificação que está indo ser usado. Como antes, esquemas de codificação diferentes caracterizados por conjuntos diferentes de subquadros estão disponíveis. Porém, nesta concretização, o seletor 85 é colocado antes da codificação atual. O sinal lateral de entrada xiaterai entra no seletor 85 e em uma unidade analisadora de sinal 84. O resultado da análise se torna a entrada de uma chave 86, na qual só um dos esquemas de codificação 81 é utilizado. A saída desse esquema de codificação também será o sinal de saída piaterai da unidade de codificador de sinal lateral 30.
[0048] A vantagem com uma decisão de malha aberta é que só uma codificação atual tem que ser executada. A desvantagem é, porém, que a análise das características de sinal pode ser realmente muito complicada e pode ser difícil predizer comportamentos possíveis com antecedência para ser capaz de dar uma escolha apropriada na chave 86. Muita análise estatística de som tem que ser executada e incluída na unidade analisadora de sinal 84. Qualquer pequena mudança nos esquemas de codificação pode virar de cabeça para baixo o comportamento estatístico.
[0049] Usando seleção de malha fechada (Fig. 3b), os esquemas de codificação podem ser trocados sem fazer qualquer mudança no resto da unidade. Por outro lado, se muitos esquemas de codificação deverem ser investigados, os requisitos computacionais serão altos.
[0050] O benefício com uma tal codificação de comprimento de quadro variável para o sinal lateral é que alguém pode selecionar entre uma resolução temporal fina e resolução de frequência grossa em um lado e resolução temporal grossa e resolução de frequência fina no outro. As concretizações acima preservarão a
Petição 870180028425, de 09/04/2018, pág. 19/41
14/27 imagem estéreo da melhor maneira possível.
[0051] Também há alguns requisitos na codificação atual utilizada nos esquemas de codificação diferentes. Em particular, quando a seleção de malha fechada é usada, os recursos computacionais para executar um número de mais ou menos codificações simultâneas têm que ser grandes. Quanto mais complicado o processo de codificação, mais potência computacional é precisada. Além disso, uma baixa taxa de bit em transmissão também é preferida.
[0052] O método apresentado em US 5,434,948 usa uma versão filtrada do sinal mono (principal) para parecer com o sinal lateral ou de diferença. Os parâmetros de filtro são otimizados e permitidos variar em tempo. Os parâmetros de filtro são então transmitidos representando uma codificação do sinal lateral. Em uma concretização, também um sinal lateral residual é transmitido. Em muitos casos, uma tal abordagem seria possível para usar como método de codificação de sinal lateral dentro da extensão da presente invenção. Esta abordagem tem, porém, algumas desvantagens. A quantização dos coeficientes de filtro e qualquer sinal lateral residual requer frequentemente taxas de bit relativamente altas para transmissão, uma vez que a ordem de filtro tem que ser alta para prover uma estimativa de sinal lateral precisa. A estimação do próprio filtro pode ser problemática, especialmente em casos de música rica em transientes.
[0053] Erros de estimação darão um sinal lateral modificado que, às vezes, é maior em magnitude do que o sinal inalterado. Isto conduzirá a demandas de taxa de bit mais altas. Além disso, se um novo conjunto de coeficientes de filtro for computado a cada N amostras, os coeficientes de filtro precisam ser interpolados para produzir uma transição suave de um conjunto de coeficientes de filtro para outro, como discutido acima.
[0054] Interpolação de coeficientes de filtro é uma tarefa complexa e erros na interpolação se manifestarão em grandes sinais de erro lateral conduzindo a taxas de bit mais altas necessárias para o codificador de sinal de erro de diferença.
[0055] Um meio para evitar a necessidade por interpolação é atualizar os coeficientes de filtro em uma base de amostra por amostra e confiar em análise
Petição 870180028425, de 09/04/2018, pág. 20/41
15/27 retro-adaptável. Para isto funcionar bem, é preciso que a taxa de bit do codificador residual seja bastante alta. Esta não é, portanto, uma boa alternativa para codificação estéreo de baixa taxa de bit.
[0056] Existem casos, por exemplo bastante comuns com música, onde os sinais mono e de diferença são quase não correlatos. A estimação de filtro então se torna muito problemática com o risco adicionado de apenas piorar as coisas para o codificador de sinal de erro de diferença.
[0057] A solução de acordo com US 5,434,948 pode funcionar muito bem em casos onde os coeficientes de filtro variam muito lentamente em tempo, por exemplo, sistemas de telefonia de conferência. No caso de sinais de música, esta abordagem não funciona muito bem uma vez que os filtros precisam mudar muito rápido para rastrear a imagem estéreo. Isto significa que os comprimentos de subquadro de magnitude muito diferente tem que ser utilizados, o que significa que o número de combinações para teste aumenta rapidamente. Isto, por sua vez, significa que os requisitos para computar todo os possíveis esquemas de codificação se tornam impraticavelmente altos.
[0058] Portanto, em uma concretização preferida, a codificação do sinal lateral é baseada na idéia de reduzir a redundância entre o sinal mono e lateral usando um simples fator de equilíbrio em vez de um filtro de preceptor consumidor de taxa de bit complexo. O resíduo desta operação é então codificado. A magnitude de um tal resíduo é relativamente pequena e não requer taxa de bit muito alta necessária para transferência. Esta idéia é realmente muito adequada para combinar com a abordagem de conjunto de quadro variável descrita anteriormente, uma vez que a complexidade computacional é baixa.
[0059] O uso de um fator de equilíbrio combinado com a abordagem de comprimento de quadro variável remove a necessidade por interpolação complexa e os problemas associados que interpolação pode causar. Além disso, o uso de um simples fator de equilíbrio em vez de um filtro complexo dá menos problemas com estimação uma vez que possíveis erros de estimação para o fator de equilíbrio têm menos impacto. A solução preferida será capaz de reproduzir ambos sinais
Petição 870180028425, de 09/04/2018, pág. 21/41
16/27 localizados e campos de som difusos com boa qualidade e com requisitos de taxa de bit limitada e recursos computacionais.
[0060] Figura 4 ilustra uma concretização preferida de um codificador estéreo de acordo com a presente invenção. Esta concretização é muito semelhante à mostrada na Figura 2a, porém, com os detalhes da unidade de codificador de sinal lateral 30 revelados. O codificador 14 desta concretização não tem qualquer unidade de pré-processamento, e os sinais de entrada são providos diretamente às unidades de adição e subtração 34, 36. O sinal mono xmono é multiplicado com um certo fator de equilíbrio gsm em um multiplicador 33. Em uma unidade de subtração 35, o sinal mono multiplicado é subtraído do sinal lateral xiaterai, isto é, essencialmente a diferença entre os dois canais, para produzir um sinal residual lateral. O fator de equilíbrio gsm é determinado baseado no conteúdo dos sinais mono e lateral pelo otimizador 37 a fim de minimizar o sinal residual lateral de acordo com um critério de qualidade. O critério de qualidade é preferivelmente um critério de mínimo quadrado médio. O sinal residual lateral é codificado em um codificador residual lateral 39 de acordo com qualquer procedimento de codificador. Preferivelmente, o codificador residual lateral 39 é um codificador de transformada de baixa taxa de bit ou um codificador de CELP (Predição Linear Excitada de Codebook). Os parâmetros de codificação piaterai representando o sinal lateral então incluem os parâmetros de codificação piaterai residual representando o sinal residual lateral e o fator de equilíbrio otimizado 49.
[0061] Na concretização da Figura 4, o sinal mono 42 usado para sintetizar os sinais laterais é o sinal alvo xmono para o codificador mono 38. Como mencionado acima (com relação à Figura 2a), o sinal de síntese local do codificador mono 38 também pode ser utilizado. No caso anterior, o atraso de codificador total pode ser aumentado e a complexidade computacional para o sinal lateral pode aumentar. Por outro lado, a qualidade pode ser melhor uma vez que é então possível reparar erros de codificação feitos no codificador mono.
[0062] De um modo mais matemático, o esquema de codificação básico pode ser descrito como segue. Denote os dois sinais de canal como a e b, que podem ser
Petição 870180028425, de 09/04/2018, pág. 22/41
17/27 o canal esquerdo e direito de um par estéreo. Os sinais de canal são combinados em um sinal mono por adição e a um sinal lateral por uma subtração. Em forma de equação, as operações são descritas como:
Xmono(n) = 0,5(a(n) + b (n))
Xiaterai(n) = 0,5(a(n) - b(n)).
[0063] É benéfico escalonar os sinais xmono θ xiaterai abaixo por um fator de dois. É aqui subtendido que outros modos de criar os sinais xmono e xiaterai existem. Alguém pode, por exemplo, usar:
Xmono(n) = ya(n) + (1 - y)b(n)
Xiaterai(n) = 7a(n) - (1 - y)b(n) <γ< 1,0.
[0064] Em blocos dos sinais de entrada, um sinal modificado ou lateral residual é computado de acordo com:
Xlateral residual(n) = Xlateral(n) - f(Xmono, Xlateral)-Xmono(n), onde f (Xmono, xiaterai) é uma função de fator de equilíbrio que baseada no bloco em N amostras, isto é, um subquadro, dos sinais lateral e mono se esforça para remover tanto quanto possível do sinal lateral. Em outras palavras, o fator de equilíbrio é usado para minimizar o sinal lateral residual. No caso especial onde é minimizado em um sentido de quadrado médio, isto é equivalente a minimizar a energia do sinal lateral residual xiaterai residual· [0065] No caso especial supracitado, f(xmono, xiaterai) é descrito como:
ΓΤ· i1 n+ 1--11 n ,jtn.rrlrri onde xiaterai é o sinal lateral e xmono é o sinal mono. Note que a função é baseada em um bloco começando em inicio de quadro e terminando em fim de quadro.
Petição 870180028425, de 09/04/2018, pág. 23/41
18/27 [0066] É possível adicionar ponderação no domínio de frequência à computação do fator de equilíbrio. Isto é feito por convolução dos sinais xiaterai θ Xmono com a resposta de impulso de um filtro de ponderação. É então possível mover o erro de estimação para uma faixa de frequência onde eles são menos fáceis de ouvir. Isto é referido como ponderação perceptiva.
[0067] Uma versão quantizada do valor de fator de equilíbrio dado pela função f(Xmono e xiaterai) é transmitida ao decodificador. É preferível levar em conta a quantização já quando o sinal lateral modificado é gerado. A expressão abaixo é então alcançada:
Xlateral residual(n) = Xlateral(n) - gQXmono(n) (/
\ΛΠΙίΤ1 7/
Qg (..) é uma função de quantização que é aplicada ao fator de equilíbrio dado pela função f(x mono θ Xlatera ι). O fator de equilíbrio é transmitido no canal de transmissão. Em sinais localizados esquerdo-direito normais, o fator de equilíbrio é limitado ao intervalo [-1,0 1,0]. Se, por outro lado, os canais estiverem fora de fase com respeito um ao outro, o fator de equilíbrio pode se estender além destes limites. [0068] Como um meio opcional para estabilizar a imagem estéreo, alguém pode limitar o fator de equilíbrio se a correlação cruzada normalizada entre o sinal mono e lateral for pobre como dada pela equação abaixo:
\ V *·λ«ιι z z onde
Ji =—^= kí;
Al· fntrfπ ijrjjrlrn [0069] Estas situações ocorrem bastante frequentemente com, por exemplo, música clássica ou música de estúdio com uma grande quantidade de sons difusos,
Petição 870180028425, de 09/04/2018, pág. 24/41
19/27 onde em alguns casos os canais a e b poderíam quase se cancelar em ocasiões quando um sinal mono é criado. O efeito sobre o fator de equilíbrio é que pode saltar rapidamente, causando uma imagem estéreo confusa. A solução acima alivia este problema.
[0070] A abordagem baseada em filtro em US 5,434,948 tem os problemas semelhantes, mas, nesse caso, a solução não é tão simples.
[0071] Se Es for a função de codificação (por exemplo, um codificador de transformada) do sinal lateral residual e Em for a função do sinal mono, então os sinais a e b decodificados na ponta de decodificador podem ser descritos como (é assumido aqui que γ= 0,5).
a(n) = (1 - gQ)x mono (Π) + Xlateral(n) b(n) = (1 -gQ)x mono (Π) + Xlateral(n)
X lateral = Es (Es(X|ateral residual))
X mono = Em 1(Em(x mono)) [0072] Um benefício importante de computar o fator de equilíbrio para cada quadro é que alguém evita o uso de interpolação. Em vez disso, normalmente, como descrito acima, o processamento de quadro é executado com quadros sobrepostos.
[0073] O princípio de codificação usando fatores de equilíbrio que opera particularmente bem no caso de sinais de música, onde mudanças rápidas tipicamente são precisadas para rastrear a imagem estéreo.
[0074] Finalmente, codificação multicanal se tornou popular. Um exemplo é som circundante de 5 canais em filmes de DVD. Os canais são arranjados lá como: esquerdo dianteiro, central dianteiro, direito dianteiro, esquerdo traseiro, direito traseiro, e alto-falante de sons graves. Na Figura 5, uma concretização de um codificador que codifica os três canais dianteiros em um tal arranjo explorando redundâncias de intercanal de acordo com a presente invenção é mostrada.
[0075] Três sinais de canal L, C, R são providos em três entradas 16A-C, e o sinal mono xmono é criado por uma soma de todos os três sinais. Uma unidade de codificador de sinal central 130 é adicionada, que recebe o sinal central Xcentrai- O sinal mono 42 é nesta concretização o sinal mono codificado e decodificado xmono, e
Petição 870180028425, de 09/04/2018, pág. 25/41
20/27 é multiplicado com um certo fator de equilíbrio go em um multiplicador 133.
[0076] Em uma unidade de subtração 135, o sinal mono multiplicado é subtraído do sinal central xcentrai, para produzir um sinal residual central. O fator de equilíbrio go é determinado baseado no conteúdo dos sinais mono e central por um otimizador 137 a fim de minimizar o sinal residual central de acordo com o critério de qualidade. O sinal residual central é codificado em um codificador de residual central 139 de acordo com quaisquer procedimentos de codificador. Preferivelmente, o codificador de residual central 139 é um codificador de transformada de baixa taxa de bit ou um codificador de CELP. Os parâmetros de codificação pcentrai representando o sinal central então incluem os parâmetros de codificação pcentrai residual representando o sinal residual central e o fator de equilíbrio otimizado 149. O sinal residual central e o sinal mono escalonado são adicionados em uma unidade de adição 235, criando um sinal central modificado 142 sendo compensado por erros de codificação.
[0077] O sinal lateral xiaterai, isto é, a diferença entre os canais esquerdo L e direito R, é provido à unidade de codificador de sinal lateral 30 como em concretizações anteriores. Porém, aqui, o otimizador 37 também depende do sinal central modificado 142 provido pela unidade de codificador de sinal central 130. O sinal residual lateral, portanto, será criado como uma combinação linear ótima do sinal mono 42, do sinal central modificado 142 e do sinal lateral na unidade de subtração 35.
[0078] O conceito de comprimento de quadro variável descrito acima pode ser aplicado em qualquer dos sinais lateral e central, ou em ambos.
[0079] Figura 6 ilustra uma unidade de decodificador adequada para receber sinais de áudio codificados da unidade de codificador da Figura 5. O sinal recebido 54 é dividido em parâmetros de codificação pmono representando o sinal principal, parâmetros de codificação pcentrai representando o sinal central e parâmetros de codificação piaterai representando o sinal lateral. No decodificador 64, os parâmetros de codificação pmono representando o sinal principal são usados para gerar um sinal principal xmono· No decodificador 160, os parâmetros de codificação pcentrai representando o sinal central são usados para gerar um sinal central xcentrai,
Petição 870180028425, de 09/04/2018, pág. 26/41
21/27 baseado em sinal principal xmono· No decodificador 60, os parâmetros de codificação Piaterai representando o sinal lateral são decodificados, gerando um sinal lateral X lateral, baseado em sinal principal X mono e sinal central X central· [0080] O procedimento pode ser expresso matematicamente como segue: [0081] Os sinais de entrada xeSquerdo, Xdireito θ Xcentrai são combinados a um canal mono de acordo com:
Xmono (n) — CtXeSqUerdo(Fl) + PXdireito(Fl) + %Xcentral(n)· α, β e χ estão na seção restante colocados a 1,0 por simplicidade, mas eles podem ser fixados a valores arbitrários. Os valores de α, β e χ podem ser tanto constantes ou dependentes dos conteúdos de sinal a fim de enfatizar um ou dois canais para alcançar uma qualidade ótima.
[0082] A correlação cruzada normalizada entre o sinal mono e o central é
computada como: Λ -
=íni í n D X
onde ei£ni. ipwiirn -
Σ X 6ϊ)χ ,6t) centxc·' '
.JT Ί.Τ .-1 r—
=
“ nu .jtί.τrlrn —
iU= LELtQXo ijTjjTlm
Xcentrai é o sinal central e xmono é o sinal mono. O sinal mono vem do sinal alvo mono, mas é possível usar a síntese local do codificador mono igualmente. [0083] O sinal residual central a ser codificado é:
Xcentral residual(n) = Xcentral(n) - gQXmono(n) (f p 'Λ l·
Qg (..) é uma função de quantização que é aplicada ao fator de equilíbrio.
Petição 870180028425, de 09/04/2018, pág. 27/41
22/27
O fator de equilíbrio é transmitido no canal de transmissão.
[0084] Se Ec for a função de codificação (por exemplo, um codificador de transformada) do sinal residual central e Em for a função de codificação do sinal mono, então o sinal xCentrai decodificado na ponta de decodificador pode ser escrito como:
X central(n) = QqX mono(n) + X central residual(n)
X central residual = Ec (Ec(xcentral residual))
X mono = Em'1(E m(Xmono)) [0085] O sinal residual lateral a ser codificado é:
Xlateral residual(n) = (Xesquerdo(n) Xdireito(n)) QQsmX mono (n) gQscX central(n), onde gosm, e gQSC são valores quantizados dos parâmetros gsm e gsc que minimizam a expressão:
ip~J<rlrn
Al· Xeiíqío η pode por exemplo ser igual a 2 para uma minimização de quadrado mínimo do erro.
[0086] Os parâmetros gsm e gSc podem ser quantizados juntamente ou separadamente.
[0087] Se Es for a função de codificação do sinal residual lateral, então os sinais de canal xeSquerdo θ xdireito decodificados são dados como:
X esquerdo(n) = X mono (n) - X central(n) + X lateral(n)
X direito(n) = X mono(n) - X central(n) - X lateral(n)
X lateral (n) = X lateral residual + QQsrnX mono (n) + gQscX central(n)
X lateral residual = Es (Es(X|atera| residual))· [0088] Um dos artefatos de percepção que são mais incômodos é o efeito de pré-eco. Na Figura 7a-b, diagramas estão ilustrando um tal artefato. Assuma um componente de sinal tendo o desenvolvimento de tempo como mostrado por curva 100. No começo, partindo de tO, o componente de sinal não está presente na amostra de áudio. Em um tempo t entre t1 e t2, o componente de sinal aparece subitamente. Quando o componente de sinal é codificado, usando um comprimento
Petição 870180028425, de 09/04/2018, pág. 28/41
23/27 de quadro de t2-t1, a ocorrência do componente de sinal será borrada sobre o quadro inteiro, como indicado na curva 101. Se uma decodificação acontecer da curva 101, o componente de sinal aparece em tempo At antes do aparecimento pretendido do componente de sinal, e um pré-eco é percebido.
[0089] Os artefatos de pré-eco se tornam mais acentuados se quadros de codificação longos forem usados. Usando quadros mais curtos, o artefato é suprimido um pouco.
[0090] Outro modo de lidar com os problemas de pré-eco descritos acima é utilizar o fato que o sinal mono está disponível em ambas a ponta de codificador e decodificador. Isto torna possível escalonar o sinal lateral de acordo com o contorno de energia do sinal mono. Na ponta de decodificador, o escalonamento inverso é executado e assim alguns dos problemas de pré-eco podem ser aliviados.
[0091] Um contorno de energia do sinal mono é computado através do quadro como:
início de quadro < m < fim de quadro, onde w(n) é uma função de janela. A função de janela mais simples é uma janela retangular, mas outros tipos de janela tal como uma janela de hamming pode ser mais desejável.
[0092] O sinal residual lateral é então escalonado como:
início de quadro < n < fim de quadro.
[0093] Em uma forma mais geral, a equação acima pode ser escrita como:
Zíteril j >>
Zstexü j \ j:«=>íiülZ /
2. ζβ*ϊ.Λ2£2 J = início de quadro < n < fim de quadro, onde f(..) é uma função contínua monotônica. No decodificador, o
Petição 870180028425, de 09/04/2018, pág. 29/41
24/27 contorno de energia é computado no sinal mono decodificado e é aplicado ao sinal lateral decodificado como:
xiaterai(n) = xaterai (n)/f(Ec(n)), início de quadro < n < fim de quadro.
[0094] Como este escalonamento de contorno de energia em algum sentido é alternativo ao uso de comprimentos de quadro mais curtos, este conceito é particularmente bem adequado para ser combinado com o conceito de comprimento de quadro variável, descrito ademais acima. Tendo alguns esquemas de codificação que aplicam escalonamento de contorno de energia, alguns que não aplicam e alguns que aplicam escalonamento de contorno de energia só durante certos subquadros, um conjunto mais flexível de esquemas de codificação pode ser provido. Na Figura 8, uma concretização de uma unidade de codificador de sinal 30 de acordo com a presente invenção é ilustrada. Aqui, os esquemas de codificação diferentes 81 incluem subquadros hachurados 91, representando codificação aplicando o escalonamento de contorno de energia, e subquadros não hachurados 92, representando procedimentos de codificação não aplicando o escalonamento de contorno de energia. Desta maneira, combinações não só de subquadros de comprimentos diferentes, mas subquadros também de princípios de codificação diferentes estão disponíveis. No exemplo explicativo presente, a aplicação de escalonamento de contorno de energia difere entre esquemas de codificação diferentes. Em um caso mais geral, qualquer princípio de codificação pode ser combinado com o conceito de comprimento variável de uma maneira análoga.
[0095] O conjunto de esquemas de codificação da Figura 8 inclui esquemas que operam, por exemplo, artefatos de pré-eco de modos diferentes. Em alguns esquemas, subquadros mais longos com minimização de pré-eco de acordo com o princípio de contorno de energia são usados. Em outros esquemas, subquadros mais curtos sem escalonamento de contorno de energia são utilizados. Dependendo do conteúdo de sinal, uma das alternativas pode ser mais vantajosa. Para casos de pré-eco muito severos, esquemas de codificação utilizando subquadros curtos com escalonamento de contorno de energia podem ser necessários.
[0096] A solução proposta pode ser usada na banda de frequência completa ou
Petição 870180028425, de 09/04/2018, pág. 30/41
25/27 em uma ou mais sub-bandas distintas. O uso de sub-banda pode ser aplicado tanto em ambos os sinais principal e lateral, ou em um deles separadamente. Uma concretização preferida inclui uma divisão do sinal lateral em várias bandas de frequência.
[0097] A razão é simplesmente que é mais fácil remover a possível redundância em uma banda de frequência isolada do que na banda de frequência inteira. Isto é particularmente importante ao codificar sinais de música com conteúdo espectral rico.
[0098] Um possível uso é codificar a banda de frequência abaixo de um limiar predeterminado com o método acima. O limiar predeterminado pode ser preferivelmente 2 kHz, ou até mesmo mais preferivelmente 1 kHz. Para a parte restante da faixa de frequência de interesse, alguém pode tanto codificar outra banda de frequência adicional com o método acima, ou usar um método completamente diferente.
[0099] Uma motivação para usar o método acima preferivelmente para baixas frequências é que os campos de som difusos geralmente têm pouco conteúdo de energia em altas frequências. A razão natural é que absorção de som tipicamente aumenta com frequência. Também, os componentes de campo de som difuso parecem desempenhar um papel menos importante para o sistema audível humano em frequências mais altas.
[0100] Portanto, é benéfico empregar esta solução em baixas frequências (abaixo de 1 ou 2 kHz) e se confiar em outros esquemas de codificação até mesmo mais eficientes em bit em frequências mais altas. O fato que o esquema é só aplicado em baixas frequências dá uma grande economia em taxa de bit, como a taxa de bit necessária com o método proposto é proporcional à largura de banda requerida. Na maioria dos casos, o codificador mono pode codificar a banda de frequência inteira, enquanto a codificação de sinal lateral proposta é sugerida para ser executada só na parte inferior da banda de frequência, como ilustrado esquematicamente pela Figura 9. Número de referência 301 se refere a um esquema de codificação de acordo com a presente invenção do sinal lateral, número
Petição 870180028425, de 09/04/2018, pág. 31/41
26/27 de referência 302 se refere a qualquer outro esquema de codificação do sinal lateral e número de referência 303 se refere a um esquema de codificação do sinal lateral.
[0101] Também existe a possibilidade de usar o método proposto para várias bandas de frequência distintas.
[0102] Na Figura 10, as etapas principais de uma concretização de um método de codificação de acordo com a presente invenção são ilustradas como um fluxograma. O procedimento começa na etapa 200. Na etapa 210, um sinal principal deduzido dos sinais multicanais é codificado. Na etapa 212, esquemas de codificação são providos, que incluem subquadros com comprimentos e/ou ordem diferentes. Um sinal lateral deduzido na etapa 214 dos sinais multicanais é codificado por um esquema de codificação selecionado dependente pelo menos parcialmente do conteúdo de sinal atual dos sinais multicanais presentes. O procedimento termina na etapa 299.
[0103] Na Figura 11, as etapas principais de uma concretização de um método de decodificação de acordo com a presente invenção são ilustradas como um fluxograma. O procedimento começa na etapa 200. Na etapa 220, um sinal principal codificado recebido é decodificado. Na etapa 222, esquemas de codificação são providos, que incluem subquadros com comprimentos e/ou ordem diferentes. Um sinal lateral recebido é decodificado na etapa 224 por um esquema de codificação selecionado. Na etapa 226, os sinais principal e lateral decodificados são combinados em um sinal multicanal. O procedimento termina na etapa 299.
[0104] As concretizações descritas acima devem ser entendidas como alguns exemplos ilustrativos da presente invenção. Será entendido por aqueles qualificados na técnica que várias modificações, combinações e mudanças podem ser feitas às concretizações sem partir da extensão da presente invenção. Em particular, soluções de parte diferentes nas concretizações diferentes podem ser combinadas em outras configurações, onde tecnicamente possível. A extensão da presente invenção é, porém, definida pelas reivindicações anexas.

Claims (19)

  1. REIVINDICAÇÕES
    1. Método de codificar sinais multicanais, compreendendo as etapas de:
    gerar (210) um primeiro sinal de saída (pmono) sendo parâmetros de codificação representando um sinal principal;
    dito sinal principal sendo uma primeira combinação linear de sinais de pelo menos um primeiro e um segundo canal (a, b; L, R); e gerar (214) um segundo sinal de saída (piaterai) sendo parâmetros de codificação representando um sinal lateral;
    dito sinal lateral sendo uma segunda combinação linear de sinais pelo menos do primeiro e do segundo canal (a, b; L, R) dentro de um quadro de codificação (80), caracterizado pelo fato de compreender a etapa adicional de:
    prover (212) pelo menos dois esquemas de codificação (81), cada um dos pelo menos dois esquemas de codificação sendo particularizado por um respectivo conjunto de subquadros (90) juntos constituindo o quadro de codificação (80), pelo que a soma dos comprimentos dos subquadros (90) em cada esquema de codificação (81) é igual ao comprimento do quadro de codificação (80);
    cada conjunto de subquadros (90) compreendendo pelo menos um subquadro (90);
    pelo que a etapa de gerar (214) o segundo sinal de saída (piaterai) compreende a etapa de selecionar um esquema de codificação (81) pelo menos em uma parte dependente do conteúdo de sinal do sinal lateral presente (xiaterai);
    o segundo sinal de saída (piaterai) sendo codificado em cada um dos subquadros (90) do conjunto selecionado de subquadros (90) separadamente.
  2. 2. Método, de acordo com a reivindicação 1, caracterizado pelo fato
    Petição 870190015803, de 15/02/2019, pág. 11/18
    2/7 de que a etapa de gerar (214) o segundo sinal de saída (piaterai) por sua vez compreende as etapas de:
    gerar parâmetros de codificação representando um sinal lateral (xiaterai), sendo uma primeira combinação linear de sinais pelo menos do primeiro e do segundo canal (a, b; L, R), dentro de todos os subquadros (90) de cada um dos pelo menos dois conjuntos de subquadros (90) separadamente;
    calcular uma medida de fidelidade total para cada um dos pelo menos dois esquemas de codificação (81); e selecionar o sinal codificado do esquema de codificação (81) tendo a melhor medida de fidelidade como os parâmetros de codificação (piaterai) representando o sinal lateral.
  3. 3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que a medida de fidelidade é baseada em uma medida de sinal para ruído.
  4. 4. Método, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que os subquadros (90) têm comprimentos lSf de acordo com:
    lsf= lf/2, onde Ifé o comprimento do quadro de codificação (80) e n é um inteiro.
  5. 5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que n é menor do que um valor predeterminado.
  6. 6. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que os pelo menos dois esquemas de codificação (81) incluem todas as permutações de comprimentos de subquadro (90).
  7. 7. Método, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que a etapa de gerar (210) parâmetros de codificação (Pmono) representando o sinal principal por sua vez compreende as etapas de:
    criar um sinal principal (xmono) como uma segunda combinação linear de
    Petição 870190015803, de 15/02/2019, pág. 12/18 w
    sinais pelo menos do primeiro e do segundo canal (a, b; L, R); e codificar o sinal principal em parâmetros de codificação (pmono) representando o sinal principal, a etapa de codificar o sinal lateral por sua vez compreendendo as etapas de:
    criar um sinal residual lateral (xiaterai residual) como uma diferença entre o sinal lateral e o sinal principal (xmono) escalonado por um fator de equilíbrio (gsm);
    o fator de equilíbrio (gSm) sendo determinado como o fator que minimiza o sinal residual lateral de acordo com um critério de qualidade;
    codificar o sinal residual lateral e o fator de equilíbrio (gsm) nos parâmetros de codificação (piaterai) representando o sinal lateral.
  8. 8. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que o critério de qualidade é baseado em uma medida de mínimo quadrado médio.
  9. 9. Método, de acordo com qualquer uma das reivindicações 1 a 8, caracterizado pelo fato de que os pelo menos dois esquemas de codificação (81) incluem princípios de codificação diferentes do sinal lateral (xiaterai).
  10. 10. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que pelo menos um primeiro esquema de codificação dos pelo menos dois esquemas de codificação (81) compreende um primeiro princípio de codificação para o sinal lateral (xiaterai) para todos os subquadros (90) e pelo menos um segundo esquema de codificação dos pelo menos dois esquemas de codificação (81) compreende um segundo princípio de codificação para o sinal lateral (xiaterai) para todos os subquadros (90).
  11. 11. Método, de acordo com a reivindicação 9 ou 10, caracterizado pelo fato de que pelo menos um esquema de codificação dos pelo menos dois esquemas de codificação (81) compreende o primeiro princípio de codificação
    Petição 870190015803, de 15/02/2019, pág. 13/18
    4/7 para o sinal lateral (xiaterai) para um subquadro e o segundo princípio de codificação para o sinal lateral (xiaterai) para outro subquadro.
  12. 12. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a etapa de gerar (214) o segundo sinal de saída (piaterai) por sua vez compreende as etapas de:
    analisar características espectrais de um sinal lateral (xiaterai), sendo uma primeira combinação linear de sinais pelo menos do primeiro e do segundo canal (a, b; L, R);
    selecionar um conjunto de subquadros (90) com base nas características espectrais analisadas; e codificar o sinal lateral (xiaterai) dentro de todos os subquadros (90) do conjunto selecionado de subquadros (90) separadamente.
  13. 13. Método, de acordo com qualquer uma das reivindicações 1 a 12, caracterizado pelo fato de que a etapa de gerar (214) um segundo sinal de saída (piaterai) θ aplicada em uma banda de frequência limitada.
  14. 14. Método, de acordo com a reivindicação 13, caracterizado pelo fato de que a etapa de gerar (214) um segundo sinal de saída (piaterai) é aplicada só para frequências abaixo de 2 kHz.
  15. 15. Método, de acordo com a reivindicação 14, caracterizado pelo fato de que a etapa de gerar (214) um segundo sinal de saída (piaterai) é aplicada só para frequências abaixo de 1 kHz.
  16. 16. Método, de acordo com qualquer uma das reivindicações 1 a 15, caracterizado pelo fato de que os sinais multicanais representam sinais de música.
  17. 17. Método de decodificar sinais multicanais, compreendendo as etapas de:
    decodificar (220) parâmetros de codificação (pmono) representando um sinal
    Petição 870190015803, de 15/02/2019, pág. 14/18
    5/7 principal em um sinal principal decodificado;
    dito sinal principal sendo uma primeira combinação linear de sinais de pelo menos um primeiro e um segundo canal (a, b; L, R);
    decodificar (224) parâmetros de codificação (piaterai) representando um sinal lateral em um sinal lateral decodificado;
    dito sinal lateral sendo uma segunda combinação linear de sinais de pelo menos dito primeiro e dito segundo canal (a, b; L, R), dentro de um quadro de codificação (80); e combinar (226) pelo menos o sinal principal decodificado (xmono) e o sinal lateral decodificado (xiaterai) em sinais de pelo menos dito primeiro e dito segundo canal (a, b; L, R), caracterizado pelo fato de compreender adicionalmente a etapa de:
    prover (222) pelo menos dois esquemas de codificação (81), cada um dos pelo menos dois esquemas de codificação (81) sendo particularizado por um conjunto de subquadros (90) juntos constituindo o quadro de codificação (80), pelo que a soma dos comprimentos dos subquadros (90) em cada esquema de codificação (81) é igual ao comprimento do quadro de codificação (80);
    cada conjunto de subquadros (90) compreendendo pelo menos um subquadro (90), pelo que a etapa de decodificar (224) os parâmetros de codificação (piaterai) representando o sinal lateral por sua vez compreende a etapa de decodificar os parâmetros de codificação (piaterai) representando o sinal lateral separadamente nos subquadros (90) de um dos pelo menos dois esquemas de codificação (81).
  18. 18. Aparelho codificador (14), compreendendo:
    meio de entrada (16; 16A-C) para sinais multicanais (a, b; L, R, C) compreendendo pelo menos um primeiro e um segundo canal (a, b; L, R);
    meio (38) para gerar um primeiro sinal de saída (pmono) sendo parâmetros
    Petição 870190015803, de 15/02/2019, pág. 15/18 de codificação representando um sinal principal;
    dito sinal principal (xmono) sendo uma primeira combinação linear de sinais pelo menos do primeiro e do segundo canal (a, b; L, R);
    meio (30) para gerar um segundo sinal de saída (piaterai) sendo parâmetros de codificação representando um sinal lateral;
    dito sinal lateral sendo uma segunda combinação linear de sinais pelo menos do primeiro e do segundo canal (a, b; L, R), dentro de um quadro de codificação (80); e meio de saída (52);
    caracterizado pelo fato de compreender:
    meio para prover pelo menos dois esquemas de codificação (81), cada um dos pelo menos dois esquemas de codificação (81) sendo particularizado por um respectivo conjunto de subquadros (90) juntos constituindo o quadro de codificação (80), pelo que a soma dos comprimentos dos subquadros (90) em cada esquema de codificação (81) é igual ao comprimento do quadro de codificação (80);
    cada conjunto de subquadros (90) compreendendo pelo menos um subquadro (90);
    pelo que o meio (30) para gerar o segundo sinal de saída (piaterai) por sua vez compreende meio (86; 87) para selecionar um esquema de codificação pelo menos em uma parte dependente do conteúdo de sinal do sinal lateral presente (Xlateral);
    meio para codificar o sinal lateral (xiaterai) em cada um dos subquadros (90) do esquema codificado selecionado separadamente.
  19. 19. Aparelho decodificador (24), compreendendo:
    meio de entrada (54) para codificar parâmetros (pmono) representando um sinal principal e parâmetros de codificação (piaterai) representando um sinal
    Petição 870190015803, de 15/02/2019, pág. 16/18
    7/7 lateral;
    dito sinal principal sendo uma primeira combinação linear de um primeiro e de um segundo canal (a, b; L, R);
    dito sinal lateral sendo uma segunda combinação linear do dito primeiro e do dito segundo canal (a, b; L, R);
    meio (64) para decodificar os parâmetros de codificação (pmono) representando o sinal principal em um sinal principal decodificado;
    meio (60) para decodificar os parâmetros de codificação (piaterai) representando o sinal lateral dentro de um quadro de codificação (80) em um sinal lateral decodificado;
    meio (68, 70) para combinar pelo menos o sinal principal decodificado (xmono) e o sinal lateral decodificado (xiaterai) em sinais de pelo menos dito primeiro e dito segundo canal (a, b; L, R); e meio de saída (26; 26A-C), caracterizado pelo fato de que o meio (60) para decodificar os parâmetros de codificação (piaterai) representando o sinal lateral por sua vez compreende:
    meio para prover pelo menos dois esquemas de codificação (81), cada um dos pelo menos dois esquemas de codificação (81) sendo particularizado por um respectivo conjunto de subquadros (90) juntos constituindo o quadro de codificação (80), pelo que a soma dos comprimentos dos subquadros (90) em cada esquema de codificação é igual ao comprimento do quadro de codificação (80);
    cada conjunto de subquadros (90) compreendendo pelo menos um subquadro (90); e meio para decodificar os parâmetros de codificação (piaterai) representando o sinal lateral separadamente nos subquadros (90) de um dos pelo menos dois esquemas de codificação (81).
BRPI0410856A 2003-12-19 2004-12-15 métodos de codificar e de decodificar sinais multicanais, aparelho codificador, e, aparelho decodificador BRPI0410856B8 (pt)

Priority Applications (1)

Application Number Priority Date Filing Date Title
BRPI0419281-8A BRPI0419281B1 (pt) 2003-12-19 2004-12-15 Métodos de codificar e de decodificar sinais multicanais, e, aparelhos codificador e decodificador

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
SE0303501A SE0303501D0 (sv) 2003-12-19 2003-12-19 Filter-based parametric multi-channel coding
SE0303501-1 2003-12-19
SE0400417-2 2004-02-20
SE0400417A SE527670C2 (sv) 2003-12-19 2004-02-20 Naturtrogenhetsoptimerad kodning med variabel ramlängd
PCT/SE2004/001867 WO2005059899A1 (en) 2003-12-19 2004-12-15 Fidelity-optimised variable frame length encoding

Publications (3)

Publication Number Publication Date
BRPI0410856A BRPI0410856A (pt) 2006-07-04
BRPI0410856B1 true BRPI0410856B1 (pt) 2019-10-01
BRPI0410856B8 BRPI0410856B8 (pt) 2019-10-15

Family

ID=31996354

Family Applications (2)

Application Number Title Priority Date Filing Date
BRPI0419281-8A BRPI0419281B1 (pt) 2003-12-19 2004-12-15 Métodos de codificar e de decodificar sinais multicanais, e, aparelhos codificador e decodificador
BRPI0410856A BRPI0410856B8 (pt) 2003-12-19 2004-12-15 métodos de codificar e de decodificar sinais multicanais, aparelho codificador, e, aparelho decodificador

Family Applications Before (1)

Application Number Title Priority Date Filing Date
BRPI0419281-8A BRPI0419281B1 (pt) 2003-12-19 2004-12-15 Métodos de codificar e de decodificar sinais multicanais, e, aparelhos codificador e decodificador

Country Status (15)

Country Link
EP (2) EP1845519B1 (pt)
JP (2) JP4335917B2 (pt)
CN (2) CN100559465C (pt)
AT (2) ATE443317T1 (pt)
AU (1) AU2004298708B2 (pt)
BR (2) BRPI0419281B1 (pt)
CA (2) CA2527971C (pt)
DE (2) DE602004023240D1 (pt)
HK (2) HK1091585A1 (pt)
MX (1) MXPA05012230A (pt)
PL (1) PL1623411T3 (pt)
RU (2) RU2305870C2 (pt)
SE (1) SE527670C2 (pt)
WO (1) WO2005059899A1 (pt)
ZA (1) ZA200508980B (pt)

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0305434B1 (pt) * 2002-07-12 2017-06-27 Koninklijke Philips Electronics N.V. Methods and arrangements for encoding and decoding a multichannel audio signal, and multichannel audio coded signal
US8214220B2 (en) 2005-05-26 2012-07-03 Lg Electronics Inc. Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal
JP4639966B2 (ja) * 2005-05-31 2011-02-23 ヤマハ株式会社 オーディオデータ圧縮方法およびオーディオデータ圧縮回路並びにオーディオデータ伸張回路
US8494667B2 (en) 2005-06-30 2013-07-23 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
AU2006266655B2 (en) 2005-06-30 2009-08-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
EP1913578B1 (en) 2005-06-30 2012-08-01 LG Electronics Inc. Method and apparatus for decoding an audio signal
US8032368B2 (en) 2005-07-11 2011-10-04 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signals using hierarchical block swithcing and linear prediction coding
US7788107B2 (en) 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
EP1938311B1 (en) 2005-08-30 2018-05-02 LG Electronics Inc. Apparatus for decoding audio signals and method thereof
US7987097B2 (en) 2005-08-30 2011-07-26 Lg Electronics Method for decoding an audio signal
US8577483B2 (en) 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
WO2007040353A1 (en) 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing
KR100857115B1 (ko) 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7751485B2 (en) 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7672379B2 (en) 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US7646319B2 (en) 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7742913B2 (en) 2005-10-24 2010-06-22 Lg Electronics Inc. Removing time delays in signal paths
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
US7752053B2 (en) 2006-01-13 2010-07-06 Lg Electronics Inc. Audio signal processing using pilot based coding
WO2007091927A1 (en) * 2006-02-06 2007-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Variable frame offset coding
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US7889103B2 (en) 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
US8639519B2 (en) 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
EP2124486A1 (de) * 2008-05-13 2009-11-25 Clemens Par Winkelabhängig operierende Vorrichtung oder Methodik zur Gewinnung eines pseudostereophonen Audiosignals
KR101629862B1 (ko) * 2008-05-23 2016-06-24 코닌클리케 필립스 엔.브이. 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더
JPWO2010016270A1 (ja) * 2008-08-08 2012-01-19 パナソニック株式会社 量子化装置、符号化装置、量子化方法及び符号化方法
CN102160114B (zh) * 2008-09-17 2012-08-29 法国电信公司 用于对数字音频信号中的前回声进行衰减的方法和装置
JP5309944B2 (ja) 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
US8200496B2 (en) 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8175888B2 (en) 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8219408B2 (en) 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8140342B2 (en) 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
EP2461321B1 (en) * 2009-07-31 2018-05-16 Panasonic Intellectual Property Management Co., Ltd. Coding device and decoding device
US8977546B2 (en) * 2009-10-20 2015-03-10 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device and method for both
EP2346028A1 (en) * 2009-12-17 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
CN102770913B (zh) * 2009-12-23 2015-10-07 诺基亚公司 稀疏音频
US8442837B2 (en) 2009-12-31 2013-05-14 Motorola Mobility Llc Embedded speech and audio coding using a switchable model core
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
EP2544465A1 (en) * 2011-07-05 2013-01-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral weights generator
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
PL2922053T3 (pl) * 2012-11-15 2019-11-29 Ntt Docomo Inc Urządzenie do kodowania audio, sposób kodowania audio, program do kodowania audio, urządzenie do dekodowania audio, sposób dekodowania audio, i program do dekodowania audio
US10060955B2 (en) * 2014-06-25 2018-08-28 Advanced Micro Devices, Inc. Calibrating power supply voltages using reference measurements from code loop executions
ES2955962T3 (es) 2015-09-25 2023-12-11 Voiceage Corp Método y sistema que utiliza una diferencia de correlación a largo plazo entre los canales izquierdo y derecho para mezcla descendente en el dominio del tiempo de una señal de sonido estéreo en canales primarios y secundarios
CN107742521B (zh) 2016-08-10 2021-08-13 华为技术有限公司 多声道信号的编码方法和编码器
CN109215668B (zh) * 2017-06-30 2021-01-05 华为技术有限公司 一种声道间相位差参数的编码方法及装置
CN115831130A (zh) * 2018-06-29 2023-03-21 华为技术有限公司 立体声信号的编码方法、解码方法、编码装置和解码装置
CN112233682B (zh) * 2019-06-29 2024-07-16 华为技术有限公司 一种立体声编码方法、立体声解码方法和装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434948A (en) * 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
NL9100173A (nl) * 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
US5694332A (en) * 1994-12-13 1997-12-02 Lsi Logic Corporation MPEG audio decoding system with subframe input buffering
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US5796842A (en) * 1996-06-07 1998-08-18 That Corporation BTSC encoder
US6463410B1 (en) * 1998-10-13 2002-10-08 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
JP3335605B2 (ja) * 2000-03-13 2002-10-21 日本電信電話株式会社 ステレオ信号符号化方法
WO2002091363A1 (en) * 2001-05-08 2002-11-14 Koninklijke Philips Electronics N.V. Audio coding
JP2003084790A (ja) * 2001-09-17 2003-03-19 Matsushita Electric Ind Co Ltd 台詞成分強調装置
CN1219415C (zh) * 2002-07-23 2005-09-14 华南理工大学 一种5.1通路环绕声的耳机重发的信号处理方法

Also Published As

Publication number Publication date
AU2004298708B2 (en) 2008-01-03
CN1816847A (zh) 2006-08-09
JP2007529021A (ja) 2007-10-18
EP1845519A3 (en) 2007-11-07
CA2690885C (en) 2014-01-21
RU2005134365A (ru) 2006-05-27
CN101118747B (zh) 2011-02-23
DE602004023240D1 (de) 2009-10-29
BRPI0410856B8 (pt) 2019-10-15
EP1623411A1 (en) 2006-02-08
CA2527971A1 (en) 2005-06-30
SE0400417L (sv) 2005-06-20
JP2008026914A (ja) 2008-02-07
EP1623411B1 (en) 2007-08-29
EP1845519B1 (en) 2009-09-16
PL1623411T3 (pl) 2008-01-31
ATE443317T1 (de) 2009-10-15
HK1115665A1 (en) 2008-12-05
ZA200508980B (en) 2007-03-28
RU2305870C2 (ru) 2007-09-10
SE0400417D0 (sv) 2004-02-20
CN100559465C (zh) 2009-11-11
BRPI0410856A (pt) 2006-07-04
EP1845519A2 (en) 2007-10-17
DE602004008613D1 (de) 2007-10-11
JP4335917B2 (ja) 2009-09-30
SE527670C2 (sv) 2006-05-09
CA2527971C (en) 2011-03-15
BRPI0419281B1 (pt) 2018-08-14
ATE371924T1 (de) 2007-09-15
HK1091585A1 (en) 2007-01-19
DE602004008613T2 (de) 2008-06-12
JP4589366B2 (ja) 2010-12-01
CN101118747A (zh) 2008-02-06
CA2690885A1 (en) 2005-06-30
AU2004298708A1 (en) 2005-06-30
RU2425340C2 (ru) 2011-07-27
RU2007121143A (ru) 2008-12-10
WO2005059899A1 (en) 2005-06-30
MXPA05012230A (es) 2006-02-10

Similar Documents

Publication Publication Date Title
BRPI0410856B1 (pt) Métodos de codificar e de decodificar sinais multicanais, aparelho codificador, e, aparelho decodificador
US7809579B2 (en) Fidelity-optimized variable frame length encoding
JP5277508B2 (ja) マルチ・チャンネル音響信号をエンコードするための装置および方法
JP5171269B2 (ja) マルチチャネルオーディオ符号化における忠実度の最適化及び信号伝送量の低減
JP5455647B2 (ja) オーディオデコーダ
US9269361B2 (en) Stereo parametric coding/decoding for channels in phase opposition
PT1603118T (pt) Recetor e método para descodificar o fluxo de bits codificado em estéreo paramétrico
KR20100086000A (ko) 오디오 신호 처리 방법 및 장치
JP2010204533A (ja) オーディオ復号装置及びオーディオ復号方法
KR20220034102A (ko) 오디오 스트림에 있어서의 메타데이터를 코딩하고 가요성 객체간 및 객체내 비트레이트 적응화를 위한 방법 및 시스템
US20100121633A1 (en) Stereo audio encoding device and stereo audio encoding method
JPWO2008090970A1 (ja) ステレオ符号化装置、ステレオ復号装置、およびこれらの方法
KR102654181B1 (ko) 예측 코딩에서 저비용 에러 복구를 위한 방법 및 장치
AU2007237227B2 (en) Fidelity-optimised pre-echo suppressing encoding

Legal Events

Date Code Title Description
B15K Others concerning applications: alteration of classification

Ipc: G10L 19/008 (2013.01), G10L 19/18 (2013.01)

B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09B Patent application refused [chapter 9.2 patent gazette]
B12B Appeal against refusal [chapter 12.2 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 01/10/2019, OBSERVADAS AS CONDICOES LEGAIS. (CO) 10 (DEZ) ANOS CONTADOS A PARTIR DE 01/10/2019, OBSERVADAS AS CONDICOES LEGAIS

B16C Correction of notification of the grant [chapter 16.3 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 01/10/2019, OBSERVADAS AS CONDICOES LEGAIS. (CO) REFERENTE A RPI 2543 DE 01/10/2019,QUANTO AO ITEM (73) QUALIFICACAO DO DEPOSITANTE.