BRPI0508343B1 - método para decodificar m canais de áudio codificados representando n canais de áudio e método para codificar n canais de áudio de entrada em m canais de áudio codificados. - Google Patents

método para decodificar m canais de áudio codificados representando n canais de áudio e método para codificar n canais de áudio de entrada em m canais de áudio codificados. Download PDF

Info

Publication number
BRPI0508343B1
BRPI0508343B1 BRPI0508343A BRPI0508343A BRPI0508343B1 BR PI0508343 B1 BRPI0508343 B1 BR PI0508343B1 BR PI0508343 A BRPI0508343 A BR PI0508343A BR PI0508343 A BRPI0508343 A BR PI0508343A BR PI0508343 B1 BRPI0508343 B1 BR PI0508343B1
Authority
BR
Brazil
Prior art keywords
channel
audio
audio channels
angle
signal
Prior art date
Application number
BRPI0508343A
Other languages
English (en)
Inventor
Franklin Davis Mark
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of BRPI0508343A publication Critical patent/BRPI0508343A/pt
Publication of BRPI0508343B1 publication Critical patent/BRPI0508343B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 

Abstract

codificação de áudio de múltiplos canais. a presente invenção refere-se a múltiplos canais de áudio que são combinados ou em um sinal composto monofônico ou em múltiplos canais de áudio juntamente com as informações auxiliares relativas das quais os múltiplos canais de áudio são reconstruídos, incluindo uma mistura de redução de múltiplos canais de áudio para um sinal de áudio monofônico ou para múltiplos canais de áudio e uma decorrelação aperfeiçoada de múltiplos canais de áudio derivados de um canal de áudio monofônico ou de múltiplos canais de áudio. aspectos da invenção descrita são utilizáveis em codificadores de áudio, decodificadores, sistemas de codificação/decodificação, misturadores de redução, misturadores de expansão, e decorrelatores.

Description

(54) Título: MÉTODO PARA DECODIFICAR M CANAIS DE ÁUDIO CODIFICADOS REPRESENTANDO N CANAIS DE ÁUDIO E MÉTODO PARA CODIFICAR N CANAIS DE ÁUDIO DE ENTRADA EM M CANAIS DE ÁUDIO CODIFICADOS.
(51) IntCI.: G10L 19/008; G10L 19/02; G10L 19/26; H04S 3/02; H04S 5/00.
(52) CPC: G10L 19/008; G10L 19/0204; G10L 19/26; H04S 3/02; H04S 5/00.
(30) Prioridade Unionista: 01/03/2004 US 60/549,368; 14/06/2004 US 60/579,974; 14/07/2004 US 60/588,256.
(73) Titular(es): DOLBY LABORATORIES LICENSING CORPORATION.
(72) lnventor(es): MARK FRANKLIN DAVIS.
(86) Pedido PCT: PCT US2005006359 de 28/02/2005 (87) Publicação PCT: WO 2005/086139 de 15/09/2005 (85) Data do Início da Fase Nacional: 31/08/2006 (57) Resumo: CODIFICAÇÃO DE ÁUDIO DE MÚLTIPLOS CANAIS. A presente invenção refere-se a múltiplos canais de áudio que são combinados ou em um sinal composto monofônico ou em múltiplos canais de áudio juntamente com as informações auxiliares relativas das quais os múltiplos canais de áudio são reconstruídos, incluindo uma mistura de redução de múltiplos canais de áudio para um sinal de áudio monofônico ou para múltiplos canais de áudio e uma decorrelação aperfeiçoada de múltiplos canais de áudio derivados de um canal de áudio monofônico ou de múltiplos canais de áudio. Aspectos da invenção descrita são utilizáveis em codificadores de áudio, decodificadores, sistemas de codificação/decodificação, misturadores de redução, misturadores de expansão, e decorrelatores.
Relatório Descritivo da Patente de Invenção para MÉTODO
PARA DECODIFICAR M CANAIS DE ÁUDIO CODIFICADOS REPRESENTANDO N CANAIS DE ÁUDIO Ε MÉTODO PARA CODIFICAR N
CANAIS DE ÁUDIO DE ENTRADA EM M CANAIS DE ÁUDIO CODIFICADOS.
CAMPO DA TÉCNICA
A presente invenção refere-se geralmente ao processamento de sinal de áudio. A invenção é especificamente útil no processamento de sinal de áudio de baixa taxa de bits e de muito baixa taxa de bits. Mais especificamente, os aspectos da invenção referem-se a um codificador (ou processo de codificação), um decodificador (ou processos de decodificação), e a um sistema de codificação/decodificação (ou processo de codificação / decodificação) para os sinais de áudio nos quais uma pluralidade de canais de áudio está representada por um canal de áudio monofônico (mono) composto e informações auxiliares (cadeia lateral). Altemativamente, a pluralidade de canais de áudio está representada por uma pluralidade de canais de áudio e informações de cadeia lateral. Os aspectos da invenção também referem-se a um misturador de descida de múltiplos canais para canal monofônico composto (ou processo de mistura de redução), a um misturador de subida de canal monofônico para múltiplos canais (ou processo de mistura de expansão), e a um decorrelator de canal monofônico para múltiplos canais (ou processo de decorrelação). Outros aspectos da invenção referem-se a um misturador de descida de múltiplos canais para múltiplos canais (ou processo de mistura de redução), a um misturador de subida de múltiplos canais para múltiplos canais (ou processo de mistura de expansão), e a um decorrelator (ou processo de decorrelação).
ANTECEDENTES DA TÉCNICA
No sistema de codificação e decodificação de áudio digital AC-3, os canais podem ser seletivamente combinados ou acoplados em altas frequências quando o sistema fica com insuficiência de bits. Os detalhes do sistema AC-3 são bem conhecidos na técnica - ver, por exemplo: ATSC Standard A/52A Digital Audio Compression Standard (AC-3), Revision A Advanced Television Systems Committee, 20 de Agosto de 2001. O documento A/52A está disponível na World Wide Web http://www.atsc.orci/ standards-html. O documento A/52A está por meio disto aqui incorporado por
Petição 870180038999, de 11/05/2018, pág. 6/18 referência na sua totalidade.
Figure BRPI0508343B1_D0001
A freqüência acima a qual o sistema AC-3 combina os canais sob demanda é referida como a freqüência de acoplamento. Acima da freqüência de acoplamento, os canais acoplados são combinados em um aco' 5 plamento ou canal combinado. O codificador gera as coordenadas de acoplamento (fatores de amplitude de escala) para cada sub-banda acima da freqüência de acoplamento em cada canal. As coordenadas de acoplamento indicam a razão da energia original de cada sub-banda de canal acoplado para a energia da sub-banda correspondente no canal composto. Abaixo da 10 freqüência de acoplamento, os canais são discretamente codificados. A polaridade de fase de uma sub-banda de canal acoplado pode ser invertida antes do canal ser combinado com um ou mais outros canais acoplados de modo a reduzir o cancelamento de componente de sinal fora de fase. O canal composto juntamente com as informações de cadeia lateral que incluem, ,15 em uma base por sub-banda, as coordenadas de acoplamento e se a fase do canal está invertida, são enviados para o decodificador. Na prática, as frequências de acoplamento empregadas nas modalidades comerciais do sistema AC-3 variavam de aproximadamente 10 kHz a aproximadamente 3500 Hz. As Patentes U.S. Números 5.583.962; 5.633.981; 5.727.119;
5.909.664, e 6.021.386 incluem ensinamentos que referem-se à combinação de múltiplos canais de áudio em um canal composto e informações auxiliares ou de cadeia lateral e a recuperação das mesmas de uma aproximação dos múltiplos canais originais. Cada uma das ditas patentes está por meio disto incorporada por referência na sua totalidade.
DESCRIÇÃO DA INVENÇÃO
Os aspectos da presente invenção podem ser vistos como aperfeiçoamentos sobre as técnicas de acoplamento do sistema de codificação e decodificação AC-3 e também sobre outras técnicas nas quais múltiplos canais de áudio estão combinados ou em um sinal composto monofônico ou 30 em múltiplos canais de áudio juntamente com as informações auxiliares relativas e das quais múltiplos canais de áudio são reconstruídos. Os aspectos da presente invenção também podem ser vistos como aperfeiçoamentos sobre as técnicas para mistura de redução de múltiplos canais de áudio em um sinal de áudio monofônico ou em múltiplos canais de áudio e para decorrelacionar múltiplos canais de áudio derivados de um canal de áudio monofônico ou de múltiplos canais de áudio.
Os aspectos da invenção podem ser empregados em uma técnica de codificação de áudio espacial N:1:N (onde NM é o número de canais de áudio) ou uma técnica de codificação de áudio espacial M:1:N (onde MM é o número de canais de áudio codificados e ”N” é o número de canais de
Figure BRPI0508343B1_D0002
áudio decodificados) que aperfeiçoam o acoplamento de canal, provendo, entre outras coisas, uma compensação de fase aperfeiçoada, mecanismos de decorrelação, e constantes de tempo variáveis dependentes de sinal. Os aspectos da presente invenção podem também ser empregados em técnicas de codificação de áudio espacial N:x:N e M:x:N em que xM pode ser 1 ou maior do que 1. Os objetivos incluem a redução de artefatos de cancelamento de acoplamento no processo de codificação pelo ajuste de fase intercanaís relativa antes da mistura de redução, e o aperfeiçoamento da dimensionalidade espacial do sinal reproduzido pela restauração dos ângulos de fase e graus de decorrelação no decodificador. Os aspectos da invenção quando incorporados em modalidades práticas devem permitir um acoplamento de canal contínuo ou invés de sob demanda e frequências de acoplamento mais baixas do que, por exemplo, no sistema AC-3, por meio disto reduzindo a taxa de dados requerida.
DESCRIÇÃO DOS DESENHOS
A figura 1 é um diagrama de blocos idealizado que mostra as 25 principais funções ou dispositivos de uma disposição de codificação N:1 que incorpora os aspectos da presente invenção.
A figura 2 é um diagrama de blocos idealizado que mostra as principais funções ou dispositivos de uma disposição de decodificação 1:N que incorpora os aspectos da presente invenção.
A figura 3 mostra um exemplo de uma organização conceituai simplificada de bins e sub-bandas ao longo de um eixo geométrico de frequência (vertical) e blocos e um quadro ao longo de um eixo geométrico de tempo (horizontal). A figura não está em escala.
A figura 4 está na natureza de um fluxograma e diagrama de blocos funcional híbrido que mostra as etapas ou os dispositivos de codificação que executam as funções de uma disposição de codificação que incorporam os aspectos da presente invenção.
A figura 5 está na natureza de um fluxograma e diagrama de blocos funcional híbrido que mostra as etapas ou os dispositivos de decodificação que executam as funções de uma disposição de decodificação que incorporam os aspectos da presente invenção.
A figura 6 é um diagrama de blocos idealizado que mostra as principais funções ou dispositivos de uma primeira disposição de codificação N:x que incorpora os aspectos da presente invenção.
A figura 7 é um diagrama de blocos idealizado que mostra as principais funções ou dispositivos de uma disposição de decodificação x:M que incorpora os aspectos da presente invenção.
A figura 8 é um diagrama de blocos idealizado que mostra as principais funções ou dispositivos de uma primeira disposição de decodificação x;M alternativa que incorpora os aspectos da presente invenção.
A Figura 9 é um diagrama de blocos idealizado que mostra as principais funções ou dispositivos de uma segunda disposição de decodificação x:M alternativa que incorpora os aspectos da presente invenção. MELHOR MODO DE EXECUTAR A INVENÇÃO
CODIFICADOR N;1 BÁSICO
Referindo à figura 1, uma função ou dispositivo de codificador N:1 que incorpora os aspectos da presente invenção está mostrado. A figura é um exemplo de uma função ou estrutura que opera como um codificador básico que incorpora os aspectos da invenção. Outras disposições funcionais ou estruturais do que os aspectos práticos da invenção podem ser empregados, que incluem as disposições funcionais ou estruturais alternativas e/ou equivalentes abaixo descritos.
Dois ou mais canais de entrada de áudio são aplicados no codificador. Apesar de que, em princípio, os aspectos da invenção poderem ser praticados por modalidades analógicas, digitais ou analógicas / digitais híbridas, os exemplos aqui descritos são modalidades digitais. Assim, os sinais de entrada podem ser amostras de tempo que podem ter sido derivadas de sinais de áudio analógicos. As amostras de tempo podem ser codificadas 5 como sinais de modulação de código de pulso (PCM) lineares. Cada canal de entrada de áudio de PCM linear é processado por uma função ou dispositivo de banco de filtros que tem tanto uma saída em fase quanto de quadra-
Figure BRPI0508343B1_D0003
tura, tal como uma transformada de Fourier discreta (DFT) direta em janela de 512 pontos (como implementada por uma Transformada de Fourier Rápida (FFT)). O banco de filtros pode ser considerado ser uma transformada de domínio de tempo para domínio de freqüência.
A figura 1 mostra uma primeira entrada de canal de PCM (canal Τ’) aplicada a uma função ou dispositivo de banco de filtros, Banco de Filtros” 2, e uma segunda entrada de canal de PCM (canal n) aplicada, res45 pectivamente, a outra função ou dispositivo de banco de filtros, Banco de Filtros” 4. Podem existir n canais de entrada, onde n é um inteiro positivo igual a dois ou mais. Assim, também existem n Banco de Filtros, cada um recebendo um único dos ”n” canais de entrada. Para simplicidade de apre-
Figure BRPI0508343B1_D0004
sentação, a figura 1 mostra somente dois canais de entrada, ”1” e ”n.
Quando um Banco de Filtros está implementado por uma FFT, os sinais de domínio de tempo são segmentados em blocos consecutivos e são usualmente processados em blocos sobrepostos. As saídas de frequência discretas da FFT (coeficientes de transformada) são referidos como bins, cada um tendo um valor complexo com partes reais e imaginárias que cor25 respondem, respectivamente, a componentes em fase e de quadratura. Os bins de transformada contíguos podem ser agrupados em sub-bandas que aproximam as larguras de banda críticas do ouvido humano, e a maioria das informações de cadeia lateral produzidas pelo codificador, como será descrito, podem ser calculadas e transmitidas em uma base por sub-banda de 30 modo a minimizar os recursos de processamento e reduzir a taxa de bits.
Múltiplos blocos de domínio de tempo sucessivos podem ser agrupados em quadros, sendo feita a média dos valores de bloco ou de outro modo combi nados ou acumulados através de cada quadro, para minimizar a taxa de dados de cadeia lateral. Nos exemplos aqui descritos, cada banco de filtros é implementado por uma FFT, os bins de transformada contíguos são agrupados em sub-bandas, os blocos são agrupados em quadros e os dados de ’5 cadeia lateral são enviados em uma base de uma vez por quadro. Alternatívamente, os dados de cadeia lateral podem ser enviados em uma base de
Figure BRPI0508343B1_D0005
Figure BRPI0508343B1_D0006
mais de uma vez por quadro (por exemplo, uma vez por bloco). Ver, por exemplo, a figura 3 e a sua descrição, aqui adiante. Como é bem conhecido, existe uma permuta entre a freqüêncía na qual as informações de cadeia lateral são enviadas e a taxa de bits requerida.
Uma implementação prática adequada de aspectos da presente invenção pode empregar quadros de comprimento fixo de aproximadamente 32 milissegundos quando uma taxa de amostragem de 48 kHz é empregada, cada quadro tendo seis blocos em intervalos de aproximadamente 5,3 milissegundos cada (empregando, por exemplo, blocos que têm uma duração de aproximadamente 10,6 milissegundos com uma sobreposição de 50%). No entanto, nem tais tempos nem o emprego de quadros de comprimento fixo nem a sua divisão em um número fixo de blocos é crítico para praticar os aspectos da invenção desde que as informações aqui descritas como sendo enviadas em uma base por quadro sejam enviadas não menos frequentemente do que aproximadamente a cada 40 milissegundos. Os quadros podem ser de tamanho arbitrário e seu tamanho pode variar dinamicamente.
Comprimentos de bloco variáveis podem ser empregados como no sistema AC-3 acima citado. É com esta compreensão que referência é aqui feita a quadros e blocos.
Na prática, se o(s) sinal(is) de mono ou múltiplos canais composto^), ou o(s) sinal(is) de mono ou múltiplos canais composto(s) e os canais de baixa frequência discretos, forem codificados, como por exemplo por um codificador preceptivo, como abaixo descrito, é conveniente empregar a 30 mesma configuração de quadro e de bloco como empregada no codificador perceptivo. Mais ainda, se o codificador empregar comprimentos de bloco variáveis de modo que exista, de tempos em tempos, uma comutação de um comprimento de bloco para outro, seria desejável se uma ou mais das informações de cadeia lateral como aqui descrito sejam atualizadas quando uma tal comutação de bloco ocorrer. De modo a minimizar o aumento em dados complementares quando da atualização das informações de cadeia lateral •5 quando da ocorrência de uma tal comutação, a resolução de frequência das informações de cadeia lateral atualizadas pode ser reduzida.
A figura 3 mostra um exemplo de uma organização conceituai simplificada de bins e de sub-bandas ao longo de um eixo geométrico de
Figure BRPI0508343B1_D0007
freqüência (vertical) e um quadro ao longo de um eixo geométrico de tempo (horizontal). Quando os bins são divididos em sub-bandas que aproximamse de bandas críticas, as sub-bandas de freqüência mais baixa tem menos bins (por exemplo, um) e o número de bins por sub-banda aumenta com o aumento de freqüência.
Retornando à figura 1, uma versão de domínio de freqüência de *15 cada um dos canais de entrada de domínio de tempo, produzida pelo respectivo Banco de Filtros de cada canal (Bancos de Filtros 2 e 4 neste exemplo) de cada canal, são somados juntos (misturados em descida”) para um sinal de áudio composto monofônico (mono) por uma função ou dispositivo
Figure BRPI0508343B1_D0008
de combinação aditivo Combinador Aditivo” 6.
A mistura de redução pode ser aplicada na largura de banda de freqüência inteira dos sinais de áudio de entrada ou, opcionalmente, pode ser limitada a frequências acima de uma dada freqüência de acoplamento, desde que os artefatos do processo de mistura de redução possa tornar-se mais audível nas médias a baixas frequências. Em tais casos, os canais po25 dem ser transportados discretamente abaixo da freqüência de acoplamento.
Esta estratégia pode ser desejável mesmo se os artefatos de processamento não forem um problema, e que as sub-bandas de média/baixa freqüência construídas por bins de transformada de agrupamento em sub-bandas como banda crítica (tamanho aproximadamente proporcional à freqüência) tendam 30 a ter um pequeno número de bins de transformada em baixas frequências (um bin em frequências muito baixas) e possam ser diretamente codificados com tão poucos ou poucos bits do que é requerido para enviar um sinal de áudio mono misturado em descida com as informações de cadeia lateral· Uma frequência de acoplamento ou de transição tão baixa quanto 4 kHz.
2300 Hz, 1000 Hz, ou mesmo o fundo da banda de frequência dos sinais de áudio aplicados no codificador, pode ser aceitável para algumas aplicações, *5 especificamente aquelas nas quais uma taxa de bits muito baixa é importante. Outras frequências podem prover um equilíbrio útil entre a economia de bits e a aceitação do ouvinte. A escolha de uma frequência de acoplamento específica não é crítica para a invenção. A frequência de acoplamento pode
Figure BRPI0508343B1_D0009
ser variável e, se variável, pode depender, por exemplo, diretamente ou indiretamente das características de sinal de entrada.
Antes da mistura de redução, é um aspecto da presente invenção aperfeiçoar os alinhamentos de ângulo de fase dos canais uns em relação ao outros, de modo a reduzir o cancelamento de componentes de sinal fora de fase quando os canais são combinados e prover um canal composto * .15 mono aperfeiçoado. Isto pode ser conseguido deslocando controlavelmente ao longo do tempo o ângulo absoluto de alguns ou de todos os bins de transformada em uns dos canais. Por exemplo, todos os bins de transforma-
Figure BRPI0508343B1_D0010
da que representam um áudio acima de uma freqüência de acoplamento, assim definindo uma banda de freqüência de interesse, podem ser controla20 velmente deslocados ao longo do tempo, se necessário, em cada canal ou, quando um canal é utilizado como uma referência, em todos menos o canal de referência.
O ângulo absoluto de um bin pode ser considerado como o ângulo da representação de magnitude e ângulo de cada bin de transforma25 da de valor complexo produzido por um banco de filtros. O deslocamento controlável dos ângulos absolutos de bins em um canal é executado por uma função ou dispositivo de rotação de ângulo (Girar Ângulo). O Girar Ângulo 8 processa a saída do Banco de Filtros 2 antes de sua aplicação no somatório de mistura de redução provido pelo Combinador Aditivo 6, cujo Girar Ân30 guio 10 processa a saída do Banco de Filtros 4 antes de sua aplicação no Combinador Aditivo 6. Será apreciado que, sob algumas condições de sinal, nenhum ângulo de rotação pode ser requerido para um bin de transformada específico ao longo de um período de tempo (o período de tempo de um quadro, nos exemplos aqui descritos). Abaixo da frequência de acoplamento, as informações de canal podem ser discretamente codificadas (não mostrado na figura 1).
‘5 Em princípio, um aperfeiçoamento nas alinhamentos de ângulo de fase dos canais uns em relação aos outros pode ser executado pelo deslocamento de fase de cada bin de transformada ou sub-banda pelo negativo de seu ângulo de fase absoluto, em cada bloco através de toda a banda de
Figure BRPI0508343B1_D0011
frequência de interesse. Apesar disto substancialmente evitar o cancelamento de componentes de sinal fora de fase, isto tende a causar artefatos que podem ser audíveis, especificamente se o sinal composto mono resultante for ouvido em isolamento. Assim, é desejável empregar o princípio de menor tratamento deslocando os ângulos absolutos dos bins em um canal somente tanto quanto necessário para minimizar o cancelamento fora de fase * J 5 no processo de mistura de redução e minimizar o colapso de imagem espacial do sinal de múltiplos canais reconstituído pelo decodificador. As técnicas para determinar tais deslocamentos de ângulo estão abaixo descritas. Tais técnicas incluem uma suavização de tempo e de frequência e o modo no qual o processamento de sinal responde à presença de um transiente.
Figure BRPI0508343B1_D0012
A normalização de energia pode também ser executada em uma base por bin no codificador para reduzir adicionalmente qualquer cancelamento fora de fase restante de bins isolados, como adicionalmente abaixo descrito. Como também adicionalmente abaixo descrito, a normalização de energia pode também ser executada em uma base por sub-banda (no deco25 dificador) para assegurar que a energia do sinal composto mono seja igual às somas das energias dos canais contribuintes.
Cada canal de entrada tem uma função ou dispositivo de analisador de áudio (Analisador de Áudio) associado com este para gerar as informações de cadeia lateral para aquele canal e para controlar a quantida30 de ou grau de rotação de ângulo aplicada no canal antes deste ser aplicado no somatório de mistura de redução 6. As saídas de Banco de Filtros dos canais 1 e n são aplicadas no Analisador de Áudio 12 e no Analisador de
Áudio 14, respectiva mente. O Analisador de Áudio 12 gera as informações de cadeia lateral para o canal 1 e a quantidade rotação de ângulo de fase para o canal 1. O Analisador de Áudio 14 gera as informações de cadeia lateral para o canal n e a quantidade rotação de ângulo de fase para o canal '5 n. Será compreendido que tais referências aqui a ângulo” referem-se a ângulo de fase.
As informações de cadeia lateral para cada canal geradas por um analisador de áudio para cada canal podem incluir:
Figure BRPI0508343B1_D0013
um Fator de Escala de Amplitude (SF de Amplitude) um Parâmetro de Controle de Ângulo um Fator de Escala de Decorrelação (SF de decorrelação) um Sinalizador de Transiente, e opcionalmente, um Sinalizador de Interpolação.
Tais informações de cadeia lateral podem ser caracterizadas • ,15 como parâmetros espaciais, indicativos de propriedades espaciais dos canais e/ou indicativos de características de sinal que podem ser relevantes para o processamento espacial, tal como os transientes. Em cada caso, as
Figure BRPI0508343B1_D0014
informações de cadeia lateral aplica-se a uma única sub-banda (exceto para o Sinalizador de Transiente e o Sinalizador de Interpolação, cada um dos 20 quais aplica-se a todas as sub-bandas dentro de um canal) e podem ser atualizadas uma vez por quadro, como nos exemplos abaixo descritos, ou quando da ocorrência de uma comutação de bloco em um codificador relativo. Os detalhes adicionais dos vários parâmetros espaciais estão abaixo apresentados. A rotação de ângulo para um canal especifico no codificador 25 pode ser considerada como o Parâmetro de Controle de Ângulo de polaridade invertida que forma parte das informações de cadeia lateral.
Se um canal de referência for empregado, este canal pode não requerer um Analisador de Áudio ou, alternativamente, pode requerer um Analisador de Áudio que gere somente as informações de cadeia lateral de 30 Fator de Escala de Amplitude. Não é necessário enviar um Fator de Escala de Amplitude se este fator de escala puder ser deduzido com precisão suficiente por um decodificador dos Fatores de Escala de Amplitude dos outros canais, não de referência. É possível deduzir no decodificador o valor aproximado do Fator de Escala de Amplitude do canal de referência se a normalização de energia no codificador assegurar que os fatores de escala através dos canais dentro de qualquer sub-banda substancialmente somam o qua' 5 drado de 1, como abaixo descrito. O valor de Fator de Escala de Amplitude de canal de referência aproximado deduzido pode ter erros como um resultado da quantização relativamente bruta de fatores de escala de amplitude que resultam em deslocamentos de imagem no áudio de múltiplos canais reproduzidos. No entanto, em um ambiente de baixa taxa de dados, tais artefatos podem ser mais aceitáveis do que utilizar os bits para enviar o Fator de Escala de Amplitude do canal de referência. No entanto, em alguns casos pode ser desejável empregar rência que gere, pelo menos, Escala de Amplitude.
A figura 1 mostra um as em analisador de áudio para o canal de refeinformações de cadeia lateral de Fator de uma linha tracejada uma entrada opcional para cada analisador de áudio para o domínio de tempo de PCM para o analisador de áudio no canal. Esta entrada pode ser utilizada pelo Analisador de Áudio para detectar um transiente ao longo de um período de tempo (o período de um bloco ou quadro, nos exemplos aqui descritos) e gerar um indicador de transiente (por exemplo, um Sinalizador de Transiente'* de um bit) em resposta a um transiente. Alternativa mente, como abaixo descrito nos comentários da Etapa 408 da figura 4, um transiente pode ser detectado no domínio de freqüência, em cujo caso o Analisador de Áudio não precisa receber uma entrada de domínio de tempo.
O sinal de áudio composto mono e as informações de cadeia lateral para todos os canais (ou todos os canais exceto o canal de referência) pode ser armazenado, transmitido, ou armazenado e transmitido para um processo ou dispositivo de decodificação (Decodificador). Preliminarmente ao armazenamento, transmissão, ou armazenamento e transmissão, os vários sinais de áudio e as várias informações de cadeia lateral podem ser multiplexadas e empacotadas em um ou mais fluxos de bits adequados para o meio ou mídia de armazenamento, transmissão ou armazenamento e transmissão. O áudio composto mono pode ser aplicado a um processo ou dispositivo de codificação de redução de taxa de dados tal como, por exemplo, um codificador preceptivo ou um codificador perceptivo e um codificador de entropia (por exemplo, um codificador aritmético ou de Huffman) (algu 5 mas vezes referido como um codificador sem perda) antes do armazenamento, transmissão, ou armazenamento e transmissão. Também, como acima mencionado, o áudio composto mono e as informações de cadeia late-
Figure BRPI0508343B1_D0015
ral relativas podem ser derivados de múltiplos canais de entrada somente para as frequências de áudio acima de uma certa freqüência (uma freqüência de acoplamento). Neste caso, as freqüências de áudio abaixo da freqüência de acoplamento em cada um dos múltiplos canais de entrada podem ser armazenadas, transmitidas ou armazenadas e transmitidas como canais discretos ou podem ser combinadas ou processadas de algum modo outro que como aqui descrito. Tais canais discretos ou de outro modo com• *15 binados podem também ser aplicados a um processo ou dispositivo de codificação de redução de dados tal como, por exemplo, um codificador perceptivo ou um codificador perceptivo e um codificador de entropia. O áudio composto mono e o áudio de múltiplos canais discretos podem todos ser aplicados em um processo ou dispositivo de codificação perceptiva integrada
Figure BRPI0508343B1_D0016
ou de codificação perceptiva e de entropia.
O modo específico no qual as informações de cadeia lateral são executadas no fluxo de bits do codificador não é crítico para a invenção. Se desejado, as informações de cadeia lateral podem ser executadas de tal modo que o fluxo de bits seja compatível com os decodificadores de legado 25 (isto é, o fluxo de bits é inversamente compatível). Muitas técnicas adequadas para executar isto são conhecidas. Por exemplo, muitos codificadores geram um fluxo de bits que tem bits não utilizados ou nulos que são ignorados pelo decodificador. Um exemplo de uma tal disposição está mostrada na Patente U.S. Número 6.807.528 B1 de Truman et al., intitulada Adding Data to a Compressed Data Frame, 19 de Outubro de 2004, cuja patente está por meio disto incorporada por referência na sua totalidade. Tais bits podem ser substituídos pelas informações de cadeia lateral. Outro exemplo é que as informações de cadeia lateral podem ser estenograficamente codificadas no fluxo de bits do codificador. Alternativamente, as informações de cadeia lateral podem ser armazenadas ou transmitidas separadamente do fluxo de bits inversamente compatível por qualquer técnica que permita a transmissão ou ’5 o armazenamento de tais informações juntamente com um fluxo de bits mono / estéreo compatível com os decodificadores de legado.
DECODIFICADOR 1 :N E 1:M BÁSICO
Figure BRPI0508343B1_D0017
Figure BRPI0508343B1_D0018
Referindo à figura 2, uma função ou dispositivo de decodificador (Decodificador) que incorpora os aspectos da presente invenção está mostrado. A figura é um exemplo de uma função ou estrutura que opera como um decodificador básico que emprega os aspectos da invenção. Outras disposições funcionais ou estruturais que praticam os aspectos da invenção podem ser empregadas, incluindo as disposições funcionais ou estruturais alternativas e/ou equivalentes abaixo descritas.
O Decodificador recebe um sinal de áudio composto mono e as informações de cadeia lateral para todos os canais ou todos os canais exceto o canal de referência. Se necessário, o sinal de áudio composto e as informações de cadeia lateral relativas são demultiplexados, desempacotados e/ou decodificados. A decodificação pode empregar uma tabela de consulta. O objetivo é derivar dos canais de áudio composto mono uma pluralidade de canais de áudio individuais que aproximam-se dos respectivos dos canais de áudio aplicados no Codificador da figura 1, sujeito a técnicas de redução de taxa de bits da presente invenção que estão aqui descritas.
É claro, pode-se escolher não recuperar todos os canais aplica25 dos no codificador ou utilizar somente o sinal composto monofônico. Alternativamente, os canais além daqueles aplicados no Codificador podem ser de rivados da saída de um Decodificador de acordo com os aspectos da presente invenção pelo emprego de aspectos das invenções descritas no Pedido Internacional PCT/US 02/03619, requerido em 07 de Fevereiro de 2002, publicado em 15 de Agosto de 2002, designando os Estados Unidos, e seu
Pedido Nacional U.S S.N. 10/467.213 resultante, requerido em 05 de Agosto de 2003, e no Pedido Internacional PCT/US03/24570, requerido em 06 de
Agosto de 2003, publicado em 04 de Março de 2001 como WO 2004/019656, designando os Estados Unidos, e seu Pedido U.S. Nacional
S.N. 10/522.515 resultante, requerido em 27 de Janeiro de 2005. Tais pedidos estão por meio disto incorporados por referência em sua totalidade. Os 5 canais recuperados por um Decodificador que pratica os aspectos da presente invenção são especificamente úteis em conexão com as técnicas de multiplicação de canais dos pedidos citados e incorporados em que os ca nais recuperados não somente tem relações de amplitude intercanais úteis
Figure BRPI0508343B1_D0019
mas também tem relações de fase intercanais úteis. Outra alternativa para a multiplicação de canais é empregar um decodificador de matriz para derivar os canais adicionais. Os aspectos de preservação de amplitude e de fase intercanais da presente invenção tornam os canais de saída de um decodificador que incorpora os aspectos da presente invenção especificamente adequados para aplicação em um decodificador de matriz sensível à amplitu• *15 de e à fase. Muitos tais decodificadores de matriz empregam circuitos de controle de banda larga que operam apropriadamente somente quanto os sinais aplicados a este são estéreo através de toda a largura de banda dos sinais. Assim, se os aspectos da presente invenção forem incorporados em um sistema N:1:N no qual Né2, os dois canais recuperados pelo decodifi-
Figure BRPI0508343B1_D0020
cador podem ser aplicados em um decodificador de matriz ativa 2:M. Tais canais podem ter sido canais discretos abaixo de uma frequência de acoplamento, como acima mencionado. Muitos decodificadores de matriz ativa adequados são bem conhecidos na técnica, incluindo, por exemplo, os decodificadores de matriz conhecidos como decodificadores Pro Logic e Pro 25 Logic II” (Pro Logic é uma marca registrada da Dolby Laboratories Licensing Corporation). Os aspectos dos decodificadores Pro Logic estão descritos nas Patentes U.S. Números 4.799.620 e 4.941.177, cada uma das quais está aqui incorporada por referência na sua totalidade. Os aspectos dos decodificadores Pro Logic II estão descritos no Pedido de Patente Pendente 30 U.S. S.N. 09/532.711 de Fosgate, intitulado Method for Deriving at Least
Three Audio Signals from Two Input Audio Sígnals, requerido em 22 de
Março de 2000, e publicado como WO 01/41504 em 07 de Junho de 2001, e
Figure BRPI0508343B1_D0021
no Pedido de Patente Pendente U.S. S.N. 10/362.786 de Fosgate et al, intitulado Method for Apparatus for Audio Matrix Decoding, requerido em 25 de Fevereiro de 2003, e publicado como US 2004/0125960 A1 em 01 de Julho de 2004. Cada um dos ditos pedidos de patente está aqui incorporado 5 por referência na sua totalidade. Alguns aspectos da operação dos decodificadores Dolby Pro Logic e Pro Logic II estão explicados, por exemplo, em documentos disponíveis no website da Dolby Laboratories (www.dolby.com): Dolby Suround Pro Logic Decoder Principies of Operation, por Roger Dressler, e Mixing with Dolby Pro Logic II Technology, por Jim Hilson. Ou10 tros decodificadores de matriz ativa adequados podem incluir aqueles descritos em uma ou mais das seguintes Patentes U.S. e dos Pedidos de Patente Internacionais publicados (cada um designando os Estados Unidos), cada um dos quais está por meio disto incorporado por referência na sua totalidade: 5.046.098; 5.274.740; 5.400.433; 5.625.696; 5.644.640; 5.504.819;
* , 15 5.428.687; 5.172.415; e WO 02/19768.
Figure BRPI0508343B1_D0022
Referindo novamente à figura 2, o canal de áudio composto mono recebido é aplicado a uma pluralidade de percursos de sinal dos quais um respectivo de cada um dos múltiplos canais de áudio recuperados é derivado. Cada percurso derivado de canal inclui, em qualquer ordem, uma fun20 ção ou dispositivo de ajuste de amplitude (Ajustar Amplitude) e uma função ou dispositivo de rotação de ângulo (Girar Ângulo).
O Ajustar Amplitudes aplica ganhos ou perdas ao sinal composto mono de modo que, sob certas condições de sinal, as magnitudes (ou energias) de saída relativas dos canais de saída derivados deste são similares àqueles dos canais na entrada do codificador. Alternativamente, sob certas condições de sinal quando variações de ângulo randômicas são impostas, como a seguir descrito, uma quantidade controlável de variações de amplitude randômicas pode também ser imposta sobre a amplitude de um canal recuperado de modo a aperfeiçoar a sua decorrelação em relação a outros 30 dos canais recuperados.
O Girar Ângulos aplica rotações de fase de modo que, sob certas condições de sinal, os ângulos de fase relativos dos canais de saída de16 rivados do sinal composto mono são similares àqueles dos canais na entra-
Figure BRPI0508343B1_D0023
da do codificador. De preferência, sob certas condições de sinal, uma quantidade controlável de variações de ângulo randômicas é também imposta sobre o ângulo de um canal recuperado de modo a aperfeiçoar a sua decor' 5 relação em relação a outros dos canais recuperados.
Como abaixo adicionalmente discutido, as variações de amplitude de ângulo randômicas podem incluir não somente as variações pseudorandômicas e as verdadeiramente randômicas, mas também as variações deterministicamente geradas que têm o efeito de reduzir a correlação cruza10 da entre os canais. Isto está abaixo adicíonalmente discutido nos Comentários da Etapa 505 da figura 5A.
Conceituai mente, o Ajustar Amplitude e Girar Ângulo para um canal específico escalam os coeficientes de DFT de áudio composto mono para gerar os valores de bin de transformada reconstruídos para o canal.
* r 15 O Ajustar Amplitude para cada canal pode ser controlado pelo menos pelo Fator de Escala de Amplitude de cadeia lateral recuperada para o canal específico ou, no caso do canal de referência, ou do Fator de Escala de Amplitude de cadeia lateral recuperada para o canal de referência ou de um Fator de Escala de Amplitude deduzido dos Fatores de Escala de Ampli-
Figure BRPI0508343B1_D0024
tude de cadeia lateral recuperada dos outros canais, não de referência. Alternativamente, para melhorar a decorrelação dos canais recuperados, o Ajustar Amplitude pode também ser controlado por um Parâmetro de Fator de Escala de Amplitude Randomizada derivado do Fator de Escala de Decorrelação de cadeia lateral recuperada para um canal específico e o Sinali25 zador de Transiente de cadeia lateral recuperada para o canal específico.
O Girar Ângulo para cada canal pode ser controlado pelo menos pelo Parâmetro de Controle de Ângulo de cadeia lateral recuperada (em cujo caso, o Girar Ângulo no decodificador pode substancialmente desfazer o ângulo de rotação provido pelo Girar Ângulo no codificador). Para melhorar a 30 decorrelação dos canais recuperados, um Girar Ângulo pode também ser controlado por um Parâmetro de Controle de Ângulo Randomizado derivado do Fator de Escala de Decorrelação de cadeia lateral recuperada para um canal específico e o Sinalizador de Transiente de cadeia lateral recuperada para o canal específico. O Parâmetro de Controle de Ângulo Randomizado para um canal, e, se empregado, o Fator de Escala de Decorrelação para um canal, podem ser derivados do Fator de Escala de Decorrelação recupe5 rado para o canal e o Sinalizador de Transiente recuperado para o canal por uma função ou dispositivo de decorrelator controlável (Decorrelator Controlável'').
Figure BRPI0508343B1_D0025
Figure BRPI0508343B1_D0026
Referindo ao exemplo da figura 2, o áudio composto mono recuperado é aplicado a um primeiro percurso de recuperação de áudio de canal 10 22, o qual deriva o áudio do canal 1, e a um segundo percurso de recuperação de áudio de canal 24, o qual deriva o áudio do canal η. O percurso de áudio 22 inclui um Ajustar Amplitude 26, um Girar Ângulo 28, e, se uma saída PCM for desejada, uma função ou dispositivo de banco de filtros inverso (Banco de Filtros Inverso) 30. Similarmente, o percurso de áudio 24 inclui t 15 um Ajustar Amplitude 32, um Girar Ângulo 34, e, se uma saída PCM for desejada, uma função ou dispositivo de banco de filtros inverso (Banco de Filtros Inverso) 36. Como com o caso da figura 1, somente dois canais estão mostrados para simplicidade de apresentação, sendo compreendido que podem existir mais do que dois canais.
As informações de cadeia lateral recuperada para o primeiro canal, o canal 1, podem incluir um Fator de Escala de Amplitude, um Parâmetro de Controle de Ângulo, um Fator de Escala de Decorrelação, um Sínalizador de Transiente, e, opcionalmente, um Sinalizador de Interpolação, como acima apresentado em conexão com a descrição de um Codificador bá25 sico. O Fator de Escala de Amplitude é aplicado no Ajustar Amplitude 26. Se o Sinalizador de Interpolação opcional for empregado, um interpolador ou função de interpolador de frequência opcional (Interpolador) 27 pode ser empregado de modo a interpolar a frequência cruzada do Parâmetro de Controle de Ângulo (por exemplo, através dos bins em cada sub-banda de um canal). Tal interpolação pode ser, por exemplo, uma interpolação linear de ângulos de bin entre os centros de cada sub-banda. O estado do Sinalizador de Interpolação de um bit seleciona se uma interpolação através de freqüência é utilizada ou não, como está abaixo adicionalmente explicado. O Sinalizador de Transiente e o Fator de Escala de Decorrelação são aplicados a um Decorrelator Controlável 38 que gera um Parâmetro de Controle de Ângulo Randomizado em resposta a este. O estado do Sinalizador de 5 Transiente de um bit seleciona um de dois múltiplos modos de decorrelação de ângulo randomizado como está abaixo adicionalmente explicado. O Parâmetro de Controle de Ângulo, o qual pode ser interpolado através de fre-
Figure BRPI0508343B1_D0027
qüência se o Sinalizador de Interpolação e o Interpolador forem empregados, e o Parâmetro de Controle de Ângulo Randomizado são somados juntos por um combinador aditivo ou função de combinação 40 de modo a prover um sinal de controle para o Girar Ângulo 28. Alternativamente, o Decorrelator Controlável 38 pode também gerar um Fator de Escala de Amplitude Randomizada em resposta ao Sinalizador de Transiente e ao Fator de Escala de Decorrelação, além de gerar um Parâmetro de Controle de Ângulo * % 15 Randomizado. O Fator de Escala de Amplitude pode ser somado juntamente com um tal Fator de Escala de Amplitude Randomizada por um combinador auditivo ou função de combinação (não mostrado) de modo a prover o sinal de controle para o Ajustar Amplitude 26.
Figure BRPI0508343B1_D0028
Similarmente, as informações de cadeia lateral recuperada para o segundo canal, o canal n, podem também incluir um Fator de Escala de Amplitude, um Parâmetro de Controle de Ângulo, um Fator de Escala de Decorrelação, um Sinalizador de Transiente, e, opcíonaímente, um Sinalizador de Interpolação, como acima descrito em conexão com a descrição de um Codificador básico. O Fator de Escala de Amplitude é aplicado no Ajustar 25 Amplitude 32. Um interpolador de freqüência ou função de interpolador (Ίηterpolador) 33 pode ser empregado de modo a interpolar o Parâmetro de Controle de Ângulo através de freqüência. Como com o canal 1, o estado do Sinalizador de Interpolação de um bit seleciona se uma interpolação através de freqüência é utilizada ou não. O Sinalizador de Transiente e o Fator de 30 Escala de Decorrelação são aplicados a um Decorrelator Controlável 42 que gera um Parâmetro de Controle de Ângulo Randomizado em resposta a este. Como com o canal 1, o estado do Sinalizador de Transiente de um bit seleciona um de dois múltiplos modos de decorrelação de ângulo randomizado, como está abaixo adicionalmente explicado. O Parâmetro de Controle de Ângulo e o Parâmetro de Controle de Ângulo Randomizado são somados juntos por um combinador aditivo ou função de combinação 44 de modo a ’5 prover um sinal de controle para o Girar Ângulo 34. Altemativamente, como acima descrito em conexão com o canal 1, o Decorrelator Controlável 42 pode também gerar um Fator de Escala de Amplitude Randomizada em resposta ao Sinalizador de Transiente e ao Fator de Escala de Decorrelação,
Figure BRPI0508343B1_D0029
Figure BRPI0508343B1_D0030
além de gerar um Parâmetro de Controle de Ângulo Randomizado. O Fator de Escala de Amplitude e o Fator de Escala de Amplitude Randomizada po dem sem somados juntos por um combinador auditivo ou função de combinação (não mostrado) de modo a prover o sinal de controle para o Ajustar Amplitude 32.
Apesar de um processo ou topologia como há pouco descrito ser útil para a compreensão, essencialmente os mesmos resultados podem ser obtidos de processos ou topologias alternativos que alcançam os mesmos resultados ou similares. Por exemplo, a ordem de Ajustar Amplitude 26 (32) e Girar Ângulo 28 (34) pode ser invertida e/ou podem existir mais do que um Girar Ângulo - um que responda ao Parâmetro de Controle de Ângulo e outro que responda ao Parâmetro de Controle de Ângulo Randomizado. O Girar Ângulo pode também ser considerado serem três ao invés de uma ou duas funções ou dispositivos, como no exemplo da figura 5 abaixo descrito. Se um Fator de Escala de Amplitude Randomizada for empregado, pode existir mais de um Ajustar Amplitude - um que responda ao Fator de Escala de 25 Amplitude e um que responda ao Fator de Escala de Amplitude Randomizada. Devido à maior sensibilidade do ouvido humano à amplitude em relação à fase, se um Fator de Escala de Amplitude Randomizada for empregado, pode ser desejável escalar o seu efeito em relação ao efeito do Parâmetro de Controle de Ângulo Randomizado de modo que o seu efeito sobre a am30 plitude seja menor do que o efeito que o Parâmetro de Controle de Ângulo
Randomizado tem sobre o ângulo de fase. Como outro processo ou topologia alternativo, o Fator de Escala de Decorrelação pode ser utilizado para controlar a razão do ângulo de fase randomizado versus o ângulo de fase básico (ao invés de adicionar um parâmetro que representa um ângulo de fase randomizado a um parâmetro que representa o ângulo de fase básico), e se também empregada, a razão de deslocamento de amplitude randomi5 zado versus o deslocamento de amplitude básico (ao invés de adicionar um fator de escala que representa uma amplitude randomizada a um fator de escala que representa a amplitude básica) (isto é, variação de intensidade cruzada variável em cada caso).
Figure BRPI0508343B1_D0031
Figure BRPI0508343B1_D0032
Se um canal de referência for empregado, como acima discutido em conexão com o codificador básico, o Girar Ângulo, o Decorrelator Contro lável e o Combinador Aditivo para aquele canal podem ser omitidos desde que as informações de cadeia lateral para o canal de referência possam in cluir somente o Fator de Escala de Amplitude (ou, alternativamente, se as informações de cadeia lateral não contiverem o Fator de Escala de Amplitude para o canal de referência, este pode ser deduzido dos Fatores de Escala de Amplitude dos outros canais quando a normalização de energia no codificador assegura que os fatores de escala através dos canais dentro de uma sub-banda somam o quadrado de 1). Um Ajuste de Amplitude está provido para o canal de referência e é controlado por um Fator de Escala de Amplitude recebido ou derivado para o canal de referência. Sendo o Fator de Escala de Amplitude do canal de referência derivado da cadeia lateral ou deduzido no decodificador, o canal de referência recuperado é uma versão escalada em amplitude do canal composto mono. Este não requer um ângulo de rotação porque este é a referência para as rotações dos outros canais.
Apesar do ajuste da amplitude relativa de canais recuperados poder prover um modesto grau de decorrelação, se utilizado somente um ajuste de amplitude é provável resultar em um campo sonoro reproduzido que é substancialmente deficiente em espacialização ou formação de imagem para muitas condições de sinal (por exemplo, um campo sonoro des30 montado). O ajuste de amplitude pode afetar as diferenças de nível interaural no ouvido, o qual é somente uma das sugestões direcionais psicoacústicas empregadas pelo ouvido. Assim, de acordo com os aspectos da inven ção, certas técnicas de ajuste de ângulo podem ser empregadas, dependendo das condições de sinal, para prover uma decorrelação adicional. Referência pode ser feita à Tabela 1 que provê comentários abreviados úteis na compreensão das múltiplas técnicas ou modos de operação de correlação “ 5 de ajuste de ângulo que podem ser empregadas de acordo com os aspectos da invenção. Outras técnicas de decorrelação como abaixo descritas em conexão com os exemplos das figuras 8 e 9 podem ser empregadas ao in-
Figure BRPI0508343B1_D0033
Figure BRPI0508343B1_D0034
vés ou em adição às técnicas da Tabela 1.
Na prática, a aplicação de rotações de ângulo e alterações de magnitude pode resultar em uma convolução circular (também conhecida como convolução cíclica ou periódica). Apesar de que, geralmente, é dese jável evitar a circunvolução circular, artefatos audíveis indesejáveis que re sultam da convolução circular são um tanto reduzidos por um deslocamento de ângulo complementar em um codificador e decodificador. Além disso, os efeitos da convolução circular podem ser tolerados em implementações de baixo custo de aspectos da presente invenção, especificamente aqueles nos quais a mistura de redução para mono ou múltiplos canais ocorre somente em parte da banda de freqüência de áudio, tal como, por exemplo acima de 1500 Hz (em cujo caso os efeitos audíveis da convolução circular são mínimos). Alternativamente, a convolução circular pode ser evitada ou minimizada por qualquer técnica adequada, que inclui, por exemplo, uma utilização apropriada de preenchimento de zeros. Um modo de utilizar o preenchimento de zeros é transformar a variação de domínio de freqüência proposta (que representa os ângulos de rotação e o escalamento de amplitude) no domínio de tempo, enquadrá-la (com uma janela arbitrária), preenchê-la com zeros, então transformar de volta para o domínio de freqüência e multiplicar pela versão de domínio de freqüência do áudio a ser processado (o áudio não precisa ser enquadrado).
TABELA 1
TÉCNICAS DE DECORRELAÇÃO DE AJUSTE DE ÂNGULO
Figure BRPI0508343B1_D0035
Figure BRPI0508343B1_D0036
Para os sinais que são substanciaimente espectralmente estáticos, tais como, por exemplo, uma nota de apito, uma primeira técnica (Técnica 1”) restaura o ângulo do sinal composto mono recebido em relação ao ângulo de cada um dos outros canais recuperados para um ângulo similar (sujeito à granularidade de freqüência e de tempo e à quantização) ao ângulo original do canal em relação aos outros canais na entrada do codificador. As diferenças de ângulo de fase são úteis, especificamente, para prover uma decorrelação de componentes de sinal de baixa freqüência abaixo de aproximadamente 1500 Hz onde o ouvido acompanha os ciclos individuais do sinal de áudio. De preferência a Técnica 1 opera sob todas as condições de sinal para prover um deslocamento de ângulo básico.
Para os componentes de sinal de alta freqüência acima de aproximadamente 1500 Hz, o ouvido não acompanha os ciclos de som individuais mas ao contrário responde a envelopes de forma de onda (em uma base de banda crítica). Com isto, acima de aproximadamente 1500 Hz a decorrelação é melhor provida for diferenças em envelopes de sinal ao invés de diferenças de ângulo de fase. A aplicação de deslocamentos de ângulo de fase somente de acordo com a Técnica 1 não altera os envelopes de sinais suficientemente para decorrelatar os sinais de alta freqüência. A segunda e a terceira técnicas (Técnica 2 e Técnica 3, respectivamente) adicionam uma quantidade controlável de variações de ângulo randomizado ao ângulo determinado pela Técnica 1 sob certas condições de sinal, por meio disto causando uma quantidade controlável de variações de envelope randomizado, o que melhora a decorrelação.
As mudanças randomizadas no ângulo de fase são um modo desejável de causar mudanças randomizadas nos envelopes de sinais. Um envelope específico resulta da interação de uma combinação específica de amplitudes e fases de componentes espectrais dentro de uma sub-banda. Apesar da mudança das amplitudes de componentes espectrais dentro de uma sub-banda mudar o envelope, grandes mudanças de amplitude são requeridas para obter uma mudança significativa no envelope, o que é desejável porque o ouvido humano é sensível a variações na amplitude espectral.
Em contraste, a mudança dos ângulos de fase do componente espectral tem um maior efeito sobre o envelope do que a mudança das amplitudes de componente espectral - os componentes espectrais nào mais alinham do mesmo modo, de modo que os reforços e as subtrações que definem o en'5 velope ocorrem em diferentes tempos, por meio disto mudando o envelope.
Apesar do ouvido humano ter alguma sensibilidade de envelope, o ouvido ê relativamente surdo à fase, de modo que a qualidade de som total permane-
Figure BRPI0508343B1_D0037
ce substancialmente similar. No entanto, para algumas condições de sinal, alguma randomização das amplitudes de componentes espectrais juntamente com a randomização das fases de componentes espectrais pode prover uma randomização melhorada de envelopes de sinal desde que uma tal randomização de amplitude não cause artefatos audíveis indesejáveis.
De preferência, uma quantidade ou grau controlável da Técnica ou da Técnica 3 opera juntamente com a Técnica 1 sobre certas condições ,15 de sinal. O Sinalizador de Transiente seleciona a Técnica 2 (nenhum transiente presente no quadro ou bloco, dependendo se o Sinalizador de Transi-
Figure BRPI0508343B1_D0038
ente é enviado na taxa de quadros ou de blocos) ou a Técnica 3( transiente presente no quadro ou bloco). Assim, existem múltiplos modos de operação, dependendo se um transiente está presente ou não. Altemativamente, além disso, sob certas condições de sinal, uma quantidade ou grau controlável de randomização de amplitude também opera juntamente com a escalagem de amplitude que procura restaurar a amplitude de canal original.
A Técnica 2 é adequada para os sinais contínuos complexos que são ricos em harmônicos, tais como os violinos orquestrais em massa. A 25 Técnica 3 é adequada para os sinais impulsivos ou de transiente complexos, tais como aplausos, castanholas, etc. (A Técnica 2 mescla as palmas no aplauso, tornando-a inadequada para tais sinais). Como adicionalmente abaixo explicado, de modo a minimizar os artefatos audíveis, a Técnica 2 e a
Técnica 3 tem diferentes resoluções de tempo e freqüência para aplicar as variações de ângulo randomizado - a Técnica 2 é selecionada quando um transiente não está presente, enquanto que a Técnica 3 é selecionada quando um transiente está presente.
A Técnica 1 desloca lentamente (quadro por quadro) o ângulo de bin em um canal. A quantidade ou grau deste deslocamento básico pelo Parâmetro de Controle de Ângulo (nenhum deslocamento de o parâmetro for zero). Como abaixo adicionalmente explicado, ou o mesmo ou um parâmetro 5 interpolado é aplicado a todos os bins em cada sub-banda e o parâmetro é atualizado a cada quadro. Conseqüentemente, cada sub-banda de cada ca-
Figure BRPI0508343B1_D0039
nal pode ter um deslocamento de fase em relação a outros canais, provendo um grau de decorrelação em baixas freqüências (abaixo de 1500 Hz). No entanto, a Técnica 1, por si própria, é inadequada para um sinal de transiente tal como os aplausos. Para tais condições de sinal, os canais reproduzidos podem exibir um efeito de filtro de pente. No caso de aplausos, essencialmente nenhuma decorrelação é provida ajustando somente a amplitude relativa de canais recuperados porque todos os canais tendem a ter a mesma amplitude ao longo do período de um quadro.
>15 A Técnica 2 opera quando um transiente não está presente. A
Técnica 2 adiciona ao deslocamento de ângulo da Técnica 1 um deslocamento de ângulo randomizado que não muda com o tempo, em uma base de bin por bin (cada bin tem um deslocamento randomizado diferente) em um
Figure BRPI0508343B1_D0040
canal, fazendo com que os envelopes dos canais sejam diferentes uns dos outros, assim provendo uma decorrelação de sinais complexos entre os canais. A manutenção dos valores de ângulo de fase randomizado constantes ao longo do tempo evita os artefatos de bloco ou de quadro que podem resultar de alteração de bloco a bloco ou de quadro a quadro de ângulos de fase de bin. Apesar desta técnica ser uma ferramenta de decorrelação muito útil quando um transiente não está presente, esta pode temporariamente mesclar um transiente (resultando no que é frequentemente referido como pré-ruído - a mesclagem pós-transíente é mascarada pelo transiente). A quantidade ou grau de deslocamento adicional provido pela Técnica 2 é escalada diretamente pelo Fator de Escala de Decorrelação (não existe ne30 nhum deslocamento adicional se o fator de escala for zero). Idealmente, a quantidade de ângulo de fase randomizado adicionada ao deslocamento de ângulo de base (da Técnica 1) de acordo com a Técnica 2 é controlada pelo
Fator de Escala de Decorrelação em um modo que minimiza os artefatos de trinado de sinal audível Tal minimização de artefatos de trinado de sinal resulta do modo no qual o Fator de Escala de Decorrelação é derivado e da aplicação de suavização de tempo apropriada, como abaixo descrito. Apesar *5 de um valor de deslocamento de ângulo randomizado adicional diferente ser aplicado a cada bin e que o valor de deslocamento não muda, a mesma escalagem é aplicada através de uma sub-banda e a escalagem é atualizada a
Figure BRPI0508343B1_D0041
cada quadro.
A Técnica 3 opera na presença de um transiente no quadro ou bloco, dependendo da taxa na qual o Sinalizador de Transiente é enviado. Esta desloca todos os bins em cada sub-banda em um canal de bloco para bloco com um único valor de ângulo randomizado, comum a todos os bins na sub-banda, fazendo com que não somente os envelopes, mas também as amplitudes e as fases, dos sinais em um canal mudem em relação a outros b15 canais de bloco para bloco. Estas mudanças em resolução de tempo e de frequência da randomização de ângulo reduz as similaridades de sinal de estado estável entre os canais e provêem uma decorrelação dos canais
Figure BRPI0508343B1_D0042
substancialmente sem causar os artefatos de pré-ruído. A mudança na resolução de frequência da randomização de ângulo, de muito fina (todos os 20 bins diferentes em um canal) na Técnica 2 para bruta (todos os bins dentro de uma sub-banda os mesmos, mas cada sub-banda diferente) na Técnica 3 é especificamente útil na minimização dos artefatos de pré-ruído. Apesar do ouvido não responder a mudanças de ângulo puras diretamente em altas frequências, quando dois ou mais canais misturam acusticamente no seu 25 caminho dos alto-falantes para um ouvinte, as diferenças de fase podem causar mudanças de amplitude (efeitos de filtro de pente) que podem ser audíveis e questionáveis, e estas são rompidas pela Técnica 3. As características impulsivas do sinal minimizam os artefatos de taxa de blocos que possam ocorrer. Assim, a Técnica 3 adiciona ao deslocamento de fase da 30 Técnica 1 um deslocamento de ângulo randomizado rapidamente mutável (bloco por bloco) em uma base de sub-banda por sub-banda em um canal. A quantidade ou grau de deslocamento adicional é indiretamente escalada, ,70 como abaixo descrito, pelo Fator de Escala de Decorrelação (não existe deslocamento adicional se o fator de escala for zero). A mesma escalagem é aplicada através de uma sub-banda e a escalagem é atualizada a cada quadro.
Figure BRPI0508343B1_D0043
Apesar das técnicas de ajuste de ângulo terem sido caracterizadas como três técnicas, isto é um assunto de semântica e estas podem também ser caracterizadas como duas técnicas: (1) uma combinação da Técnica 1 e um grau variável da Técnica 2, o qual pode ser zero, e (2) uma combinação da Técnica 1 e um grau variável da Técnica 3, o qual pode ser zero. Para conveniência em apresentação, as técnicas são tratadas como sendo três técnicas.
Figure BRPI0508343B1_D0044
Os aspectos das técnicas de decorrelação de múltiplos modos e as suas modificações podem ser empregadas na provisão de decorrelação de sinais de áudio derivados, tal como por mistura de expansão, de um ou w 15 mais canais de áudio mesmo quando tais canais de áudio não são derivados de um decodificador de acordo com os aspectos da presente invenção. Tais disposições, quando aplicadas a um canal de áudio mono, são algumas vezes referidas como dispositivos e funções pseudo-estéreo. Qualquer dispositivo ou função adequado (um misturador de expansão) pode ser em20 pregado para derivar múltiplos sinais de um canal de áudio mono ou de múltiplos canais de áudio. Uma vez que tais múltiplos canais de áudio são derivados por um misturador de expansão, um ou mais destes podem ser decorrelatados em relação a um ou mais dos outros sinais de áudio derivados pela aplicação das múltiplas técnicas de decorrelação aqui descritas. Em uma 25 tal aplicação, cada canal de áudio derivado ao qual as técnicas de decorrelação são aplicadas pode ser comutado de um modo de operação para outro pela detecção de transíentes no próprio canal de áudio derivado. Alternativamente, a operação da técnica de transiente presente (Técnica 3) pode ser simplificada para não prover nenhum deslocamento dos ângulos de fase de 30 componentes espectrais quando um transiente estiver presente.
INFORMAÇÕES DE CADEIA LATERAL
Como acima mencionado, as informações de cadeia lateral po28 dem incluir um Fator de Escala de Amplitude, um Parâmetro de Controle de Ângulo, um Fator de Escala de Decorrelação. um Sinalizador de Transiente, e, opcionalmente, um Sinalizador de Interpolação. Tais informações de cadeia lateral para uma modalidade prática dos aspectos da presente invenção 5 podem ser resumidas na Tabela 2 seguinte.
Figure BRPI0508343B1_D0045
Figure BRPI0508343B1_D0046
TABELA 2
CARACTERÍSTICAS DE INFORMAÇÕES DE CADEIA LATERAL PARA UM CANAL
Figure BRPI0508343B1_D0047
Figure BRPI0508343B1_D0048
Em cada caso, as informações de cadeia lateral de um canal aplicam a uma única sub-banda (exceto para o Sinalizador de Transiente e o Sinalizador de interpolação, cada um dos quais aplicam a todas as subbanda s em um canal) e podem ser atualizadas uma vez por quadro. Apesar 5 da resolução de tempo (uma vez por quadro), da resolução de freqüência (sub-banda), da faixa de valores e dos níveis de quantização indicados terem sido considerados proverem um desempenho útil e um compromisso útil
Figure BRPI0508343B1_D0049
entre uma baixa taxa de bits e o desempenho, será apreciado que estas resoluções de tempo e de freqüência, faixas de valores e níveis de quantização não são críticos e que outras resoluções, faixas e níveis podem ser empregados na prática dos aspectos da invenção. Por exemplo, o Sinalizador de Transiente e/ou Sinalizador de Interpolação, se empregado, podem ser atualizados uma vez por bloco com somente um aumento mínimo em dados suplementares de cadeia lateral. No caso do Sinalizador de Transiente, fazer ’ .15 isto tem a vantagem que a comutação da Técnica 2 para a Técnica 3 e viceversa é mais precisa. Além disso, como acima mencionado, as informações de cadeia lateral podem ser atualizadas quando da ocorrência de uma co
Figure BRPI0508343B1_D0050
mutação de bloco de um codificador relativo.
Será notado que a Técnica 2, acima descrita (ver também a Ta· 20 bela 1), provê uma resolução de freqüência de bin ao invés de uma resolução de freqüência de sub-banda (isto é, um diferente deslocamento de ângulo de fase pseudo-randômico é aplicado a cada bin ao invés de cada subbanda) mesmo se o mesmo Fator de Escala de Decorrelação de Sub-Banda aplicar a todos os bins em uma sub-banda. Será também notado que a Téc25 nica 3, acima descrita (ver também a Tabela 1), provê uma resolução de freqüência de bloco (isto é, um diferente deslocamento de ângulo de fase randomtzado é aplicado a cada bloco ao invés de cada quadro) mesmo se o mesmo Fator de Escala de Decorrelação de Sub-Banda aplicar a todos os bins em uma sub-banda. Tais resoluções, maiores do que a resolução das 30 informações de cadeia lateral, são possíveis porque os deslocamentos de ângulo de fase randomizados podem ser gerados em um decodificador e não precisam ser conhecidos no codificador (este é o caso mesmo se o codi ficador também aplicar um deslocamento de ângulo de fase randomizado no sinal composto mono codificado, uma alternativa que está abaixo descrita). Em outras palavras, não é necessário enviar as informações de cadeia lateral que tenham uma granularidade de bin ou de bloco mesmo se tais técni5 cas de decorrelação empregarem tal granularidade. O decodificador pode empregar, por exemplo, uma ou mais tabelas de consulta de ângulos de fase de bin randomizados, A obtenção de resoluções de tempo e/ou de frequên-
Figure BRPI0508343B1_D0051
Figure BRPI0508343B1_D0052
cia para uma decorrelação maior do que as taxas de informações de cadeia lateral está entre os aspectos da presente invenção. Assim, uma decorrela10 ção por meio de fases randomizadas e executada ou com uma resolução de freqüência fina (bin por bin) que não muda com o tempo (Técnica 2), ou com uma resolução de freqüência bruta (banda por banda) (ou uma resolução de freqüência fina (bin por bin) quando uma interpolação de freqüência é empregada, como abaixo adicionalmente descrito) e uma resolução de tempo „ 15 fina (taxa de blocos) (Técnica 3).
Será também apreciado que conforme graus crescentes de deslocamentos de fase randomizados são adicionados ao ângulo de fase de um canal recuperado, o ângulo de fase absoluto do canal recuperado difere cada vez mais do ângulo de fase absoluto original daquele canal. Um aspecto 20 da presente invenção é a apreciação de que o ângulo de fase absoluto resultante do canal recuperado não precisa coincidir com aquele do canal original quando as condições de sinal são tais que os deslocamentos de fase randomizados são adicionados de acordo com os aspectos da presente invenção. Por exemplo, em casos extremos quando o Fator de Escala de Decor25 relação causa o mais alto grau de deslocamento de fase randomizado, o deslocamento de fase causado pela Técnica 2 ou Técnica 3 domina o deslo camento de fase básico causado pela Técnica 1, No entanto, não é uma preocupação que um deslocamento de fase randomizado seja audivelmente o mesmo conforme as diferentes fases randômicas no sinal original dão ori30 gem a um Fator de Escala de Decorrelação que cause a adição de algum grau de deslocamento de fase randomizado.
Como acima mencionado, os deslocamentos de amplitude ran domizados podem ser empregados além dos deslocamentos de fase randomizados. Por exemplo, o Ajustar Amplitude pode também ser controlado por um Parâmetro de Fator de Escala de Amplitude Randomizada derivado do Fator de Escala de Decorrelação de cadeia lateral recuperada para um canal 5 específico e o Sinalizador de Transiente de cadeia lateral recuperada para o canal específico. Tais deslocamentos de amplitude randomizados podem operar em duas maneiras em um modo análogo à aplicação de deslocamen-
Figure BRPI0508343B1_D0053
tos de fase randomizados. Por exemplo, na ausência de um transiente, um deslocamento de amplitude randomizado que não muda com o tempo pode ser adicionado em uma base de bin por bin (diferente de bin para bin), e, na presença de um transiente (no quadro ou bloco), um deslocamento de amplitude randomizado que muda em uma base de bloco por bloco (diferente de bloco para bloco) e muda de sub-banda para sub-banda (o mesmo deslocamento para todos os bins em uma sub-banda; diferente de sub-banda para , „15 sub-banda). Apesar da quantidade ou grau no qual os deslocamentos de amplitude randomizados são adicionados poder ser controlado pelo Fator de
Escala de Decorrelação, acredita-se que um valor de fator de escala específico deve causar menos deslocamento de amplitude do que o deslocamento de fase randomizado correspondente que resulta do mesmo valor de fator de
Figure BRPI0508343B1_D0054
escala de modo a evitar os artefatos audíveis.
Quando o Sinalizador de Transiente aplica a um quadro, a resolução de tempo com o qual o Sinalizador de Transiente seleciona a Técnica 2 ou a Técnica 3 pode ser melhorada pela provisão de um detector de transiente suplementar no decodificador de modo a prover uma resolução tem25 poral mais fina do que a taxa de quadros ou mesmo a taxa de blocos. Um tal detector de transiente suplementar pode detectar a ocorrência de um transiente no sinal de áudio composto mono ou de múltiplos canais recebido pelo decodificador e tais informações de detecção são então enviadas para cada Decorrelator Controlável (como 38, 42 da figura 2). Então, quando do rece30 bimento de um Sinalizador de Transiente para o seu canal, o Decorrelator Controlável comuta da Técnica 2 para a Técnica 3 quando do recebimento da indicação de detecção de transiente local do decodificador. Assim, um aperfeiçoamento substancial em resolução temporal é possível sem aumentar a taxa de bits de cadeia lateral, no entanto com uma precisão espacial diminuída (o codificador detecta os transientes em cada canal de entrada antes de sua mistura de redução, enquanto que, a detecção no decodifica-
Figure BRPI0508343B1_D0055
dor é feita após a mistura de redução).
Como uma alternativa de enviar as informações de cadeia lateral em uma base de quadro por quadro, as informações de cadeia lateral podem ser atualizadas a cada bloco, pelo menos para os sinais altamente dinâmicos. Como acima mencionado, a atualização do Sinalizador de Transiente e/ou do Sinalizador de Interpolação a cada bloco resulta em somente um pequeno aumento em dados suplementares de cadeia lateral. De modo a executar um tal aumento em resolução temporal para outras informações de cadeia lateral sem substancialmente aumentar a taxa de dados de cadeia lateral, uma disposição de codificação diferencial de ponto flutuante de bloco ’ -15 pode ser utilizada. Por exemplo, blocos de transformada consecutivos podem ser coletados em grupos de seis ao longo de um quadro. As informações de cadeia lateral completas podem ser enviadas para cada canal de
Figure BRPI0508343B1_D0056
sub-banda no primeiro bloco. Nos cinco blocos subseqüentes, somente os valores diferenciais podem ser enviados, cada um a diferença entre a amplitude e o ângulo de bloco atual, e os valores equivalentes do bloco anterior. Isto resulta em uma taxa de dados muito baixa para os sinais estáticos, tais como uma nota de apito. Para os sinais mais dinâmicos, uma maior faixa de valores de diferença é requerida, mas com menor precisão. Assim, para cada grupo de cinco valores diferenciais, um expoente pode ser enviado pri25 meiro, utilizando, por exemplo, 3 bits, então os valores diferenciais são quantizados para, por exemplo, uma precisão de 2 bits. Esta disposição reduz a taxa de dados de cadeia lateral de pior caso média por aproximadamente um fator de dois. Uma redução adicional pode ser obtida pela omissão dos dados de cadeia lateral para um canal de referência (já que estes podem ser derivados de outros canais), como acima discutido, e utilizando, por exemplo, uma codificação aritmética. Alternativamente ou em adição, uma codificação diferencial através da freqüência pode ser empregada enviando, por exemplo, as diferenças em ângulo ou amplitude de sub-banda.
Figure BRPI0508343B1_D0057
Sendo as informações de cadeia lateral enviadas em uma base de quadro por quadro ou mais frequentemente, pode ser útil interpolar os valores de cadeia lateral através dos blocos em um quadro, Uma interpolação linear ao longo do tempo pode ser empregada no modo da interpolação linear através da freqüência, como abaixo descrito.
Uma implementação adequada dos aspectos da presente invenção emprega etapas ou dispositivos de processamento que implementam as respectivas etapas de processamento e estão funcionalmente relacionados como a seguir apresentados. Apesar das etapas de codificação e de decodificação abaixo listadas poderem cada uma ser executada por sequências de instruções de software de computador que operam na ordem das etapas abaixo listadas, será compreendido que resultados equivalentes ou similares podem ser obtidos por etapas ordenadas de outros modos, levando em con . J5 ta que certas quantidades são derivadas de outras anteriores. Por exemplo, sequências de instruções de software de computador multi-encadeadas po-
Figure BRPI0508343B1_D0058
dem ser empregadas de modo que certas sequências de etapas sejam executadas em paralelo. Alternativa mente, as etapas descritas podem ser implementadas como dispositivos que executam as funções descritas, os vá20 rios dispositivos tendo funções e inter-relações funcionais como aqui acima descrito.
CODIFICAÇÃO
O codificador ou função de codificação pode coletar um valor de quadro de dados antes de este derivar as informações de cadeia lateral e 25 misturar em redução os canais de áudio do quadro em um único canal de áudio monofônico (mono) (no modo do exemplo da figura 1, acima descrito), ou em múltiplos canais de áudio (no modo do exemplo da figura 6, abaixo descrito). Fazendo isto, as informações de cadeia lateral podem ser enviadas prímeiramente para um decodificador, permitindo que o decodificador 30 inicie a decodificação imediatamente quando do recebimento das informações de áudio mono ou de múltiplos canais. As etapas de um processo de codificação (etapas de codificação) podem ser descritas como segue. Em relação às etapas de codificação, referência é feita à figura 4, a qual é na natureza de um fluxograma e um diagrama de blocos funcional híbrido. Através da Etapa 419, a figura 4 mostra as etapas de codificação para um canal. As Etapas 420 e 421 aplicam a todos os múltiplos canais que são combina5 dos para proverem uma saída de sinal mono composta ou são colocados em matriz juntos para proverem múltiplos canais, como abaixo descrito em conexão com o exemplo da figura 6.
ETAPA 401. DETECTAR TRANSIENTES
Figure BRPI0508343B1_D0059
a. Executar a detecção de transiente dos valores de PCM em um canal de áudio de entrada.
b. Determinar um Sinalizador de Transiente Verdadeiro de um bit se um transiente estiver presente em qualquer bloco de um quadro para o canal.
COMENTÁRIOS RELATIVOS À ETAPA 401:
-15 O Sinalizador de Transiente forma uma porção das informações de cadeia lateral e é também utilizado na Etapa 411, como abaixo descrito. Uma resolução de transiente mais fina do que a taxa de blocos no decodificador pode aperfeiçoar o desempenho do decodificador. Apesar de que como acima discutido, um Sinalizador de Transiente de taxa de blocos ao invés
Figure BRPI0508343B1_D0060
de taxa de quadros poder executar uma porção das informações de cadeia lateral com um aumento modesto na taxa de bits, um resultado similar, no entanto com uma precisão espacial diminuída, pode ser conseguido sem aumentar a taxa de bits de cadeia lateral pela detecção da ocorrência de transientes no sinal composto mono recebido no decodificador.
Existe um sinalizador de transiente por canal por quadro, o qual, porque este é derivado no domínio de tempo, necessariamente aplica a todas as sub-bandas dentro daquele canal. A detecção de transiente pode ser executada no modo similar àquele empregado em um codificador AC-3 para controlar a decisão de quando comutar entre os blocos de áudio de compri30 mento longo e curto, mas com uma sensibilidade mais alta e com o Sinalizador de Transiente Verdadeiro para qualquer quadro no qual o Sinalizador de Transiente para um bloco é Verdadeiro (um codificador AC-3 detecta os
Figure BRPI0508343B1_D0061
transientes em uma base de bloco). Em particular, ver Seção 8.2.2 do documento A/52A acima citado. A sensibilidade da detecção de transiente descrita na Seção 8.2.2 pode ser aumentada pela adição de um fator de sensibilidade F a uma equação aqui apresentada. A Seção 8.2.2 do documento A/52A está abaixo apresentada, com o fator de sensibilidade adicionado (a Seção 8.2.2 como abaixo reproduzida está corrigida para indicar que o filtro de passagem baixa é um filtro IIR biquad direto de forma II em cascata ao invés de forma I como no documento A/52 A publicado; a Seção 8.2.2 estava correta no documento A/52 anterior). Apesar de não ser crítico, um fator de sensibilidade de 0,2 foi descoberto ser um valor adequado em uma modalidade prática dos aspectos da presente invenção.
Alternativamente, uma técnica de detecção de transiente similar descrita na Patente U.S. Número 5.394.473 pode ser empregada. A patente ‘473 descreve os aspectos do detector de transiente do documento A/52A * J5 em maiores detalhes. Tanto o dito documento A/52A quanto a dita patente '473 estão por meio disto incorporados por referência na sua totalidade.
Como outra alternativa, os transientes podem ser detectados no domínio de freqüência ao invés de no domínio de tempo (ver os Comentários da Etapa 408). Neste caso, a Etapa 401 pode ser omitida e uma etapa alter-
Figure BRPI0508343B1_D0062
nativa empregada no domínio de freqüência como abaixo descrito.
ETAPA 402. JANELA E DFT.
Multiplicar os blocos sobrepostos de amostras de tempo de PCM por uma janela de tempo e convertê-los em valores de freqüência complexos através de uma DFT como implementado por uma FFT.
ETAPA 403. CONVERTER OS VALORES COMPLEXOS EM MAGNITUDE E ÂNGULO.
Converter cada valor de bin de transformada complexo de domínio de freqüência (a +/b) em uma representação de magnitude e ângulo utilizando as manipulações complexas padrão:
a. Magnitude = square_root (a2 + b2)
b. Ângulo - arctan (b/a)
COMENTÁRIOS RELATIVOS À ETAPA 403:
Algumas das Etapas seguintes utilizam ou podem utilizar, como uma alternativa, a energia de um bin, definida como a magnitude acima ao quadrado (isto é, energia = (a2 + b2)).
ETAPA 404. CALCULAR A ENERGIA DE SUB-BANDA.
a. Calcular a energia de sub-banda por bloco pela adição de valores de energia de bin dentro de cada sub-banda (um
Figure BRPI0508343B1_D0063
somatório através da freqüência).
b. Calcular a energia de sub-banda por quadro calculando a média ou acumulando a energia em todos os blocos em um quadro (uma média/acumulação através do tempo).
c. Se a freqüência de acoplamento do codificador estiver abaixo de aproximadamente 1000 Hz, aplicar a energia de média calculada por quadro ou acumulada por quadro de sub-banda a um suavizador de tempo que opera sobre to, 15 das as sub-bandas abaixo daquela freqüência e acima da freqüência de acoplamento.
COMENTÁRIOS RELATIVOS À ETAPA 404c:
Figure BRPI0508343B1_D0064
A suavização de tempo para prover uma suavização interquadros nas sub-bandas de baixa freqüência pode ser útil. De modo a evitar as 20 descontinuidades que causam artefatos entre os valores de bin nos limites de sub-banda, pode ser útil aplicar uma suavização de tempo progressivamente decrescente da sub-banda de freqüência mais baixa abrangendo e acima da freqüência de acoplamento (onde a suavização pode ter um efeito significativo) acima através de uma sub-banda de freqüência mais alta na 25 qual o efeito de suavização de tempo é mensurável, mas inaudível, apesar de quase audível. Uma constante de tempo adequada para a sub-banda de faixa de freqüência mais baixa (onde a sub-banda é um único bin se as subbandas forem bandas criticas) pode estar na faixa de 50 a 100 milissegundos, por exemplo. A suavização de tempo progressivamente decrescente 30 pode continuar até uma sub-banda que abranja aproximadamente 1000 Hz onde a constante de tempo pode ser de aproximadamente 10 milissegundos, por exemplo.
Apesar de um suavizador de primeira ordem ser adequado, o suavizador pode ser um suavizador de dois estágios que tem uma constante de tempo variável que encurta o seu tempo de ataque e de decaimento em resposta a um transiente (um tal suavizador de dois estágios pode ser um equivalente digital dos suavizadores de dois estágios analógicos descritos nas Patentes U.S. Números 3.846.719 e 4.922.535, cada uma das quais está por meio disto incorporada por referência na sua totalidade). Em outras palavras, a constante de tempo de estado estável pode ser escalada de acordo com a frequência e pode também ser variável em resposta a transientes. Alternativa mente, tal suavização pode ser aplicada na Etapa 412.
ETAPA 405. CALCULAR A SOMA DE MAGNITUDES DE BIN.
a. Calcular a soma por bloco das magnitudes de bin (Etapa 403) de cada sub-banda (um somatório através da frequência).
b. Calcular a soma por quadro das magnitudes de bin de cada sub-banda calculando a média ou acumulando as magnitudes da Etapa 405a através dos blocos em um quadro (uma média / acumulação através do tempo). Estas somas são utilizadas para calcular um Fator de Consistência de Ângulo Intercanais na Etapa 410 abaixo.
c. Se a frequência de acoplamento do codificador estiver abaixo de aproximadamente 1000 Hz, aplicar as magnitudes de média por quadro ou acumulada por quadro de subbanda a um suavizador de tempo que opera sobre todas as sub-bandas abaixo daquela frequência e acima da freqüência de acoplamento.
COMENTÁRIOS RELATIVOS À ETAPA 405c:
Ver os comentários relativos à Etapa 404c exceto que no caso da Etapa 405c, a suavização de tempo pode ser alternativamente executada como parte da Etapa 410.
ETAPA 406. CALCULAR O ÂNGULO DE FASE DE BIN INTERCANAIS RELATIVO.
Figure BRPI0508343B1_D0065
calcular ο ângulo de fase íntercanaís relativo de cada bin de transformada de cada bloco pela subtração do ângulo de bin da Etapa 403 o ângulo de bin correspondente de um canal de referência (por exemplo, o primeiro canal). O resultado, como com outras adições e subtrações de ân~ ’ 5 guio aqui, é tomado como radianos de módulo (π, -π) adicionando ou subtraindo 2π até que o resultado esteja dentro da faixa desejada de -π até +π.
ETAPA 407. CALCULAR O ÂNGULO DE FASE DE SUB-BANDA INTERCANAIS.
Figure BRPI0508343B1_D0066
Para cada canal, calcular um ângulo de fase intercanais de média ponderada de amplitude de taxa de quadro para todas as sub-bandas como segue:
a. Para cada bin, construir um número complexo da magnitude da Etapa 403 e do ângulo de fase de bin intercanais relativo da Etapa 406.
b. Adicionar os números complexos construídos da Etapa 407a através de cada sub-banda (um somatório através da frequência).
COMENTÁRIOS RELATIVOS À ETAPA 407b:
Figure BRPI0508343B1_D0067
Por exemplo, se uma sub-banda tiver dois bins e um dos bins 20 tem um valor complexo de 1 + j1 e outro bin tem um valor complexo de 2 + j2, a sua soma complexa é 3 + j3.
c. Calcular a média ou acumular a soma de números complexos por bloco para cada sub-banda da Etapa 407b através dos blocos de cada quadro (uma média ou acumulação a- través do tempo).
d. Se a frequência de acoplamento do codificador estiver abaixo de aproximadamente 1000 Hz, aplicar o valor complexo de média por quadro ou acumulado por quadro de sub-banda a um suavizador de tempo que opera sobre to30 das as sub-bandas abaixo daquela frequência e acima da frequência de acoplamento.
COMENTÁRIOS RELATIVOS À ETAPA 407d:
Figure BRPI0508343B1_D0068
Ver os comentários relativos à Etapa 404c exceto que no caso da Etapa 407d, a suavização de tempo pode ser alternativamente executada como parte das Etapas 407e ou 410.
e. Computar a magnitude do resultado complexo da Etapa
407d como pela Etapa 403.
COMENTÁRIOS RELATIVOS À ETAPA 407e:
Esta magnitude é utilizada na Etapa 410a abaixo. No exemplo simples dado na etapa 407b, a magnitude de 3 + j3 é square_raot (9 + 9) =
f. Computar o ângulo do resultado complexo como pela Etapa 403.
COMENTÁRIOS RELATIVOS À ETAPA 407f:
No exemplo simples dado na Etapa 407b, o ângulo de 3 + j3 é arctan (3/3) = 45 graus = π/4 radianos. Este ângulo de sub-banda é suaviza„15 do em tempo dependentemente de sinal (ver Etapa 413) e quantizado (ver Etapa 414) para gerar as informações de cadeia lateral de Parâmetro de Controle de Ângulo de Sub-Banda, como abaixo descrito.
ETAPA 408: CALCULAR O FATOR DE ESTABILIDADE ESPECTRAL DE BIN.
Figure BRPI0508343B1_D0069
Para cada bin, calcular um Fator de Estabilidade Espectral de
Bin na faixa de 0 a 1 como segue:
a. Fazer xm = magnitude de bin do bloco presente calculada na Etapa 403.
b. Fazer ym = correspondendo à magnitude de bin do bloco anterior.
c. Se xm > ym, então Fator de Amplitude Dinâmica de Bin = (Ym/Xm) ;
d. Ou então se ym > xm, então Fator de Amplitude Dinâmica de Bin = (xm / ym)2;
e. Ou então se ym = xm, então Fator de Estabilidade Espectral de Bin = 1.
COMENTÁRIOS RELATIVOS À ETAPA 408:
Estabilidade espectral é uma medida da extensão na qual os componentes espectrais (por exemplo, os coeficientes espectrais ou valores de bin) mudam ao longo do tempo. Um Fator de Estabilidade Espectral de Bin de 1 indica nenhuma mudança ao longo de um dado período de tempo.
A Estabilidade Espectral pode também ser tomada como um indicador sobre se um transiente está presente. Um transiente pode causar um súbito aumento e queda em amplitude espectral (bin) ao longo de um período de tempo de um ou mais blocos, dependendo de sua posição em
Figure BRPI0508343B1_D0070
relação aos blocos e seus limites. Consequentemente, uma mudança no
Fator de Estabilidade Espectral de Bin de um alto valor para um baixo valor ao longo de um pequeno número de blocos pode ser tomada como uma indicação da presença de um transiente no bloco ou blocos que tem o valor mais baixo. Uma confirmação adicional da presença de um transiente, ou uma alternativa ao emprego do Fator de Estabilidade Espectral de Bin, é * * 15 observar os ângulos de fase de bins dentro do bloco (por exemplo, no resultado de ângulo de fase da Etapa 403). Como um transiente é provável ocupar uma única posição temporal dentro de um bloco e ter a energia dominante no bloco, a existência e a posição de um transiente podem ser indicadas por um atraso de fase substancialmente uniforme de bin para bin no bloco -
Figure BRPI0508343B1_D0071
a saber, uma rampa substancialmente linear de ângulos de fase como uma função da freqüência. Ainda uma confirmação adicional ou alternativa é observar as amplitudes de bin ao longo de um pequeno número de blocos (por exemplo, no resultado de magnitude da Etapa 403), a saber procurando diretamente por um súbito aumento e queda do nível espectral.
Alternativamente, a Etapa 408 pode observar três blocos consecutivos ao invés de um bloco. Se a freqüência de acoplamento do codificador estiver abaixo de aproximadamente 1000 Hz, a Etapa 408 pode observar mais de três blocos consecutivos. O número de blocos consecutivos pode levar em consideração variar com a freqüência de modo que o número gra30 dualmente aumenta conforme a faixa de freqüência de sub-banda diminui.
Se o Fator de Estabilidade Espectral de Bin for obtido de mais do que um bloco, a detecção de um transiente, como há pouco descrito, pode ser de terminada por etapas separadas que respondem somente ao número de blocos úteis para detectar os transientes.
Como uma alternativa adicional, as energias de bin podem ser utilizadas ao invés de magnitudes de bin.
Como ainda uma alternativa adicional, a Etapa 408 pode empregar uma técnica de detecção de decisão de evento como abaixo descrito nos comentários após a Etapa 409.
ETAPA 409. COMPUTAR O FATOR DE ESTABILIDADE ESPECTRAL DE
Figure BRPI0508343B1_D0072
SUB-BANDA.
Computar um Fator de Estabilidade Espectral de Sub-Banda de taxa de quadro em uma escala de 0 a 1 pela formação de uma média ponderada em amplitude do Fator de Estabilidade Espectral de Bin dentro de cada sub-banda através dos blocos em um quadro como segue:
Figure BRPI0508343B1_D0073
a. Para cada bin, calcular o produto do Fator de Estabilidade Espectral de Bin da Etapa 408 e a magnitude de bin da Etapa 403.
b. Somar os produtos dentro de cada sub-banda (um somatório através da freqüência).
c. Calcular a média ou acumular o somatório da Etapa 409b em todos os blocos em um quadro (uma média / acumulação através do tempo).
d. Se a freqüência de acoplamento do codificador estiver abaixo de aproximadamente 1000 Hz, aplicar o somatório de média por quadro ou acumulado por quadro a um suavizador de tempo que opera sobre todas as sub-bandas abaixo daquela freqüência e acima da freqüência de acoplamento.
COMENTÁRIOS RELATIVOS À ETAPA 409d:
Ver os comentários relativos à Etapa 404c exceto que no caso da Etapa 409d, não existe uma etapa subsequente adequada na qual a sua30 vização de tempo possa ser alternativamente executada.
e. Dividir os resultados da Etapa 409c ou da Etapa 409d, con- forme apropriado, pela soma das magnitudes de bin (Etapa
403) dentro da sub-banda.
COMENTÁRIOS RELATIVOS À ETAPA 409e:
Figure BRPI0508343B1_D0074
A multiplicação pela magnitude na Etapa 409a e a divisão pela soma das magnitudes na Etapa 409e proveem a ponderação de amplitude. O resultado da Etapa 408 é independente da amplitude absoluta e, se não ponderada em amplitude, pode fazer com que o resultado da Etapa 409 seja controlado por amplitudes muito pequenas, o que é indesejável.
f. Escalar o resultado para obter o Fator de Estabilidade Espectral de Sub-Banda pelo mapeamento da faixa de {0,5 ... 1} a {0 ... 1}. Isto pode ser feito pela multiplicação do resultado por 2, subtraindo 1, e limitando os resultados menores que 0 a um valor de 0.
COMENTÁRIOS RELATIVOS À ETAPA 409f
A Etapa 409f pode ser útil em assegurar que um canal de ruído .15 resulte em um Fator de Estabilidade Espectral de Sub-Banda de zero.
COMENTÁRIOS RELATIVOS ÀS ETAPAS 408 e 409
Figure BRPI0508343B1_D0075
O objetivo das Etapas 408 e 409 é de medir a estabilidade espectral - mudanças na composição espectral ao longo do tempo em uma sub-banda de um cana). Altemativamente, os aspectos de uma detecção de 20 decisão de evento tal como descrita na Publicação Internacional Número WO 02/097792 A1 (designando os Estados Unidos) podem ser empregados para medir a estabilidade espectral ao invés da proposta há pouco descrita em conexão com as Etapas 408 e 409. O Pedido de Patente U.S. S.N.
10/478.538, requerido em 20 de Novembro de 2003, é o pedido nacional dos 25 Estados Unidos do Pedido PCT WO 02/097792 A1 publicado. Tanto o Pedido PCT publicado quando o Pedido U.S. estão por meio disto incorporados por referência na sua totalidade. De acordo com estes pedidos incorporados, as magnitudes do coeficiente de FFT complexa de cada bin são calculadas e normalizadas (a maior magnitude é determinada para um valor de um, por 30 exemplo). Então as magnitudes dos bins correspondentes (em dB) nos blocos consecutivos são subtraídas (ignorando os sinais), as diferenças entre os bins são somadas, e, se a soma exceder um limite, o limite de bloco é considerado ser um limite de evento auditório.. Alternativamente, as mudanças em amplitude de bloco para bloco podem também ser consideradas juntamente com as mudanças de magnitude espectral (observando a quantidade de normalização requerida).
Se os aspectos dos pedidos de detecção de eventos incorporados forem empregados para medir a estabilidade espectral, a normalização pode não ser requerida e as mudanças em magnitude espectral (as mudanças em amplitude não seriam medidas se a normalização for omitida) de pre-
Figure BRPI0508343B1_D0076
ferência são consideradas em uma base de sub-banda. Ao invés de executar a Etapa 408 como acima indicado, as diferenças de decibéis em magnitude espectral entre os bins correspondentes em cada sub-banda podem ser somadas de acordo com os ensinamentos dos ditos pedidos. Então, cada uma destas somas, que representam o grau de mudança espectral de bloco para bloco podem ser escaladas de modo que o resultado seja um fator de 15 estabilidade espectral que tem uma faixa de 0 a 1, em que um valor de 1 indica a estabilidade mais alta, uma mudança de 0 dB de bloco para bloco para um dado bin. Um valor de 0, que indica a estabilidade mais baixa, pode
Figure BRPI0508343B1_D0077
ser atribuído a mudanças de decibéis iguais a ou maiores do que uma quantidade adequada, tal como 12 dB, por exemplo. Estes resultados, um Fator 20 de Estabilidade Espectral de Bin, podem ser utilizados pela Etapa 409 no mesmo modo que a Etapa 409 utiliza os resultados da Etapa 408 como acima descrito. Quando a Etapa 409 recebe um Fator de Estabilidade Espectral de Bin obtido pelo emprego da técnica de detecção de decisão de evento alternativa há pouco descrita, o Fator de Estabilidade Espectral de Sub25 Banda da Etapa 409 pode também ser utilizado como um indicador de um transiente. Por exemplo, se a faixa de valores produzidos pela Etapa 409 for de 0 a 1, um transiente pode ser considerado estar presente quando o Fator de Estabilidade Espectral de Sub-Banda for um valor pequeno, tal como, por exemplo, 0,1, indicando uma instabilidade espectral substancial.
Será apreciado que o Fator de Estabilidade Espectral de Bin produzido pela Etapa 408 e pela alternativa há pouco descrita alternativa à Etapa 408 cada um inerentemente provê um limite variável até um certo grau pelo fato de que estes estão baseados em mudanças relativas de bloco para bloco. Opcionalmente, pode ser útil suplementar cada inerência especificamente provendo um deslocamento no limite em resposta a, por exemplo, múltiplos transientes em um quadro ou um grande transiente entre transien5 tes menores (por exemplo, um transiente alto vindo sobre um aplauso de nível médio ou baixo). No caso do último exemplo, um detector de eventos
Figure BRPI0508343B1_D0078
pode inicialmente identificar cada palma como um evento, mas um transiente alto (por exemplo, uma batida de tambor) pode tornar desejável deslocar o limite de modo que somente a batida de tambor seja identificada como um evento.
Alternativamente, uma métrica de randomicidade pode ser empregada (por exemplo, como descrito na Patente U.S. Re 36.714, a qual está por meio disto incorporada por referência na sua totalidade) ao invés de uma medida de estabilidade espectral ao longo do tempo.
- ,15 ETAPA 410. CALCULAR O FATOR DE CONSISTÊNCIA DE ÂNGULO INTERCANAIS
Figure BRPI0508343B1_D0079
Para cada sub-banda que tem mais de um bin, calcular um Fator de Consistência de Ângulo de Intercanais de taxa de quadro como segue:
a. Dividir a magnitude da soma complexa da Etapa 407e pela soma das magnitudes da Etapa 405. O Fator de Consistência de Ângulo bruto resultante é um número na faixa de 0 a 1.
b. Calcular um fator de correção: fazer n = o número de valores através da sub-banda que contribuem para as duas quantidades na etapa acima (em outras palavras, n é o número de bins na sub-banda). Se n for menor do que 2, fazer o Fator de Consistência de Ângulo ser 1 e ir para as Etapas 411 e 413.
c. Fazer r = Variação Randômica Esperada = 1/n. Subtrair r do resultado da Etapa 410b.
d. Normalizar o resultado da Etapa 410c dividindo por (1 - r). O resultado tem um valor máximo de 1. Limitar o valor mí nimo a 0 conforme necessário.
COMENTÁRIOS RELATIVOS À ETAPA 410
A Consistência de Ângulo Intercanais é uma medida de quão similares os ângulos de fase intercanais são dentro de uma sub-banda ao 5 longo de um período de quadro. Se todos os ângulos intercanais de bin da sub-banda forem os mesmos, o Fator de Consistência de Ângulo Intercanais é 1,0; enquanto que, se os ângulos intercanais forem randomicamente distri-
Figure BRPI0508343B1_D0080
Figure BRPI0508343B1_D0081
buídos, o valor aproxima-se de zero.
O Fator de Consistência de Ângulo de Sub-Banda indica se exis10 te uma imagem fantasma entre os canais. Se a consistência for baixa, então é desejável decorrelacionar os canais. Um alto valor indica uma imagem fundida. A fusão de imagem é independente de outras características de sinal.
Será notado que o Fator de Consistência de Ângulo de Sub, 15 Banda, apesar de ser um parâmetro de ângulo, é determinado indiretamente de duas magnitudes. Se os ângulos intercanais forem todos os mesmos, a adição dos valores complexos e então tomar a magnitude gera o mesmo resultado que tomando todas as magnitudes e adicionando-as, de modo que o quociente seja 1. Se os ângulos intercanais forem distribuídos, a adição 20 dos valores complexos (tal como adicionando vetores que tem diferentes ângulos) resulta em um cancelamento pelo menos parcial, de modo que a magnitude da soma seja menor do que a soma das magnitudes, e o quociente seja menor do que 1.
A seguir está um exemplo simples de uma sub-banda que tem dois bins:
Suponha que os dois valores de bin complexos sejam (3 + j4) e (6 + j8). (O mesmo ângulo em cada caso: ângulo = arctan (imaginário / real), de modo que ângulol = arctan (4/3) e ângulo2 = arctan (8/6) = arctan (4/3)). Adicionar os valores complexos, soma = (9 + j12), a magnitude da qual é 30 square_root (81 + 144) -15.
A soma das magnitudes é a magnitude de (3 + j4) + magnitude de (6 + j8) = 5 + 10 = 15. O quociente é portanto 5/15 = 1 = consistência (an47 tes da normalização 1/n, seria também 1 após a normalização) (Consistência normalizada = (1 - 0,5) / (1 - 0,5) = 1,0).
Figure BRPI0508343B1_D0082
Se um dos bins acima tiver um ângulo diferente, digamos que o segundo tem um valor complexo de (6 - j8), o qual tem a mesma magnitude, 10. A soma complexa é agora (9 - j4), a qual tem uma magnitude de squarejroot (81 + 16) = 9,85, de modo o quociente é 9,85 / 15 = 0,66 = consistência (antes da normalização). Para normalizar, subtrair 1/n = 1/2, e dividir por (1 - 1/n) (consistência normalizada = (0,66 - 0,5) / (1 - 0,5) = 0,32).
Apesar da técnica acima descrita para determinar um Fator de Consistência de Ângulo de Sub-Banda ter sido considerada útil, a sua utilização não é crítica. Outras técnicas adequadas podem ser empregadas. Por exemplo, pode-se calcular um desvio padrão de ângulos utilizando as fórmulas padrão. Em qualquer caso, é desejável empregar uma ponderação de amplitude para minimizar o efeito de pequenos sinais sobre o valor de con.15 sistência calculado.
Além disso, uma derivação alternativa do Fator de Consistência de Ângulo de Sub-Banda pode utilizar a energia (os quadrados das magnitudes) ao invés da magnitude. Isto pode ser executado elevando ao quadrado a magnitude da Etapa 403 antes desta ser aplicada nas Etapas 405 e 407.
ETAPA 411. DERIVAR O FATOR DE ESCALA DE DECORRELAÇÃO DE
SUB-BANDA
Derivar um Fator de Escala de Decorrelação de taxa de quadro para cada sub-banda como segue:
a. Fazer x = Fator de Estabilidade Espectral de taxa de qua- dro da Etapa 409f.
b. Fazer y = Fator de Consistência de Ângulo de taxa de quadro da Etapa 41 Oe.
c. Então o Fator de Escala de Decorrelação de Sub-Banda (1 - x) * (1 - y), um número entre 0 e 1.
COMENTÁRIOS RELATIVOS À ETAPA 411
O Fator de Escala de Decorrelação de Sub-Banda é uma função da estabilidade espectral de características de sinal ao longo do tempo em uma sub-banda de um canal (o Fator de Estabilidade Espectral) e a consistência na mesma sub-banda de um canal de ângulos de bin em relação aos bins correspondentes de um canal de referência (o Fator de Consistência de Ângulo Intercanais). O Fator de Escala de Decorrelação de Sub-Banda é alto 5 somente se tanto o Fator de Estabilidade Espectral quanto o Fator de Consistência de Ângulo Intercanais forem baixos.
Como acima explicado, o Fator de Escala de Decorrelação controla o grau de decorrelação de envelope provida no decodificador. Os sinais
Figure BRPI0508343B1_D0083
que exibem a estabilidade espectral ao longo do tempo de preferência não devem ser decorrelacionados pela alteração de seus envelopes, independentemente do que está acontecendo em outros canais, já que pode resultar em artefatos audíveis, a saber ondulação ou trinado do sinal.
ETAPA 412. DERIVAR OS FATORES DE ESCALA DE AMPLITUDE DE
SUB-BANDA .15 Dos valores de energia de quadro de sub-banda da Etapa 404 e dos valores de energia de quadro de sub-banda de todos os outros canais (que podem ser obtidos por uma etapa que corresponda à Etapa 404 ou uma sua equivalente), derivar os Fatores de Escala de Amplitude de SubBanda como segue:
Figure BRPI0508343B1_D0084
a. Para cada sub-banda, somar os valores de energia por quadro através de todos os canais de entrada.
b. Dividir cada valor de energia de sub-banda por quadro, (da Etapa 404) pela soma dos valores de energia através de todos os canais de entrada (da Etapa 412a) para criar valores na faixa de 0 a 1.
c. Converter cada razão para dB, na faixa de -oo a 0.
d. Dividir pela granularidade de fator de escala, a qual pode ser determinada em 1,5 dB, por exemplo, mudar o sinal para gerar um valor não negativo, limitar a um valor máximo o qual pode ser, por exemplo, 31 (isto é, uma precisão de 5 bits) e arredondar para o inteiro mais próximo para criar o valor quantízado. Estes valores são os Fatores de Escala de Amplitude de Sub-Banda e sao transportados como par-
Figure BRPI0508343B1_D0085
te das informações de cadeia lateral.
e. Se a freqüência de acoplamento do codificador estiver abaixo de 1000 Hz, aplicar as magnitudes de média por quadro ou acumuladas por quadro de sub-banda para um tempo mais suave que opere em todas as sub-bandas abaixo daquela freqüência e acima da freqüência de acoplamento.
COMENTÁRIOS RELATIVOS À ETAPA 412e
Ver os comentários relativos à Etapa 404c exceto que no caso da Etapa 412e, não existe uma etapa subseqüente adequada na qual a suavização de tempo possa ser alternativamente executada.
COMENTÁRIOS PARA A ETAPA 412
Apesar da granularidade (resolução) e da precisão de quantização aqui indicadas foram consideradas serem úteis, estas não são críticas e outros valores podem prover resultados aceitáveis.
Alternativamente, pode-se utilizar a amplitude ao invés de energia para gerar os Fatores de Escala de Amplitude de Sub-Banda. Se utilizando a amplitude, usaria-se dB = 20*log(razão de amplitude), ou então se utilizando a energia, converte-se para dB através de dB = 10*log(razão de energia), onde razão de energia = raiz quadrada (razão de energia).
ETAPA 413. SUAVIZAR NO TEMPO DEPENDENTEMENTE DE SINAL OS ÂNGULOS DE FASE DE SUB-BANDA INTERCANAIS
Aplicar uma suavização temporal dependente de sinal nos ângulos intercanais de taxa de quadro de sub-banda derivados na Etapa 407f:
a. Fazer v = Fator de Estabilidade Espectral de Sub-Banda da Etapa 409d.
b. Fazer w = Fator de Consistência de Ângulo correspondente da Etapa 41 Oe.
c. Fazer x = (1 - v) * w. Este é um valor entre 0 e 1, o qual é alto se o Fator de Estabilidade Espectral for baixo e o Fator de Consistência de Ângulo for alto.
Figure BRPI0508343B1_D0086
d. Fazer y ~ 1 - x. y é alto se o Fator de Estabilidade Espectral for alto e o Fator de Consistência de Ângulo for baixo.
e. Fazer z = yexp, onde exp é uma constante, a qual pode ser = 0,1. z está também na faixa de 0 a 1, mas inclinado na direção de 1, que corresponde a uma constante de tempo lenta.
f. Se o Sinalizador de Transiente (Etapa 401) para o canal estiver determinado, determinar z = 0, que corresponde a uma constante de tempo rápida na presença de um transiente.
g. Computar íím, um valor de Z máximo permissível, lim = 1 (0,1 * w). Este varia de 0,9 se o Fator de Consistência de Ângulo for alto para 0,1 se o Fator de Consistência de Ângulo for baixo (0).
h. Limitar z por lim conforme necessário: se (z > lim) então z = lim.
i. Suavizar o ângulo de sub-banda da Etapa 407 utilizando o valor de z e um valor de ângulo suavizado operante mantido para cada sub-banda. Se A ~ ângulo da Etapa 407f e RSA = valor de ângulo suavizado operante como do bloco anterior, e NewRSA é o novo valor do ângulo suavizado operante, então: NewRSA = RSA * z + a * (1 - z). O valor de RSA é subseqüentemente determinado igual a NewRSA antes de processar o bloco seguinte. NewRSA é a saída de ângulo suavizado no tempo dependentemente de sinal da Etapa 413.
COMENTÁRIOS RELATIVOS À ETAPA 413
Quando um transiente é detectado, a constante de tempo de atualização de ângulo de sub-banda é ajustada para 0, permitindo uma rápi30 da mudança de ângulo de sub-banda. Isto é desejável porque permite que o mecanismo de atualização de ângulo normal utilize uma faixa de constantes de tempo relativamente lentas, minimizando a flutuação de imagem durante os sinais estáticos ou quase estáticos, no entanto os sinais que mudam rapidamente são tratados com constantes de tempo rápidas.
Apesar de outras técnicas e parâmetros de suavização poderem ser utilizáveis, um suavizador de primeira ordem que implementa a Etapa 5 413 foi considerado ser adequado. Se implementada como um suavizador de primeira ordem / filtro de passagem baixa, a variável z corresponde ao coeficiente de alimentação direta (algumas vezes denotado ffO), enquanto que (1 - z) corresponde ao coeficiente de retorno (algumas vezes denotado
Figure BRPI0508343B1_D0087
fb1).
ETAPA 414. QUANTIZAR OS ÂNGULOS DE FASE DE SUB-BANDA INTERCANAIS SUAVIZADOS
Quantizar os ângulos intercanais de sub-banda suavizados no tempo derivados na Etapa 413i para obter o Parâmetro de Controle de Ângulo de Sub-Banda:
a. Se o valor for menor do que 0, adicionar 2π, de modo que todos os valores de ângulo a serem quantizados estão na faixa de 0 a 2π.
Figure BRPI0508343B1_D0088
b. Dividir pela granularidade (resolução) de ângulo, a qual pode ser 2π / 64 radianos, e arredondar para um inteiro. O va20 lor máximo pode ser ajustado em 63, que corresponde a uma quantização de 6 bits.
COMENTÁRIOS RELATIVOS À ETAPA 414
O valor quantizado é tratado como um inteiro não negativo, de modo que uma maneira fácil de quantizar o ângulo é mapeá-lo para um nú25 mero de ponto flutuante não negativo (adicionar 2π se menor do que 0, tornando a faixa 0 a (menos do que) 2π), escalar pela granularidade (resolução), e arredondar para um inteiro. Similarmente, dequantizar aquele inteiro (o que podería de outro modo ser feito com uma simples tabela de consulta), pode ser executado escalando pelo inverso do fator de granularidade de ân30 guio, converter um inteiro não negativo em um ângulo de ponto flutuante não negativo (novamente, uma faixa de 0 a 2π), após o que este pode ser renormalizado para a faixa de ± π para utilização adicional. Apesar de uma tal quantização do Parâmetro de Controle de Ângulo de Sub-Banda foi considerada ser útil, uma tal quantização não é crítica e outras quantizaçoes podem prover resultados aceitáveis.
ETAPA 415. QUANTIZAR OS FATORES DÊ ESCALA DE DECORRELA5 ÇÃO DE SUB-BANDA
Quantizar os Fatores de Escala de Decorrelação de Sub-Banda produzidos pela Etapa 411 para, por exemplo, 8 níveis (3 bits) multiplicando por 7,49 e arredondando para o inteiro mais próximo. Estes valores quanti-
Figure BRPI0508343B1_D0089
zados são parte das informações de cadeia lateral.
COMENTÁRIOS REFERENTES À ETAPA 415
Apesar de uma tal quantização dos Fatores de Escala de Decorrelação de Sub-Banda ter sido considerada útil, a quantização utilizando os valores de exemplo não é crítica e outras quantizaçoes podem prover resultados aceitáveis.
J6 ETAPA 416. DEQUANTIZAR OS PARÂMETROS DE CONTROLE DE ÂNGULO DE SUB-BANDA
Dequantizar os Parâmetros de Controle de Ângulo de SubBanda (ver Etapa 414), para utilizar antes da mistura de redução.
COMENTÁRIOS REFERENTES À ETAPA 416
Figure BRPI0508343B1_D0090
A utilização de valores quantizados no codificador ajuda a manter a sincronia entre o codificador e o decodificador.
ETAPA 417. DISTRIBUIR OS PARÂMETROS DE CONTROLE DE ÂNGULO DE SUB-BANDA DEQUANTIZADOS DE TAXA DE QUADRO ATRAVÉS DE BLOCOS
Na preparação para a mistura de redução, distribuir os Parâmetros de Controle de Ângulo de Sub-Banda da Etapa 416 dequantizados uma vez por quadro através do tempo para as sub-bandas de cada bloco dentro do quadro.
COMENTÁRIOS REFERENTES À ETAPA 417
O mesmo valor de quadro pode ser atribuído a cada bloco no quadro. Alternativamente pode ser útil interpolar os valores de Parâmetro de Controle de Ângulo de Sub-Banda através dos blocos em um quadro. Uma interpolação linear ao longo do tempo pode ser empregada no modo da interpolação linear através da freqüência, como abaixo descrito.
ETAPA 418. INTERPOLAR OS PARÂMETROS DE CONTROLE DE ÂNGULO DE SUB-BANDA DE BLOCO PARA BINS
Distribuir os Parâmetros de Controle de Ângulo de Sub-Banda de bloco da Etapa 417 para cada canal através da freqüência para bins, de preferência utilizando uma interpolação linear como abaixo descrito, COMENTÁRIOS REFERENTES À ETAPA 418
Se uma interpolação linear através da freqüência for empregada, a Etapa 418 minimiza as mudanças de ângulo de fase de bin para bin através de um limite de sub-banda, por meio disto minimizando os artefatos de valor indesejável, tal interpolação linear pode ser habilitada, por exemplo, como abaixo descrito após a descrição da Etapa 422. Os ângulos de subbanda são calculados independentemente uns dos outros, cada um repreJ5 sentando uma média através de uma sub-banda. Assim, pode existir uma grande mudança de uma sub-banda para a seguinte. Se o valor de ângulo líquido para uma sub-banda for aplicado a todos os bins na sub-banda (uma distribuição de sub-banda retangular), uma mudança de fase inteira de uma sub-banda para uma sub-banda vizinha ocorre entre dois bins. Se exis20 tir um forte componente de sinal aqui, pode existir um valor indesejável severo, possivelmente audível. A interpolação linear entre os centros de cada sub-banda, por exemplo, espalha a mudança de ângulo de fase sobre todos os bins na sub-banda, minimizando a mudança entre qualquer par de bins, de modo que, por exemplo, o ângulo da extremidade inferior de uma sub25 banda coincide com o ângulo na extremidade mais alta da sub-banda abaixo deste, enquanto mantendo a média total a mesma como o dado ângulo de sub-banda calculado. Em outras palavras, ao invés de distribuições de subbanda retangulares, a distribuição de ângulo de sub-banda pode ser trapezoidalmente formada.
Por exemplo, suponha que a sub-banda acoplada mais baixa tenha um bin e um ângulo de sub-banda de 20 graus, a próxima sub-banda tem três bins e um ângulo de sub-banda de 40 graus, e a terceira sub-banda tem cinco bins e um ângulo de sub-banda de 100 graus. Sem nenhuma interpolação, assuma que o primeiro bin (uma sub-banda) é deslocado por um ângulo de 20 graus, os próximos três bins (outra sub-banda) são deslocados por um ângulo de 40 graus e os próximos cinco bins (uma sub-banda adicio5 nal) são deslocados por um ângulo de 100 graus. Neste exemplo, existe uma mudança máxima de 60 graus, do bin 4 para o bin 5. Com a interpolação linear, o primeiro bin é ainda deslocado por um ângulo de 20 graus, os próximos 3 bins são deslocados por aproximadamente 30, 40, e 50 graus; e
Figure BRPI0508343B1_D0091
os próximos cinco bins são deslocados por aproximadamente 67, 83, 100,
117, e 133 graus. O deslocamento de ângulo de sub-banda médio é o mesmo, mas a mudança de bin para bin máxima é reduzida para 17 graus.
Opcionalmente, as mudanças em amplitude de sub-banda para sub-banda em conexão com esta e outras etapas aqui descritas, tal como a
Etapa 417 podem também ser tratadas em um modo interpolativo similar. No
J5 entanto, pode não ser necessário fazer isto porque tende a existir uma continuidade mais natural em amplitude de uma sub-banda para a seguinte.
ETAPA 419. APLICAR UMA ROTAÇÃO DE ÂNGULO DE FASE PARA OS
VALORES DE TRANSFORMADA DE BIN PARA UM CANAL
Aplicar uma rotação de ângulo de fase em cada valor de trans-
Figure BRPI0508343B1_D0092
formada de bin como segue:
a. Fazer x = ângulo de bin para este bin como calculado na Etapa 418.
b. Fazer y = -x;
c. Computar z, um fator de escala de rotação de fase complexa de magnitude unitária com o ângulo y, z = cos (y) + j sen (y)-
d. Multiplicar o valor bin (a + jb) por z.
COMENTÁRIOS REFERENTES À ETAPA 419
A rotação de ângulo de fase aplicada no codificador é o inverso 30 do ângulo derivado do Parâmetro de Controle de Ângulo de Sub-Banda.
Os ajustes de ângulo de fase, como aqui descrito, em um codificador ou processo de codificação antes da mistura de redução (Etapa 420) tem diversas vantagens: (1) estes minimizam os cancelamentos dos canais que são somados a um sinal composto mono ou em matriz a múltiplos canais, (2) estes minimizam a confiança na normalização de energia (Etapa 421), e (3) estes pré-compensam a rotação de ângulo de fase inversa do 5 decodificador, por meio disto reduzindo os valores indesejáveis.
Os fatores de correção de fase podem ser aplicados no codificador pela subtração de cada valor de correção de fase de sub-banda dos ângulos de cada valor de bin de transformada naquela sub-banda. Isto é equi-
Figure BRPI0508343B1_D0093
valente a multiplicar cada valor de bin complexo por um número complexo com uma magnitude de 1,0 e um ângulo igual ao negativo do fator de correção de fase. Note que em um número complexo de magnitude 1, o ângulo A é igual a cos(A)+j sen(A). Esta última quantidade é calculada uma vez para cada sub-banda de cada canal, com A = -correção de fase para esta subbanda, então multiplicada por cada valor de sinal complexo de bin para realiJ5 zar o valor de bin deslocado em fase.
O deslocamento de fase é circular, resultando em uma convolução circular (como acima mencionado). Apesar da convolução circular poder
Figure BRPI0508343B1_D0094
ser benigna para alguns sinais contínuos, esta pode criar componentes espectrais espúrios para certos sinais complexos contínuos (tal como um apito) ou pode causar um borramento de transientes se diferentes ângulos de fase forem utilizados para diferentes sub-bandas. Conseqüentemente, uma técnica adequada para evitar a convolução circular pode ser empregada ou o Sinalizador de Transiente pode ser empregado de modo que, por exemplo, quando o Sinalizador de Transiente for Verdadeiro, os resultados de cálculo de ângulo podem ser desconsiderados, e todas as sub-bandas em um canal podem utilizar o mesmo fator de correção de fase tal como zero ou um valor randomizado.
ETAPA 420. MISTURA DE REDUÇÃO
Misturar em redução o mono pela adição dos bins de transfor30 mada complexa correspondentes através dos canais para produzir um canal composto mono ou misturar em redução para multiplicar os canais formando em matriz os canais de entrada, por exemplo, no modo do exemplo da figura
6, como abaixo descrito.
COMENTÁRIOS RELATIVOS À ETAPA 420
No codificador, uma vez que os bins de transformada de todos os canais foram deslocados em fase, os canais são somados, bin por bin, para criar o sinal de áudio composto mono. Altemativamente, os canais podem ser aplicados a uma matriz passiva ou ativa que provê ou um simples somatório para um canal, como na codificação N: 1 da figura 1, ou a múltiplos canais. Os coeficientes de matriz podem ser reais ou complexos (reais e i-
Figure BRPI0508343B1_D0095
Figure BRPI0508343B1_D0096
maginários).
ETAPA 421. NORMALIZAR
Para evitar o cancelamento de bins isolados e sobreenfatizar os sinais em fase, normalizar a amplitude de cada bin do canal composto mono para terem substancialmente a mesma energia que a soma das energias contribuintes, como segue.
a. Fazer x = a soma através dos canais de energias de bin (isto é, os quadrados das magnitudes de bin computados na Etapa 403).
b. Fazer y = energia do bin correspondente do canal composto mono, calculado como pela Etapa 403.
c. Fazer z = fator de escala = square_root (x / y). Se x = 0 então y é 0 e z é ajustado para 1.
d. Limitar z a um valor máximo de, por exemplo, 100. Se z for inicialmente maior do que 100 (implicando em um forte cancelamento de mistura de redução), adicionar um valor arbitrário, por exemplo, 0,01 * square_root (x) às partes reais e imaginárias do bin composto mono, o que assegurará que fique grande o bastante para ser normalizado pela eta- pa seguinte.
e. Multiplicar o valor de bin composto mono complexo por z.
COMENTÁRIOS RELATIVOS À ETAPA 421
Apesar de ser geralmente desejável utilizar os mesmos fatores de fase tanto para a codificação quanto a decodificação, mesmo a escolha ótima de um valor de correção de fase de sub-banda pode fazer com que um ou mais componentes espectrais audíveis dentro da sub-banda sejam cancelados durante o processo de mistura de redução de codificação porque o deslocamento de fase da Etapa 419 é executado em uma base de sub5 banda ao invés de uma base de bin. Neste caso, um diferente fator de fase para os bins isolados no codificador pode ser utilizado se for detectado que a energia da soma de tais bits é muito menor do que a energia da soma dos bins de canal individual naquela freqüência. Geralmente não é necessário
Figure BRPI0508343B1_D0097
aplicar um tal fator de correção isolado no decodificador, visto que os bins isolados usualmente tem pouco efeito sobre a qualidade de imagem total.
Uma normalização similar pode ser aplicada se múltiplos canais ao invés de um canal mono forem empregados.
ETAPA 422. MONTAR E EMPACOTAR EM FLUXO(S) DE BITS
As informações de canal lateral de Fatores de Escala de Ampliai 5 tude, de Parâmetros de Controle de Ângulo, de Fatores de Escala de Decorrelação, e de Sinalizadores de Transiente para cada canal juntamente com o áudio composto mono comum ou os múltiplos canais em matriz são multiplexadas como pode ser desejado e empacotadas em um ou mais fluxos de bits adequados para o meio ou mídia de armazenamento, transmissão ou de
Figure BRPI0508343B1_D0098
armazenamento e transmissão.
COMENTÁRIOS RELATIVOS À ETAPA 422
O áudio composto mono ou o áudio de múltiplos canais pode ser aplicado a um processo ou dispositivo de codificação de redução de taxa de dados tal como, por exemplo, um codificador perceptivo ou um codificador 25 perceptivo e um codificador de entropia (por exemplo, um codificador aritmético ou de Huffman) (algumas vezes referido como um codificador sem perda) antes do empacotamento. Também, como acima mencionado, o áudio composto mono (ou o áudio de múltiplos canais) e as informações de cadeia lateral relativas podem ser derivados de múltiplos canais de entrada somen30 te para as frequências de áudio acima de uma certa freqüência (uma frequência de acoplamento). Neste caso, as frequências de áudio abaixo da freqüência de acoplamento em cada um dos múltiplos canais de entrada po58 dem ser armazenadas, transmitidas ou armazenadas e transmitidas como canais discretos ou podem ser combinadas ou processadas de algum modo outro que como aqui descrito. Os canais discretos ou de outro modo combinados podem também ser aplicados a um processo ou dispositivo de codifi5 cação de redução de dados tal como, por exemplo, um codificador perceptivo ou um codificador perceptivo e um codificador de entropia. O áudio composto mono (ou o áudio de múltiplos canais) e o áudio de múltiplos canais discretos podem todos ser aplicados em um processo ou dispositivo de codi
Figure BRPI0508343B1_D0099
Figure BRPI0508343B1_D0100
ficação perceptiva integrada ou de codificação perceptiva e de entropia antes do empacotamento.
SINALIZADOR DE INTERPOLAÇÃO OPCIONAL (NÃO MOSTRADO NA figura 4)
A freqüência através de interpolação dos deslocamentos de ângulo de fase básico provida pelos Parâmetro de Controle de Ângulo de SubBanda pode ser habilitada no Codificador (Etapa 418) e/ou no Decodificador (Etapa 505, abaixo). O parâmetro de cadeia lateral de Sinalizador de Interpolação opcional pode ser empregado para habilitar a interpolação no Decodificador. Ou o Sinalizador de Interpolação ou um sinalizador de habilitação similar ao Sinalizador de Interpolação pode ser utilizado no Codificador. Note que como o codificador tem acesso a dados no nível de bin, este pode utilizar diferentes valores de interpolação do que o Decodificador, o qual interpola os Parâmetros de Controle de Ângulo de Sub-Banda nas informações de cadeia lateral.
A utilização de tal interpolação através da freqüência no Codifi25 cador ou no Decodificador pode ser habilitada se, por exemplo, qualquer uma das duas condições seguintes forem verdadeiras:
Condição 1. Se um pico espectral forte, isolado for localizado no ou próximo do limite de duas sub-bandas que tem atribuições de ângulo de rotação de fase substancialmente diferentes.
Razão: sem interpolação, uma grande mudança de fase no limite pode introduzir um trinado no componente espectral isolado. Pela utilização da interpolação para distribuir a mudança de fase de banda para banda atra vés dos valores de bin dentro da banda, a quantidade de mudança nos limites de sub-banda é reduzida. Os limites para a força de pico espectral, proximidade de um limite e diferença em rotação de fase de sub-banda para sub-banda para satisfazer esta condição podem ser empiricamente ajusta5 dos.
Condição 2. Se, dependendo da presença de um transiente, ou os ângulos de fase intercanais (sem transiente) ou os ângulos de fase absolutos dentro de um canal (transiente), compreende um bom ajuste para uma
Figure BRPI0508343B1_D0101
progressão linear.
Razão: a utilização da interpolação para reconstruir os dados tende a prover um melhor ajuste dos dados originais. Note que a inclinação da progressão linear não precisa ser constante através de todas as freqüên cias, somente dentro de cada sub-banda, já que os dados de ângulo serão ainda transportados para o decodificador em uma base de sub-banda; e isto „15 forma a entrada para a Etapa de Interpolador 418. O grau no qual os dados provêem um bom ajuste para satisfazer esta condição pode também ser empiricamente determinado.
Figure BRPI0508343B1_D0102
Outras condições, tais como aquelas empiricamente determinadas, podem beneficiar-se da interpolação através da freqüência. A existência das duas condições há pouco mencionadas pode ser determinada como segue:
Condição 1. Se um pico espectral forte, isolado for localizado no ou próximo do limite de duas sub-bandas que tem atribuições de ângulo de rotação de fase substancialmente diferentes:
Para o Sinalizador de Interpolação a ser utilizado pelo Decodificador, os Parâmetros de Controle de Ângulo de Sub-Banda (saída da Etapa 414), e para habilitação da Etapa 418 dentro do Codificador, a saída da Etapa 413 antes da quantização pode ser utilizada para determinar o ângulo de rotação de sub-banda para sub-banda.
para tanto o Sinalizador de Interpolação quanto para a habilitação dentro do Codificador, a saída de magnitude da Etapa 403, as magnitudes de DFT de corrente, pode ser utilizada para encontrar os picos isolados nos limites de sub-banda
Condição 2. Se, dependendo da presença de um transiente, ou os ângulos de fase intercanais (sem transiente) ou os ângulos de fase absolutos dentro de um canal (transiente), compreende um bom ajuste para uma 5 progressão linear:
se o Sinalizador de Transiente não for verdadeiro (sem transiente), utilizar os ângulos de fase de bin intercanais relativos da Etapa 406 para o ajuste para uma determinação de progressão linear, e
Figure BRPI0508343B1_D0103
se o Sinalizador de Transiente for verdadeiro (transiente), utilizar os ângulos de fase absolutos do canal da Etapa 403.
DECODIFICAÇÃO
As etapas de um processo de decodificação (etapas de decodificação) podem ser descritas como segue. Em relação às etapas de decodificação, referência é feita à figura 5, a qual está na natureza de um fluxoJ5 grama e um diagrama de blocos funcional híbrido. Para simplicidade, a figura mostra a derivação de componentes de informações de cadeia lateral para um canal, sendo compreendido que os componentes de informações de cadeia lateral devem ser obtidos para cada canal a menos que o canal seja um canal de referência para tais componentes, como explicado em outro 20 lugar.
ETAPA 501. DESEMPACOTAR E DECODIFICAR AS INFORMAÇÕES DE CADEIA LATERAL
Desempacotar e decodificar (incluindo a dequantização), conforme necessário, os componentes de dados de cadeia lateral (os Fatores 25 de Escala de Amplitude, os Parâmetros de Controle de Ângulo, os Fatores de Escala de Decorrelação, e o Sinalizador de Transiente) para cada quadro de cada canal (um canal mostrado na figura 5). Tabelas de consulta podem ser utilizadas para decodificar os Fatores de Escala de Amplitude, os Parâmetros de Controle de Ângulo, e os Fatores de Escala de Decorrelação.
COMENTÁRIOS RELATIVOS À ETAPA 501
Como acima explicado, se um canal de referência for empregado, os dados de cadeia lateral para o canal de referência podem não incluir os Parâmetros de Controle de Ângulo, os Fatores de Escala de Decorrelação, e o Sinalizador de Transiente.
ETAPA 502. DESEMPACOTAR E DECODIFICAR O SINAL DE ÁUDIO
COMPOSTO MONO OU DE MÚLTIPLOS CANAIS
Desempacotar e decodificar, conforme necessário, as informações de sinal de áudio composto mono ou de múltiplos canais para prover os coeficientes de DFT para cada bin de transformada do sinal de áudio com-
Figure BRPI0508343B1_D0104
posto mono ou de múltiplos canais.
COMENTÁRIOS RELATIVOS À ETAPA 502
A Etapa 501 e a Etapa 502 podem ser consideradas serem partes de uma única etapa de desempacotamento e de decodificação. A Etapa
502 pode incluir uma matriz passiva ou ativa.
ETAPA 503. DISTRIBUIR OS VALORES DE PARÂMETRO DE ÂNGULO ATRAVÉS DOS BLOCOS
J 5 Os valores de Parâmetro de Controle de Ângulo de Sub-Banda de bloco são derivados dos valores de Parâmetro de Controle de Ângulo de Sub-Banda de quadro dequantizados.
COMENTÁRIOS RELATIVOS À ETAPA 503
A Etapa 503 pode ser implementada pela distribuição do mesmo
Figure BRPI0508343B1_D0105
valor de parâmetro para cada bloco no quadro.
ETAPA 504. DISTRIBUIR O FATOR DE ESCALA DE DECORRELAÇÃO DE SUB-BANDA ATRAVÉS DOS BLOCOS
Os valores de Fator de Escala de Decorrelação de Sub-Banda de bloco são derivados dos valores de Fator de Escala de Decorrelação de 25 Sub-Banda de quadro dequantizados.
COMENTÁRIOS RELATIVOS À ETAPA 504
A Etapa 504 pode ser implementada pela distribuição do mesmo valor de fator de escala para cada bloco no quadro.
ETAPA 505. INTERPOLAR LINEARMENTE ATRAVÉS DA FREQÜÊNCIA
Opcionalmente, derivar os ângulos de bin dos ângulos de subbanda de bloco da Etapa 503 do decodificador por interpolação linear através da frequência como acima descrito em conexão com a Etapa 418 do codificador. A interpolaçâo linear na Etapa 505 pode ser habilitada quando o Sinalizador de Interpolaçâo é utilizado e é verdadeiro.
ETAPA 506. ADICIONAR UM DESLOCAMENTO DE ÂNGULO DE FASE RANDOMIZADO (TÉCNICA 3)
De acordo com a Técnica 3, acima descrita, quando o Sinaíizador de Transiente indica um transiente, adicionar ao Parâmetro de Controle de Ângulo de Sub-Banda de bloco provido pela Etapa 503, o qual pode ter sido linearmente interpolado através da freqüência pela Etapa 505, um valor
Figure BRPI0508343B1_D0106
Figure BRPI0508343B1_D0107
deslocado randomizado escalado pelo Fator de Escala de Decorrelação (a escalagem pode ser indireta como apresentado nesta etapa):
a. Fazer y = Fator de Escala de Decorrelação de Sub-Banda de bloco.
b. Fazer z = yexp, onde exp é uma constante, por exemplo = 5. z também estará na faixa de 0 a 1, mas inclinado na direção de 0, refletindo uma tendência na direção de baixos níveis de variação randomizada a menos que o valor de Fator de Escala de Decorrelação seja alto.
c. Fazer x = um número randomizado entre +1,0 e -1,0, esco- lhido separadamente para cada sub-banda de cada bloco.
d. Então, o valor adicionado ao Parâmetro de Controle de Ângulo de Sub-Banda para adicionar um valor deslocado de ângulo randomizado de acordo com a Técnica 3 é x * pi * z.
COMENTÁRIOS RELATIVOS À ETAPA 506
Como será apreciado por aqueles versados na técnica, os ângu25 los randomizados (ou amplitudes randomizadas” se as amplitudes forem também escaladas) para escalagem pelo Fator de Escala de Decorrelação podem incluir não somente as variações pseudorrandômicas e verdadeiramente randômicas, mas também as variações deterministicamente geradas que, quando aplicadas a ângulos de fase ou a ângulos de fase e a amplitu30 des, tem o efeito de reduzir a correlação cruzada entre os canais. Tais variações randomizadas” podem ser obtidas em muitos modos. Por exemplo, um gerador de número pseudorrandômico com vários valores de semente pode ser empregado. Altemativamente, os números verdadeiramente randômicos podem ser gerados utilizando um gerador de número randômico de hardware. Visto que uma resolução de ângulo randomizado de somente aproximadamente 1 grau pode ser suficiente, tabelas de números randomizados que 5 tem duas ou três casas decimais (por exemplo 0,84 ou 0,844) podem ser empregadas. De preferência, os valores randomizados (entre -1,0 e +1,0 com referência à Etapa 505c, acima) são uniformemente distribuídos estatisticamente através de cada canal.
Figure BRPI0508343B1_D0108
Apesar da escalagem indireta não linear da Etapa 506 ser considerada útil, esta não é crítica e outras escafagens adequadas podem ser empregadas - especificamente outros valores para o expoente podem ser empregados para obter resultados similares.
Quando o Fator de Escala de Decorrelação de Sub-Banda é 1, uma faixa completa de ângulos randômicos de -π a +π é adicionada (em cujo J5 caso os valores de Parâmetro de Controle de Ângulo de Sub-Banda produzidos pela Etapa 503 são tornados irrelevantes). Conforme o valor de Fator de Escala de Decorrelação de Sub-Banda diminui na direção de zero, o deslocamento de ângulo randomizado também diminui na direção de zero, fa-
Figure BRPI0508343B1_D0109
zendo com que a entrada da Etapa 506 mova-se na direção dos valores de Parâmetro de Controle de Ângulo de Sub-Banda produzidos pela Etapa 503.
Se desejado, o codificador acima descrito pode também adicionar um deslocamento randomizado escalado de acordo com a Técnica 3 ao deslocamento de ângulo aplicado a um canal antes da mistura de redução. Fazer isto pode aperfeiçoar o cancelamento de valores indesejados no de25 codificador. Pode também ser benéfico para aperfeiçoar a sincronicidade do codificador e do decodificador.
ETAPA 507. ADICIONAR UM DESLOCAMENTO DE ÂNGULO DE FASE RANDOMIZADO (TÉCNICA 2)
De acordo com a Técnica 2, acima descrita, quando o Sinaliza30 dor de Transiente não indica um transiente, para cada bin, adicionar a todos os Parâmetro de Controle de Ângulo de Sub-Banda de bloco em um quadro provido pela Etapa 503 (a Etapa 505 opera somente quando o Sinalizador de Transiente indica um transiente) um valor deslocado randomizado diferente escalado pelo Fator de Escala de Decorrelação (a escalagem pode ser direta como aqui apresentado nesta etapa):
a. Fazer y = Fator de Escala de Decorrelação de Sub-Banda de bloco.
b. Fazer x ~ um número randomizado entre +1,0 e -1,0, escolhido separadamente para cada sub-banda de cada quadro.
c. Então, o valor adicionado ao Parâmetro de Controle de Ângulo de bin de bloco para adicionar um valor deslocado de ângulo randomizado de acordo com a Técnica 2 é x * pi * y.
COMENTÁRIOS RELATIVOS À ETAPA 507
Ver os comentários acima relativos á Etapa 506 relativos ao deslocamento de ângulo randomizado.
Apesar da escalagem direta da Etapa 505 ser considerada útil, esta não é crítica e outras escalagens adequadas podem ser empregadas.
Para minimizar as descontinuidades temporais, o valor de ângulo randomizado único para cada bin de cada canal de preferência não muda com o tempo. Os valores de ângulo randomizado de todos os bins em uma sub-banda são escalados pelo mesmo valor de Fator de Escala de Decorrelação de Sub-Banda, o qual é atualizado na taxa de quadro. Assim, quando o valor de Fator de Escala de Decorrelação de Sub-Banda é 1, uma faixa completa de ângulos randômicos de -π a +π é adicionada (em cujo caso os valores de ângulo de sub-banda de bloco derivados dos valores de ângulo de sub-banda de quadro dequantizados são tornados irrelevantes). Conforme o valor de Fator de Escala de Decorrelação de Sub-Banda diminui na direção de zero, o deslocamento de ângulo randomizado também diminui na direção de zero. Ao contrário da Etapa 504, a escalagem nesta Etapa 507 pode ser uma função direta do valor de Fator de Escala de Decorrelação de Sub-Banda. Por exemplo, um valor de Fator de Escala de Decorrelação de Sub-Banda de 0,5 proporcionalmente reduz cada variação de ângulo randômico em 0,5.
O valor de ângulo randomizado escalado pode então ser adicio nado ao ângulo de bin da Etapa 506 do decodificador. O valor de Fator de Escala de Decorrelação é atualizado uma vez por quadro. Na presença de um Sinalizador de Transiente para o quadro, esta etapa é pulada, para evitar os artefatos de pré-ruído de transiente.
Se desejado, o codificador acima descrito pode também adicionar um deslocamento randomizado escalado de acordo com a Técnica 2 ao deslocamento de ângulo aplicado antes da mistura de redução. Fazer isto pode aperfeiçoar o cancelamento de valores indesejados no decodificador.
Figure BRPI0508343B1_D0110
Pode também ser benéfico para aperfeiçoar a sincronicidade do codificador e do decodificador.
ETAPA 508. NORMALIZAR OS FATORES DE ESCALA DE AMPLITUDE
Normalizar os Fatores de Escala de Amplitude através dos canais de modo que estes somam os quadrados para 1.
COMENTÁRIOS RELATIVOS À ETAPA 508
J 5 Por exemplo, se dois canais tem fatores de escala dequantizados de -3,0 dB (= 2 * granularidade de 1,5 dB) (0,70795), a soma dos quadrados é 1,002. Dividindo cada um pela raiz quadrada de 1,002 = 1,001 gera dois valores de 0,7072 (-3,01 dB).
ETAPA 509. INTENSIFICAR OS NÍVEIS DE FATOR DE ESCALA DE SUB-
Figure BRPI0508343B1_D0111
BANDA (OPCIONAL)
Opcionalmente, quando o Sinalizador de Transiente indica nenhum transiente, aplicar uma ligeira intensificação nos níveis de Fator de
Escala de Sub-Banda, dependente dos níveis de Fator de Escala de Decorrelação de Sub-Banda: multiplicar cada Fator de Escala de Amplitude de
Sub-Banda por um pequeno fator (por exemplo, 1 + 0,2 * Fator de Escala de
Decorrelação de Sub-Banda). Quando o Sinalizador de Transiente é verdadeiro, pular esta etapa.
COMENTÁRIOS RELATIVOS À ETAPA 509
Esta etapa pode ser útil porque a Etapa 507 de decorrelação do 30 decodificador pode resultar em níveis ligeiramente reduzidos no processo de banco de filtros inverso.
ETAPA 510. DISTRIBUIR OS VALORES DE AMPLITUDE DE SUB-BANDA
ATRAVÉS DOS BINS
A Etapa 510 pode ser implementada pela distribuição do mesmo valor de fator de escala de amplitude de sub-banda para cada bin na subbanda.
ETAPA 510a. ADICIONAR O DESLOCAMENTO DE AMPLITUDE RANDOMIZADA (OPCIONAL)
Opcionalmente, aplicar uma variação randomizada no Fator de
Escala de Amplitude de Sub-Banda normalizado dependente dos níveis de
Figure BRPI0508343B1_D0112
Fator de Escala de Decorrelação de Sub-Banda e do Sinalizador de Transiente. Na ausência de um transiente, adicionar um Fator de Escala de Amplitude Randomizada que não muda com o tempo em uma base de bin por bin (diferente de bin para bin), e, na presença de um transiente (no quadro ou bloco), adicionar um Fator de Escala de Amplitude Randomizada que muda em uma base de bloco por bloco (diferente de bloco para bloco) e muda de 15 sub-banda para sub-banda (o mesmo deslocamento para todos os bins em uma sub-banda; diferente de sub-banda para sub-banda). A Etapa 510a não está mostrada nos desenhos.
COMENTÁRIOS RELATIVOS À ETAPA 510a
Figure BRPI0508343B1_D0113
Apesar do grau no qual os deslocamentos de amplitude randomizada são adicionados poder ser controlado pelo Fator de Escala de Decorrelação, acredita-se que um valor de fator de escala específico deve causar menos deslocamento de amplitude do que o deslocamento de fase randomizada correspondente que resulta do mesmo valor de fator de escala de modo a evitar os artefatos audíveis.
ETAPA 511. MISTURA DE EXPANSÃO
a. Para cada bin de cada canal de saída, construir um fator de escala de mistura de expansão complexo da amplitude da Etapa 508 do decodificador e do ângulo de bin da Etapa 507 do decodificador: (amplitude * (cos (ângulo) + j sen (ângulo)).
b. Para cada canal de saída, multiplicar o valor de bin complexo e o fator de escala de mistura de expansão complexo para produzir o valor de bin de saída complexo misturado em expansão de cada bin do canal.
ETAPA 512. EXECUTAR A DFT INVERSA (OPCIONAL)
Opcionalmente, executar uma transformada de DFT inversa nos bins de cada canal de saída para gerar os valores de PCM de saída de múltiplos canais. Como é bem conhecido, em conexão com uma tal transformação de DFT inversa, os blocos individuais de amostra de tempo são enqua-
Figure BRPI0508343B1_D0114
drados, e os blocos adjacentes são sobrepostos e adicionados juntos de modo a reconstruir o sinal de áudio de PCM de saída de tempo contínuo final.
COMENTÁRIOS RELATIVOS À ETAPA 512
Um decodificador de acordo com a presente invenção pode não prover saídas de PCM. No caso onde o processo de decodificador é empregado somente acima de uma dada freqüência de acoplamento, e os coefici,15 entes de MDCT discretos são enviados para cada canal abaixo desta freqüência, pode ser desejável converter os coeficientes de DFT derivados pelas Etapas 511a e 511b de mistura de expansão do decodificador em coefi-
Figure BRPI0508343B1_D0115
cientes de MDCT, de modo que estes possam ser combinados com os coeficientes de MDCT discretos de freqüência mais baixa e requantizados de 20 modo a prover, por exemplo, um fluxo de bits compatível com um sistema de codificação que tem um grande número de usuários instalados, tal como um fluxo de bits SP/DIF de AC-3 padrão para aplicação em um dispositivo externo onde uma transformada inversa pode ser executada. Uma transformada de DFT inversa pode ser aplicada a alguns dos canais de saída para pro ver as saídas de PCM.
SEÇÃO 8.2.2 DO DOCUMENTO A/52A
COM FATOR DE SENSIBILIDADE F ADICIONADO
8.2.2 DETECÇÃO DE TRANSIENTE
Os transientes são detectados nos canais de largura de banda total de modo a decidir quando comutar para os blocos de áudio de comprimento curto para aperfeiçoar o desempenho pré-eco. As versões filtradas em passagem alta dos sinais são examinadas quanto a um aumento em e nergia de um segmento de tempo de sub-bloco para o seguinte. Os subblocos são examinados em diferentes escalas de tempo. Se um transiente for detectado na segunda metade de um bloco de áudio em um canal aquele canal comuta para um bloco curto. Um canal que é comutado em bloco utili5 za a estratégia de expoente D45 [isto é, os dados tem uma resolução de freqüência mais bruta de modo a reduzir os dados suplementares que resultam do aumento da resolução temporal].
Figure BRPI0508343B1_D0116
O detector de transiente é utilizado para determinar quando comutar de um bloco de transformada longo (comprimento 512), para o bloco curto (comprimento 256). Este opera sobre 512 amostras para cada bloco de áudio. Isto é feito em dois passes, com cada passe processando 256 amostras. A detecção de transiente é dividida em quatro etapas: 1) filtragem de passagem alta, 2) segmentação do bloco em submúltiplos, 3) detecção de amplitude de pico dentro de cada segmento de sub-bloco, e 4) comparação 15 de limites. O detector de transiente emite um sinalizador blksw[n] para cada canal de largura de banda total, o qual quando ajustado para um indica a presença de um transiente, na segunda metade do bloco de entrada de comprimento 512 para o canal correspondente.
1) Filtragem de Passagem Alta: O filtro de passagem alta é im-
Figure BRPI0508343B1_D0117
plementado como um filtro IIR biquad direto de forma II em cascata com um corte de 8 kHz.
2) Segmentação de Bloco: O bloco de 256 amostras filtradas em passagem alta é segmentado em uma árvore hierárquica de níveis na qual o nível 1 representa o bloco de comprimento 256, o nível 2 são dois segmentos de comprimento 128, e o nível 3 são quatro segmentos de comprimento 64.
3) Detecção de Pico: A amostra com a maior magnitude é identificada para cada segmento em todos os níveis da árvore hierárquica. Os picos para um único nível são encontrados como segue:
P[j][k] = max(x(n)) para n = (512 x (k-1) / 2Aj), (512 x (k-1) / 2Aj) + 1, ...(512 x k / 2Aj) -1 ek = 1.....2Aü-1);
onde: x(n) = a enésima amostra no bloco de comprimento 256 j = 1, 2, 3 é o número de nível hierárquico k ~ o número de segmento dentro do nível j
Note que P[j][O], (isto é, K=0) é definido ser o pico do último segmento no nível j da árvore calculada imediatamente antes da árvore atual. Por exemplo, P[3][4] na árvore precedente é P[3](0] na árvore atual.
4) Comparação de Limites: O primeiro estágio do comparador de limites verifica para ver se existe um nível de sinal significativo no bloco
Figure BRPI0508343B1_D0118
atual. Isto é feito pela comparação do valor de pico total P[1 ][1 ] do bloco atual com um limite de silêncio. Se P[1 ][1 ] estiver abaixo deste limite então um bloco longo é forçado. O valor de limite de silêncio é 100/32768. O próximo estágio do comparador verifica os níveis de pico relativos de segmentos adjacentes em cada nível da árvore hierárquica. Se a razão de pico de quaisquer dois segmentos adjacentes em um nível específico exceder um limite 15 predefinido para aquele nível, então um sinalizador é determinado para indicar a presença de um transiente no bloco de comprimento 256 atual. As razões são comparadas como segue:
mag(P[j][l<|) x T[j] > (F* mag(P[j][(k-1)])) [Note o fator de sensibilidade F]
Figure BRPI0508343B1_D0119
onde: T[j] é o limite predefinido para o nível j, definido como:
T[1] = 0.1
T[2] = 0,075
T[3] = 0.05
Se esta desigualdade for verdadeira para qualquer um de dois picos de segmento em qualquer nível, então um transiente é indicado para a primeira metade do bloco de entrada de comprimento 512. O segundo passe através deste processo determina a presença de transientes na segunda metade do bloco de entrada de comprimento 512.
CODIFICAÇÃO N:M
Os aspectos da presente invenção não estão limitados à codificação N:1 como descrito em conexão com a figura 1. Mais genericamente, os aspectos da invenção são aplicáveis na transformação de qualquer nú mero de canais de entrada (n canais de entrada) em qualquer número de canais de saída (m canais de saída) no modo da figura 6 (isto é, a codificação N:M). Como em muitas aplicações comuns o número de canais de entrada n é maior do que o número de canais de saída m, a disposição de co5 dificação N:M da figura 6 será referida como mistura de redução para conveniência de descrição.
Referindo aos detalhes da figura 6, ao invés de somar as saídas de Girar Ângulo 8 e Girar Ângulo 10 no Combinador Aditivo 6 como na dis-
Figure BRPI0508343B1_D0120
posição da figura 1, estas saídas podem ser aplicadas a um dispositivo ou função de matriz de mistura de redução 6' (Matriz de Mistura de Redução”).
A Matriz de Mistura de Redução 6' pode ser uma matriz passiva ou ativa que provê ou um somatório simples para um canal, como na codificação N:1 da figura 1, ou para múltiplos canais. Os coeficientes de matriz podem ser reais ou complexos (reais e imaginários). Outros dispositivos e funções na figura 6 ,15 podem ser os mesmos que na disposição da figura 1 e estes recebem os mesmos números de referência.
A Matriz de Mistura de Redução 6’ pode prover uma função dependente de freqüência híbrida de modo que esta provenha, por exemplo,
Figure BRPI0508343B1_D0121
mf1_f2 canais em uma faixa de freqüência de f1 a f2 e mf2.f3 canais em uma faixa de freqüência de f2 a f3. Por exemplo, abaixo de uma freqüência de acoplamento de, por exemplo, 1000 Hz a Matriz de Mistura de Redução 6* pode prover dois canais e acima da freqüência de acoplamento a Matriz de Mistura de Redução 6’ pode prover um canal. Pelo emprego de dois canais abaixo da freqüência de acoplamento, uma melhor fidelidade espacial pode 25 ser obtida, especialmente se os dois canais representarem as direções horizontais (para corresponder à horizontal idade dos ouvidos humanos).
Apesar da figura 6 mostrar a geração das mesmas informações de cadeia lateral para cada canal como na disposição da figura 1, pode ser possível omitir certas das informações de cadeia lateral quando mais do que 30 um canal é provido pela saída da Matriz de Mistura de Redução 6'. Em alguns casos, resultados aceitáveis podem ser obtidos quando somente as informações de cadeia lateral de fator de escala de amplitude são providas pela disposição da figura 6, Detalhes adicionais referentes às opções de cadeia lateral estão abaixo discutidos em conexão com as descrições das figuras 7, 8 e 9.
Como há pouco acima mencionado, os múltiplos canais gerados pela Matriz de Mistura de Redução 6' não precisam ser menos que o número de canais de entrada n. Quando o propósito de um codificador tal como na figura 6 é de reduzir o número de bits para transmissão ou armazenamento, é provável que o número de canais produzidos pela Matriz de Mistura de
Figure BRPI0508343B1_D0122
Redução 6’ será menor do que o número de canais de entrada n. No entanto, a disposição da figura 6 pode também ser utilizada como um misturador de expansão. Neste caso, podem existir aplicações nas quais o número de canais m produzidos pela Matriz de Mistura de Redução 6' é maior do que o número de canais de entrada n.
Os codificadores como descrito em conexão com os exemplos
J5 das figuras 2, 5 e 6 podem também incluir o seu próprio decodificador local ou função de decodificação de modo a determinar se as informações de áudio e as informações de cadeia lateral, quando decodificadas por um tal decodificador, proveríam resultados adequados. Os resultados de uma tal de-
Figure BRPI0508343B1_D0123
terminação poderíam ser utilizados para aperfeiçoar os parâmetros pelo emprego de, por exemplo, um processo recursivo. Em um sistema de codificação e decodificação de bloco, cálculos de recursão poderíam ser executados, por exemplo, em cada bloco antes do próximo bloco terminar de modo a minimizar o retardo na transmissão de um bloco de informações de áudio e seus parâmetros espaciais associados.
Uma disposição na qual o codificador também inclui o seu próprio decodificador ou função de decodificação poderia também ser empregada vantajosamente quando os parâmetros espaciais não são armazenados ou enviados para certos blocos. Se uma decodificação inadequada resultasse de não enviar as informações de cadeia lateral de parâmetro espa30 ciai, tais informações de cadeia lateral seriam enviadas para o bloco específico. Neste caso, o decodificador pode ser uma modificação do decodificador ou da função de decodificação das figuras 2, 5 ou 6 pelo fato de que o deco dificador teria tanto a capacidade de recuperar as informações de cadeia lateral de parâmetro espacial para as frequências acima da freqüência de acoplamento do fluxo de bits que entra quanto também gerar as informações de cadeia lateral de parâmetro espacial das informações estéreo abaixo da freqüência de acoplamento.
Em uma alternativa simplificada para tais exemplos de codificador que incorpora um decodificador local, ao invés de ter um decodificador local ou função de decodificador, o codificador podería simplesmente verifi-
Figure BRPI0508343B1_D0124
car para determinar se existe qualquer conteúdo de sinal abaixo da freqüência de acoplamento (determinado em qualquer modo adequado, por exemplo, uma soma da energia nos bins de freqüência através da faixa de freqüência), e, se não, enviaria ou armazenaria as informações de cadeia lateral de parâmetro espacial ao invés de não o fazer se a energia estivesse acima do limite. Dependendo do esquema de codificação, as informações de baixo sinal abaixo da freqüência de acoplamento podem também resultar em mais bits ficando disponíveis para enviar as informações de cadeia lateral.
DECODIFICAÇÃO M:N
Uma forma mais generalizada da disposição da figura 2 está mostrada na figura 7, em que uma função ou dispositivo de matriz de mistura
Figure BRPI0508343B1_D0125
de expansão (Matriz de Mistura de Expansão) 20 recebe os canais 1 a m gerados pela disposição da figura 6. A Matriz de Mistura de Expansão 20 pode ser uma matriz passiva. Esta pode ser, mas não precisa ser, a transposição conjugada (isto é, o complemento) da Matriz de Mistura de Redução 6’ da disposição da figura 6. Alternativa mente, a Matriz de Mistura de Ex25 pansão 20 pode ser uma matriz ativa - uma matriz variável ou uma matriz passiva em combinação com uma matriz variável. Se um decodificador de matriz ativa for empregado, no seu estado relaxado ou quiescente este pode ser o conjugado complexo da Matriz de Mistura de Redução ou pode ser independente da Matriz de Mistura de Redução. As informações de cadeia 30 lateral podem ser aplicadas como mostrado na figura 7 de modo a controlar as funções ou dispositivos de Ajustar Amplitude, de Girar Ângulo, e de Interpolador (opcional). Neste caso, a Matriz de Mistura de Expansão, se for uma matriz ativa, opera independentemente das informações de cadeia lateral e responde somente aos canais aplicados a esta. Alternativa mente, algumas ou todas as informações de cadeia lateral podem ser aplicadas na matriz ativa para auxiliar na sua operação. Neste caso, algumas ou todas as fun5 ções ou dispositivos de Ajustar Amplitude, de Girar Ângulo, e de Interpolador podem ser omitidas. O exemplo de Decodificador da figura 7 pode também empregar a alternativa de aplicar um grau de variações de amplitude randomizada sob certas condições de sinal, como acima descrito em conexão com
Figure BRPI0508343B1_D0126
as figuras 2 e 5.
Quando a Matriz de Mistura de Expansão 20 é uma matriz ativa, a disposição da figura 7 pode ser caracterizada como um decodificador de matriz híbrida para operar um sistema de codificador / decodificador de matriz híbrida. Híbrida” neste contexto refere-se ao fato de que o decodifi cador pode derivar alguma medida de informações de controle de seu sinal de áudio de entrada (isto é, a matriz ativa responde às informações espaciais codificadas nos canais aplicados a esta) e uma medida adicional de informações de controle das informações de cadeia lateral de parâmetro espacial. Outros elementos da figura 7 são como na disposição da figura 2 e recebem os mesmos números de referência.
Figure BRPI0508343B1_D0127
Os decodificadores de matriz ativa adequados para utilização em um decodificador de matriz híbrida podem incluir os decodificadores de matriz ativa tais como aqueles acima mencionados e incorporados por referência, que incluem, por exemplo, os decodificadores de matriz conhecidos como decodificadores Pro Logic” e Pro Logic II (Pro Logic” é uma marca 25 registrada da Dolby Laboratories Licensing Corporation).
DECORRELAÇÃO ALTERNATIVA
As figuras 8 e 9 mostram variações do Decodificador generalizado da figura 7. Especificamente, tanto a disposição da figura 8 quanto a disposição da figura 9 mostram alternativas à técnica de decorrelação das figu30 ras 2 e 7. Na figura 8, as respectivas funções ou dispositivos de decorrelator (Decorrelatores) 46 e 48 estão no domínio de tempo, cada um seguindo o respectivo Banco de Filtros Inverso 30 e 36 no seu canal. Na figura 9, as . respectivas funções ou dispositivos de decorrelator (“Decorrelatores) 50 e estào no domínio de freqüência, cada um precedendo o respectivo Banco * de Filtros Inverso 30 e 36 no seu canal. Em ambas as disposições da figura e da figura 9, cada um dos Decorrelatores (46, 48, 50, 52) tem uma carac5 terística única de modo que as suas saídas são mutuamente decorrelacionadas umas em relação às outras. O Fator de Escala de Decorrelação pode ser utilizado para controlar, por exemplo, a razão entre sinal correlacionado e não correlacionado provido em cada canal. Opcionalmente, o Sinalizador de Transiente pode também ser utilizado para descolar o modo de operação do Decorrelator, como está abaixo explicado. Em ambas as disposições da figura 8 e da figura 9, cada Decorrelator pode ser um reverberador do tipo Schroeder que tem a sua própria característica de filtro única, na qual a quantidade ou o grau de reverberação é controlado pelo fator de escala de decorrelação (implementado, por exemplo, pelo controle do grau no qual a saída do Decorrelator forma uma parte de uma combinação linear da entrada e da saída do Decorrelator). Alternativamente, outras técnicas de decorrelação controláveis podem ser empregadas ou sozinhas ou em combinação umas com as outras ou com um reverberador do tipo Schroeder. Os reverberadores do tipo Schroeder são bem conhecidos e podem traçar a sua origem em dois documentos de jornal: 'Colorless' Artificial Reverberation por M.R. Schroeder e B.F. Logan, IRE Transactions on Áudio, vol. AU-9, pp. 209-214, 1961 e Natural Sounding Artificial Reverberation por M.R. Schroeder, Journal A.E.S., Julho, 1962, vol. 10, ns 2, pp. 219-223.
Quando os Decorrelatores 46 e 48 operam no domínio de tem25 po, como na disposição da figura 8, um único (isto é, de banda larga) Fator de Escala de Decorrelação é requerido. Isto pode ser obtido por qualquer um de diversos modos. Por exemplo, somente um único Fator de Escala de Decorrelação pode ser gerado no codificador da figura 1 ou da figura 7. Alternativamente, se o codificador da figura 1 ou da figura 7 gerar Fatores de Escala de Decorrelação em uma base de sub-banda, os Fatores de Escala de Decorrelação de Sub-Banda podem ser somados em amplitude ou potência no codificador da figura 1 ou da figura 7 ou no decodificador da figura 8.
Quando os Decorrelatores 50 e 52 operam no domínio de freqüência, como na disposição da figura 9, estes podem receber um fator de , escala de decorrelação para cada sub-banda ou grupo de sub-bandas e, concomitantemente, prover um grau mensurável de decorrelação para tais 5 sub-bandas ou grupos de sub-bandas.
Os Decorrelatores 46 e 48 da figura 8 e os Decorrelatores 50 e da figura 9 podem opcionalmente receber o Sinalizador de Transiente. Nos Decorrelatores de domínio de tempo da figura 8, o Sinalizador de Tran-
Figure BRPI0508343B1_D0128
siente pode ser empregado para mudar o modo de operação do respectivo Decorrelator. Por exemplo, o Decorrelator pode operar como um reverberador do tipo Schroeder na ausência do sinalizador de transiente mas quando de seu recebimento e por um curto período de tempo subseqüente, diga-se de 1 a 10 milissegundos, operar como um retardo fixo. Cada canal pode ter um retardo fixo predeterminado ou retardo pode ser variado em resposta a J5 uma pluralidade de transientes dentro de um curto período de tempo. Nos
Decorrelatores de domínio de freqüência da figura 9, o sinalizador de transiente pode também ser empregado para mudar o modo de operação do respectivo decorrelator. No entanto, neste caso, o recebimento de um sinalizador de transiente pode, por exemplo, disparar um curto aumento (diversos
Figure BRPI0508343B1_D0129
milissegundos) em amplitude no canal no qual o sinalizador ocorreu.
Em ambas as disposições da figura 8 e 9, um Interpolador 27 (33), controlado pelo Sinalizador de Transiente opcional, pode prover uma interpolação através da freqüência dos ângulos de fase emitidos do Girar Ângulo 28 (34) em um modo como acima descrito.
Como acima mencionado, quando dois ou mais canais são enviados além das informações de cadeia lateral, pode ser aceitável reduzir o número de parâmetros de cadeia lateral. Por exemplo, pode ser aceitável enviar somente o Fator de Escala de Amplitude, em cujo caso os dispositivos ou funções de decorrelação e de ângulo no decodificador podem ser 30 omitidos (neste caso, as figuras 7, 8 e 9 reduzem à mesma disposição).
Alternativamente, somente o Fator de Escala de Amplitude, o Fator de Escala de Decorrelação, e, opcíonalmente, o Sinalizador de Transí ente podem ser enviados. Neste caso, qualquer uma das disposições das figuras 7, 8 ou 9 pode ser empregada (omitindo o Girar Ânguio 28 e 34 em cada uma destas).
Como outra alternativa, somente o fator de escala de amplitude e o parâmetro de controle de ângulo podem ser enviados. Neste caso, qualquer uma das disposições das figuras 7, 8 ou 9 pode ser empregada (omitindo o Decorrelator 38 e 42 da figura 7 e 46, 48. 50, 52 das figuras 8 e 9).
Figure BRPI0508343B1_D0130
Como nas figuras 1 e 2, as disposições das figuras 6-9 pretendem mostrar qualquer número de canais de entrada e de saída apesar de que, para simplicidade de apresentação, somente dois canais estão mostrados.
Deve ser compreendido que a implementação de outras variações e modificações da invenção e seus vários aspectos ficarão aparentes para aqueles versados na técnica, e que a invenção não está limitada por - J 5 estas modalidades específicas descritas. É portanto contemplado cobrir pela presente invenção quaisquer e todas modificações, variações, ou equivalentes que caiam dentro do verdadeiro espírito e escopo dos princípios subjacentes básicos aqui descritos.
Figure BRPI0508343B1_D0131

Claims (44)

  1. REIVINDICAÇÕES
    1. Método para decodificar M canais de áudio codificados representando N canais de áudio, onde N é igual a dois ou mais, e um conjunto de um ou mais parâmetros espaciais, o método compreendendo:
    a) receber os referidos M canais de áudio codificados e o referido conjunto de parâmetros espaciais,
    b) derivar N sinais de áudio a partir dos referidos M canais de áudio codificados, em que cada sinal de áudio é dividido em uma pluralidade de faixas de frequência, onde cada faixa compreende um ou mais componentes espectrais, e
    c) gerar um sinal de saída de múltiplos canais a partir dos N sinais de áudio e dos parâmetros espaciais, caracterizado pelo fato de que
    M é igual a dois ou mais, pelo menos um dos referidos N sinais de áudio é um sinal correlacionado derivado de uma combinação ponderada de pelo menos dois dos referidos M canais de áudio codificados, o referido conjunto de parâmetros espaciais inclui um primeiro parâmetro indicativo da quantidade de um sinal não correlacionado para mistura com um sinal correlacionado e, a etapa c) inclui derivar pelo menos um sinal não-correlacionado do referido pelo menos um sinal correlacionado, e controlar a proporção do pelo menos um sinal correlacionado para referido pelo menos um sinalo nãocorrelacionado em pelo menos um canal dos referido sinal de saída de múltiplos canais em resposta a um ou mais dos ditos parâmetros espaciais, em que o referido controle está parcialmente de acordo com o referido primeiro parâmetro.
  2. 2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a etapa c) inclui derivar referido pelo menos um sinal nãocorrelacionado pela aplicação de um filtro de reverberação artificial ao referido pelo menos um sinal correlacionado.
  3. 3. Método, de acordo com a reivindicação 1, caracterizado pelo
    Petição 870180038999, de 11/05/2018, pág. 7/18 fato de que a etapa c) inclui derivar o referido pelo menos um sinal nãocorrelacionado pela aplicação de uma pluralidade de filtros de reverberação artificiais ao referido pelo menos um sinal correlacionado.
  4. 4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que cada um da referida pluralidade de filtros de reverberação artificiais possui uma característica de filtro única.
  5. 5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o referido controle na etapa c) inclui derivar uma proporção separada do referido pelo menos um sinal correlacionado ao referido pelo menos um sinal não-correlacionado para cada uma da dita pluralidade de faixas de frequência, pelo menos parcialmente de acordo com o dito primeiro parâmetro.
  6. 6. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que os referidos N sinais de áudio são derivados a partir dos ditos M canais de áudio codificados por um processo que inclui a desmatrização dos referidos M canais de áudio codificados.
  7. 7. Método, de acordo com a reivindicação 6, caracterizado pelo fato de que a desmatrização opera pelo menos parcialmente em resposta a um ou mais dos referidos parâmetros espaciais.
  8. 8. Método, de acordo com qualquer uma das reivindicações 1 a
    7, caracterizado pelo fato de compreender ainda o deslocamento das magnitudes dos componentes espectrais nos referidos pelo menos um N sinais de áudio em resposta a um ou mais dos ditos parâmetros espaciais.
  9. 9. Método, de acordo com qualquer uma das reivindicações 1 a
    8, caracterizado pelo fato de que o dito sinal de saída de múltiplos canais está no domínio do tempo.
  10. 10. Método de acordo com qualquer uma das reivindicações 1 a 8, caracterizado pelo fato de que o dito sinal de saída de múltiplos canais está no domínio da frequência.
  11. 11. Método de acordo com qualquer uma das reivindicações 1 a 10, caracterizado pelo fato de que N é igual a 3 ou mais.
  12. 12. Método para codificar N canais de áudio de entrada em M
    Petição 870180038999, de 11/05/2018, pág. 8/18 canais de áudio codificados, onde N é igual a dois ou mais, e um conjunto de um ou mais parâmetros espaciais relativos aos N canais de áudio de entrada, o método compreendendo
    a) derivar M sinais de áudio a partir dos referidos N canais de áudio de entrada,
    b) determinar um conjunto de um ou mais parâmetros espaciais indicativos das propriedades espaciais dos N canais de áudio de entrada, e
    c) gerar M sinais codificados compreendendo os M sinais de áudio derivados na etapa (a) e o conjunto de parâmetros espaciais determinado na etapa (b), caracterizado pelo fato de que M é igual a um ou mais e a etapa (b) inclui determinar o referido conjunto de um ou mais parâmetros espaciais de tal modo que ele inclua um primeiro parâmetro responsivo a medidas de estabilidade espectral intracanais, que é uma medida da extensão na qual componentes espectrais mudam ao longo do tempo, e similaridade de ângulos de fase intracanais.
  13. 13. Método de acordo com a reivindicação 12, caracterizado pelo fato de que a medida de estabilidade espectral intracanais é uma medida de mudanças ao longo do tempo da amplitude ou energia dos componentes espectrais em um primeiro canal de entrada.
  14. 14. Método de acordo com a reivindicação 12 ou 13, caracterizado pelo fato de que a medida de similaridade de ângulos de fase intracanais é uma medida da similaridade dos ângulos de fase intracanais de componentes espectrais de um primeiro canal de áudio de entrada em relação aos componentes espectrais correspondentes de um outro canal de áudio de entrada.
  15. 15. Método de acordo com qualquer uma das reivindicações 12 a 14, caracterizado pelo fato de que o conjunto de parâmetros inclui adicionalmente um parâmetro adicional responsivo aos ângulos de fase de componentes espectrais em um primeiro canal de áudio de entrada em relação a ângulos de fase de componentes espectrais correspondentes em um outro canal de áudio de entrada.
    Petição 870180038999, de 11/05/2018, pág. 9/18
  16. 16. Método de acordo com a reivindicação 15, caracterizado pelo fato de que os referidos M sinais de áudio são derivados a partir dos ditos N canais de áudio de entrada por um processo que inclui modificar pelo menos um dos referidos N canais de áudio de entrada em resposta a uma função do referido parâmetro adicional.
  17. 17. Método de acordo com a reivindicação 16, caracterizado pelo fato de que a dita modificação altera ângulos de fase de componentes espectrais do dito pelo menos um dos referidos N canais de áudio de entrada.
  18. 18. Método de acordo com qualquer uma das reivindicações 12 a 17, caracterizado pelo fato de que múltiplos sinais de áudio são derivados a partir dos referidos N canais de áudio de entrada por um processo que inclui o matriciamento passivo ou ativo dos referidos N canais de áudio de entrada.
  19. 19. Método de acordo com qualquer uma das reivindicações 12 a 18, caracterizado pelo fato de que o conjunto de parâmetros inclui adicionalmente um parâmetro responsivo à ocorrência de um transiente em um primeiro canal de áudio de entrada.
  20. 20. Método de acordo com qualquer uma das reivindicações 12 a 19, caracterizado pelo fato de que o conjunto de parâmetros inclui adicionalmente um parâmetro responsivo à amplitude ou energia de um primeiro canal de áudio de entrada.
  21. 21. Método de acordo com qualquer uma das reivindicações 12 a 20, caracterizado pelo fato de que a medida de estabilidade espectral intracanais é relativa a componentes espectrais em uma faixa de frequências do dito primeiro canal de entrada, e a medida de similaridade de ângulos de fase intracanais é relativa a componentes espectrais na referida faixa de frequências do dito primeiro canal de entrada em relação a componentes espectrais em uma faixa de frequências correspondente do referido outro canal de entrada.
  22. 22. Método para decodificar M canais de áudio codificados representando N canais de áudio, onde N é igual a dois ou mais, e um conjunto de um ou mais parâmetros espaciais relativos aos N canais de áudio, o
    Petição 870180038999, de 11/05/2018, pág. 10/18 método compreendendo
    a) receber os ditos M canais de áudio codificados e o dito conjunto de parâmetros espaciais indicativos das propriedades espaciais dos N canais de áudio,
    b) derivar N canais de áudio a partir dos referidos M canais de áudio codificados, onde um sinal de áudio em cada um dos canais de áudio é dividido em uma pluralidade de faixas de frequência, onde cada faixa compreende um ou mais componentes espectrais, e
    c) gerar um sinal de saída de múltiplos canais a partir dos N canais de áudio e dos parâmetros espaciais, caracterizado pelo fato de que
    M é igual a um ou mais, e o referido conjunto de parâmetros espaciais inclui um primeiro parâmetro responsivo a medidas de estabilidade espectral intracanais, que é uma medida da extensão na qual componentes espectrais mudam ao longo do tempo, e similaridade de ângulos de fase intracanais, e a etapa (c) inclui o deslocamento dos ângulos de fase dos componentes espectrais no sinal de áudio em pelo menos um dos referidos N canais de áudio em resposta a um ou mais dos referidos parâmetros espaciais, onde o referido deslocamento é, pelo menos em parte, de acordo com o dito primeiro parâmetro.
  23. 23. Método de acordo com a reivindicação 22, caracterizado pelo fato de que os ditos N canais de áudio são derivados a partir dos ditos M canais de áudio codificados por um processo que inclui a desmatrização ativa ou passiva dos referidos M canais de áudio codificados.
  24. 24. Método de acordo com a reivindicação 22, caracterizado pelo fato de que M é igual a dois ou mais e os referidos N canais de áudio são derivados a partir dos ditos M canais de áudio codificados por um processo que inclui a desmatrização ativa dos referidos M canais de áudio codificados.
  25. 25. Método de acordo com a reivindicação 24, caracterizado pelo fato de que a desmatrização opera pelo menos em parte em resposta a características dos referidos M canais de áudio codificados.
    Petição 870180038999, de 11/05/2018, pág. 11/18
  26. 26. Método de acordo com a reivindicação 24 ou 25, caracterizado pelo fato de que a desmatrização opera pelo menos em parte em resposta a um ou mais dos referidos parâmetros espaciais.
  27. 27. Método de acordo com a reivindicação 22, caracterizado pelo fato de que o dito deslocamento é efetuado de acordo com uma primeira modalidade de operação ou uma segunda modalidade de operação, o deslocamento dos ângulos de fase de componentes espectrais no sinal de áudio de acordo com uma primeira modalidade de operação inclui deslocar os ângulos de fase de componentes espectrais no sinal de áudio de acordo com uma primeira resolução de frequência e uma primeira resolução de tempo, e o deslocamento dos ângulos de fase de componentes espectrais no sinal de áudio de acordo om uma segunda modalidade de operação inclui o deslocamento dos ângulos de fase de componentes espectrais no sinal de áudio de acordo com uma segunda resolução de frequência e uma segunda resolução de tempo.
  28. 28. Método de acordo com a reivindicação 27, caracterizado pelo fato de que a segunda resolução de tempo é mais fina do que a primeira resolução de tempo.
  29. 29. Método de acordo com a reivindicação 27, caracterizado pelo fato de que a segunda resolução de frequência é mais grossa ou igual à primeira resolução de frequência, e a segunda resolução de tempo é mais fina do que a primeira resolução de tempo.
  30. 30. Método de acordo com a reivindicação 28, caracterizado pelo fato de que a primeira resolução de frequência é mais fina do que a resolução de frequência dos parâmetros espaciais.
  31. 31. Método de acordo com a reivindicação 29 ou 30, caracterizado pelo fato de que a segunda resolução de tempo é mais fina do que a resolução de tempo dos parâmetros espaciais.
  32. 32. Método de acordo com a reivindicação 22, caracterizado pelo fato de que o dito deslocamento é efetuado de acordo com uma primeira modalidade de operação ou uma segunda modalidade de operação, a dita primeira modalidade de operação compreende deslocar os ângulos de fase
    Petição 870180038999, de 11/05/2018, pág. 12/18
    7 de componentes espectrais em pelo menos uma ou mais da pluralidade de faixas de frequências, onde cada componente espectral é deslocado por um ângulo diferente, cujo ângulo é substancialmente invariável no tempo, e a dita segunda modalidade de operação compreende o deslocamento dos ângulos de fase de todos os componentes espectrais na dita pelo menos uma ou mais da pluralidade de faixas de frequência pelo mesmo ângulo, onde um deslocamento diferente de ângulo de fase é aplicado a cada faixa de frequência na qual ângulos de fase são deslocados e cujo deslocamento de ângulo de fase varia com o tempo.
  33. 33. Método de acordo com a reivindicação 32, caracterizado pelo fato de que na dita segunda modalidade de operação os ângulos de fase de componentes espectrais dentro de uma faixa de frequência são interpolados para reduzir as mudanças de ângulo de fase de componente espectral para componente espectral através de um limite de faixa de frequência.
  34. 34. Método de acordo com a reivindicação 22, caracterizado pelo fato de que o deslocamento é efetuado de acordo com uma primeira modalidade de operação ou uma segunda modalidade de operação, a primeira modalidade de operação compreendendo o deslocamento de ângulos de fase de componentes espectrais em pelo menos uma ou mais da pluralidade de faixas de frequência, onde cada componente espectral é deslocado por um ângulo diferente, cujo ângulo é substancial mente invariável no tempo, e a dita segunda modalidade de operação não compreende qualquer deslocamento dos ângulos de fase de componentes espectrais.
  35. 35. Método de acordo com qualquer uma das reivindicações 27 a 34, caracterizado pelo fato de que o referido deslocamento dos ângulos de fase de componentes espectrais inclui um deslocamento aleatório.
  36. 36. Método de acordo com a reivindicação 35, caracterizado pelo fato de que o dito deslocamento aleatório é controlável.
  37. 37. Método de acordo com qualquer uma das reivindicações 27 a 36, caracterizado pelo fato de adicionalmente compreender deslocar as magnitudes dos componentes espectrais no sinal de áudio em resposta a um ou mais dos ditos parâmetros espaciais de acordo com uma primeira
    Petição 870180038999, de 11/05/2018, pág. 13/18 modalidade de operação e uma segunda modalidade de operação.
  38. 38. Método de acordo com a reivindicação 37, caracterizado pelo fato de que o referido deslocamento de magnitude inclui um deslocamento aleatório.
  39. 39. Método de acordo com a reivindicação 37 ou 38, caracterizado pelo fato de que a quantidade de deslocamento de magnitude é controlável.
  40. 40. Método de acordo com qualquer uma das reivindicações 27 a 39, caracterizado pelo fato de que a seleção de modalidade de operação é responsiva ao dito sinal de áudio.
  41. 41. Método de acordo com a reivindicação 40, caracterizado pelo fato de que a seleção de modalidade de operação é responsiva à presença de um transiente no dito sinal de áudio.
  42. 42. Método de acordo com qualquer uma das reivindicações 27 a 41, caracterizado pelo fato de que a seleção de modalidade de operação é responsiva a um sinal de controle.
  43. 43. Método de acordo com qualquer uma das reivindicações 22 a 42, caracterizado pelo fato de que o dito sinal de saída de múltiplos canais está no domínio do tempo.
  44. 44. Método de acordo com qualquer uma das reivindicações 22 a 42, caracterizado pelo fato de que o dito sinal de saída de múltiplos canais está no domínio da frequência.
    Petição 870180038999, de 11/05/2018, pág. 14/18
    ·. ·
    LU
    LU to
    UJ < Q? to g 111 'U oo oo < —1 oc è Ο Ψ o
    Ο ω o
    Q O 2 §0-0 < LU
    Q < z UJ < to ίζ
    III oo oo < —1
    5 < OC ot
    NALISADOR DE ÁUDIO GIRAR ÂNGULO “ Λ ao c o GIRAR Angulo ~ Λ í <c <N xt· V-
    2/11
    3/11 ο Q.
    UJ
    I—
    FREQUÊNCIA
    QUADRO
    cn CO b- <O tO M CO CM T*~ O Z z Z Z Z z Z z z z CO CO CD ca CO CD CD £0 CD co cn 00 Γ- co LO -st- co CM 0 Z. z Z z Z Z Z z Z z CD CD CO CD CD CD CD ca DO CQ cn co b- <O 10 t CO CM x~ O Z. ’ z Z z Z Z Z z z Z CD CD CD CD CQ ca CQ cn CD CQ cn ao b- <0 tO m- CO CM O Z Z z z z z Z z z Z 00 CQ co CD co £0 CD 00 CD 00 cn ao b- <O to CO CM 0 2: Z z Z z Z z z z z £0 CD m ca CD CO £0 ca cn CQ CD 00 b- co to 5j- CO CM -r- 0 z z Z Z Z z Z z Z z CD - .......- .· . CD CQ CD CO ca .....V ca ca l ca f ~ cn
    4/11
    5/11 *
    ω Ο χ
    6/11
    PARAMETRO DE r/Λ CA
    CONTROLE DE ÂNGULO IIUi. QA
    DE SUB-BANDA
    FATORES DE ESCALA DE AMPLITUDE E DE ÂNGULO
    7/11
    FATORES DE ESCALA DE AMPLITUDE E DE ÂNGULO
    LU O
    Z CO
    O < o.<£g O<È5
    H88 <o i
    O LL
    F/G._ 5B
    8/11 η
    Ο.
    -J tf < LU
    Z I—
    OO O tf Z V< =d CO Ll.
    S<Z tr m < OqO £<o e ο α õ^z
    Z
    O O Ott <5 CD LL
    S2:
    sg
    L
    CO i
    a
    9/11
    I
    I
    I
    I I
    I I
    I I
    I
    10/11
    11/11
BRPI0508343A 2004-03-01 2005-02-28 método para decodificar m canais de áudio codificados representando n canais de áudio e método para codificar n canais de áudio de entrada em m canais de áudio codificados. BRPI0508343B1 (pt)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US54936804P 2004-03-01 2004-03-01
US57997404P 2004-06-14 2004-06-14
US58825604P 2004-07-14 2004-07-14
PCT/US2005/006359 WO2005086139A1 (en) 2004-03-01 2005-02-28 Multichannel audio coding

Publications (2)

Publication Number Publication Date
BRPI0508343A BRPI0508343A (pt) 2007-07-24
BRPI0508343B1 true BRPI0508343B1 (pt) 2018-11-06

Family

ID=34923263

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0508343A BRPI0508343B1 (pt) 2004-03-01 2005-02-28 método para decodificar m canais de áudio codificados representando n canais de áudio e método para codificar n canais de áudio de entrada em m canais de áudio codificados.

Country Status (17)

Country Link
US (18) US8983834B2 (pt)
EP (4) EP1721312B1 (pt)
JP (1) JP4867914B2 (pt)
KR (1) KR101079066B1 (pt)
CN (3) CN1926607B (pt)
AT (4) ATE527654T1 (pt)
AU (2) AU2005219956B2 (pt)
BR (1) BRPI0508343B1 (pt)
CA (11) CA3026267C (pt)
DE (3) DE602005005640T2 (pt)
ES (1) ES2324926T3 (pt)
HK (4) HK1092580A1 (pt)
IL (1) IL177094A (pt)
MY (1) MY145083A (pt)
SG (3) SG10201605609PA (pt)
TW (3) TWI397902B (pt)
WO (1) WO2005086139A1 (pt)

Families Citing this family (273)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7644282B2 (en) 1998-05-28 2010-01-05 Verance Corporation Pre-processed information embedding system
US6737957B1 (en) 2000-02-16 2004-05-18 Verance Corporation Remote control signaling using audio watermarks
US7610205B2 (en) 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7283954B2 (en) 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7461002B2 (en) 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
CA2499967A1 (en) 2002-10-15 2004-04-29 Verance Corporation Media monitoring, management and information system
US7369677B2 (en) * 2005-04-26 2008-05-06 Verance Corporation System reactions to the detection of embedded watermarks in a digital host content
US20060239501A1 (en) 2005-04-26 2006-10-26 Verance Corporation Security enhancements of digital watermarks for multi-media content
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
WO2007109338A1 (en) * 2006-03-21 2007-09-27 Dolby Laboratories Licensing Corporation Low bit rate audio encoding and decoding
ATE527654T1 (de) 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
EP1769491B1 (en) * 2004-07-14 2009-09-30 Koninklijke Philips Electronics N.V. Audio channel conversion
US7508947B2 (en) * 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
TWI393121B (zh) 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
TWI497485B (zh) * 2004-08-25 2015-08-21 Dolby Lab Licensing Corp 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法
CN101048935B (zh) 2004-10-26 2011-03-23 杜比实验室特许公司 控制音频信号的单位响度或部分单位响度的方法和设备
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
SE0402651D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
DE102005014477A1 (de) 2005-03-30 2006-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und zum Erzeugen einer Multikanal-Darstellung
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US7418394B2 (en) * 2005-04-28 2008-08-26 Dolby Laboratories Licensing Corporation Method and system for operating audio encoders utilizing data from overlapping audio segments
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126843A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
AU2006255662B2 (en) * 2005-06-03 2012-08-23 Dolby Laboratories Licensing Corporation Apparatus and method for encoding audio signals with decoding instructions
US8020004B2 (en) 2005-07-01 2011-09-13 Verance Corporation Forensic marking using a common customization function
US8781967B2 (en) 2005-07-07 2014-07-15 Verance Corporation Watermarking in an encrypted domain
JP5009910B2 (ja) * 2005-07-22 2012-08-29 フランス・テレコム レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
US7917358B2 (en) * 2005-09-30 2011-03-29 Apple Inc. Transient detection by power weighted average
EP1952113A4 (en) * 2005-10-05 2009-05-27 Lg Electronics Inc METHOD AND DEVICE FOR SIGNAL PROCESSING AND CODING AND DECODING METHOD AND DEVICE THEREFOR
KR100857112B1 (ko) * 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7974713B2 (en) 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
KR20070041398A (ko) * 2005-10-13 2007-04-18 엘지전자 주식회사 신호 처리 방법 및 신호 처리 장치
US7970072B2 (en) 2005-10-13 2011-06-28 Lg Electronics Inc. Method and apparatus for processing a signal
KR100866885B1 (ko) * 2005-10-20 2008-11-04 엘지전자 주식회사 멀티채널 오디오 신호의 부호화 및 복호화 방법과 그 장치
US8620644B2 (en) * 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
US7676360B2 (en) * 2005-12-01 2010-03-09 Sasken Communication Technologies Ltd. Method for scale-factor estimation in an audio encoder
TWI420918B (zh) * 2005-12-02 2013-12-21 Dolby Lab Licensing Corp 低複雜度音訊矩陣解碼器
ES2446245T3 (es) 2006-01-19 2014-03-06 Lg Electronics Inc. Método y aparato para procesar una señal de medios
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
JP4951985B2 (ja) * 2006-01-30 2012-06-13 ソニー株式会社 音声信号処理装置、音声信号処理システム、プログラム
WO2007091845A1 (en) 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
DE102006006066B4 (de) * 2006-02-09 2008-07-31 Infineon Technologies Ag Vorrichtung und Verfahren zur Detektion von Audio-Signalrahmen
ATE505912T1 (de) 2006-03-28 2011-04-15 Fraunhofer Ges Forschung Verbessertes verfahren zur signalformung bei der mehrkanal-audiorekonstruktion
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
EP1845699B1 (en) 2006-04-13 2009-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal decorrelator
ATE493794T1 (de) 2006-04-27 2011-01-15 Dolby Lab Licensing Corp Tonverstärkungsregelung mit erfassung von publikumsereignissen auf der basis von spezifischer lautstärke
ATE527833T1 (de) * 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
EP2084901B1 (en) 2006-10-12 2015-12-09 LG Electronics Inc. Apparatus for processing a mix signal and method thereof
JP4940308B2 (ja) 2006-10-20 2012-05-30 ドルビー ラボラトリーズ ライセンシング コーポレイション リセットを用いるオーディオダイナミクス処理
BRPI0718614A2 (pt) 2006-11-15 2014-02-25 Lg Electronics Inc Método e aparelho para decodificar sinal de áudio.
KR101062353B1 (ko) 2006-12-07 2011-09-05 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 그 장치
BRPI0719884B1 (pt) 2006-12-07 2020-10-27 Lg Eletronics Inc método, aparelho e mídia legível por computador para decodificar um sinal de áudio
EP2595152A3 (en) * 2006-12-27 2013-11-13 Electronics and Telecommunications Research Institute Transkoding apparatus
US8200351B2 (en) * 2007-01-05 2012-06-12 STMicroelectronics Asia PTE., Ltd. Low power downmix energy equalization in parametric stereo encoders
JP5140684B2 (ja) * 2007-02-12 2013-02-06 ドルビー ラボラトリーズ ライセンシング コーポレイション 高齢又は聴覚障害聴取者のための非スピーチオーディオに対するスピーチオーディオの改善された比率
BRPI0807703B1 (pt) 2007-02-26 2020-09-24 Dolby Laboratories Licensing Corporation Método para aperfeiçoar a fala em áudio de entretenimento e meio de armazenamento não-transitório legível por computador
DE102007018032B4 (de) * 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
JP5133401B2 (ja) 2007-04-26 2013-01-30 ドルビー・インターナショナル・アクチボラゲット 出力信号の合成装置及び合成方法
JP5291096B2 (ja) 2007-06-08 2013-09-18 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
US7953188B2 (en) * 2007-06-25 2011-05-31 Broadcom Corporation Method and system for rate>1 SFBC/STBC using hybrid maximum likelihood (ML)/minimum mean squared error (MMSE) estimation
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
WO2009011827A1 (en) 2007-07-13 2009-01-22 Dolby Laboratories Licensing Corporation Audio processing using auditory scene analysis and spectral skewness
US8135230B2 (en) * 2007-07-30 2012-03-13 Dolby Laboratories Licensing Corporation Enhancing dynamic ranges of images
US8385556B1 (en) 2007-08-17 2013-02-26 Dts, Inc. Parametric stereo conversion system and method
WO2009045649A1 (en) * 2007-08-20 2009-04-09 Neural Audio Corporation Phase decorrelation for audio processing
CN101790756B (zh) 2007-08-27 2012-09-05 爱立信电话股份有限公司 瞬态检测器以及用于支持音频信号的编码的方法
JP5883561B2 (ja) 2007-10-17 2016-03-15 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ アップミックスを使用した音声符号器
WO2009075510A1 (en) * 2007-12-09 2009-06-18 Lg Electronics Inc. A method and an apparatus for processing a signal
CN102017402B (zh) 2007-12-21 2015-01-07 Dts有限责任公司 用于调节音频信号的感知响度的系统
WO2009084920A1 (en) 2008-01-01 2009-07-09 Lg Electronics Inc. A method and an apparatus for processing a signal
KR101449434B1 (ko) * 2008-03-04 2014-10-13 삼성전자주식회사 복수의 가변장 부호 테이블을 이용한 멀티 채널 오디오를부호화/복호화하는 방법 및 장치
ES2739667T3 (es) 2008-03-10 2020-02-03 Fraunhofer Ges Forschung Dispositivo y método para manipular una señal de audio que tiene un evento transitorio
WO2009116280A1 (ja) * 2008-03-19 2009-09-24 パナソニック株式会社 ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法
KR101599875B1 (ko) * 2008-04-17 2016-03-14 삼성전자주식회사 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 부호화 방법 및 장치, 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 복호화 방법 및 장치
KR20090110244A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
WO2009128078A1 (en) * 2008-04-17 2009-10-22 Waves Audio Ltd. Nonlinear filter for separation of center sounds in stereophonic audio
KR20090110242A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 신호를 처리하는 방법 및 장치
KR101061129B1 (ko) * 2008-04-24 2011-08-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
US8060042B2 (en) 2008-05-23 2011-11-15 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US8630848B2 (en) * 2008-05-30 2014-01-14 Digital Rise Technology Co., Ltd. Audio signal transient detection
WO2009146734A1 (en) * 2008-06-03 2009-12-10 Nokia Corporation Multi-channel audio coding
US8355921B2 (en) * 2008-06-13 2013-01-15 Nokia Corporation Method, apparatus and computer program product for providing improved audio processing
US8259938B2 (en) 2008-06-24 2012-09-04 Verance Corporation Efficient and secure forensic marking in compressed
JP5110529B2 (ja) * 2008-06-27 2012-12-26 日本電気株式会社 物標探査装置、物標探査プログラム及び物標探査方法
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
KR101381513B1 (ko) 2008-07-14 2014-04-07 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
EP2154911A1 (en) 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
EP2154910A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for merging spatial audio streams
US8346380B2 (en) 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
KR101108061B1 (ko) * 2008-09-25 2012-01-25 엘지전자 주식회사 신호 처리 방법 및 이의 장치
US8346379B2 (en) 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
TWI413109B (zh) * 2008-10-01 2013-10-21 Dolby Lab Licensing Corp 用於上混系統之解相關器
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
KR101600352B1 (ko) * 2008-10-30 2016-03-07 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
JP5317177B2 (ja) * 2008-11-07 2013-10-16 日本電気株式会社 目標物探知装置及び目標物探知制御プログラム、目標物探知方法
JP5317176B2 (ja) * 2008-11-07 2013-10-16 日本電気株式会社 物体探査装置及び物体探査プログラム、物体探査方法
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
WO2010070225A1 (fr) * 2008-12-15 2010-06-24 France Telecom Codage perfectionne de signaux audionumeriques multicanaux
TWI449442B (zh) * 2009-01-14 2014-08-11 Dolby Lab Licensing Corp 用於無回授之頻域主動矩陣解碼的方法與系統
EP2214162A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Upmixer, method and computer program for upmixing a downmix audio signal
EP2214161A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal
WO2010101527A1 (en) * 2009-03-03 2010-09-10 Agency For Science, Technology And Research Methods for determining whether a signal includes a wanted signal and apparatuses configured to determine whether a signal includes a wanted signal
US8666752B2 (en) 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
ES2452569T3 (es) * 2009-04-08 2014-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato, procedimiento y programa de computación para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavización de valor fase
CN102307323B (zh) * 2009-04-20 2013-12-18 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法
CN101533641B (zh) 2009-04-20 2011-07-20 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法和装置
CN101556799B (zh) * 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
WO2011047887A1 (en) * 2009-10-21 2011-04-28 Dolby International Ab Oversampling in a combined transposer filter bank
CN102171754B (zh) 2009-07-31 2013-06-26 松下电器产业株式会社 编码装置以及解码装置
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
KR101599884B1 (ko) * 2009-08-18 2016-03-04 삼성전자주식회사 멀티 채널 오디오 디코딩 방법 및 장치
EP2491553B1 (en) 2009-10-20 2016-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using an iterative interval size reduction
KR20110049068A (ko) * 2009-11-04 2011-05-12 삼성전자주식회사 멀티 채널 오디오 신호의 부호화/복호화 장치 및 방법
DE102009052992B3 (de) * 2009-11-12 2011-03-17 Institut für Rundfunktechnik GmbH Verfahren zum Abmischen von Mikrofonsignalen einer Tonaufnahme mit mehreren Mikrofonen
US9324337B2 (en) * 2009-11-17 2016-04-26 Dolby Laboratories Licensing Corporation Method and system for dialog enhancement
CN103854651B (zh) * 2009-12-16 2017-04-12 杜比国际公司 Sbr比特流参数缩混
FR2954640B1 (fr) * 2009-12-23 2012-01-20 Arkamys Procede d'optimisation de la reception stereo pour radio analogique et recepteur de radio analogique associe
CN102792370B (zh) * 2010-01-12 2014-08-06 弗劳恩霍弗实用研究促进协会 使用描述有效状态值及区间边界的散列表的音频编码器、音频解码器、编码音频信息的方法及解码音频信息的方法
WO2011094675A2 (en) * 2010-02-01 2011-08-04 Rensselaer Polytechnic Institute Decorrelating audio signals for stereophonic and surround sound using coded and maximum-length-class sequences
TWI557723B (zh) * 2010-02-18 2016-11-11 杜比實驗室特許公司 解碼方法及系統
US8428209B2 (en) * 2010-03-02 2013-04-23 Vt Idirect, Inc. System, apparatus, and method of frequency offset estimation and correction for mobile remotes in a communication network
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
KR20110116079A (ko) 2010-04-17 2011-10-25 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
WO2012006770A1 (en) * 2010-07-12 2012-01-19 Huawei Technologies Co., Ltd. Audio signal generator
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
MY178197A (en) * 2010-08-25 2020-10-06 Fraunhofer Ges Forschung Apparatus for generating a decorrelated signal using transmitted phase information
KR101697550B1 (ko) * 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
US9607131B2 (en) 2010-09-16 2017-03-28 Verance Corporation Secure and efficient content screening in a networked environment
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding
EP2612321B1 (en) * 2010-09-28 2016-01-06 Huawei Technologies Co., Ltd. Device and method for postprocessing decoded multi-channel audio signal or decoded stereo signal
JP5533502B2 (ja) * 2010-09-28 2014-06-25 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
WO2012070370A1 (ja) * 2010-11-22 2012-05-31 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置、方法およびプログラム、並びに、音声復号装置、方法およびプログラム
TWI665659B (zh) * 2010-12-03 2019-07-11 美商杜比實驗室特許公司 音頻解碼裝置、音頻解碼方法及音頻編碼方法
EP2464146A1 (en) * 2010-12-10 2012-06-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decomposing an input signal using a pre-calculated reference curve
EP2477188A1 (en) * 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
WO2012122303A1 (en) 2011-03-07 2012-09-13 Xiph. Org Method and system for two-step spreading for tonal artifact avoidance in audio coding
US9009036B2 (en) 2011-03-07 2015-04-14 Xiph.org Foundation Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding
US9015042B2 (en) 2011-03-07 2015-04-21 Xiph.org Foundation Methods and systems for avoiding partial collapse in multi-block audio coding
JP6009547B2 (ja) 2011-05-26 2016-10-19 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. オーディオ・システム及びオーディオ・システムのための方法
US9129607B2 (en) 2011-06-28 2015-09-08 Adobe Systems Incorporated Method and apparatus for combining digital signals
US9546924B2 (en) * 2011-06-30 2017-01-17 Telefonaktiebolaget Lm Ericsson (Publ) Transform audio codec and methods for encoding and decoding a time segment of an audio signal
US8615104B2 (en) 2011-11-03 2013-12-24 Verance Corporation Watermark extraction based on tentative watermarks
US8533481B2 (en) 2011-11-03 2013-09-10 Verance Corporation Extraction of embedded watermarks from a host content based on extrapolation techniques
US8923548B2 (en) 2011-11-03 2014-12-30 Verance Corporation Extraction of embedded watermarks from a host content using a plurality of tentative watermarks
US8682026B2 (en) 2011-11-03 2014-03-25 Verance Corporation Efficient extraction of embedded watermarks in the presence of host content distortions
US8745403B2 (en) 2011-11-23 2014-06-03 Verance Corporation Enhanced content management based on watermark extraction records
US9547753B2 (en) 2011-12-13 2017-01-17 Verance Corporation Coordinated watermarking
US9323902B2 (en) 2011-12-13 2016-04-26 Verance Corporation Conditional access using embedded watermarks
EP2803066A1 (en) * 2012-01-11 2014-11-19 Dolby Laboratories Licensing Corporation Simultaneous broadcaster -mixed and receiver -mixed supplementary audio services
CN108810744A (zh) 2012-04-05 2018-11-13 诺基亚技术有限公司 柔性的空间音频捕捉设备
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
US9571606B2 (en) 2012-08-31 2017-02-14 Verance Corporation Social media viewing system
US10432957B2 (en) 2012-09-07 2019-10-01 Saturn Licensing Llc Transmission device, transmitting method, reception device, and receiving method
US9106964B2 (en) 2012-09-13 2015-08-11 Verance Corporation Enhanced content distribution using advertisements
US8726304B2 (en) 2012-09-13 2014-05-13 Verance Corporation Time varying evaluation of multimedia content
US8869222B2 (en) 2012-09-13 2014-10-21 Verance Corporation Second screen content
US9269363B2 (en) * 2012-11-02 2016-02-23 Dolby Laboratories Licensing Corporation Audio data hiding based on perceptual masking and detection based on code multiplexing
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
US9830917B2 (en) 2013-02-14 2017-11-28 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
EP2956935B1 (en) 2013-02-14 2017-01-04 Dolby Laboratories Licensing Corporation Controlling the inter-channel coherence of upmixed audio signals
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
US9191516B2 (en) * 2013-02-20 2015-11-17 Qualcomm Incorporated Teleconferencing using steganographically-embedded audio data
WO2014153199A1 (en) 2013-03-14 2014-09-25 Verance Corporation Transactional video marking system
US9786286B2 (en) * 2013-03-29 2017-10-10 Dolby Laboratories Licensing Corporation Methods and apparatuses for generating and using low-resolution preview tracks with high-quality encoded object and multichannel audio signals
US10635383B2 (en) 2013-04-04 2020-04-28 Nokia Technologies Oy Visual audio processing apparatus
US9570083B2 (en) 2013-04-05 2017-02-14 Dolby International Ab Stereo audio encoder and decoder
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
KR102072365B1 (ko) * 2013-04-05 2020-02-03 돌비 인터네셔널 에이비 고급 양자화기
EP2997573A4 (en) 2013-05-17 2017-01-18 Nokia Technologies OY Spatial object oriented audio apparatus
ES2624668T3 (es) 2013-05-24 2017-07-17 Dolby International Ab Codificación y descodificación de objetos de audio
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
JP6216553B2 (ja) 2013-06-27 2017-10-18 クラリオン株式会社 伝搬遅延補正装置及び伝搬遅延補正方法
EP3933834A1 (en) 2013-07-05 2022-01-05 Dolby International AB Enhanced soundfield coding using parametric component generation
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
EP2830334A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2830063A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for decoding an encoded audio signal
SG11201600466PA (en) 2013-07-22 2016-02-26 Fraunhofer Ges Forschung Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2830332A3 (en) 2013-07-22 2015-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration
EP2830336A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Renderer controlled spatial upmix
EP2838086A1 (en) 2013-07-22 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
US9251549B2 (en) 2013-07-23 2016-02-02 Verance Corporation Watermark extractor enhancements based on payload ranking
US9489952B2 (en) * 2013-09-11 2016-11-08 Bally Gaming, Inc. Wagering game having seamless looping of compressed audio
CN105531761B (zh) 2013-09-12 2019-04-30 杜比国际公司 音频解码系统和音频编码系统
ES2932422T3 (es) 2013-09-17 2023-01-19 Wilus Inst Standards & Tech Inc Método y aparato para procesar señales multimedia
TWI557724B (zh) * 2013-09-27 2016-11-11 杜比實驗室特許公司 用於將 n 聲道音頻節目編碼之方法、用於恢復 n 聲道音頻節目的 m 個聲道之方法、被配置成將 n 聲道音頻節目編碼之音頻編碼器及被配置成執行 n 聲道音頻節目的恢復之解碼器
SG11201602628TA (en) 2013-10-21 2016-05-30 Dolby Int Ab Decorrelator structure for parametric reconstruction of audio signals
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
EP3062534B1 (en) 2013-10-22 2021-03-03 Electronics and Telecommunications Research Institute Method for generating filter for audio signal and parameterizing device therefor
US9208334B2 (en) 2013-10-25 2015-12-08 Verance Corporation Content management using multiple abstraction layers
WO2015099424A1 (ko) 2013-12-23 2015-07-02 주식회사 윌러스표준기술연구소 오디오 신호의 필터 생성 방법 및 이를 위한 파라메터화 장치
CN103730112B (zh) * 2013-12-25 2016-08-31 讯飞智元信息科技有限公司 语音多信道模拟与采集方法
US9564136B2 (en) 2014-03-06 2017-02-07 Dts, Inc. Post-encoding bitrate reduction of multiple object audio
WO2015138798A1 (en) 2014-03-13 2015-09-17 Verance Corporation Interactive content acquisition using embedded codes
EP4294055A1 (en) 2014-03-19 2023-12-20 Wilus Institute of Standards and Technology Inc. Audio signal processing method and apparatus
CN106165454B (zh) 2014-04-02 2018-04-24 韦勒斯标准与技术协会公司 音频信号处理方法和设备
JP6418237B2 (ja) * 2014-05-08 2018-11-07 株式会社村田製作所 樹脂多層基板およびその製造方法
EP3162086B1 (en) * 2014-06-27 2021-04-07 Dolby International AB Apparatus for determining for the compression of an hoa data frame representation a lowest integer number of bits required for representing non-differential gain values
EP3489953B8 (en) * 2014-06-27 2022-06-15 Dolby International AB Determining a lowest integer number of bits required for representing non-differential gain values for the compression of an hoa data frame representation
EP2980801A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
EP3201918B1 (en) 2014-10-02 2018-12-12 Dolby International AB Decoding method and decoder for dialog enhancement
US9609451B2 (en) * 2015-02-12 2017-03-28 Dts, Inc. Multi-rate system for audio processing
US10262664B2 (en) * 2015-02-27 2019-04-16 Auro Technologies Method and apparatus for encoding and decoding digital data sets with reduced amount of data to be stored for error approximation
US9554207B2 (en) 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
CN107534786B (zh) * 2015-05-22 2020-10-27 索尼公司 传输装置、传输方法、图像处理装置、图像处理方法、接收装置、及接收方法
US10043527B1 (en) * 2015-07-17 2018-08-07 Digimarc Corporation Human auditory system modeling with masking energy adaptation
FR3048808A1 (fr) * 2016-03-10 2017-09-15 Orange Codage et decodage optimise d'informations de spatialisation pour le codage et le decodage parametrique d'un signal audio multicanal
EP3430620B1 (en) 2016-03-18 2020-03-25 Fraunhofer Gesellschaft zur Förderung der Angewand Encoding by reconstructing phase information using a structure tensor on audio spectrograms
CN107731238B (zh) 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
CN107886960B (zh) * 2016-09-30 2020-12-01 华为技术有限公司 一种音频信号重建方法及装置
US10362423B2 (en) 2016-10-13 2019-07-23 Qualcomm Incorporated Parametric audio decoding
AU2017357453B2 (en) 2016-11-08 2021-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain
KR102201308B1 (ko) * 2016-11-23 2021-01-11 텔레호낙티에볼라게트 엘엠 에릭슨(피유비엘) 상관해제 필터들의 적응적 제어를 위한 방법 및 장치
US10367948B2 (en) * 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
US10210874B2 (en) * 2017-02-03 2019-02-19 Qualcomm Incorporated Multi channel coding
EP3616196A4 (en) 2017-04-28 2021-01-20 DTS, Inc. AUDIO ENCODER WINDOW AND TRANSFORMATION IMPLEMENTATIONS
CN107274907A (zh) * 2017-07-03 2017-10-20 北京小鱼在家科技有限公司 双麦克风设备上实现指向性拾音的方法和装置
WO2019020757A2 (en) 2017-07-28 2019-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. APPARATUS FOR ENCODING OR DECODING A MULTI-CHANNEL SIGNAL ENCODED USING A FILLING SIGNAL GENERATED BY A BROADBAND FILTER
KR102489914B1 (ko) 2017-09-15 2023-01-20 삼성전자주식회사 전자 장치 및 이의 제어 방법
EP3467824B1 (en) * 2017-10-03 2021-04-21 Dolby Laboratories Licensing Corporation Method and system for inter-channel coding
US10854209B2 (en) * 2017-10-03 2020-12-01 Qualcomm Incorporated Multi-stream audio coding
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
WO2019091573A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
CN111316353B (zh) * 2017-11-10 2023-11-17 诺基亚技术有限公司 确定空间音频参数编码和相关联的解码
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
US10306391B1 (en) 2017-12-18 2019-05-28 Apple Inc. Stereophonic to monophonic down-mixing
KR20200099561A (ko) 2017-12-19 2020-08-24 돌비 인터네셔널 에이비 통합 음성 및 오디오 디코딩 및 인코딩 개선을 위한 방법, 장치 및 시스템
BR112020012654A2 (pt) 2017-12-19 2020-12-01 Dolby International Ab métodos, aparelhos e sistemas para aprimoramentos de decodificação e codificação de fala e áudio unificados com transpositor de harmônico com base em qmf
TWI812658B (zh) * 2017-12-19 2023-08-21 瑞典商都比國際公司 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統
TWI809289B (zh) 2018-01-26 2023-07-21 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
US11523238B2 (en) * 2018-04-04 2022-12-06 Harman International Industries, Incorporated Dynamic audio upmixer parameters for simulating natural spatial variations
EP3804356A1 (en) 2018-06-01 2021-04-14 Shure Acquisition Holdings, Inc. Pattern-forming microphone array
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
CN112889296A (zh) 2018-09-20 2021-06-01 舒尔获得控股公司 用于阵列麦克风的可调整的波瓣形状
US11544032B2 (en) * 2019-01-24 2023-01-03 Dolby Laboratories Licensing Corporation Audio connection and transmission device
JP7416816B2 (ja) * 2019-03-06 2024-01-17 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ダウンミキサ及びダウンミックス方法
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
EP3942842A1 (en) 2019-03-21 2022-01-26 Shure Acquisition Holdings, Inc. Housings and associated design features for ceiling array microphones
JP2022526761A (ja) 2019-03-21 2022-05-26 シュアー アクイジッション ホールディングス インコーポレイテッド 阻止機能を伴うビーム形成マイクロフォンローブの自動集束、領域内自動集束、および自動配置
WO2020216459A1 (en) * 2019-04-23 2020-10-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method or computer program for generating an output downmix representation
US11445294B2 (en) 2019-05-23 2022-09-13 Shure Acquisition Holdings, Inc. Steerable speaker array, system, and method for the same
US11056114B2 (en) * 2019-05-30 2021-07-06 International Business Machines Corporation Voice response interfacing with multiple smart devices of different types
EP3977449A1 (en) 2019-05-31 2022-04-06 Shure Acquisition Holdings, Inc. Low latency automixer integrated with voice and noise activity detection
CN112218020B (zh) * 2019-07-09 2023-03-21 海信视像科技股份有限公司 一种多声道平台音频数据传输方法及其装置
WO2021041275A1 (en) 2019-08-23 2021-03-04 Shore Acquisition Holdings, Inc. Two-dimensional microphone array with improved directivity
US11270712B2 (en) 2019-08-28 2022-03-08 Insoundz Ltd. System and method for separation of audio sources that interfere with each other using a microphone array
DE102019219922B4 (de) 2019-12-17 2023-07-20 Volkswagen Aktiengesellschaft Verfahren zur Übertragung einer Mehrzahl an Signalen sowie Verfahren zum Empfang einer Mehrzahl an Signalen
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
US11706562B2 (en) 2020-05-29 2023-07-18 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
CN112153535B (zh) * 2020-09-03 2022-04-08 Oppo广东移动通信有限公司 一种声场扩展方法、电路、电子设备及存储介质
MX2023004247A (es) * 2020-10-13 2023-06-07 Fraunhofer Ges Forschung Aparato y metodo para codificar una pluralidad de objetos de audio o aparato y metodo para decodificacion usando dos o mas objetos de audio relevantes.
TWI772930B (zh) * 2020-10-21 2022-08-01 美商音美得股份有限公司 適合即時應用之分析濾波器組及其運算程序、基於分析濾波器組之信號處理系統及程序
CN112309419B (zh) * 2020-10-30 2023-05-02 浙江蓝鸽科技有限公司 多路音频的降噪、输出方法及其系统
CN112566008A (zh) * 2020-12-28 2021-03-26 科大讯飞(苏州)科技有限公司 音频上混方法、装置、电子设备和存储介质
CN112584300B (zh) * 2020-12-28 2023-05-30 科大讯飞(苏州)科技有限公司 音频上混方法、装置、电子设备和存储介质
JP2024505068A (ja) 2021-01-28 2024-02-02 シュアー アクイジッション ホールディングス インコーポレイテッド ハイブリッドオーディオビーム形成システム
US11837244B2 (en) 2021-03-29 2023-12-05 Invictumtech Inc. Analysis filter bank and computing procedure thereof, analysis filter bank based signal processing system and procedure suitable for real-time applications
US20220399026A1 (en) * 2021-06-11 2022-12-15 Nuance Communications, Inc. System and Method for Self-attention-based Combining of Multichannel Signals for Speech Processing

Family Cites Families (159)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US554334A (en) * 1896-02-11 Folding or portable stove
US1124580A (en) 1911-07-03 1915-01-12 Edward H Amet Method of and means for localizing sound reproduction.
US1850130A (en) 1928-10-31 1932-03-22 American Telephone & Telegraph Talking moving picture system
US1855147A (en) 1929-01-11 1932-04-19 Jones W Bartlett Distortion in sound transmission
US2114680A (en) 1934-12-24 1938-04-19 Rca Corp System for the reproduction of sound
US2860541A (en) 1954-04-27 1958-11-18 Vitarama Corp Wireless control for recording sound for stereophonic reproduction
US2819342A (en) 1954-12-30 1958-01-07 Bell Telephone Labor Inc Monaural-binaural transmission of sound
US2927963A (en) 1955-01-04 1960-03-08 Jordan Robert Oakes Single channel binaural or stereo-phonic sound system
US3046337A (en) 1957-08-05 1962-07-24 Hamner Electronics Company Inc Stereophonic sound
US3067292A (en) 1958-02-03 1962-12-04 Jerry B Minter Stereophonic sound transmission and reproduction
US3846719A (en) 1973-09-13 1974-11-05 Dolby Laboratories Inc Noise reduction systems
US4308719A (en) * 1979-08-09 1982-01-05 Abrahamson Daniel P Fluid power system
DE3040896C2 (de) 1979-11-01 1986-08-28 Victor Company Of Japan, Ltd., Yokohama, Kanagawa Schaltungsanordnung zur Erzeugung und Aufbereitung stereophoner Signale aus einem monophonen Signal
US4308424A (en) 1980-04-14 1981-12-29 Bice Jr Robert G Simulated stereo from a monaural source sound reproduction system
US4624009A (en) 1980-05-02 1986-11-18 Figgie International, Inc. Signal pattern encoder and classifier
US4464784A (en) 1981-04-30 1984-08-07 Eventide Clockworks, Inc. Pitch changer with glitch minimizer
US4799260A (en) 1985-03-07 1989-01-17 Dolby Laboratories Licensing Corporation Variable matrix decoder
US4941177A (en) 1985-03-07 1990-07-10 Dolby Laboratories Licensing Corporation Variable matrix decoder
US5046098A (en) 1985-03-07 1991-09-03 Dolby Laboratories Licensing Corporation Variable matrix decoder with three output channels
US4922535A (en) 1986-03-03 1990-05-01 Dolby Ray Milton Transient control aspects of circuit arrangements for altering the dynamic range of audio signals
US5040081A (en) 1986-09-23 1991-08-13 Mccutchen David Audiovisual synchronization signal generator using audio signature comparison
US5055939A (en) 1987-12-15 1991-10-08 Karamon John J Method system & apparatus for synchronizing an auxiliary sound source containing multiple language channels with motion picture film video tape or other picture source containing a sound track
US4932059A (en) * 1988-01-11 1990-06-05 Fosgate Inc. Variable matrix decoder for periphonic reproduction of sound
US5164840A (en) 1988-08-29 1992-11-17 Matsushita Electric Industrial Co., Ltd. Apparatus for supplying control codes to sound field reproduction apparatus
US5105462A (en) 1989-08-28 1992-04-14 Qsound Ltd. Sound imaging method and apparatus
US5040217A (en) 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5172415A (en) 1990-06-08 1992-12-15 Fosgate James W Surround processor
US5428687A (en) 1990-06-08 1995-06-27 James W. Fosgate Control voltage generator multiplier and one-shot for integrated surround sound processor
US5625696A (en) 1990-06-08 1997-04-29 Harman International Industries, Inc. Six-axis surround sound processor with improved matrix and cancellation control
US5504819A (en) 1990-06-08 1996-04-02 Harman International Industries, Inc. Surround sound processor with improved control voltage generator
US5121433A (en) * 1990-06-15 1992-06-09 Auris Corp. Apparatus and method for controlling the magnitude spectrum of acoustically combined signals
WO1991020164A1 (en) * 1990-06-15 1991-12-26 Auris Corp. Method for eliminating the precedence effect in stereophonic sound systems and recording made with said method
US5235646A (en) * 1990-06-15 1993-08-10 Wilde Martin D Method and apparatus for creating de-correlated audio output signals and audio recordings made thereby
WO1991019989A1 (en) 1990-06-21 1991-12-26 Reynolds Software, Inc. Method and apparatus for wave analysis and event recognition
US5274740A (en) 1991-01-08 1993-12-28 Dolby Laboratories Licensing Corporation Decoder for variable number of channel presentation of multidimensional sound fields
KR100228688B1 (ko) 1991-01-08 1999-11-01 쥬더 에드 에이. 다차원 음장용 인코우더/디코우더
NL9100173A (nl) 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
JPH0525025A (ja) * 1991-07-22 1993-02-02 Kao Corp 毛髪化粧料
US5175769A (en) 1991-07-23 1992-12-29 Rolm Systems Method for time-scale modification of signals
US5173944A (en) * 1992-01-29 1992-12-22 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Head related transfer function pseudo-stereophony
FR2700632B1 (fr) 1993-01-21 1995-03-24 France Telecom Système de codage-décodage prédictif d'un signal numérique de parole par transformée adaptative à codes imbriqués.
US5463424A (en) * 1993-08-03 1995-10-31 Dolby Laboratories Licensing Corporation Multi-channel transmitter/receiver system providing matrix-decoding compatible signals
US5394472A (en) * 1993-08-09 1995-02-28 Richard G. Broadie Monaural to stereo sound translation process and apparatus
US5659619A (en) * 1994-05-11 1997-08-19 Aureal Semiconductor, Inc. Three-dimensional virtual audio display employing reduced complexity imaging filters
TW295747B (pt) * 1994-06-13 1997-01-11 Sony Co Ltd
US5727119A (en) 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
JPH09102742A (ja) * 1995-10-05 1997-04-15 Sony Corp 符号化方法および装置、復号化方法および装置、並びに記録媒体
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5742689A (en) * 1996-01-04 1998-04-21 Virtual Listening Systems, Inc. Method and device for processing a multichannel signal for use with a headphone
TR199801388T2 (xx) 1996-01-19 1998-10-21 Tiburtius Bernd Elektriksel koruma muhafazas�.
US5857026A (en) * 1996-03-26 1999-01-05 Scheiber; Peter Space-mapping sound system
US6430533B1 (en) 1996-05-03 2002-08-06 Lsi Logic Corporation Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation
US5870480A (en) * 1996-07-19 1999-02-09 Lexicon Multichannel active matrix encoder and decoder with maximum lateral separation
JPH1074097A (ja) 1996-07-26 1998-03-17 Ind Technol Res Inst オーディオ信号のパラメータを変更する方法及び装置
US6049766A (en) 1996-11-07 2000-04-11 Creative Technology Ltd. Time-domain time/pitch scaling of speech or audio signals with transient handling
US5862228A (en) 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
US6111958A (en) * 1997-03-21 2000-08-29 Euphonics, Incorporated Audio spatial enhancement apparatus and methods
US6211919B1 (en) 1997-03-28 2001-04-03 Tektronix, Inc. Transparent embedment of data in a video signal
TW384434B (en) * 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
JPH1132399A (ja) * 1997-05-13 1999-02-02 Sony Corp 符号化方法及び装置、並びに記録媒体
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
US6330672B1 (en) 1997-12-03 2001-12-11 At&T Corp. Method and apparatus for watermarking digital bitstreams
TW358925B (en) * 1997-12-31 1999-05-21 Ind Tech Res Inst Improvement of oscillation encoding of a low bit rate sine conversion language encoder
TW374152B (en) * 1998-03-17 1999-11-11 Aurix Ltd Voice analysis system
GB2343347B (en) * 1998-06-20 2002-12-31 Central Research Lab Ltd A method of synthesising an audio signal
GB2340351B (en) 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
US6266644B1 (en) 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
JP2000152399A (ja) * 1998-11-12 2000-05-30 Yamaha Corp 音場効果制御装置
SE9903552D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Efficient spectral envelope coding using dynamic scalefactor grouping and time/frequency switching
JP4610087B2 (ja) 1999-04-07 2011-01-12 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 損失のない符号化・復号へのマトリックス改良
EP1054575A3 (en) * 1999-05-17 2002-09-18 Bose Corporation Directional decoding
US6389562B1 (en) * 1999-06-29 2002-05-14 Sony Corporation Source code shuffling to provide for robust error recovery
US7184556B1 (en) * 1999-08-11 2007-02-27 Microsoft Corporation Compensation system and method for sound reproduction
US6931370B1 (en) * 1999-11-02 2005-08-16 Digital Theater Systems, Inc. System and method for providing interactive audio in a multi-channel audio environment
EP1145225A1 (en) 1999-11-11 2001-10-17 Koninklijke Philips Electronics N.V. Tone features for speech recognition
TW510143B (en) 1999-12-03 2002-11-11 Dolby Lab Licensing Corp Method for deriving at least three audio signals from two input audio signals
US6970567B1 (en) 1999-12-03 2005-11-29 Dolby Laboratories Licensing Corporation Method and apparatus for deriving at least one audio signal from two or more input audio signals
US6920223B1 (en) 1999-12-03 2005-07-19 Dolby Laboratories Licensing Corporation Method for deriving at least three audio signals from two input audio signals
FR2802329B1 (fr) 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
ES2292581T3 (es) * 2000-03-15 2008-03-16 Koninklijke Philips Electronics N.V. Funcion laguerre para la codificacion de audio.
US7212872B1 (en) * 2000-05-10 2007-05-01 Dts, Inc. Discrete multichannel audio with a backward compatible mix
US7076071B2 (en) * 2000-06-12 2006-07-11 Robert A. Katz Process for enhancing the existing ambience, imaging, depth, clarity and spaciousness of sound recordings
KR100809310B1 (ko) * 2000-07-19 2008-03-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 서라운드 및/또는 오디오 센터 신호를 구동하기 위한 다중-채널 스테레오 컨버터
BRPI0113271B1 (pt) 2000-08-16 2016-01-26 Dolby Lab Licensing Corp método para modificar a operação da função codificadora e/ou da função decodificadora de um sistema de codificação perceptual de acordo com informação suplementar
JP4624643B2 (ja) 2000-08-31 2011-02-02 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション オーディオ・マトリックス・デコーディング装置に関する方法
US20020054685A1 (en) * 2000-11-09 2002-05-09 Carlos Avendano System for suppressing acoustic echoes and interferences in multi-channel audio systems
US7382888B2 (en) * 2000-12-12 2008-06-03 Bose Corporation Phase shifting audio signal combining
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US20040062401A1 (en) 2002-02-07 2004-04-01 Davis Mark Franklin Audio channel translation
CA2437764C (en) 2001-02-07 2012-04-10 Dolby Laboratories Licensing Corporation Audio channel translation
US7660424B2 (en) 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US7254239B2 (en) * 2001-02-09 2007-08-07 Thx Ltd. Sound system and method of sound reproduction
JP3404024B2 (ja) * 2001-02-27 2003-05-06 三菱電機株式会社 音声符号化方法および音声符号化装置
CN1279511C (zh) 2001-04-13 2006-10-11 多尔拜实验特许公司 一种时间标度和/或音调偏移一个音频信号的方法
US7610205B2 (en) 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7461002B2 (en) 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US7283954B2 (en) 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US6807528B1 (en) 2001-05-08 2004-10-19 Dolby Laboratories Licensing Corporation Adding data to a compressed data frame
WO2002093560A1 (en) 2001-05-10 2002-11-21 Dolby Laboratories Licensing Corporation Improving transient performance of low bit rate audio coding systems by reducing pre-noise
TW552580B (en) * 2001-05-11 2003-09-11 Syntek Semiconductor Co Ltd Fast ADPCM method and minimum logic implementation circuit
MXPA03010749A (es) 2001-05-25 2004-07-01 Dolby Lab Licensing Corp Comparacion de audio usando caracterizaciones basadas en eventos auditivos.
MXPA03010750A (es) 2001-05-25 2004-07-01 Dolby Lab Licensing Corp Metodo para la alineacion temporal de senales de audio usando caracterizaciones basadas en eventos auditivos.
TW556153B (en) * 2001-06-01 2003-10-01 Syntek Semiconductor Co Ltd Fast adaptive differential pulse coding modulation method for random access and channel noise resistance
TW569551B (en) * 2001-09-25 2004-01-01 Roger Wallace Dressler Method and apparatus for multichannel logic matrix decoding
TW526466B (en) * 2001-10-26 2003-04-01 Inventec Besta Co Ltd Encoding and voice integration method of phoneme
EP1451809A1 (en) * 2001-11-23 2004-09-01 Koninklijke Philips Electronics N.V. Perceptual noise substitution
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US20040037421A1 (en) 2001-12-17 2004-02-26 Truman Michael Mead Parital encryption of assembled bitstreams
WO2003069954A2 (en) * 2002-02-18 2003-08-21 Koninklijke Philips Electronics N.V. Parametric audio coding
EP1339231A3 (en) 2002-02-26 2004-11-24 Broadcom Corporation System and method for demodulating the second audio FM carrier
US7599835B2 (en) 2002-03-08 2009-10-06 Nippon Telegraph And Telephone Corporation Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program
DE10217567A1 (de) 2002-04-19 2003-11-13 Infineon Technologies Ag Halbleiterbauelement mit integrierter Kapazitätsstruktur und Verfahren zu dessen Herstellung
US8340302B2 (en) * 2002-04-22 2012-12-25 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
DE60311794T2 (de) * 2002-04-22 2007-10-31 Koninklijke Philips Electronics N.V. Signalsynthese
US7428440B2 (en) * 2002-04-23 2008-09-23 Realnetworks, Inc. Method and apparatus for preserving matrix surround information in encoded audio/video
JP4187719B2 (ja) * 2002-05-03 2008-11-26 ハーマン インターナショナル インダストリーズ インコーポレイテッド マルチチャネル・ダウンミキシング装置
US7257231B1 (en) * 2002-06-04 2007-08-14 Creative Technology Ltd. Stream segregation for stereo signals
US7567845B1 (en) * 2002-06-04 2009-07-28 Creative Technology Ltd Ambience generation for stereo signals
TWI225640B (en) 2002-06-28 2004-12-21 Samsung Electronics Co Ltd Voice recognition device, observation probability calculating device, complex fast fourier transform calculation device and method, cache device, and method of controlling the cache device
JP2005533271A (ja) * 2002-07-16 2005-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化
DE10236694A1 (de) 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7454331B2 (en) 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
US7536305B2 (en) * 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
JP3938015B2 (ja) 2002-11-19 2007-06-27 ヤマハ株式会社 音声再生装置
WO2004073178A2 (en) 2003-02-06 2004-08-26 Dolby Laboratories Licensing Corporation Continuous backup audio
EP2665294A2 (en) * 2003-03-04 2013-11-20 Core Wireless Licensing S.a.r.l. Support of a multichannel audio extension
KR100493172B1 (ko) * 2003-03-06 2005-06-02 삼성전자주식회사 마이크로폰 어레이 구조, 이를 이용한 일정한 지향성을갖는 빔 형성방법 및 장치와 음원방향 추정방법 및 장치
TWI223791B (en) * 2003-04-14 2004-11-11 Ind Tech Res Inst Method and system for utterance verification
EP1629463B1 (en) 2003-05-28 2007-08-22 Dolby Laboratories Licensing Corporation Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
US7398207B2 (en) 2003-08-25 2008-07-08 Time Warner Interactive Video Group, Inc. Methods and systems for determining audio loudness levels in programming
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
BR122018007834B1 (pt) * 2003-10-30 2019-03-19 Koninklijke Philips Electronics N.V. Codificador e decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, e, meio de armazenamento legível por computador
US7412380B1 (en) * 2003-12-17 2008-08-12 Creative Technology Ltd. Ambience extraction and modification for enhancement and upmix of audio signals
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
ATE527654T1 (de) 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
WO2007109338A1 (en) * 2006-03-21 2007-09-27 Dolby Laboratories Licensing Corporation Low bit rate audio encoding and decoding
US7639823B2 (en) * 2004-03-03 2009-12-29 Agere Systems Inc. Audio mixing using magnitude equalization
US7617109B2 (en) 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
SE0402649D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
SE0402651D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
TWI397903B (zh) 2005-04-13 2013-06-01 Dolby Lab Licensing Corp 編碼音訊之節約音量測量技術
TW200638335A (en) 2005-04-13 2006-11-01 Dolby Lab Licensing Corp Audio metadata verification
AU2006255662B2 (en) 2005-06-03 2012-08-23 Dolby Laboratories Licensing Corporation Apparatus and method for encoding audio signals with decoding instructions
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
US7965848B2 (en) 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
ATE493794T1 (de) 2006-04-27 2011-01-15 Dolby Lab Licensing Corp Tonverstärkungsregelung mit erfassung von publikumsereignissen auf der basis von spezifischer lautstärke
JP2009117000A (ja) * 2007-11-09 2009-05-28 Funai Electric Co Ltd 光ピックアップ
EP2065865B1 (en) 2007-11-23 2011-07-27 Michal Markiewicz System for monitoring vehicle traffic
CN103387583B (zh) * 2012-05-09 2018-04-13 中国科学院上海药物研究所 二芳基并[a,g]喹嗪类化合物、其制备方法、药物组合物及其应用

Also Published As

Publication number Publication date
US9454969B2 (en) 2016-09-27
US9715882B2 (en) 2017-07-25
CA3026276A1 (en) 2012-12-27
CN102169693B (zh) 2014-07-23
CA3035175C (en) 2020-02-25
CA2992097A1 (en) 2005-09-15
US20160189718A1 (en) 2016-06-30
CA3026245C (en) 2019-04-09
AU2005219956B2 (en) 2009-05-28
US20190147898A1 (en) 2019-05-16
CA2556575A1 (en) 2005-09-15
MY145083A (en) 2011-12-15
CA3026267A1 (en) 2005-09-15
US10796706B2 (en) 2020-10-06
US20170178653A1 (en) 2017-06-22
US20210090583A1 (en) 2021-03-25
US20200066287A1 (en) 2020-02-27
DE602005014288D1 (de) 2009-06-10
CA2992097C (en) 2018-09-11
CN102176311A (zh) 2011-09-07
US20170178651A1 (en) 2017-06-22
AU2009202483B2 (en) 2012-07-19
US9691405B1 (en) 2017-06-27
US20170148456A1 (en) 2017-05-25
TW201329959A (zh) 2013-07-16
US20170365268A1 (en) 2017-12-21
US20170076731A1 (en) 2017-03-16
HK1092580A1 (en) 2007-02-09
CA2992125C (en) 2018-09-25
US9691404B2 (en) 2017-06-27
TWI397902B (zh) 2013-06-01
AU2005219956A1 (en) 2005-09-15
CN1926607B (zh) 2011-07-06
SG149871A1 (en) 2009-02-27
CA2992065C (en) 2018-11-20
CA3026276C (en) 2019-04-16
EP2224430A3 (en) 2010-09-15
ES2324926T3 (es) 2009-08-19
US10269364B2 (en) 2019-04-23
TWI484478B (zh) 2015-05-11
CA3035175A1 (en) 2012-12-27
US8170882B2 (en) 2012-05-01
EP1721312A1 (en) 2006-11-15
HK1142431A1 (en) 2010-12-03
US9704499B1 (en) 2017-07-11
US9672839B1 (en) 2017-06-06
IL177094A0 (en) 2006-12-10
HK1128100A1 (en) 2009-10-16
US20170178650A1 (en) 2017-06-22
CN1926607A (zh) 2007-03-07
US8983834B2 (en) 2015-03-17
CA2992125A1 (en) 2005-09-15
DE602005022641D1 (de) 2010-09-09
EP2065885A1 (en) 2009-06-03
EP2065885B1 (en) 2010-07-28
AU2009202483A1 (en) 2009-07-16
ATE390683T1 (de) 2008-04-15
US20170148457A1 (en) 2017-05-25
KR101079066B1 (ko) 2011-11-02
ATE430360T1 (de) 2009-05-15
TWI498883B (zh) 2015-09-01
IL177094A (en) 2010-11-30
US9640188B2 (en) 2017-05-02
EP1914722A1 (en) 2008-04-23
CA2917518C (en) 2018-04-03
US9697842B1 (en) 2017-07-04
HK1119820A1 (en) 2009-03-13
US10460740B2 (en) 2019-10-29
ATE527654T1 (de) 2011-10-15
US20150187362A1 (en) 2015-07-02
US11308969B2 (en) 2022-04-19
CA3026245A1 (en) 2005-09-15
EP2224430B1 (en) 2011-10-05
SG10201605609PA (en) 2016-08-30
CN102176311B (zh) 2014-09-10
JP4867914B2 (ja) 2012-02-01
KR20060132682A (ko) 2006-12-21
US20170178652A1 (en) 2017-06-22
BRPI0508343A (pt) 2007-07-24
US20070140499A1 (en) 2007-06-21
DE602005005640T2 (de) 2009-05-14
ATE475964T1 (de) 2010-08-15
CA3026267C (en) 2019-04-16
JP2007526522A (ja) 2007-09-13
US9311922B2 (en) 2016-04-12
DE602005005640D1 (de) 2008-05-08
US20170148458A1 (en) 2017-05-25
SG10202004688SA (en) 2020-06-29
US9779745B2 (en) 2017-10-03
US9520135B2 (en) 2016-12-13
EP1914722B1 (en) 2009-04-29
CN102169693A (zh) 2011-08-31
TW201331932A (zh) 2013-08-01
CA2992065A1 (en) 2005-09-15
EP1721312B1 (en) 2008-03-26
CA2917518A1 (en) 2005-09-15
WO2005086139A1 (en) 2005-09-15
US20160189723A1 (en) 2016-06-30
TW200537436A (en) 2005-11-16
US20080031463A1 (en) 2008-02-07
CA2992089C (en) 2018-08-21
CA2992089A1 (en) 2005-09-15
CA2992051C (en) 2019-01-22
CA2556575C (en) 2013-07-02
EP2224430A2 (en) 2010-09-01
CA2992051A1 (en) 2005-09-15
US10403297B2 (en) 2019-09-03
US20190122683A1 (en) 2019-04-25

Similar Documents

Publication Publication Date Title
BRPI0508343B1 (pt) método para decodificar m canais de áudio codificados representando n canais de áudio e método para codificar n canais de áudio de entrada em m canais de áudio codificados.

Legal Events

Date Code Title Description
B06T Formal requirements before examination [chapter 6.20 patent gazette]
B15K Others concerning applications: alteration of classification

Ipc: G10L 19/008 (2013.01), G10L 19/02 (2013.01), G10L

B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 06/11/2018, OBSERVADAS AS CONDICOES LEGAIS.